消息首页搜索举报

【现货！】大数据技术基础-基于Hadoop与Spark 罗福强　李瑶　陈

二手会有少量涂画，整体不影响再次阅读使用！套装不一定齐全，请下单前咨询在线客服！

4 0.8折 49.8 八五品

库存3件

上海黄浦

认证卖家担保交易快速发货售后保障

作者罗福强　李瑶　陈虹君

出版社人民邮电出版社

ISBN9787115454102

出版时间2017-05

版次1

装帧平装

开本16开

纸张胶版纸

页数292页

字数494千字

定价49.8元

货号9787115454102

上书时间2024-12-02

上海真实库存12小时发货书店

十年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 8小时
好评率暂无

最新上架

【现货！】虫虫1 丁健飞上海科学普及出版社 9787542728784 ¥3.50

【现货！】听孩子说，胜过对孩子说王双双著青岛出版社 ¥3.50

【现货！】杨靖宇的故事徐骏华　编著中国社会出版社 ¥3.50

【现货！】房地产开发与经营李德智蒋英陈红霞机械工业出版社 ¥3.50

【现货！】国际大奖小说:浪漫鼠德佩罗 (美)迪卡米洛著,(美)埃 ¥3.50

【现货！】凉生，我们可不可以不忧伤 3 花火文学系列乐小米　 ¥3.50

【现货！】我的爱，被谁出卖碧染著百花洲文艺出版社 ¥3.50

【现货！】鲁滨孙漂流记丹尼尔·笛福黑龙江美术出版社 ¥3.50

【现货！】调皮的日子2 下秦文君著春风文艺出版社 ¥3.50

商品详情

品相描述：八五品

商品描述: 基本信息
书名:大数据技术基础-基于Hadoop与Spark
定价：49.8元
作者:罗福强　李瑶　陈虹君
出版社：人民邮电出版社
出版日期：2017-05-01
ISBN：9787115454102
字数：494
页码：292
版次：
装帧：平装
开本：16开
商品重量：
编辑推荐

内容提要
本书主要内容包括：章大数据技术概述、第二章 Hadoop平台的安装与配置、第三章Hadoop分布式文件系统、第四章HDFS API编程、第五章 Hadoop分布式计算框架、第六章 MapReduce API编程、第七章 MapReduce 高级编程、第八章 Spark概述、第九章 Spark Streaming编程、第十章 Spark SQL编程。
目录
章　大数据技术概述　11.1　大数据技术的发展背景　11.1.1　大数据技术的发展过程　21.1.2　大数据技术的影响　31.1.3　大数据发展的重大事件　51.2　大数据的概念、特征及意义　71.2.1　什么是大数据　71.2.2　大数据的特征　81.2.3　大数据来自哪儿　91.2.4　大数据的挑战　101.2.5　研究大数据的意义　121.3　大数据的存储与计算模式　131.3.1　大数据的存储模式　131.3.2　大数据的计算模式　161.4　大数据的典型应用　181.4.1　智慧医疗的应用　191.4.2　智慧农业的应用　201.4.3　金融行业的应用　211.4.4　零售行业的应用　241.4.5　电子商务行业的应用　241.4.6　电子政务的应用　241.5　初识Hadoop大数据平台　261.5.1　Hadoop的发展过程　261.5.2　Hadoop的优势　271.5.3　Hadoop的生态系统　281.5.4　Hadoop的版本　291.6　习题　32第2章　Hadoop平台的安装与配置　332.1　安装准备　332.1.1　硬件要求　332.1.2　安装Linux　342.1.3　安装Java　362.2　Hadoop的集群安装　382.2.1　Hadoop的运行模式　382.2.2　Linux系统设置　392.2.3　SSH的安装　412.2.4　Hadoop的安装　422.2.5　Hadoop的配置　422.2.6　Hadoop的测试　492.3　Hadoop开发平台的安装　512.3.1　Eclipse的安装　512.3.2　下载hadoop-eclipse-plugin插件　532.3.3　在Eclipse中配置Hadoop　532.4　习题　552.5　实训　55第3章　Hadoop分布式文件系统　573.1　HDFS概述　573.1.1　HDFS简介　573.1.2　HDFS的基本概念　583.1.3　HDFS的特点　593.2　HDFS的体系结构　613.2.1　HDFS设计目标　613.2.2　HDFS的结构模型　613.2.3　HDFS文件的读写　633.2.4　HDFS的数据组织机制　633.2.5　HDFS的高可用性机制　663.3　HDFS Shell操作　683.3.1　Shell命令介绍　683.3.2　HDFS Shell帮助　683.3.3　文件操作命令　693.3.4　跨文件系统的交互操作命令　733.3.5　权限管理操作　743.4　习题　763.5　实训　77第4章　HDFS API编程　784.1　HDFS API概述　784.1.1　HDFS API简介　784.1.2　HDFS Java API的一般用法　824.2　HDFS Java API客户端编程　854.2.1　目录与文件的创建　854.2.2　文件上传与下载　874.2.3　数据流与文件读写操作　894.2.4　目录与文件的重命名　934.2.5　目录和文件的删除　944.2.6　文件系统的状态信息显示　954.3　HDFS应用举例——云盘系统的实现　994.3.1　云盘系统分析　994.3.2　云盘系统设计　994.3.3　云盘系统实现　1004.4　习题　1044.5　实训　104第5章　Hadoop分布式计算框架　1065.1　MapReduce概述　1065.1.1　为什么需要MapReduce　1065.1.2　MapReduce的优势　1105.1.3　MapReduce的基本概念　1115.1.4　MapReduce框架　1125.1.5　MapReduce发展　1145.2　YARN运行机制　1185.2.1　YARN组成结构　1185.2.2　YARN通信协议　1205.2.3　YARN工作流程　1215.3　数据的混洗处理　1235.3.1　map端　1245.3.2　reduce端　1255.4　作业的调度　1255.4.1　FIFO调度器　1265.4.2　Capacity调度器　1265.4.3　Fair调度器　1275.4.4　调度器的比较　1285.5　任务的执行　1295.5.1　推测执行　1295.5.2　JVM重用　1305.5.3　跳过坏记录　1305.6　失败处理机制　1305.6.1　任务运行失败　1305.6.2　ApplicationMaster运行失败　1315.6.3　NodeManager运行失败　1315.6.4　ResourceManager运行失败　1325.6.5　日志文件　1335.7　MapReduce示例演示——WordCount　1335.8　习题　136第6章　MapReduce API编程　1376.1　MapReduce API概述　1376.1.1　MapReduce API简介　1376.1.2　MapReduce API编程思路　1406.2　MapReduce的数据类型　1466.2.1　序列化　1466.2.2　Writable接口　1466.2.3　Writable类　1486.3　MapReduce的输入　1536.3.1　输入分片　1536.3.2　文件输入　1546.3.3　文本输入　1566.3.4　二进制输入　1576.3.5　多个输入　1586.3.6　数据库输入　1596.4　MapReduce的输出　1596.4.1　文本输出　1606.4.2　二进制输出　1606.4.3　多个输出　1606.4.4　延迟输出　1616.4.5　数据库输出　1616.5　MapReduce的任务　1616.5.1　map任务　1626.5.2　combine任务　1636.5.3　partition任务　1646.5.4　reduce任务　1646.5.5　任务的配置与执行　1656.6　MapReduce应用举例——倒排索引　1686.6.1　功能介绍　1686.6.2　准备数据　1696.6.3　分析与设计　1706.6.4　MapReduce编码实现　1716.6.5　测试结果　1736.7　习题　1746.8　实训　175第7章　MapReduce 高级编程　1777.1　自定义数据类型　1777.2　自定义输入/输出　1837.2.1　RecordReader与RecordWriter　1837.2.2　自定义输入　1887.2.3　自定义输出　1927.3　自定义Combiner/Partitioner　1947.3.1　自定义Combiner　1947.3.2　自定义Partitioner　1977.4　组合式计算作业　2007.4.1　迭代式计算　2007.4.2　依赖关系组合式计算　2017.4.3　链式计算　2027.5　MapReduce的特性　2037.5.1　计数器　2037.5.2　连接　2107.6　MapReduce应用举例——成绩分析系统的实现　2157.6.1　成绩分析系统解析　2157.6.2　成绩分析系统功能设计　2167.6.3　成绩分析系统实现　2167.7　习题　2257.8　实训　225第8章　Spark概述　2268.1　环境搭建　2268.1.1　Scala的下载和安装　2278.1.2　Spark的下载与安装　2288.2　Spark简介　2318.2.1　Spark的发展　2318.2.2　Spark的特点　2328.2.3　Spark与Hadoop的关系　2338.2.4　Spark的企业应用　2348.3　Spark大数据技术框架　2358.3.1　Spark技术体系　2358.3.2　四大组件概述　2378.4　Spark 2.0 使用体验　2388.4.1　Spark入口　2388.4.2　个Spark程序　2398.5　Spark的数据模型　2428.5.1　RDD介绍　2428.5.2　RDD的处理过程　2438.5.3　Transformation算子与使用　2438.5.4　Action算子与使用　2518.5.5　RDD分区　2538.5.6　RDD的依赖关系　2538.5.7　RDD的容错支持　2548.6　Spark任务调度　2558.6.1　Spark应用程序部署　2558.6.2　Spark任务的调度机制　2558.7　习题　2568.8　实训　257第9章　Spark Streaming编程　2589.1　Spark Streaming介绍　2589.2　Spark Streaming工作机制　2599.3　Spark的DStream流　2629.3.1　DStream转换　2629.3.2　Window操作　2639.3.3　DStream输出　2649.3.4　持久化与序列化　2659.3.5　设置检测点　2669.4　Spark Streaming案例　2679.5　集群处理与性能　2709.6　习题　2729.7　实训　2720章　Spark SQL编程　27310.1　Spark SQL概述　27310.2　DataFrame　27510.2.1　DataSet与DataFrame　27510.2.2　反射机制获取RDD内的Schema　27610.2.3　编程接口指定Schema　27710.3　数据源　27810.3.1　一般load/save方法　27810.3.2　Parquet数据集　27910.3.3　JSON数据集　28010.3.4　BC数据集　28110.3.5　DataFrame的案例　28210.4　Spark Streaming与Spark SQL综合案例　28510.5　习题　29010.6　实训　291参考文献　292
作者介绍
罗福强，副教授，教材作者。其编写的《Visual ET程序设计教程》教材，累计销售数万册。
序言

【封面】

— 没有更多了 —

【现货！】大数据技术基础-基于Hadoop与Spark 罗福强 李瑶 陈

上海真实库存12小时发货书店

商品详情

【现货！】大数据技术基础-基于Hadoop与Spark 罗福强　李瑶　陈