Hadoop & Spark大数据开发实战
正版新书 新华官方库房直发 可开电子发票
¥
34.22
5.9折
¥
58
全新
库存2件
作者肖睿,雷刚跃 主编
出版社中国水利水电出版社
ISBN9787517056430
出版时间2017-07
版次1
装帧平装
开本16开
纸张胶版纸
页数298页
字数416千字
定价58元
货号SC:9787517056430
上书时间2024-12-23
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
肖睿,北京大学教育学博士,课工场创始人,总经理。长期服务于中国IT职业教育领军企业北大青鸟Aptech,现任北大青鸟Aptech副总裁,职业教育研究院院长。肖睿先生曾就读于吉林大学少年班,专攻人工智能专家系统方向,作为靠前很好软件技术专家,早期曾领导北大方正核心软件产品研发,并受聘为北京大学软件学院特约讲师、北京创客总部创业导师、教育部专业和课程评审专家、人力资源和社会保障部岗位标准评审专家。拥有20年IT职业教育产品管理和企业管理经验,是中国IT职业教育领军人物。
内容简介:
大数据让我们以一种靠前的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,很终形成变革之力。本书围绕Hadoop和Spark这两个主流技术进行讲解,主要内容包括Hadoop环境配置、分布式文件系统HDFS、分布式计算框架MapReduce、资源调度框架YARN与Hadoop新特性、大数据数据仓库Hive、离线处理辅助系统、Spark Core、 Spark SQL、Spark Streaming等知识。为保证很优学习效果,本书紧密结合实际应用,利用大量案例说明和实践,提炼含金量十足的开发经验。本书使用Hadoop和Spark进行大数据开发,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来多方面的学习体验。
目录:
前言
关于引用作品版权说明
第1章初识Hadoop
本章任务
任务1大数据概述
1.1.1大数据基本概念
1.1.2大数据对于企业带来的挑战
任务2Hadoop概述
1.2.1Hadoop简介
1.2.2Hadoop生态系统
1.2.3大数据应用案例
任务3Hadoop环境搭建
1.3.1虚拟机安装
1.3.2Linux系统安装
1.3.3Hadoop伪分布式环境搭建
本章总结
本章作业
第2章分布式文件系统HDFS
本章任务
任务1初识HDFS
2.1.1HDFS概述
2.1.2HDFS基本概念
2.1.3HDFS体系结构
任务2HDFS操作
2.2.1HDFS shell访问
2.2.2Java API访问
任务3HDFS运行机制
2.3.1HDFS文件读写流程
2.3.2HDFS副本机制
2.3.3数据负载均衡
2.3.4机架感知
任务4HDFS进阶
2.4.1Hadoop序列化
2.4.2基于文件的数据结构SequenceFile
2.4.3基于文件的数据结构MapFile
本章总结
本章作业
第3章分布式计算框架
MapReduce
本章任务
任务1MapReduce编程模型
3.1.1MapReduce概述
3.1.2MapReduce编程模型
3.1.3MapReduce WordCount编程实例
任务2MapReduce进阶
3.2.1MapReduce类型
3.2
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价