数据馆员的Hadoop简明手册
¥
13.61
4.9折
¥
28
九五品
仅1件
作者顾立平,袁慧 著
出版社科学技术文献出版社
ISBN9787518930135
出版时间2017-10
版次1
装帧平装
开本16开
纸张胶版纸
页数82页
字数45000千字
定价28元
上书时间2024-12-08
商品详情
- 品相描述:九五品
- 商品描述
-
基本信息
书名:数据馆员的Hadoop简明手册
定价:28.00元
作者:顾立平,袁慧 著
出版社:科学技术文献出版社
出版日期:2017-10-01
ISBN:9787518930135
字数:45000
页码:82
版次:1
装帧:平装
开本:32开
商品重量:
编辑推荐
Hadoop是一个开源的框架,它能够使用户在不了解分布式底层细节的情况下,开发分布式程序,以便进行大规模数据集的分布式处理、用于计算机集群进行高速运算,以及面向海量数据的存储。本书旨在协助初级数据馆员们能够迅速了解Hadoop的知识、用途以及整体概貌,作为进一步实践操作层面之前的入门基础读物。
内容提要
Hadoop是一个开源的框架,它能够使用户在不了解分布式底层细节的情况下,开发分布式程序,以便进行大规模数据集的分布式处理、用于计算机集群进行高速运算,以及面向海量数据的存储。本书旨在协助初级数据馆员们能够迅速了解Hadoop的知识、用途以及整体概貌,作为进一步实践操作层面之前的入门基础读物。
目录
章 Hadoop概念1.1 Hadoop简介1.1.1 Hadoop是什么1.1.2 Hadoop形成的历史1.1.3 Hadoop在云计算和大数据中的地位1.1.4 Hadoop与Google FS的关系1.1.5 小结1.2 Hadoop生态系统1.2.1 Hadoop组成1.2.2 HDFS1.2.3 MapReduce1.3 Hadoop不同版本的变化1.3.1 Hadoop版本的变化1.3.2 HDFS→HDFS21.3.3 MapReduce 1.0→MapReduce 2.0第2章 Hadoop的YARN、HBase、Hive组件2.1 YARN2.1.1 YARN的基本组成结构2.1.2 YARN的工作流程2.2 HBase2.2.1 NoSQL数据库2.2.2 HBase分布式数据库2.3 Hive数据仓库系统2.3.1 Hive的定义2.3.2 Hive和数据库的异同2.3.3 部分查询逻辑实现举例第3章 MapReduce入门3.1 MapReduce初析3.2 MapReduce运行机制3.3 Map函数和Reduce函数3.4 Mapper和Reducer抽象类3.5 Maplkeduce的驱动类3.6 MapReduce的输入与输出3.6.1 MapReduce的输入InputFormat3.6.2 MapReduce的输出OutputFormat3.7 自定义Writable和WritableComparable3.8 技术详解3.8.1 Combiner详解3.8.2 Partitioner详解3.8.3 Distributed FileSystem详解3.9 Hadoop工具介绍3.10 Counter-计数器和自定义Counter计数器第4章 基于Hadoop二次开发实战4.1 MapReduce的优化4.2 Hadoop小文件优化4.3 任务调度附录 Hadoop家族产品
作者介绍
顾立平(AlaKu),博士、教授。在中国科学院文献情报中心从事开放获取、著作权、数据权益的政策研究与建议;在中国科学院大学经济与管理学院讲授信息用户与服务研究。学术理念和工作信念是:好做事(态度)、做好事(方向)、做事好(目标)。
序言
— 没有更多了 —
以下为对购买帮助不大的评价