• 写给大忙人的Hadoop 2
21年品牌 40万+商家 超1.5亿件商品

写给大忙人的Hadoop 2

书籍均为精品二手图书品相85品以上,出库会经过高温消毒,书籍上架都会检测可保证正版!!

12 1.7折 69 九品

仅1件

天津宝坻
认证卖家担保交易快速发货售后保障

作者Douglas Eadline

出版社"电子工业出版社

ISBN9787121288050

出版时间2016

装帧平装

开本16开

纸张胶版纸

定价69元

货号969488255420465154

上书时间2023-12-19

粤读二手书店

七年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
本店所售书籍均精品二手正版书书籍,严格审核品相为85品以上,出库会经过高温消毒,由于成本增加,所售书籍价格略高,运费首本5元,每增加一本运费加2元,每天下午2点前订单一般当天发出,最迟48小时内发出,二手书不保证100%没有任何笔记,有时会出现缺货现象,我们会第一时间告知您,感谢理解与支持。
商品描述
以下信息以网上匹配仅供参考,不支持以此为由退款
内容简介:

                                        《写给大忙人的Hadoop 2》首先介绍了Hadoop 的背景知识,包括Hadoop 2 和YARN 的工作原理和对Hadoop 1 的改进,然后将数据湖与传统存储比较。第2 章到第8 章,分别介绍了Hadoop 2 和核心服务的安装方法、Hadoop 分布式文件系统、MapReduce 和YARN 编程,以及利用Apache Pig 等Hadoop 工具简化编程。最后两章讲述了利用Apache Ambari 等工具管理Hadoop 和基本的管理程序。附录包括Hadoop 2 故障诊断和排除的基础知识、Apache Hue 和Apache Spark 安装等。 
《写给大忙人的Hadoop 2》通俗易懂,具有大量操作实例,易于上手,适合Hadoop 用户、管理员、开发和运维人员、程序员、架构师、分析师和数据科学工作者阅读。                                   
目录:

                                        1 背景和概念 1 
定义Apache Hadoop 1 
Apache Hadoop 的发展简史 3 
大数据的定义 4 
Hadoop 作为数据湖 5 
使用Hadoop:管理员、用户或两种身份兼具 7 
原始的MapReduce. 7 
Apache Hadoop 的设计原则 8 
Apache Hadoop MapReduce 示例 8 
MapReduce 的优势 10 
Apache Hadoop V1 MapReduce 操作 11 
使用Hadoop V2 超越MapReduce 13 
Hadoop V2 YARN 操作设计 14 
Apache Hadoop 项目生态系统 16 
总结和补充资料 18 
2 安装攻略 21 
核心Hadoop 服务 21 
Hadoop 配置文件 22 
规划你的资源 23 
硬件的选择 23 
软件的选择 24 
在台式机或笔记本电脑上安装 25 
安装Hortonworks HDP 2.2 沙箱 25 
用Apache 源代码安装Hadoop 32 
配置单节点YARN 服务器的步骤 33 
运行简单的MapReduce 示例 42 
安装 Apache Pig(可选) 42 
安装Apache Hive(可选) 43 
使用Ambari 安装Hadoop 44 
执行Ambari 安装 45 
撤消Ambari 安装 59 
使用Apache Whirr 在云中安装Hadoop 59 
总结和补充资料 65 
3 HDFS 基础知识 67 
HDFS 设计的特点 67 
HDFS 组件 68 
HDFS 块复制 71 
HDFS 安全模式 72 
机架的识别 73 
NameNode 高可用性 73 
HDFS NameNode 联邦 75 
HDFS 检查点和备份 76 
HDFS 快照 76 
HDFS NFS 网关 76 
HDFS 用户命令 77 
简要HDFS 命令参考 77 
一般HDFS 命令 78 
列出HDFS 中的文件 79 
在HDFS 中创建一个目录 80 
将文件复制到HDFS 80 
从HDFS 复制文件 81 
在HDFS 中复制文件 81 
删除在HDFS 中的文件 81 
删除在HDFS 中的目录 81 
获取HDFS 状态报告 81 
HDFS 的Web 图形用户界面 82 
在程序中使用HDFS 82 
HDFS Java 应用程序示例 82 
HDFS C 应用程序示例 86 
总结和补充资料 88 
4 运行示例程序和基准测试程序 91 
运行MapReduce 示例 91 
列出可用的示例 92 
运行Pi 示例 93 
使用Web 界面监控示例 95 
运行基本Hadoop 基准测试程序 101 
运行Terasort 测试 101 
运行TestDFSIO 基准 102 
管理Hadoop MapReduce 作业 104 
总结和补充资料 105 
5 Hadoop MapReduce 框架 107 
MapReduce 模型 107 
MapReduce 并行数据流. 110 
容错和推测执行 114 
推测执行. 114 
Hadoop MapReduce 硬件 115 
总结和补充资料 115 
6 MapReduce 编程 117 
编译和运行Hadoop WordCount 的示例 117 
使用流式接口 122 
使用管道接口 125 
编译和运行Hadoop Grep 链示例 127 
调试MapReduce. 131 
作业的列举、清除和状态查询 131 
Hadoop 日志管理 131 
启用YARN 日志聚合 132 
Web 界面日志查看 133 
命令行日志查看 133 
总结和补充资料 135 
7 基本的Hadoop 工具 137 
使用Apache Pig 137 
Pig 示例演练 138 
使用Apache Hive 140 
Hive 示例演练 140 
更高级的Hive 示例 142 
使用Apache Sqoop 获取关系型数据 145 
Apache Sqoop 导入和导出方法 145 
Apache Sqoop 版本更改 147 
Sqoop 示例演练 148 
使用Apache Flume 获取数据流 155 
Flume 的示例演练 157 
使用Apache Oozie 管理 Hadoop 工作流 160 
Oozie 示例演练 162 
使用Apache HBase 170 
HBase 数据模型概述 170 
HBase 示例演练 171 
总结和补充资料 176 
8 Hadoop YARN 应用程序 179 
YARN 分布式shell 179 
使用YARN 分布式shell 180 
一个简单的示例 181 
使用更多的容器 182 
带有shell 参数的分布式 shell 示例 183 
YARN 应用程序的结构 185 
YARN 应用程序框架 187 
Hadoop MapReduce 188 
Apache Tez 188 
Apache Giraph 189 
Hoya:HBase on YARN 189 
Dryad on YARN 189 
Apache Spark 189 
Apache Storm 190 
Apache REEF:可持续计算执行框架 190 
Hamster:Hadoop 和MPI 在同一集群 190 
Apache Flink:可扩展的批处理和流式数据处理 191 
Apache Slider:动态应用程序管理 191 
总结和补充资料 192 
9 用Apache Ambari 管理Hadoop 193 
快速浏览 Apache Ambari 194 
仪表板视图 194 
服务视图. 197 
主机视图. 199 
管理视图. 201 
查看视图. 201 
Admin 下拉菜单 202 
更改Hadoop 属性 206 
总结和补充资料 212 
10 基本的Hadoop 管理程序 213 
基本的Hadoop YARN 管理 214 
停用YARN 节点 214 
YARN WebProxy 214 
使用 JobHistoryServer 215 
管理YARN 作业 215 
设置容器内存 215 
设置容器核心 216 
设置MapReduce 属性 216 
基本的HDFS 管理 217 
NameNode 用户界面 217 
将用户添加到HDFS 219 
在HDFS 上执行FSCK 220 
平衡HDFS 221 
HDFS 安全模式 222 
停用HDFS 节点 222 
SecondaryNameNode 223 
HDFS 快照 223 
配置到HDFS 的NFSv3 网关 225 
容量调度程序背景知识 229 
Hadoop 2 的MapReduce 兼容性 231 
启用应用主控程序的重新启动功能 231 
计算一个节点的承载容量 232 
运行Hadoop 1 的应用程序 233 
总结和补充资料 235 
附录A 本书的网页和代码下载 237 
附录B 入门流程图和故障排除指南 239 
入门流程图 239 
常见的Hadoop 故障排除指南 239 
规则1:不要惊慌 239 
规则2:安装并使用Ambari 244 
规则3:检查日志 244 
规则4:简化情况 245 
规则5:在互联网上提问 245 
其他有用的提示 246 
附录C 按主题列出的Apache Hadoop 资源汇总 253 
常规的Hadoop 信息 253 
Hadoop 安装攻略 253 
HDFS 254 
示例 255 
MapReduce. 255 
MapReduce 编程 255 
基本工具 256 
YARN 应用程序框架 257 
Ambari 管理 257 
基本的Hadoop 管理 257 
附录D 安装Hue Hadoop GUI 259 
Hue 安装 259 
安装和配置Hue 262 
启动Hue 263 
Hue 用户界面 263 
附录E 安装Apache Spark 267 
在集群上安装Spark. 267 
在整个集群中启动Spark. 268 
在伪分布式的单节点安装版本中安装和启动Spark 270 
运行Spark 示例 271                                    

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

本店所售书籍均精品二手正版书书籍,严格审核品相为85品以上,出库会经过高温消毒,由于成本增加,所售书籍价格略高,运费首本5元,每增加一本运费加2元,每天下午2点前订单一般当天发出,最迟48小时内发出,二手书不保证100%没有任何笔记,有时会出现缺货现象,我们会第一时间告知您,感谢理解与支持。
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP