Hadoop大数据处理技术基础与实践:微课版9787115545688
正版图书,可开发票,请放心购买。
¥
37.63
6.7折
¥
56
全新
库存3件
作者安俊秀,靳宇倡,郭英编著
出版社人民邮电出版社
ISBN9787115545688
出版时间2020-09
装帧平装
开本16开
定价56元
货号10064398
上书时间2024-12-16
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
安俊秀,教授,成都信息工程大学教师。2004年7月从西安交通大学计算机科学与技术专业毕业,获工学硕士学位。中国计算机学会不错会员;中国电子学会不错会员;成都市科技攻关计划评审专家;成都军区项目评审专家;汕尾市科技顾问团首席顾问。
目录
第1章 Hadoop概述
1.1 Hadoop简介
1.2 Hadoop体系架构
1.3 Hadoop与分布式开发
1.4 Hadoop行业应用案例分析
1.4.1 Hadoop在门户网站的应用
1.4.2 Hadoop在搜索引擎中的应用
1.4.3 Hadoop在电商平台中的应用
习题
第2章 Hadoop的安装与配置管理
2.1 实验准备
2.2 配置一个单节点环境
2.2.1 运行一个虚拟环境CentOS
2.2.2 配置网络
2.2.3 创建新的用户组和用户
2.2.4 上传文件到CentOS并配置Java和Hadoop环境
2.2.5 修改Hadoop 2.7配置文件
2.2.6 修改CentOS主机名
2.2.7 绑定hostname与IP
2.2.8 关闭防火墙
2.3 节点之间的免密码通信
2.3.1 什么是SSH
2.3.2 复制虚拟机节点
2.3.3 配置SSH免密码登录
2.4 Hadoop的启动和测试
2.4.1 格式化文件系统
2.4.2 启动HDFS
2.4.3 启动YARN
2.4.4 启动JobHistory Server
2.4.5 集群验证
2.4.6 需要了解的默认配置
2.5 动态管理节点
2.5.1 动态增加和删除DataNode
2.5.2 动态修改TaskTracker
习题
第3章 HDFS技术
3.1 HDFS的特点
3.2 HDFS架构
3.2.1 数据块
3.2.2 NameNode与DataNode
3.2.3 辅助NameNode
3.2.4 安全模式
3.2.5 负载均衡
3.2.6 垃圾回收
3.3 HDFS Shell命令
3.3.1 文件处理命令
3.3.2 dfsadmin命令
3.3.3 NameNode命令
3.3.4 fsck命令
3.3.5 pipes命令
3.3.6 job命令
……
第4章 YARN技术
第5章 MapReduce技
第6章 Hadoop I/O操作
第7章 海量数据库技术HBase
第8章 ZooKeeper技术
第9章 分布式数据仓库技术Hive
第10章 分布式数据分析工具Pig
第11章 Hadoop与RDBMS数据迁移工具Sqoop
第12章 大数据实时处理技术
附录A 使用Eclipse提交Hadoop任务时相关错误的修复
附录B 常用Pig内置函数
主编推荐
1.28个微课视频,扫码同步学,重点难点轻松掌握 2.每章都附有习题,以及实践性较强的实训,巩固所学知识 3.侧重应用能力的培养,对学生起到引导作用 4.配备了PPT课件、源代码、习题答案、微课等丰富的教学资源
精彩内容
全书共有12章,从Hadoop概述开始,介绍了Hadoop的安装与配置管理,并对Hadoop的生态体系架构进行了介绍,包括HDFS技术、YARN技术、MapReduce技术、Hadoop I/O操作、海量数据库技术HBase、ZooKeeper技术、分布式数据仓库技术Hive、分布式数据分析工具Pig,以及数据迁移工具Sqoop,最后对大数据实时处理技术做了简单介绍,旨在让读者了解当前其他的大数据处理技术。
本书除了介绍Hadoop的理论外,还介绍了如何使用各组件,但因为只是介绍基础的使用,没有涉及底层的高级内容,所以本书只是起引导作用,旨在让读者了解Hadoop并能够使用Hadoop的基本功能,并不是学习Hadoop的完全手册。
本书适合作为高等院校、高等职业院校大数据、物联网、云计算及其他计算机相关专业的教材,也可供云计算与大数据技术相关的培训班使用。
— 没有更多了 —
以下为对购买帮助不大的评价