Hadoop大数据技术应用
全新正版未拆封
¥
6.06
1.7折
¥
36
全新
库存2件
作者于晓刚 袁小洁 王春与 主编
出版社北京航空航天大学出版社
出版时间2022-08
版次1
装帧其他
上书时间2024-10-20
商品详情
- 品相描述:全新
图书标准信息
-
作者
于晓刚 袁小洁 王春与 主编
-
出版社
北京航空航天大学出版社
-
出版时间
2022-08
-
版次
1
-
ISBN
9787512437975
-
定价
36.00元
-
装帧
其他
-
开本
16开
-
纸张
胶版纸
-
页数
144页
-
字数
230千字
- 【内容简介】
-
.
- 【目录】
-
章 大数据概论
1.1 大数据概述
1.2 大数据的行业应用
1.3 大数据的基本概念
1.4 本章小结
1.5 课后题
第2章 初识hadoop
2.1 hadoop简介
2.2 hadoop生态圈介绍
2.3 本章小结
2.4 课后题
第3章 linux基础
3.1 linux简介
3.2 linux文件管理常用命令、shell编程
3.2.1 linux文件基础知识
3.2.2 shell编程基础
3.2.3 shell流程控制
3.3 本章小结
3.4 课后题
第4章 hadoop集群的搭建
4.1 hadoop集群搭建前的准备
4.1.1 安装虚拟机软件
4.1.2 hadoop集群规划
4.1.3 在虚拟机软件中安装linux作系统
4.1.4 配置linux系统网络
4.1.5 ssh服务设置
4.2 hadoop集群搭建
4.2.1 k安装
4.2.2 hadoop安装
4.2.3 hadoop集群配置
4.3 hadoop集群启动
4.3.1 文件系统格式化
4.3.2 启动和关闭hadoop集群
4.3.3 查看hadoop集群运行
4.4 hadoop集群使用
4.5 本章小结
4.6 课后练
第5章 hdfs分布式文件系统
5.1 hdfs简介
5.1.1 hdfs演变
5.1.2 hdfs的基本概念
5.1.3 hdfs的特点
5.2 hdfs的读写
5.2.1 hdfs存储架构
5.2.2 hdfs文件读写
5.3 hdfs shell作
5.3.1 hdfs的shell作
5.3.2 案例——shell定时采集数据到hdfs
5.4 hdfs java api作
5.4.1 hdfs java api介绍
5.4.2 hdfs java api案例
5.5 本章小结
5.6 课后题
第6章 mapreduce分布式计算框架
6.1 mapreduce概述
6.2 .mapredlace编程模型
6.2.1 mapreduce工作流程
6.2.2 maptask工作
6.2.3 reducetask工作
6.3 mapreduce案例解析
6.3.1 单词统计
6.3.2 倒排索引(invertedindex)
6.3.3 数据去重(dedup)
6.4 本章小结
6.5 课后题
第7章 项目实战——某国新冠肺炎疫情covid-19分析
7.1 项目说明
7.1.1 mapredlice partitiion机制
7.1.2 mapredlice biner规约
7.1.3 mapreduce编程
7.1.4 数据字段说明
7.2 mapreduce自定义组件
7.2.1 初始化项目
7.2.2 自定义对象序列化
7.2.3 自定义排序
7.2.4 自定义分区
7.2.5 自定义分组
7.2.6 自定义分组拓展top n
7.3 mapreduce运行模式
7.3.1 本地运行
7.3.2 打包发布运行
参文献
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价