Spark大数据实时分析实战
正版新书 新华官方库房直发 可开电子发票
¥
52.5
7.0折
¥
75
全新
库存4件
作者付雯,聂强主编
出版社北京理工大学出版社
ISBN9787568288446
出版时间2020-12
版次1
装帧平装
开本16开
纸张胶版纸
页数260页
字数375千字
定价75元
货号SC:9787568288446
上书时间2024-10-30
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
内容简介:
本书分为六个项目,通过真实大数据实时分析项目的导入,引导读者完成大数据实时分析平台Spark的搭建,通过对基于Hadoop生态圈中Yarn资源调度框架,搭建Spark日志管理系统,搭建Kafka分布式消息系统,在工作中实现使用SparkStreaming实时读取Kafka中的数据进行实时处理。本书适用于大数据技术与应用、数据科学与大数据技术等电子信息类专业教学的教材,也可作为工程技术人员的参考书。
目录:
项目一初识Spark技术
任务1.1数据处理系统
1.1.1数据存储技术
1.1.2数据分析技术
1.1.3批数据和实时数据
1.1.4数据价值挖掘
任务1.2实时数据处理
1.2.1实时数据的价值
1.2.2实时数据处理技术
1.2.3Spark实时数据处理
项目二Spark集群的构建与安装
任务2.1Spark集群搭建
2.1.1平台选择
2.1.2软件选择
2.1.3Spark集群构建流程
任务2.2Spark集群规划
2.2.1Spark集群节点划分
2.2.2软件要求
2.2.3网络拓扑结构规划
任务2.3Spark安装准备
2.3.1JDK安装
2.3.2节点间的配置
2.3.3Spark安装包下载
任务2.4Spark集群搭建
2.4.1配置Master节点
2.4.2配置Worker节点
2.4.3分发安装包
2.4.4启动集群
任务2.5验证Spark
2.5.1验证Spark进程
2.5.2验证WEBUI界面
2.5.3验证集群功能
任务2.6Spark客户端搭建
2.6.1客户端介绍
2.6.2客户端搭建及使用
项目三Spark基于Yarn搭建
任务3.1基于Yarn构建介绍
3.1.1基于Yarn搭建环境配置
3.1.2Hadoop集群
3.1.3启动Hadoop集群
3.1.4
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价