大数据
正版新书 新华官方库房直发 可开电子发票
¥
44.24
7.9折
¥
56
全新
库存3件
作者俞东进,孙笑笑,王东京编著
出版社科学出版社
ISBN9787030714473
出版时间2022-01
版次1
装帧平装
开本16开
纸张胶版纸
页数260页
字数410千字
定价56元
货号SC:9787030714473
上书时间2024-06-26
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
内容简介:
本书围绕大数据采集、汇聚、存储、计算、分析、挖掘、可视化等处理全过程,基于Flume、Kafka、HDFS、HBase、MapReduce、Spark、Hive、ECharts等主流软件全面介绍大数据的基础原理和核心技术,以及人工智能、云计算和物联网等大数据相关内容,并在此基础上进一步阐述政务、商业等行业大数据,以及文本、图像、音频、视频等媒体大数据的应用现状和**进展。本书内容丰富,深入浅出,同时配有大量实操代码和应用案例,可作为学习大数据的入门和进阶教材。本书可供高校相关专业高年级本科生或研究生使用,也可供有志于从事大数据相关工作的各界社会人士学习使用。
目录:
第1章大数据概述
1.1大数据发展历程
1.2大数据主要特征
1.3大数据与云计算、人工智能和物联网
1.4大数据发展现状和趋势
习题
第2章大数据采集
2.1大数据采集概述
2.1.1大数据的来源
2.1.2大数据的采集
2.2海量日志采集系统Flume
2.2.1Flume简介
2.2.2Flume的组成
2.2.3Flume的工作流程
2.2.4Flume的数据流模型
2.2.5Flume实战
2.3分布式发布订阅消息系统Kafka
2.3.1Kafka简介
2.3.2Kafka的架构
2.3.3Kafka的应用场景
2.3.4Kafka实战
习题
第3章大数据存储基础
3.1HDFS简介
3.1.1HDFS的设计目标
3.1.2HDFS的局限性
3.2HDFS的体系架构
3.2.1数据块
3.2.2名称节点和数据节点
3.2.3第二名称节点
3.3HDFS运行原理
3.3.1副本机制
3.3.2数据出错与恢复
3.3.3HDFS文件读流程
3.3.4HDFS文件写流程
3.4HDFS编程实践
3.4.1利用Shell命令与HDFS进行交互
3.4.2利用Web界面管理HDFS
3.4.3使用JavaAPI访问HDFS
习题
第4章大数据存储进阶
4.1从关系型数据库到NoSQL数据库
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价