大数据 基础、技术与应用
全新正版 极速发货
¥
36.67
6.5折
¥
56
全新
库存5件
作者俞东进,孙笑笑,王东京 等 编
出版社科学出版社
ISBN9787030714473
出版时间2022-01
装帧平装
开本16开
定价56元
货号1202590825
上书时间2024-05-27
商品详情
- 品相描述:全新
- 商品描述
-
目录
第1章大数据概述
1.1大数据发展历程
1.2大数据主要特征
1.3大数据与云计算、人工智能和物联网
1.4大数据发展现状和趋势
习题
第2章大数据采集
2.1大数据采集概述
2.1.1大数据的来源
2.1.2大数据的采集
2.2海量日志采集系统Flume
2.2.1Flume简介
2.2.2Flume的组成
2.2.3Flume的工作流程
2.2.4Flume的数据流模型
2.2.5Flume实战
2.3分布式发布订阅消息系统Kafka
2.3.1Kafka简介
2.3.2Kafka的架构
2.3.3Kafka的应用场景
2.3.4Kafka实战
习题
第3章大数据存储基础
3.1HDFS简介
3.1.1HDFS的设计目标
3.1.2HDFS的局限性
3.2HDFS的体系架构
3.2.1数据块
3.2.2名称节点和数据节点
3.2.3第二名称节点
3.3HDFS运行原理
3.3.1副本机制
3.3.2数据出错与恢复
3.3.3HDFS文件读流程
3.3.4HDFS文件写流程
3.4HDFS编程实践
3.4.1利用Shell命令与HDFS进行交互
3.4.2利用Web界面管理HDFS
3.4.3使用JavaAPI访问HDFS
习题
第4章大数据存储进阶
4.1从关系型数据库到NoSQL数据库
4.1.1关系型数据库
4.1.2NoSQL简介
4.1.3NoSQL的基础理论
4.1.4NoSQL的四大类型
4.2分布式数据库HBase概述
4.2.1HBase简介
4.2.2HBase数据模型
4.2.3HBase体系结构
4.2.4HBase工作原理
4.3HBase编程实践
4.3.1安装HBase
4.3.2HBase配置
4.3.3HBaseShell命令
习题
第5章大数据计算
5.1MapReduce概述
5.1.1MapReduce来源
5.1.2MapReduce设计思想
5.1.3MapReduce的优缺点
5.2MapReduce工作流程
5.2.1MapReduce基本架构
5.2.2MapReduce运行机制
5.2.3MapReduce内部逻辑
5.3MapReduce实例分析
5.3.1WordCount设计思路
5.3.2WordCount数据处理流程
5.3.3WordCount编程实现
5.4Spark概述
5.4.1Spark简介
5.4.2Spark生态圈
5.5Spark工作流程
5.5.1基本概念
5.5.2架构设计
5.5.3运行流程
5.5.4RDD算子
习题
第6章多维大数据分析
6.1多维数据模型
6.1.1数据立方体
6.1.2多维数据模型
6.1.3概念分层
6.1.4多维数据模型中的OLAP操作
6.1.5多维数据模型的优缺点
6.2多维分析工具Hive
6.2.1Hive简介
6.2.2数据仓库与数据库
6.2.3Hive的架构及工作原理
6.2.4Hive的数据类型
6.2.5Hive的数据模型
6.2.6Hive实战
习题
第7章大数据挖掘
7.1数据挖掘概述
7.1.1数据挖掘简介
7.1.2数据预处理
7.1.3数据挖掘任务
7.2分类
7.2.1分类模型
7.2.2决策树
7.2.3支持向量机
7.3回归
7.3.1回归模型
7.3.2线性回归
7.3.3多项式回归
7.4聚类
7.4.1聚类模型
7.4.2k均值算法
7.4.3DBSCAN算法
7.5关联分析
7.5.1关联分析模型
7.5.2Apriori算法
7.5.3FP-growth算法
习题
第8章大数据可视化
8.1数据可视化概述
8.1.1数据可视化简介
8.1.2数据可视化的发展历程
8.1.3数据可视化的作用
8.2数据可视化方法
8.2.1高维大数据可视化
8.2.2网络和层次大数据可视化
8.2.3时空大数据可视化
8.2.4文本大数据可视化
8.3数据可视化工具
8.3.1ECharts
8.3.2Tableau
8.3.3D
习题
第9章大数据与人工智能
9.1人工智能概述
9.1.1人工智能简介
9.1.2人工智能核心技术
9.1.3人工智能与大数据的应用
9.1.4人工智能与大数据的关系
9.1.5大数据领域的人工智能展望
9.2机器学习与大数据
9.2.1大规模机器学习优化算法
9.2.2大数据下的机器学习
9.3深度学习与大数据
9.3.1典型深度学习算法
9.3.2大数据下的深度学习
习题
第10章政务大数据
10.1智慧政务概述
10.1.1政务信息化发展历史
10.1.2智慧政务内涵
10.1.3“最多跑一次”改革
10.2政务大数据体系架构
10.2.1政务大数据概述
10.2.2政务大数据总体架构
10.2.3政务大数据安全
10.3政务大数据与区块链
10.3.1区块链概述
10.3.2推动政务数据“上链”
10.3.3基于区块链的政务大数据共享和交换
习题
第11章商业大数据
11.1商业智能与大数据
11.1.1传统商业智能
11.1.2大数据时代的商业智能
……
内容摘要
本书围绕大数据采集、汇聚、存储、计算、分析、挖掘、可视化等处理全过程,基于Flume、Kafka、HDFS、HBase、MapReduce、Spark、Hive、ECharts等主流软件全面介绍大数据的基础原理和核心技术,以及人工智能、云计算和物联网等大数据相关内容,并在此基础上进一步阐述政务、商业等行业大数据,以及文本、图像、音频、视频等媒体大数据的应用现状和**进展。本书内容丰富,深入浅出,同时配有大量实操代码和应用案例,可作为学习大数据的入门和进阶教材。本书可供高校相关专业高年级本科生或研究生使用,也可供有志于从事大数据相关工作的各界社会人士学习使用。
— 没有更多了 —
以下为对购买帮助不大的评价