大数据导论
全新正版 极速发货
¥
36.93
6.3折
¥
59
全新
库存10件
作者罗军勇,胡学先,陈静 编
出版社科学出版社
ISBN9787030773227
出版时间2024-05
装帧平装
开本16开
定价59元
货号1203266524
上书时间2024-11-22
商品详情
- 品相描述:全新
- 商品描述
-
目录
第1章 大数据概述1
1.1 认知数据1
1.1.1 数据概念1
1.1.2 数据研究内容2
1.2 认知大数据5
1.2.1 大数据形成6
1.2.2 大数据概念7
1.2.3 大数据技术9
1.3 大数据表达12
1.4 大数据面临的挑战14
1.4.1 数据复杂性带来的挑战14
1.4.2 计算复杂性带来的挑战15
1.4.3 系统复杂性带来的挑战15
思考题16
第2章 大数据表达方法17
2.1 元数据17
2.1.1 元数据形成18
2.1.2 元数据概念20
2.1.3 元数据体系22
2.2 大数据的元数据24
2.2.1 大数据的元数据标准24
2.2.2 元数据管理25
2.3 知识表示26
2.3.1 知识的概念26
2.3.2 知识表示的概念26
2.3.3 命题逻辑与谓词逻辑29
2.3.4 语义网络32
2.3.5 本体33
2.3.6 语义Web35
2.4 知识图谱39
2.4.1 知识图谱概念40
2.4.2 知识图谱的数据模型40
2.4.3 知识图谱的向量表示43
思考题45
第3章 大数据存储46
3.1 数据存储基础46
3.1.1 数据存储概念46
3.1.2 磁盘存储原理48
3.1.3 磁盘阵列52
3.1.4 磁盘卷58
3.1.5 存储空间59
3.2 数据存储系统62
3.2.1 基于数据块的存储系统62
3.2.2 基于文件的存储系统64
3.2.3 基于对象的存储系统69
3.3 大数据存储现状69
3.3.1 大数据存储面对的挑战70
3.3.2 云存储71
思考题72
第4章 大数据管理73
4.1 数据管理相关知识73
4.1.1 数据管理概念73
4.1.2 数据管理模型75
4.1.3 数据管理系统76
4.2 大数据管理面临的主要问题79
4.3 分布式文件系统80
4.3.1 文件管理系统原理概述81
4.3.2 分布式文件管理系统原理85
4.3.3 典型的HDFS分布式文件系统90
4.4 NoSQL数据库系统96
4.4.1 关系模型98
4.4.2 非关系模型99
4.4.3 NoSQL数据存储109
4.4.4 NoSQL基本理论111
4.4.5 NoSQL体系框架112
思考题113
第5章 大数据计算115
5.1 计算系统及其体系结构115
5.2 计算服务系统及其体系结构118
5.3 大数据的计算类型及特点121
5.4 大数据的批量计算123
5.4.1 MapReduce及其计算123
5.4.2 Spark及其计算127
5.5 大数据的流式计算133
5.5.1 流数据概念及特点133
5.5.2 Spark Streaming及其流计算134
5.5.3 Storm及其流计算138
5.6 大数据的图计算141
5.6.1 BSP模型142
5.6.2 图计算系统Pregel145
思考题146
第6章 大数据分析148
6.1 大数据分析概念148
6.2 数据分析的基本方法149
6.2.1 数据分类算法149
6.2.2 数据聚类方法157
6.2.3 关联规则算法163
6.2.4 图数据分析168
6.3 数据分析的高级方法173
6.3.1 深度学习173
6.3.2 强化学习178
6.3.3 迁移学习180
思考题181
第7章 大数据可视化182
7.1 数据可视化概述182
7.1.1 可视化与可视化技术182
7.1.2 数据可视化概念183
7.1.3 数据可视化作用184
7.2 数据可视化技术186
7.2.1 数据基本统计特征的可视化186
7.2.2 高维数据的可视化189
7.2.3 面向大数据主流应用的信息可视化192
7.3 常用数据可视化工具198
7.3.1 基于Excel的数据可视化198
7.3.2 基于Tableau的数据可视化201
7.3.3 基于JavaScript开发的数据可视分析205
7.4 大数据可视化面临问题与挑战211
思考题212
第8章 大数据安全213
8.1 大数据安全概览213
8.1.1 大数据安全形势213
8.1.2 大数据安全威胁214
8.1.3 大数据安全需求214
8.2 大数据安全技术215
8.2.1 匿名认证技术215
8.2.2 访问控制安全技术220
8.2.3 数据存储完整性证明技术225
8.2.4 数据处理安全技术228
8.2.5 数据发布隐私保护技术234
思考题238
参考文献239
内容摘要
本书以数据的概念、研究任务和技术体系为基线展开,延展出大数据的概念、研究任务、技术挑战和技术体系。本书围绕大数据独有的特点,介绍大数据表达的概念和技术、大数据存储和管理技术的基础与拓展、大数据计算的特点与新技术、大数据分析的基本方法与前沿新技术、大数据可视化技术、大数据安全范畴及应对安全机制等内容。本书系统地梳理了大数据技术谱系,可为后续学习、应用和研究大数据奠定基础。
本书可作为数据科学与大数据技术或者相关本科专业的教材,也可作为其他专业学生学习大数据的参考书,还可作为从事大数据相关工作的工程技术人员的参考书。
— 没有更多了 —
以下为对购买帮助不大的评价