【现货速发】大数据概论
全新正版书籍,24小时发货,可开发票。
¥
43.5
7.4折
¥
59
全新
库存7件
作者陈明
出版社科学出版社
ISBN9787030424679
出版时间2023-02
装帧平装
开本其他
定价59元
货号25336817
上书时间2024-11-24
商品详情
- 品相描述:全新
- 商品描述
-
导语摘要
本书主要介绍大数据概论,内容包括大数据概述、科学研究第四范式、分布系统设计的CAP理论、NoSQL数据库、复杂网络、MapReduce分布编程模型、大数据存储、大数据分析、大数据挖掘、大数据可视化、大数据安全、大数据机器学习、大数据推荐技术,以及数据科学与数据思维。全书对上述内容概念性地介绍,语言精练、内容全面。
目录
前言
章 大数据概述 1
1.1 问题的提出 2
1.1.1 电子数据迅速增加 2
1.1.2 数据孕育巨大的经济价值 3
1.1.3 数据是国家的核心资产 4
1.2 大数据的产生源泉 4
1.2.1 互联网世界 5
1.2.2 物理世界 6
1.3 大数据的概念 7
1.3.1 数据容量 7
1.3.2 数据类型 8
1.3.3 价值密度 8
1.3.4 数据传播速度 9
1.3.5 真实性 9
1.4 大数据的特性 9
1.4.1 价值 9
1.4.2 非结构性 9
1.4.3 不完备性 10
1.4.4 时效性 10
1.4.5 安全性 10
1.4.6 可靠性 10
1.5 大数据技术概述 10
1.5.1 大数据技术的主要内容 11
1.5.2 大数据的处理过程 12
1.5.3 大数据技术的特征 13
1.5.4 大数据的关键问题与关键技术 14
1.6 大数据应用趋势 16
1.6.1 大数据细分市场 17
1.6.2 大数据推动企业发展 17
1.6.3 大数据分析的新方法出现 17
1.6.4 大数据与云计算高度融合 17
1.6.5 大数据一体设备陆续出现 17
1.6.6 大数据安全日益重视 18
1.7 大数据应用 18
1.7.1 判断大数据应用成功的指标 18
1.7.2 大数据技术的应用 19
1.8 大数据的展望 22
1.8.1 资源与投入 23
1.8.2 工程技术 23
1.8.3 复杂网络分析 23
1.8.4 涉及众多领域 23
1.8.5 构建大数据生态环境 23
本章小结 23
第2章 科学研究四种范式 24
2.1 科学研究范式 25
2.1.1 科学实验特点 25
2.1.2 科学实验步骤 26
2.1.3 科学实验分类 26
2.1.4 科学实验构成 27
2.1.5 科学实验程序 28
2.1.6 科学研究范式使用原则 29
2.2 科学研究第二范式 30
2.2.1 科学理论的特征 30
2.2.2 科学理论的结构 31
2.2.3 科学理论的价值 31
2.2.4 建立科学理论体系的一般方法 32
2.3 科学研究第三范式 33
2.3.1 概述 33
2.3.2 离散模型的模拟 34
2.3.3 连续系统的模拟 35
2.3.4 模拟语言 35
2.4 科学研究第四范式 36
2.4.1 数据密集型计算 36
2.4.2 格雷法则 38
2.4.3 第四范式的核心内容 40
本章小结 41
第3章 分布系统设计的CAP 理论 42
3.1 分布式系统的伸缩性 42
3.1.1 可伸缩性的概念 43
3.1.2 影响横向扩展的主要因素 44
3.2 横向扩展方案 47
3.2.1 可伸缩共享数据库 47
3.2.2 对等复制的横向扩展方案 48
3.2.3 链接服务器和分布式查询 49
3.2.4 分布式分区视图 50
3.2.5 数据依赖型路由的横向扩展 50
3.3 CAP 理论 51
3.3.1 分布系统设计的核心系统需求 51
3.3.2 CAP 定理 53
3.4 BASE 模型 56
3.4.1 三个核心需求分析 56
3.4.2 ACID、BASE 与CAP 的关系 57
3.4.3 CAP 与延迟 58
3.4.4 CAP 理论的进一步研究 58
3.5 Web 分布式系统设计 60
3.5.1 系统核心需求 60
3.5.2 系统服务 61
3.5.3 冗余 62
3.5.4 分区 62
本章小结 64
第4章 NoSQL 数据库 65
4.1 NoSQL 概述 65
4.1.1 非结构化问题 65
4.1.2 NoSQL 的产生 66
4.2 NoSQL 的特点与问题 67
4.2.1 NoSQL 的特点 67
4.2.2 NoSQL 问题 68
4.3 NoSQL 的主要存储方式 69
4.3.1 键值存储方式 69
4.3.2 文档存储方式 72
4.3.3 列存储方式 73
4.3.4 图形存储方式 76
4.3.5 各种典型的存储方式所对应的NoSQL 数据库 77
4.4 常用的NoSQL 数据库 78
4.4.1 Cassandra 78
4.4.2 Lucene/Solr 78
4.4.3 Riak 79
4.4.4 CouchDB 79
4.4.5 Neo4J 79
4.4.6 Oracle 的NoSQL 79
4.4.7 Hadoop 的HBase 79
4.4.8 Bigtable/ Accumulo/ Hypertable 80
4.4.9 DynamoDB 80
4.4.10 MongoDB 80
本章小结 82
第5章 复杂网络 83
5.1 概述 83
5.1.1 复杂网络概念 84
5.1.2 社会网络概述 84
5.1.3 社会计算 86
5.2 社会网络应用 87
5.2.1 知识获取分析 87
5.2.2 知识类型与传递 88
5.2.3 知识创新 89
5.3 社会网络分析 89
5.3.1 社会网络分析概述 89
5.3.2 社会网络分析的原理 90
5.3.3 社会网络分析的特征 90
5.3.4 社会网络分析的常用方法 90
5.4 社会网络中的隐私保护 91
5.4.1 用户隐私面临的威胁 92
5.4.2 身份隐私攻击与保护 93
5.4.3 面向用户关系的攻击及保护 93
5.4.4 万维网用户隐私保护规范 93
5.5 社会感知计算 94
5.5.1 社会感知计算概念 94
5.5.2 社会感知计算的主要内容 94
5.6 人类通信方式 95
5.6.1 通信方式的演化 95
5.6.2 六度分隔理论 96
5.6.3 150 法则 98
5.6.4 唯象理论与唯象方法 98
5.7 社交网站 99
5.7.1 社交网站概述 99
5.7.2 社交网站的作用 99
5.7.3 移动社交网络 100
5.7.4 Web 2.0 网站 101
5.7.5 Web 2.0 开发平台与必备要素 104
5.7.6 Web 3.0 网站 105
本章小结 105
第6章 MapReduce 分布编程模型 106
6.1 函数式编程范式 106
6.1.1 函数型语言 106
6.1.2 函数式编程 107
6.2 映射函数与化简函数 108
6.2.1 映射与映射函数 108
6.2.2 化简与化简函数 109
6.3 MapReduce 计算 110
6.4 基于Hadoop 平台的分布式计算 111
6.4.1 Hadoop 概述 111
6.4.2 分布式系统与Hadoop 112
6.4.3 SQL 数据库和Hadoop 113
6.4.4 基于Hadoop 的分布式计算 114
本章小结 119
第7章 大数据存储 120
7.1 大数据存储概述 120
7.1.1 大数据存储模型 121
7.1.2 大数据存储问题 121
7.2 存储方式 122
7.2.1 存储介质 122
7.2.2 直接连接存储 122
7.2.3 网络连接存储 124
7.2.4 存储域网络存储 125
7.2.5 IP-SAN 126
7.2.6 三种存储方式的比较 126
7.3 大数据的存储 127
7.3.1 数据容量问题 127
7.3.2 大图数据 127
7.3.3 分布式存储的架构 129
7.3.4 数据存储管理 130
7.4 数据云存储 132
7.4.1 云存储的意义与问题 133
7.4.2 技术措施 133
7.5 数据存储的可靠性 135
7.5.1 磁盘与磁盘阵列的可靠性 136
7.5.2 文件系统的可靠性 138
本章小结 138
第8章 大数据分析 139
8.1 数据分析概述 140
8.1.1 数据分析的概念 140
8.1.2 数据分析的目的与意义 140
8.1.3 数据分析的基本方法 141
8.1.4 数据分析的类型 146
8.1.5 数据分析的步骤 147
8.2 大数据分析基础 147
8.2.1 可视化分析 148
8.2.2 数据挖掘 148
8.2.3 大数据预测分析 148
8.2.4 语义引擎 148
8.2.5 数据质量和数据管理 148
8.2.6 大数据的离线与在线分析 148
8.3 大数据预测分析 149
8.3.1 大数据预测分析关键因素 150
8.3.2 大数据预测分析演进方向 150
8.3.3 大数据预测分析相关问题 151
8.3.4 舆情监测与分析 152
8.3.5 舆情报告图表制作 153
8.4 大数据分析应用 154
8.4.1 为客户提供服务 154
8.4.2 优化业务流程 154
8.4.3 改善生活 155
8.4.4 提高医疗条件 155
8.4.5 提高体育成绩 155
8.4.6 优化机器和设备性能 155
8.4.7 改善安全和执法 155
8.4.8 改进和优化城市 155
8.4.9 金融交易 156
8.4.10 电信业务 156
8.4.11 销售 156
8.5 大数据分析平台与工具 156
8.5.1 大数据分析基础平台 156
8.5.2 大数据分析的工具 158
本章小结 160
第9章 大数据挖掘 161
9.1 数据挖掘概述 162
9.1.1 数据挖掘的定义 162
9.1.2 数据挖掘的分类 163
9.1.3 数据挖掘的技术 163
9.2 数据挖掘对象与过程 164
9.2.1 数据挖掘对象 164
9.2.2 数据挖掘过程 164
9.2.3 数据挖掘过程工作量 165
9.3 数据挖掘的常用方法 166
9.3.1 神经网络方法 166
9.3.2 遗传算法 166
9.3.3 决策树方法 166
9.3.4 粗集方法 166
9.3.5 覆盖正例排斥反例方法 167
9.3.6 统计分析方法 167
9.3.7 模糊集方法 167
9.4 数据挖掘的几个问题 167
9.4.1 数据挖掘与数据分析的区别 167
9.4.2 数据挖掘与数据仓库 167
9.4.3 数据挖掘和OLAP 的比较 168
9.4.4 数据挖掘与人工智能 169
9.4.5 软硬件发展对数据挖掘的影响 169
……
0章 大数据可视化 182
1章 大数据安全 199
2章 大数据机器学习 218
3章 大数据推荐技术 230
4章 数据科学与数据思维 246
参考文献 265
内容摘要
本书主要介绍大数据概论,内容包括大数据概述、科学研究第四范式、分布系统设计的CAP理论、NoSQL数据库、复杂网络、MapReduce分布编程模型、大数据存储、大数据分析、大数据挖掘、大数据可视化、大数据安全、大数据机器学习、大数据推荐技术,以及数据科学与数据思维。全书对上述内容概念性地介绍,语言精练、内容全面。
— 没有更多了 —
以下为对购买帮助不大的评价