• 大数据十讲
21年品牌 40万+商家 超1.5亿件商品

大数据十讲

全新正版 极速发货

53.28 5.6折 95 全新

库存20件

广东广州
认证卖家担保交易快速发货售后保障

作者周烜,陈志广 编

出版社机械工业出版社

ISBN9787111736813

出版时间2024-01

装帧平装

开本32开

定价95元

货号1203177779

上书时间2024-10-05

徐小智的书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
丛书序

“十讲”序

前言

第1讲 大数据存储系统

1.1 大规模云存储系统/2

1.1.1 云存储系统架构/2

1.1.2 云存储资源管理与数据布局/5

1.1.3 大规模索引系统/12

1.2 大规模文件系统/17

1.2.1 本地文件系统/17

1.2.2 网络文件系统/23

1.3 本讲小结与展望/34

参考文献/34

第2讲 分布式数据库

2.1 NoSQL与NewSQL/38

2.1.1 NoSQL发展历史/38

2.1.2 键值存储/42

2.1.3 文档数据库/50

2.1.4 图数据库/56

2.1.5 NewSQL代表/60

2.2 分布式数据库架构/70

2.2.1 共享存储型/70

2.2.2 无共享型/72

2.2.3 计算、内存与存储分离型/74

2.2.4 架构对比/76

2.3 数据分片与复制/78

2.3.1 数据分片/78

2.3.2 数据复制/80

2.3.3 CAP定理/82

2.3.4 分布式一致性协议/85

2.4 分布式数据处理/90

2.4.1 分布式事务处理/90

2.4.2 分布式查询处理/93

2.5 本讲小结与展望/98

参考文献/99

第3讲 大数据处理系统——批处理

3.1 Hadoop MapReduce/103

3.1.1 Hadoop MapReduce概述/103

3.1.2 Hadoop MapReduce架构和核心组件/104

3.1.3 Hadoop MapReduce执行过程/105

3.1.4 MapReduce编程案例/109

3.1.5 Hadoop生态/112

3.2 Apache Spark/114

3.2.1 Spark概述/114

3.2.2 Spark框架/115

3.2.3 Spark编程实例/123

3.2.4 Spark工具集/126

3.3 本讲小结与展望/129

参考文献/130

第4讲 流计算系统

4.1 流计算系统概述/134

4.1.1 流数据与流计算/134

4.1.2 流计算系统的演进/134

4.1.3 流计算系统的研究挑战/135

4.2 数据管理视角的流计算系统/137

4.2.1 编程接口/139

4.2.2 执行计划/144

4.2.3 资源调度/153

4.2.4 故障容错/157

4.3 本讲小结与展望/163

参考文献/164

第5讲 大图数据处理系统

5.1 大图数据处理系统概述/168

5.1.1 大图数据特点及查询/168

5.1.2 大图数据处理特征及挑战/170

5.1.3 经典大图数据处理系统/171

5.2 计算机制/173

5.2.1 以顶点为中心的计算机制/174

5.2.2 以边为中心的计算机制/176

5.2.3 以子图为中心的计算机制/177

5.3 通信机制/179

5.3.1 共享内存/179

5.3.2 消息传递/181

5.4 图划分机制/181

5.4.1 边切分/182

5.4.2 点切分/184

5.4.3 混合切分/186

5.5 任务调度机制/187

5.5.1 同步调度/188

5.5.2 异步调度/189

5.5.3 混合调度/191

5.6 新硬件加速机制/192

5.6.1 基于RDMA的通信优化/192

5.6.2 基于GPU的计算优化/195

5.7 本讲小结与展望/198

参考文献/200

第6讲 大数据分析——算法设计

6.1 大数据的统计特征估算算法/204

6.1.1 采样估算算法/205

6.1.2 Sketch估算算法/209

6.1.3 相关应用/216

6.2 大数据的成员查找算法/219

6.2.1 概率型成员查找算法/219

6.2.2 人工智能赋能的成员查找算法/226

6.2.3 相关应用/228

6.3 大数据的近邻查找算法/231

6.3.1 准确近邻查找算法/233

6.3.2 近似近邻查找算法/235

6.3.3 相关应用与潜在研究方向/248

6.4 本讲小结与展望/250

参考文献/251

第7讲 大数据分析——机器学习

7.1 概述/254

7.1.1 机器学习、深度学习和人工智能/254

7.1.2 大数据和机器学习的关系/254

7.1.3 大数据上机器学习存在的问题和挑战/255

7.2 BigDL:分布式大数据AI平台/257

7.2.1 设计目标和架构/257

7.2.2 BigDL-Nano:对用户透明的性能加速/259

7.2.3 BigDL-Orca:从笔记本电脑到分布式大数据集群的无缝扩展/261

7.3 大数据AI在生产实践中的真实案例/265

7.3.1 案例1:基于时序预测的通信网络质量KPI监测/265

7.3.2 案例2:基于Transformer架构的分布式AI推荐系统/268

7.4 本讲小结与展望/271

参考文献/271

第8讲 图数据挖掘

8.1 图的基本定义及性质/274

8.1.1 柯尼斯堡七桥问题/274

8.1.2 图的基本定义/277

8.1.3 图的基本性质/279

8.2 图节点邻近度/283

8.2.1 图节点邻近度的度量/284

8.2.2 图节点邻近度的计算/287

8.3 图嵌入/299

8.3.1 基于矩阵分解的方法/299

8.3.2 基于随机游走的方法/303

8.4 图神经网络/306

8.4.1 图神经网络的起源和演变/307

8.4.2 可扩展图神经网络/310

8.4.3 复杂图神经网络/312

8.5 本讲小结与展望/315

参考文献/317

第9讲 大数据可视化

9.1 可视化发展历史与理论模型/320

9.1.1 早期的可视化/320

9.1.2 基本流程/323

9.2 概念、分类及主要方法/323

9.2.1 数据类型及视觉映射/324

9.2.2 高维与表格数据可视化/328

9.2.3 网络(图)数据可视化/334

9.2.4 层次结构数据可视化/337

9.2.5 时空数据可视化/343

9.2.6 文本数据可视化/346

9.3 可视分析/351

9.3.1 基本理论/351

9.3.2 可视化与可视分析案例/356

9.4 大规模数据管理/361

9.4.1 数据立方体/361

9.4.2 其他数据管理方法/366

9.5 常用可视化工具与软件/367

9.5.1 高维数据可视化工具/367

9.5.2 文本可视化工具/368

9.5.3 网络可视化工具/369

9.5.4 可视化构建工具/369

9.6 本讲小结与展望/373

参考文献/373

第10讲 工业大数据

10.1 引言/382

10.1.1 工业数据集/382

10.1.2 工业大数据/383

10.1.3 工业大数据生命周期/386

10.1.4 工业大数据应用场景/387

10.2 工业数据采集/388

10.2.1 总体架构/388

10.2.2 工业终端/389

10.2.3 工业现场协议/390

10.2.4 工业数据协议/392

10.3 工业时序数据库/393

10.3.1 设备建模与弱模式/394

10.3.2 编码与压缩/396

10.4 工业数据治理/399

10.4.1 工业数据集特点/399

10.4.2 工业数据集成框架/401

10.4.3 时序数据质量控制/402

10.5 工业时序数据分析/409

10.5.1 工业数据分析流程/409

10.5.2 时序数据分析方法/410

10.5.3 风机时序数据分析案例/415

10.6 本讲小结与展望/418

参考文献/418

内容摘要
当下,大数据已成为互联网、人工智能和数字化转型等的基础理论,宏观了解大数据前沿理论与技术,对于大数据方向的研究人员以及从事大数据开发的工程师来讲至关重要。本书由多位大数据领域专家学者合作完成,通过10章内容,深入浅出地阐述大数据的完整前沿知识体系,帮助读者以宏观视角把握大数据的发展方向和突破口,真正从普通开发者晋升为拥有大数据思维并能解决复杂问题的技术专家。本书既可作为大数据方向低年级研究生研究大数据技术的入门指南,也可作为从事大数据研究的科研人员的参考书。

主编推荐
大数据领域专家学者携手打造,系统构建知识体系
综述当下领域前沿研究方向、理论与技术
以宏观视野把握领域前沿,获取领域底层逻辑

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP