深入浅出GREENPLUM分布式数据库:原理、架构和代码分析
全新正版 现货速发
¥
28.4
5.7折
¥
49.8
全新
库存28件
作者王凤刚 著
出版社人民邮电出版社
ISBN9787115605054
出版时间2024-11
装帧平装
开本16开
定价49.8元
货号1203453053
上书时间2024-12-04
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
王凤刚
分布式数据库开源项目Greenplum和HAWQ的贡献者;
Greenplum相关产品工作经验9年;
500强企业服务经验14年;
云计算和分布式系统的开发和运维经验18年。
目录
第 1篇 原理篇
第 1章 云计算时代的数据库 2
1.1 数据库的历史和发展 2
1.2 云计算带来的挑战 3
1.3 云原生数据库的主要特点 3
第 2章 分布式数据库基础理论和架构 5
2.1 分布式数据库理论概述 5
2.1.1 CAP理论和BASE理论 5
2.1.2 一致性算法 6
2.2 典型的分布式数据库 9
2.2.1 OLTP型数据库 9
2.2.2 OLAP型数据库 9
2.2.3 HTAP型数据库 9
第3章 并发控制 10
3.1 概述 10
3.2 并发控制的分类 10
3.3 基于锁的并发控制 11
3.4 基于时间戳的并发控制 12
3.5 基于验证法的乐观并发控制 13
3.6 MVCC技术 13
3.7 快照隔离技术 16
3.8 可序列化快照隔离 17
3.9 死锁管理 20
3.10 B*树和LSM树 25
第 2篇 Greenplum架构和源码分析
第4章 Greenplum总体架构 30
4.1 概述 30
4.2 数据库通信协议 33
4.2.1 启动阶段 35
4.2.2 取消请求 36
4.2.3 常规阶段 36
4.3 Greenplum的架构和核心引擎 38
4.3.1 Greenplum主要模块介绍 38
4.3.2 通用场景 40
4.3.3 Interconnect模块 42
4.3.4 gang和slice 54
第5章 分布式事务的实现 62
5.1 分布式事务的原理和两阶段提交 62
5.1.1 事务隔离 62
5.1.2 两阶段提交 65
5.2 steal/force和WAL协议 66
5.3 PostgreSQL事务处理和状态机介绍 68
5.3.1 PostgreSQL事务处理 69
5.3.2 PostgreSQL状态机 70
5.4 分布式事务状态机 72
5.5 简单完整的分布式事务 75
5.5.1 初始化和begin命令 75
5.5.2 insert命令 79
5.5.3 两阶段提交的实现 81
5.6 分布式事务如何容错 93
第6章 分布式计算的实现 100
6.1 Greenplum的执行计划 100
6.1.1 查询优化器 100
6.1.2 Greenplum的统计信息 102
6.1.3 Legacy优化器概述 102
6.1.4 Orca优化器简介 109
6.2 运行执行器的算子 111
6.2.1 常规算子 111
6.2.2 具有特殊功能的算子 114
6.2.3 Motion算子 117
6.2.4 运行执行器综述 118
6.3 本地共享快照 122
6.4 分布式快照 125
6.4.1 分布式快照的实现方式 125
6.4.2 可见性判断 129
6.5 共享内存 133
6.6 哈希和重分布 134
第7章 分布式存储的实现 140
7.1 Greenplum数据的分布方式 140
7.1.1 哈希分布 140
7.1.2 随机分布 141
7.1.3 复制分布 142
7.2 Greenplum数据库的高可用性 142
7.3 heap表和AO表 143
7.4 外部表存储 144
7.4.1 Libcurl库函数 145
7.4.2 外部表协议gpfdist 146
7.4.3 Scan算子和gpfdist客户端 148
7.4.4 gpfdist服务端 153
第3篇 数据库和新技术
第8章 云原生数据库 158
8.1 Greenplum的云原生尝试 158
8.2 VMware多云战略和Greenplum 159
8.3 HAWQ项目介绍 160
第9章 新技术的机遇 162
9.1 NVM存储技术 162
9.2 虚拟化技术 163
9.3 容器技术 164
内容摘要
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的“全景图”。
本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。
本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者和学者,也可作为高校计算机类专业的分布式数据库相关课程的参考资料。
主编推荐
实践导向:本书打破传统理论介绍模式,深入剖析Greenplum分布式数据库的工业化实现,涵盖分布式事务、计算和存储,为读者提供从理论到实践的全面解析。
源码级分析:作者凭借丰富的Greenplum一线经验,对Greenplum的架构和源码进行深入讲解,帮助读者更直观地理解分布式数据库的相关理论。
技术前瞻:探讨云原生数据库和新技术为分布式数据库带来的机遇与挑战,为数据库领域的科研工作者和开发者指明研究方向和发展趋势。
— 没有更多了 —
以下为对购买帮助不大的评价