商品简介
近年来,基础软件的发展越来越受到重视,越来越多的计算机从业者对数据管理系统和大数据的知识产生了强烈的需求。
本书既介绍了数据管理系统的技术发展史,又介绍了数据管理系统的关键技术内涵,同时还介绍了一系列主流的商业化产品及其架构,并对前沿技术进行了讨论分析,给出作者自己的见解和洞察。本书内容主要包括数据库与大数据的诞生、发展和商业应用,数据库与大数据之间的关系,国产数据库的国际化,数据管理系统的共同之处,数据管理系统的算法理论、前沿技术等。
本书适合数据管理系统或大数据方向的技术人员和科研人员阅读,也适合互联网科技公司的技术人员及管理人员,以及对特定领域的商业和历史感兴趣的读者阅读。
作者简介
吴垚,毕业于中国人民大学,是中国人民大学和加利福尼亚大学尔湾分校(UCI)联合培养的博士,目前就职于华为公司加拿大研究院。其国内导师陈红是CCF数据库专委委员,国家科技进步二等奖获得者;国外导师MichaelJ.Carey是美国工程院院士、ACM和IEEEFellow。博士在读期间作者参与的项目包括:物联网搜索中的隐私保护研究、新一代高时效安全可靠流数据系统、“BigActiveData:FromPetabyteDatatoMillionPeople”等。毕业后就职于华为高斯部门,先后在高斯产品部、高斯实验室和多伦多实验室工作,在GaussDB、XYKernel、HPKernel等项目中参与AP数据库、AI数据库、TP数据库的研发。
目录
第 1篇 数据管理系统之数据库——掌上明珠
第 1章 数据库的诞生——“图灵”奖经典人物3
1.1 网状数据管理系统4
1.2 关系数据库模型6
1.3 数据库并发与事务8
1.4 数据库优化与实践10
1.5 小结13
1.6 参考资料13
第 2章 数据库的工业繁荣——商业机遇14
2.1 System R14
2.2 PostgreSQL16
2.3 Oracle18
2.4 MySQL20
2.5 IBM Db223
2.6 SQL Server27
2.7 小结29
2.8 参考资料30
第3章 国产数据库的热潮——四大家族31
3.1 人大金仓31
3.2 南大通用32
3.3 武汉达梦32
3.4 神舟通用33
3.5 小结34
3.6 参考资料35
第 2篇 数据管理系统之大数据——异军突起
第4章 大数据降临——生逢其时39
4.1 Google的“三驾马车”39
4.1.1 GFS40
4.1.2 MapReduce系统41
4.1.3 Bigtable系统42
4.2 Amazon的“云上时代”43
4.3 Facebook的“社交帝国”44
4.4 LinkedIn的“职业摇篮”46
4.5 学术界的徘徊辗转48
4.6 小结49
4.7 参考资料49
第5章 大数据分布式系统——高潮迭起50
5.1 容错内存迭代式计算50
5.2 实时流式大数据计算52
5.2.1 Storm系统52
5.2.2 Flink系统53
5.3 大规模机器学习系统54
5.4 数据中心的资源管理56
5.5 全球分布式数据服务58
5.6 小结59
5.7 参考资料59
第6章 开源整合架构演进——融会贯通60
6.1 链家架构演进60
6.1.1 大数据平台架构演进60
6.1.2 日志平台设计与技术61
6.2 美团架构演进62
6.2.1 由浅入深架构解析62
6.2.2 基础系统架构演进64
6.3 Airbnb架构演进65
6.3.1 大数据平台架构解析65
6.3.2 平台发展的经验和教训66
6.4 58同城架构演进68
6.4.1 大数据三层平台架构68
6.4.2 关键技术演进与实现70
6.5 滴滴出行架构演进71
6.5.1 实时计算平台架构演进71
6.5.2 实时计算平台架构72
6.6 小米架构演进73
6.6.1 流式平台整体架构73
6.6.2 3个阶段的演进历程74
6.7 小结77
6.8 参考资料77
第7章 大数据的魅力——广泛应用78
7.1 工业应用78
7.2 银行金融79
7.3 智慧城市81
7.4 健康医疗82
7.5 小结83
7.6 参考资料84
第3篇 大数据管理系统——谁主沉浮
第8章 数据库与大数据之战——华山论剑87
8.1 ACM双方论战87
8.2 MPP绝对优势89
8.3 大数据强势发展91
8.4 数据库自我革命94
8.5 NewSQL兼容并包96
8.6 老牌数据库的反击99
8.7 小结101
8.8 参考资料102
第9章 大数据管理系统——求同存异103
9.1 Hadoop生态104
9.2 BDAS平台105
9.3 AsterixDB系统106
9.4 Apache Beam框架108
9.5 SnappyData模型109
9.6 SageDB愿景110
9.7 ShardingSphere项目112
9.8 小结114
9.9 参考资料115
第 10章 新型数据管理系统——百花齐放116
10.1 大数据输入和输出116
10.2 大数据调度管控119
10.3 大数据用户交互123
10.4 大数据安全隐私124
10.5 大数据新型引擎127
10.6 大数据通用语言129
10.7 大数据网络赋能130
10.8 小结134
10.9 参考资料135
第 11章 国产数据库的国际化——齐头并进137
11.1 TiDB137
11.1.1 研发背景137
11.1.2 早期架构138
11.1.3 架构升级139
11.1.4 稳定架构140
11.2 OceanBase142
11.2.1 设计考量142
11.2.2 架构演进144
11.2.3 厚积薄发150
11.3 TDSQL150
11.3.1 分布式TDSQL 150
11.3.2 分析型TBase 152
11.3.3 云原生CynosDB 153
11.3.4 产品战略统一154
11.4 GaussDB155
11.4.1 OLTP成长史155
11.4.2 OLAP成长史156
11.4.3 HTAP成长史157
11.4.4 AI-Native成长史157
11.5 Bigflow158
11.6 ByteGraph160
11.7 小结163
11.8 参考资料164
第4篇 大数据管理系统的架构——路在何方
第 12章 高速电子计算机与大数据管理系统——万法归宗167
12.1 以计算为中心的计算机167
12.2 以存储为中心的数据机170
12.3 大数据管理的系统模型172
12.4 数据管理系统的总结抽象176
12.5 小结178
12.6 参考资料179
第 13章 无处不在的操作系统——归纳演绎180
13.1 计算机的操作系统180
13.2 数据管理系统的操作系统184
13.3 数据中心的操作系统185
13.4 资源抽象与应用接口189
13.5 小结192
13.6 参考资料192
第 14章 大数据管理系统的未来架构——沙漠绿洲194
14.1 大数据操作系统195
14.1.1 数据输入197
14.1.2 数据存储198
14.1.3 数据计算200
14.1.4 数据控制201
14.1.5 数据输出202
14.2 自动化可插拔引擎203
14.3 分布式弹性数据模型203
14.4 易用抽象作业执行框架204
14.5 深度智能系统管理内核204
14.6 大数据管理系统biggy原型204
14.7 小结205
14.8 参考资料206
第5篇 大数据管理系统的精髓——无上心法
第 15章 大数据管理系统的基础——算法理论209
15.1 存储类算法209
15.1.1 大数据LSM的优势209
15.1.2 B+-Tree与LSM-Tree对比210
15.1.3 LSM的优化算法211
15.2 执行器算法212
15.2.1 Spark RDD中DAG的应用212
15.2.2 分布式数据库的算子运算213
15.2.3 大数据DAG与数据库算子的异同214
15.3 一致性算法214
15.3.1 常见一致性算法简介214
15.3.2 Paxos算法进阶深入215
15.3.3 一致性的Consensus与Consistency216
15.4 持久化算法218
15.4.1 经典的WAL218
15.4.2 前沿的WBL219
15.5 分布式算法220
15.5.1 分布式P2P协议220
15.5.2 一致性哈希算法220
15.6 事务类算法222
15.6.1 两阶段提交222
15.6.2 三阶段提交223
15.7 分布式容错机制224
15.7.1 分布式系统容错机制225
15.7.2 数据库系统容错机制227
15.7.3 工业实践与学术创新227
15.8 高并发控制机制229
15.8.1 并发控制类别229
15.8.2 并发控制实现230
15.9 系统健壮性机制232
15.10 小结234
15.11 参考资料234
第 16章 大数据管理系统的前沿——另辟蹊径236
16.1 数据上下文管理系统Ground236
16.2 自治数据管理系统Peloton239
16.3 分布式预测系统Clipper240
16.4 数据管理中人的作用CrowdDB241
16.5 新硬件带来的变革doppioDB242
16.6 端云协同实时数据库Firebase243
16.7 自组装数据库XuanYuan245
16.8 数据治理新思路Tamr248
16.9 系统性能调优AITuning249
16.10 小结253
16.11 参考资料253
第 17章 大数据管理系统的谜团——拨云见日255
17.1 分布式机器学习与分布式数据库255
17.2 分布式一致性与数据库一致性257
17.3 可变的数据与不可变的数据260
17.4 区块链与数据库的异同261
17.5 NewSQL与OldSQL263
17.6 云计算、边缘计算与物联网266
17.7 大数据Java还是C/C++270
17.8 流数据与批处理的界线270
17.9 分布式事务与递增式时间272
17.10 小结273
17.11 参考资料274
第 18章 大数据的标准——游戏规则275
18.1 TPC标准测试275
18.2 SQL通用语言277
18.3 顶级学术会议277
18.4 设计范式279
18.5 流行趋势281
18.6 研究机构283
18.7 小结284
18.8 参考资料284
附录285
A.工业与学术285
B.国产与国际286
C.开放与封闭288
D.资本与技术292
E.个人与企业295
F.过去与未来299
G.参考资料300
内容摘要
近年来,基础软件的发展越来越受到重视,越来越多的计算机从业者对数据管理系统和大数据的知识产生了强烈的需求。
本书既介绍了数据管理系统的技术发展史,又介绍了数据管理系统的关键技术内涵,同时还介绍了一系列主流的商业化产品及其架构,并对前沿技术进行了讨论分析,给出作者自己的见解和洞察。本书内容主要包括数据库与大数据的诞生、发展和商业应用,数据库与大数据之间的关系,国产数据库的国际化,数据管理系统的共同之处,数据管理系统的算法理论、前沿技术等。
本书适合数据管理系统或大数据方向的技术人员和科研人员阅读,也适合互联网科技公司的技术人员及管理人员,以及对特定领域的商业和历史感兴趣的读者阅读。
主编推荐
1.内容新颖,结构合理
本书结合大数据和数据库系统,从技术历史的角度介绍数据管理系统的发展,既有系统架构的演进,又有商业产品的兴衰,适合不同的读者。
2.案例丰富,深入浅出
本书有针对性地介绍了如Oracle、IBM、Google等公司数据库和大数据产品的迭代,也介绍了关于Spark、MySQL、TiDB等主流系统的架构设计,同时有对分布式算法、一致性算法等的讲解。从公司、产品、技术、人物等角度列举了诸多实例。
3.配套资源,优化学习
读者可到异步社区网站下载与本书配套的彩图,方便读者提升学习效果
【内容简介】
以下为对购买帮助不大的评价