• Presto实战
  • Presto实战
  • Presto实战
  • Presto实战
  • Presto实战
  • Presto实战
21年品牌 40万+商家 超1.5亿件商品

Presto实战

全新正版 极速发货

64.25 6.5折 99 全新

库存7件

广东广州
认证卖家担保交易快速发货售后保障

作者(美)马特·富勒,(美)曼弗雷德·莫泽,(美)马丁·特拉韦尔索

出版社人民邮电出版社

ISBN9787115560056

出版时间2021-03

装帧平装

开本16开

定价99元

货号1202318950

上书时间2024-08-07

谢岳书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
译者序xv

序xvii

前言xix

第一部分Presto入门

第1章Presto介绍3

1.1大数据带来的问题3

1.2Presto来救场4

1.2.1为性能和规模而生5

1.2.2SQL-on-Anything5

1.2.3存储与计算分离6

1.3Presto使用场景6

1.3.1单一的SQL分析访问点7

1.3.2数据仓库和数据源系统的访问点7

1.3.3提供对任何内容的SQL访问8

1.3.4联邦查询9

1.3.5虚拟数据仓库的语义层9

1.3.6数据湖查询引擎9

1.3.7SQL转换和ETL10

1.3.8更快的响应带来更好的数据见解10

1.3.9大数据、机器学习和人工智能10

1.3.10其他使用场景11

1.4Presto资源11

1.4.1官方网站11

1.4.2文档12

1.4.3社区交流12

1.4.4源代码、许可证和版本12

1.4.5贡献12

1.4.6本书资源13

1.4.7鸢尾花数据集13

1.4.8航班数据集14

1.5Presto简史14

1.6小结15

第2章安装和配置Presto16

2.1使用Docker容器尝试Presto16

2.2使用归档文件安装17

2.2.1JVM17

2.2.2Python18

2.2.3安装18

2.2.4配置19

2.3添加数据源20

2.4运行Presto21

2.5小结21

第3章使用Presto22

3.1PrestoCLI22

3.1.1使用入门22

3.1.2分页25

3.1.3命令历史25

3.1.4额外诊断25

3.1.5执行查询25

3.1.6输出格式26

3.1.7忽略错误26

3.2PrestoJDBC驱动27

3.2.1下载和注册驱动28

3.2.2创建到Presto的连接29

3.3Presto与ODBC31

3.4客户端库31

3.5PrestoWebUI31

3.6使用Presto执行SQL32

3.6.1概念33

3.6.2入门案例33

3.7小结36

第二部分深入理解Presto

第4章Presto的架构39

4.1集群中的协调器和工作节点39

4.2协调器41

4.3节点发现服务41

4.4工作节点42

4.5基于连接器的架构42

4.6catalog、schema和表43

4.7查询执行模型44

4.8查询优化47

4.8.1解析和分析48

4.8.2初始查询计划49

4.9优化规则50

4.9.1谓词下推51

4.9.2CrossJoin消除51

4.9.3TopN52

4.9.4局部聚合52

4.10实现规则53

4.10.1LateralJoin去关联化53

4.10.2Semi-join(IN)去关联化54

4.11基于代价的优化器55

4.11.1代价的概念55

4.11.2Join的代价57

4.11.3表统计信息57

4.11.4过滤统计信息58

4.11.5分区表的统计信息59

4.11.6Join枚举60

4.11.7广播Join和分布式Join60

4.12使用表统计信息62

4.12.1Presto的ANALYZE命令62

4.12.2在写入存储时收集数据63

4.12.3Hive的ANALYZE命令63

4.12.4显示表统计信息63

4.13小结64

第5章生产环境部署65

5.1配置细节65

5.2服务端配置65

5.3日志66

5.4节点配置67

5.5JVM配置68

5.6启动器69

5.7集群安装70

5.8使用RPM安装72

5.8.1安装目录结构72

5.8.2配置73

5.8.3卸载Presto73

5.9在云上安装73

5.10集群规模的考量74

5.11小结74

第6章连接器75

6.1配置76

6.2RDBMS连接器示例:PostgreSQL76

6.2.1查询下推78

6.2.2并行性和并发性79

6.2.3其他RDBMS连接器80

6.2.4安全性81

6.3PrestoTPC-H和TPC-DS连接器81

6.4用于分布式存储数据源的Hive连接器82

6.4.1ApacheHadoop和Hive82

6.4.2Hive连接器83

6.4.3Hive式表格式85

6.4.4内部表与外部表85

6.4.5分区数据87

6.4.6加载数据88

6.4.7文件格式和压缩90

6.4.8MinIO示例91

6.5非关系数据源91

6.6PrestoJMX连接器92

6.7黑洞连接器94

6.8内存连接器94

6.9其他连接器95

6.10小结95

第7章高级连接器实例96

7.1用Phoenix连接HBase96

7.2键值存储连接器示例:Accumulo97

7.2.1使用PrestoAccumulo连接器100

7.2.2Accumulo中的谓词下推102

7.3ApacheCassandra连接器103

7.4流式系统连接器示例:Kafka104

7.5文档存储连接器示例:Elasticsearch106

7.5.1概述106

7.5.2配置和使用方法106

7.5.3查询处理107

7.5.4全文搜索107

7.5.5总结108

7.6Presto中的联邦查询108

7.7ETL和联合查询114

7.8小结114

第8章在Presto中使用SQL115

8.1Presto语句116

8.2Presto系统表118

8.3catalog120

8.4schema120

8.5InformationSchema121

8.6表122

8.6.1表和列属性124

8.6.2复制现有的表125

8.6.3从查询结果中新建表126

8.6.4修改表127

8.6.5删除表127

8.6.6连接器对表操作的127

8.7视图128

8.8会话信息和配置128

8.9数据类型129

8.9.1集合数据类型131

8.9.2时态数据类型132

8.9.3类型转换135

8.10SELECT语句基础136

8.11WHERE子句137

8.12GROUPBY和HAVING子句138

8.13ORDERBY子句和LIMIT子句140

8.14JOIN语句140

8.15UNION、INTERSECT和EXCEPT子句141

8.16分组操作143

8.17WITH子句144

8.18子查询145

8.18.1标量子查询145

8.18.2EXISTS子查询146

8.18.3集合比较子查询146

8.19从表中删除数据147

8.20小结147

第9章高级SQL特性148

9.1函数和运算符介绍148

9.2标量函数和运算符149

9.3布尔运算符150

9.4逻辑运算符151

9.5用BETWEEN语句选择范围152

9.6用IS(NOT)NULL检测值的存在152

9.7数学函数和运算符152

9.8三角函数153

9.9常数和随机函数154

9.10字符串函数和运算符154

9.11字符串和映射155

9.12Unicode156

9.13正则表达式158

9.14解嵌套复杂数据类型160

9.15JSON函数161

9.16日期和时间函数及运算符161

9.17直方图164

9.18聚合函数165

9.18.1映射聚合函数165

9.18.2近似聚合函数167

9.19窗函数168

9.20lambda表达式169

9.21地理空间函数170

9.22PreparedStatement171

9.23小结173

第三部分Presto的实际应用

第10章安全177

10.1认证178

10.2授权181

10.2.1系统访问控制181

10.2.2连接器访问控制184

10.3加密186

10.3.1加密Presto客户端与协调器之间的通信188

10.3.2创建Javakeystore和Javatruststore190

10.3.3在Presto集群内加密通信192

10.4CA与自签名证书193

10.5证书认证194

10.6Kerberos197

10.6.1前提条件198

10.6.2Kerberos客户端认证198

10.6.3集群内部Kerberos198

10.7数据源访问和安全配置199

10.8使用Hive连接器进行Kerberos验证200

10.8.1HiveMetastoreThrift服务认证201

10.8.2HDFS认证201

10.9集群分离202

10.10小结202

第11章将Presto与其他工具集成203

11.1使用ApacheSuperset进行查询、可视化和更多操作203

11.2使用RubiX提高性能204

11.3使用ApacheAirflow的工作流205

11.4嵌入式Presto示例:AmazonAthena205

11.5Starburst企业版Presto208

11.6其他集成案例208

11.7自定义集成209

第12章生产环境中的Presto211

12.1使用PrestoWebUI监控211

12.1.1集群级的细节212

12.1.2查询列表213

12.1.3查询细节视图215

12.2PrestoSQL查询调优221

12.3内存管理223

12.4任务并发性226

12.5工作节点调度227

12.5.1根据任务或节点调度切片227

12.5.2本地调度策略227

12.6网络数据交换228

12.6.1并发性228

12.6.2缓冲区大小228

12.7JVM调优228

12.8资源组230

12.8.1资源组的定义231

12.8.2调度策略232

12.8.3选择器规则定义233

12.9小结233

第13章真实世界的案例234

13.1部署和运行时平台234

13.2集群规模235

13.3Hadoop/Hive迁移的使用场景237

13.4其他数据源237

13.5用户和流量237

13.6小结238

第14章总结239

关于作者240

关于封面240

内容摘要
随着各行各业对大数据实时查询的需求持续增长,数据查询及分析引擎正变得不可或缺。Presto是由Facebook开源的高性能分布式SQL查询引擎,其用户包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。本书由Presto的核心开发人员参与撰写,教你系统地学习Presto的用法。书中内容涵盖Presto的安装、设计理念、查询操作、很好实践、与主要云平台的结合等。本书分为三大部分:第一部分介绍Presto的基础知识;第二部分更进一步,介绍Presto架构、集群部署、与数据源的连接等;第三部分讲解安全配置以及Presto的实际用例。你可以通过本书学会针对不同的数据源快速执行交互式SQL数据分析,并利用Presto管理和使用海量数据。

主编推荐
1.Presto是由Facebook开源的高性能分布式SQL查询引擎,其用户包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。
2.作为高性能分布式SQL查询引擎,Presto能够针对不同的数据源高效、快速地执行交互式分析。大数据的兴起使得数据存储机制多样化。面对标准不一的存储系统,你可以利用Presto轻松打破壁垒,连通数据孤岛。
3.本书由Presto项目创始成员参与执笔。你将学会用简单的Presto语句快速查询多个数据源,把握SQL-on-Anything的精髓。在任何规模、任何存储系统、任何环境中,你都能发挥SQL的威力。

- 入门:探索Presto的用例,学习安装、配置和使用Presto。
- 进阶:深入理解Presto的架构,学习连接器实例和SQL高级特性。
- 实践:了解如何在生产环境中使用Presto,保证安全性,与其他工具集成。

媒体评论
"你可以通过这本书学习从使用场景到如何大规模运行Presto集群的重要知识。"
--Ashish Kumar Singh,Pinterest大数据查询处理平台技术负责人

"如果想构建现代化的分析技术栈,那么这本书值得一读。"
--Jay Kreps,Apache Kafka联合创作者

"近些年,Presto社区成长迅速。作为又一款SQL-on-Hadoop查询引擎,它兼具优秀的性能、易用的接口和简洁的设计。国内外包括阿里巴巴在内的许多公司使用它,其优良的架构也让用户很容易进行定制和扩展。这本书既可以作为学习Presto的实战入门指南,也可以当作手册供随时查阅。无论你之前是否使用过Presto,相信你都能从中受益。"
--曹伟,PolarDB创始人,阿里巴巴研究员

"Presto如何超越一时轰动的Impala和拥趸众多的Spark成为交互式分析的龙头?带着这个疑问,我快速看完了全书,颇有点后知后觉、相见恨晚的感觉。Presto一改大数据的窠臼,基于SQL-on-Anything的理念和开源开放的工程实践对接大小各种数据源,降低了解决实际问题的门槛,难怪大家都喜欢。这本书翻译流畅,紧跟业界进展。开源大数据爱好者可以先不要急着掉进源代码细节里,而是从这本书的内容起步,从问题和场景入手,搞懂大数据。"
--郑锴,Apache Hadoop PMC成员,阿里巴巴高级技术专家

"Presto引擎在大数据领域的重要性不言而喻,但参考资料屈指可数,这本书正是大家期待的那本'官方指南'。无论是SQL编写、技术调研、运维部署,还是二次开发,都值得一读。书中第三部分为企业级应用做了详细解答,是一大亮点。"
--腾讯Presto Oteam团队

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP