• 高效使用Greenplum:入门 进阶与数据中台
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

高效使用Greenplum:入门 进阶与数据中台

全新正版未拆封

50.98 4.7折 109 全新

仅1件

四川成都
认证卖家担保交易快速发货售后保障

作者王春波

出版社机械工业出版社

出版时间2021-12

版次1

装帧其他

货号RT

上书时间2023-06-29

转角书檐

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 王春波
  • 出版社 机械工业出版社
  • 出版时间 2021-12
  • 版次 1
  • ISBN 9787111696490
  • 定价 109.00元
  • 装帧 其他
  • 开本 16开
  • 纸张 胶版纸
  • 页数 388页
  • 字数 197千字
【内容简介】
这不仅是一本从原理到使用、从入门到进阶讲解Greenplum的著作,而且是一本指导企业用更省钱、更高效地方式使用Greenplum构建企业级数据仓库和数据中台的著作。
  作者在数据架构和数据仓库一线工作10余年,积累了丰富的项目经验,他用浅显易懂的语言、贴近生产环境的案例、丰富的示意图例写作了本书,能帮助读者快速掌握具有实战价值的知识。
  具体地,阅读本书你将收获如下内容:
  · 掌握数据仓库技术的发展历程和发展方向;
  · 理解MPP架构的架构特点和实现逻辑;
  · Greenplum数据库的安装和基本操作;
  · Greenplum数据库的工作原理;
  · SQL语句从入门到开发实战;
  · Greenplum数据库ETL相关功能的具体用途;
  · 机器学习、文本处理、图计算、GIS等的入门知识;
  · 掌握Greenplum数据库的运维和监控要点;
  · 全面掌握Greenplum数据库的性能优化;
  · 数据中台的理念和建设路径;
  · 数据中台从接口到智能化应用的项目实战;
  · 零售行业数据中台的项目实战案例。
【作者简介】
王春波

资深架构师和数据仓库专家,现任上海启高信息科技有限公司大数据架构师,Apache Doris和openGauss贡献者,Greenplum中文社区参与者。

具有十多年的数据仓库、数据集市、数据中台项目实战经验,对大数据主流技术架构、产品选型与解决方案有深入研究,尤其擅长用优雅的SQL实现复杂的逻辑。

常年奔波在各个项目交付现场,曾成功主导过中国邮政储蓄银行、南海农商银行、广东省联社、前海微众银行、广东南粤银行等多家银行的管理会计项目,以及卡宾、安踏、特步等多家零售鞋服企业的数据中台项目。

公众号“数据中台研习社”运营者。
【目录】
序一

序二

序三

前言

部分 大数据平台概述

第1章 大数据平台技术的演进2

1.1 关系型数据库2

1.1.1 数据库发展历程2

1.1.2 关系型数据库独霸天下4

1.1.3 结构化查询语言SQL4

1.1.4 列存储的兴起5

1.2 Hadoop生态系统7

1.2.1 Hadoop概述7

1.2.2 Hadoop生态圈7

1.2.3 Hadoop的优缺点9

1.3 NoSQL的瓶颈和SQL数据库的回归10

1.3.1 NoSQL产品的发展10

1.3.2 NoSQL的共性11

1.3.3 SQL数据库的回归12

1.4 MPP架构的兴起14

1.4.1 什么是MPP架构14

1.4.2 MPP架构的蓬勃发展15

1.4.3 MPP数据库代表—TBase17

1.4.4 浅谈HTAP19

第二部分 Greenplum入门

第2章 Greenplum概述24

2.1 Greenplum的前世今生24

2.2 Greenplum数据库架构27

2.3 Greenplum数据库的特点28

2.4 Greenplum新特性及展望30

2.5 Greenplum的优势32

第3章 Greenplum的安装与部署35

3.1 Greenplum数据库安装过程35

3.1.1 准备工作35

3.1.2 安装Master节点39

3.1.3 复制安装包到其他节点41

3.1.4 初始化Greenplum数据库42

3.2 安装GPCC43

3.3 Greenplum访问接口46

3.3.1 CLI46

3.3.2 JDBC47

3.3.3 ODBC48

3.4 Greenplum数据库常用命令48

3.4.1 启动和停止48

3.4.2 修改参数49

3.4.3 其他常用命令51

3.5 Greenplum性能测试52

第4章 Greenplum使用入门54

4.1 数据类型详解54

4.1.1 基本数据类型54

4.1.2 特殊数据类型56

4.1.3 组合数据类型60

4.2 数据表的基本使用62

4.2.1 表对象定义62

4.2.2 表的基本操作63

4.2.3 数据的基本操作64

4.3 数据表的高级应用65

4.3.1 数据表的存储特性69

4.3.2 分区表详解72

4.3.3 外部表76

4.4 数据库函数79

4.4.1 数学函数79

4.4.2 三角函数列表80

4.4.3 字符串函数和操作符80

4.4.4 类型转换相关函数82

4.4.5 自定义函数83

4.5 数据库的其他对象85

4.5.1 视图85

4.5.2 索引85

4.5.3 序列87

第三部分 Greenplum应用

第5章 Greenplum查询详解90

5.1 SQL语法92

5.1.1 简单SQL语法92

5.1.2 WITH子句特性95

5.1.3 IN语句和EXISTS语句98

5.1.4 MERGE子句的实现100

5.2 JOIN操作101

5.3 分析函数的妙用106

5.4 高级函数精选110

第6章 ETL工具箱114

6.1 数据加载王者GPLoad114

6.1.1 GPLoad简介114

6.1.2 GPLoad配置详解116

6.1.3 GPLoad实战118

6.2 自定义存储过程120

6.2.1 存储过程介绍 120

6.2.2 存储过程应用模板121

6.2.3 存储过程精选案例122

6.3 PXF插件131

6.3.1 PXF简介131

6.3.2 安装PXF132

6.3.3 PXF实战135

6.4 DBLink136

6.4.1 DBLink简介136

6.4.2 安装DBLink137

6.4.3 DBlink实战139

6.5 拉链表142

第7章 Greenplum高级应用147

7.1 开放的编程接口147

7.1.1 PL/Python148

7.1.2 PL/R150

7.2 MADlib机器学习库153

7.2.1 安装MADlib154

7.2.2 线性回归案例157

7.2.3 关联规则案例158

7.2.4 朴素贝叶斯分类案例159

7.3 半结构化数据分析164

7.4 地理空间数据分析166

7.5 图计算应用168

第8章 Greenplum运维管理和监控172

8.1 数据库管理172

8.1.1 创建和管理数据库172

8.1.2 创建和管理模式173

8.1.3 创建和管理表空间175

8.1.4 创建和管理用户178

8.1.5 创建和管理资源队列180

8.2 可视化监控页面—GPCC183

8.3 管理好帮手—gp_toolkit185

8.4 Greenplum备份和恢复187

8.5 在线扩容工具GPExpand189

8.5.1 Greenplum扩容实战189

8.5.2 扩容原理分析191

8.6 锁机制192

8.6.1 锁管理概述192

8.6.2 普通锁数据结构192

第9章 Greenplum性能优化197

9.1 系统级优化197

9.1.1 操作系统选择197

9.1.2 硬件资源配置198

9.1.3 磁盘读写199

9.1.4 节点之间的网络带宽202

9.1.5 系统参数202

9.2 数据库级优化204

9.2.1 数据库参数配置204

9.2.2 资源队列206

9.3 表级优化206

9.3.1 建表参数207

9.3.2 表的优化208

9.4 执行计划和查询优化209

9.4.1 查看执行计划210

9.4.2 数据扫描方式210

9.4.3 分布式执行方式213

9.4.4 两种聚合方式214

9.4.5 关联分类214

9.4.6 优化器的选择216

9.4.7 其他关键术语217

第10章 Greenplum与开源组件220

10.1 Kettle220

10.2 DataX224

10.3 HDFS、Hive和HBase228

10.4 Spark230

10.5 Kafka235

10.6 Flink238

第11章 Greenplum与BI应用244

11.1 Tableau244
点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP