• 高效使用Greenplum:入门、进阶与数据中台
  • 高效使用Greenplum:入门、进阶与数据中台
21年品牌 40万+商家 超1.5亿件商品

高效使用Greenplum:入门、进阶与数据中台

全新正版 极速发货

61.82 5.7折 109 全新

库存13件

广东广州
认证卖家担保交易快速发货售后保障

作者王春波 著

出版社机械工业出版社

ISBN9787111696490

出版时间2022-01

装帧平装

开本16开

定价109元

货号1202555619

上书时间2024-06-05

大智慧小美丽

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
作者介绍<br>王春波<br>资深架构师和数据仓库专家,现任上海启高信息科技有限公司大数据架构师,ApacheDoris和openGauss贡献者,Greenplum中文社区参与者。<br>具有十多年的数据仓库、数据集市、数据中台项目实战经验,对大数据主流技术架构、产品选型与解决方案有深入研究,尤其擅长用优雅的SQL实现复杂的逻辑。<br>常年奔波在各个项目交付现场,曾成功主导过中国邮政储蓄银行、南海农商银行、广东省联社、前海微众银行、广东南粤银行等多家银行的管理会计项目,以及卡宾、安踏、特步等多家零售鞋服企业的数据中台项目。<br>公众号“数据中台研习社”运营者。

目录
序一<br/>序二<br/>序三<br/>前言<br/>第一部分 大数据平台概述<br/>第1章 大数据平台技术的演进2<br/>1.1 关系型数据库2<br/>1.1.1 数据库发展历程2<br/>1.1.2 关系型数据库独霸天下4<br/>1.1.3 结构化查询语言SQL4<br/>1.1.4 列存储的兴起5<br/>1.2 Hadoop生态系统7<br/>1.2.1 Hadoop概述7<br/>1.2.2 Hadoop生态圈7<br/>1.2.3 Hadoop的优缺点9<br/>1.3 NoSQL的瓶颈和SQL数据库的回归10<br/>1.3.1 NoSQL产品的发展10<br/>1.3.2 NoSQL的共性11<br/>1.3.3 SQL数据库的回归12<br/>1.4 MPP架构的兴起14<br/>1.4.1 什么是MPP架构14<br/>1.4.2 MPP架构的蓬勃发展15<br/>1.4.3 MPP数据库代表—TBase17<br/>1.4.4 浅谈HTAP19<br/>第二部分 Greenplum入门<br/>第2章 Greenplum概述24<br/>2.1 Greenplum的前世今生24<br/>2.2 Greenplum数据库架构27<br/>2.3 Greenplum数据库的特点28<br/>2.4 Greenplum新特性及展望30<br/>2.5 Greenplum的优势32<br/>第3章 Greenplum的安装与部署35<br/>3.1 Greenplum数据库安装过程35<br/>3.1.1 准备工作35<br/>3.1.2 安装Master节点39<br/>3.1.3 复制安装包到其他节点41<br/>3.1.4 初始化Greenplum数据库42<br/>3.2 安装GPCC43<br/>3.3 Greenplum访问接口46<br/>3.3.1 CLI46<br/>3.3.2 JDBC47<br/>3.3.3 ODBC48<br/>3.4 Greenplum数据库常用命令48<br/>3.4.1 启动和停止48<br/>3.4.2 修改参数49<br/>3.4.3 其他常用命令51<br/>3.5 Greenplum性能测试52<br/>第4章 Greenplum使用入门54<br/>4.1 数据类型详解54<br/>4.1.1 基本数据类型54<br/>4.1.2 特殊数据类型56<br/>4.1.3 组合数据类型60<br/>4.2 数据表的基本使用62<br/>4.2.1 表对象定义62<br/>4.2.2 表的基本操作63<br/>4.2.3 数据的基本操作64<br/>4.3 数据表的高级应用65<br/>4.3.1 数据表的存储特性69<br/>4.3.2 分区表详解72<br/>4.3.3 外部表76<br/>4.4 数据库函数79<br/>4.4.1 数学函数79<br/>4.4.2 三角函数列表80<br/>4.4.3 字符串函数和操作符80<br/>4.4.4 类型转换相关函数82<br/>4.4.5 自定义函数83<br/>4.5 数据库的其他对象85<br/>4.5.1 视图85<br/>4.5.2 索引85<br/>4.5.3 序列87<br/>第三部分 Greenplum应用<br/>第5章 Greenplum查询详解90<br/>5.1 SQL语法92<br/>5.1.1 简单SQL语法92<br/>5.1.2 WITH子句特性95<br/>5.1.3 IN语句和EXISTS语句98<br/>5.1.4 MERGE子句的实现100<br/>5.2 JOIN操作101<br/>5.3 分析函数的妙用106<br/>5.4 高级函数精选110<br/>第6章 ETL工具箱114<br/>6.1 数据加载王者GPLoad114<br/>6.1.1 GPLoad简介114<br/>6.1.2 GPLoad配置详解116<br/>6.1.3 GPLoad实战118<br/>6.2 自定义存储过程120<br/>6.2.1 存储过程介绍 120<br/>6.2.2 存储过程应用模板121<br/>6.2.3 存储过程精选案例122<br/>6.3 PXF插件131<br/>6.3.1 PXF简介131<br/>6.3.2 安装PXF132<br/>6.3.3 PXF实战135<br/>6.4 DBLink136<br/>6.4.1 DBLink简介136<br/>6.4.2 安装DBLink137<br/>6.4.3 DBlink实战139<br/>6.5 拉链表142<br/>第7章 Greenplum高级应用147<br/>7.1 开放的编程接口147<br/>7.1.1 PL/Python148<br/>7.1.2 PL/R150<br/>7.2 MADlib机器学习库153<br/>7.2.1 安装MADlib154<br/>7.2.2 线性回归案例157<br/>7.2.3 关联规则案例158<br/>7.2.4 朴素贝叶斯分类案例159<br/>7.3 半结构化数据分析164<br/>7.4 地理空间数据分析166<br/>7.5 图计算应用168<br/>第8章 Greenplum运维管理和监控172<br/>8.1 数据库管理172<br/>8.1.1 创建和管理数据库172<br/>8.1.2 创建和管理模式173<br/>8.1.3 创建和管理表空间175<br/>8.1.4 创建和管理用户178<br/>8.1.5 创建和管理资源队列180<br/>8.2 可视化监控页面—GPCC183<br/>8.3 管理好帮手—gp_toolkit185<br/>8.4 Greenplum备份和恢复187<br/>8.5 在线扩容工具GPExpand189<br/>8.5.1 Greenplum扩容实战189<br/>8.5.2 扩容原理分析191<br/>8.6 锁机制192<br/>8.6.1 锁管理概述192<br/>8.6.2 普通锁数据结构192<br/>第9章 Greenplum性能优化197<br/>9.1 系统级优化197<br/>9.1.1 操作系统选择197<br/>9.1.2 硬件资源配置198<br/>9.1.3 磁盘读写199<br/>9.1.4 节点之间的网络带宽202<br/>9.1.5 系统参数202<br/>9.2 数据库级优化204<br/>9.2.1 数据库参数配置204<br/>9.2.2 资源队列206<br/>9.3 表级优化206<br/>9.3.1 建表参数207<br/>9.3.2 表的优化208<br/>9.4 执行计划和查询优化209<br/>9.4.1 查看执行计划210<br/>9.4.2 数据扫描方式210<br/>9.4.3 分布式执行方式213<br/>9.4.4 两种聚合方式214<br/>9.4.5 关联分类214<br/>9.4.6 优化器的选择216<br/>9.4.7 其他关键术语217<br/>第10章 Greenplum与开源组件220<br/>10.1 Kettle220<br/>10.2 DataX224<br/>10.3 HDFS、Hive和HBase228<br/>10.4 Spark230<br/>10.5 Kafka235<br/>10.6 Flink238<br/>第11章 Greenplum与BI应用244<br/>11.1 Tableau244<br/>11.1.1 Tableau连接Greenplum245<br/>11.1.2 Tableau最佳实践要点245<br/>11.2 永洪BI248<br/>11.3 帆软BI250<br/>11.4 DataV253<br/>11.5 Quick BI253<br/>第四部分 数据中台实战<br/>第12章 数据中台建设思路256<br/>12.1 为什么要搭建数据中台256<br/>12.2 什么是数据中台258<br/>12.3 如何搭建数据中台259<br/>12.3.1 数据资产盘点和规划259<br/>12.3.2 数据应用规划与设计260<br/>12.3.3 数据平台选型与建设261<br/>12.3.4 数据应用设计与实现262<br/>12.3.5 组织架构调整与流程变革262<br/>12.4 数据中台怎么选型263<br/>12.4.1 数据仓库选型263<br/>12.4.2 ETL工具选型265<br/>12.4.3 调度平台选型266<br/>12.4.4 BI工具选型268<br/>第13章 接口数据同步270<br/>13.1 全量接口同步270<br/>13.2 增量接口同步276<br/>13.3 流式数据同步281<br/>13.4 日志流数据同步283<br/>第14章 数据建模285<br/>14.1 数据建模思想285<br/>14.1.1 Inmon企业信息化工厂286<br/>14.1.2 Kimball的维度数据仓库287<br/>14.1.3 两种建模体系的对比288<br/>14.2 数据分层设计288<br/>14.2.1 操作数据存储层289<br/>14.2.2 数据仓库层290<br/>14.2.3 数据集市层292<br/>14.3 数据分层实战案例293<br/>14.3.1 ODS层293<br/>14.3.2 DWD层293<br/>14.3.3 DWB层297<br/>14.3.4 DWS层299<br/>14.3.5 ADS层307<br/>14.4 数据中台命名规范311<br/>14.4.1 数据库表命名312<br/>14.4.2 数据库字段命名312<br/>14.4.3 脚本命名规范313<br/>第15章 数据中台主要配套功能314<br/>15.1 数据权限管理314<br/>15.2 数据补录319<br/>15.3 BI门户320<br/>15.4 元数据管理323<br/>15.5 指标管理324<br/>第16章 数据中台数据应用328<br/>16.1 商业智能328<br/>16.2 自助分析平台331<br/>16.3 数据服务332<br/>16.4 标签平台335<br/>16.5 推荐系统338<br/>第17章 基于Greenplum的数据中台实践案例342<br/>17.1 项目背景342<br/>17.2 项目需求343<br/>17.3 项目技术实现344<br/>17.3.1 系统架构344<br/>17.3.2 系统ETL分层345<br/>17.3.3 系统调度任务346<br/>17.4 智能数据应用347<br/>17.4.1 自助分析应用348<br/>17.4.2 固定报表349<br/>17.4.3 可视化大屏350<br/>17.4.4 钉钉数据服务351<br/>17.5 典型技术方案分享352<br/>17.5.1 准实时需求实现方案352<br/>17.5.2 数据库优化方案353<br/>17.5.3 数据权限控制方案355<br/>17.5.4 历史数据离线存储方案358<br/>17.5.5 系统备份方案358<br/>17.6 典型业务方案分享359<br/>17.6.1 零售指标同期分析359<br/>17.6.2 零售指标节假日对比分析361<br/>17.6.3 在库库存362<br/>17.6.4 在途库存363<br/>17.6.5 售罄率365<br/>17.6.6 齐码率368<br/>17.7 项目总结370

内容摘要
内容简介<br>这不仅是一本从原理到使用、从入门到进阶讲解Greenplum的著作,而且是一本指导企业用更省钱、更高效地方式使用Greenplum构建企业级数据仓库和数据中台的著作。<br>作者在数据架构和数据仓库一线工作10余年,积累了丰富的项目经验,他用浅显易懂的语言、贴近生产环境的案例、丰富的示意图例写作了本书,能帮助读者快速掌握具有实战价值的知识。<br>具体地,阅读本书你将收获如下内容:<br>?掌握数据仓库技术的发展历程和发展方向;<br>?理解MPP架构的架构特点和实现逻辑;<br>?Greenplum数据库的安装和基本操作;<br>?Greenplum数据库的工作原理;<br>?SQL语句从入门到开发实战;<br>?Greenplum数据库ETL相关功能的具体用途;<br>?机器学习、文本处理、图计算、GIS等的入门知识;<br>?掌握Greenplum数据库的运维和监控要点;<br>?全面掌握Greenplum数据库的性能优化;<br>?数据中台的理念和建设路径;<br>?数据中台从接口到智能化应用的项目实战;<br>?零售行业数据中台的项目实战案例。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP