greenplum 构建实时数据仓库实践 数据库 王雪迎
详解greenplum构建实时数据仓库技术,使用纯sql处理历史全量数据
¥
60.15
6.8折
¥
89
全新
库存3件
作者王雪迎
出版社清华大学出版社
ISBN9787302611653
出版时间2022-08
版次1
装帧平装
开本16
页数360页
字数576千字
定价89元
货号xhwx_1202695041
上书时间2024-10-13
商品详情
- 品相描述:全新
-
正版特价新书
- 商品描述
-
主编:
"本书详解greenplum构建实时数据仓库,涉及的具体技术包括:
myql主从复制,保证为业务系统提供可靠的数据库服务,并提供数据来源。
canal erver实时获取增量myql binlog,并将其传入kafka消息队列。
kafka将消息持久化,同时提供可伸缩、高吞吐的消息服务。
canal clientadapter负责消费kafka中的消息,将数据流传输到greenplum。
greenplum提供实时etl功能,自动维护作数据存储、维度表与事实表。
greenplum数据库权限与角管理、数据导入导出、能优化、监控与维护。
greenplum集成机器学库madlib,对数据进行分析与挖掘。"
目录:
章数据仓库简介
1.1什么是数据仓库
1.1.1数据仓库的定义
1.1.2建立数据仓库的原因
1.2作型系统与分析型系统
1.2.1作型系统
1.2.2分析型系统
1.2.3作型系统和分析型系统的对比
1.3抽取一转换一装载
1.3.1数据抽取
1.3.2数据转换
1.3.3数据装载
1.3.4开发etl系統的方法
1.4数据仓库架构
1.4.1基本架构
1.4.2主要数据仓库架构
……
内容简介:
greenplum分布式数据库具有可选存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特,因此greenplum成为一款理想的分析型数据库产品。本书详解greenplum数据仓库构建与数据分析技术,配套示例源码。
本书共分10章。内容包括数据仓库简介、数据仓库设计基础、greenplum与数据仓库、greenplum安装部署、实时数据同步、实时数据装载、维度表技术、事实表技术、greenplum运维与监控、集成机器学库madlib。
本书适合greenplum初学者、大数据分析系统设计与开发、数据仓库系统设计与开发、dba、架构师等相关技术人员阅读,也适合高等院校大数据相关专业的师生作为实训教材。
作者简介:
王雪迎 ,于中国地质大学计算机专业,工程师,20年数据库、数据仓库相关技术工作经验。先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任dba、数据架构师等职位。著有图书greenplum构建实时数据仓库实践hadoop构建数据仓库实践hawq数据仓库与数据挖掘实战ql机器学库madlib技术解析myql高可用实践。
— 没有更多了 —
以下为对购买帮助不大的评价