剑指大数据 企业级数据仓库项目实战 金融租赁版
全新正版 极速发货
¥
48.27
6.1折
¥
79
全新
库存9件
作者尚硅谷教育 编
出版社电子工业出版社
ISBN9787121476914
出版时间2024-05
装帧平装
开本16开
定价79元
货号1203252331
上书时间2024-09-05
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
尚硅谷教育是一家专业的IT教育培训机构,开设了JavaEE、大数据、HTML5前端等多门学科,在互联网上发布的JavaEE、大数据、HTML5前端、区块链、C语言、Python等技术视频教程广受赞誉。
目录
第1章 数据仓库概论1
1.1 数据仓库的概念与特点1
1.2 数据仓库的演进过程2
1.3 数据仓库技术3
1.4 数据仓库基本架构5
1.5 数据库和数据仓库的区别8
1.6 学前导读9
1.6.1 学习的基础要求9
1.6.2 你将学到什么9
1.7 本章总结9
第2章 项目需求描述11
2.1 前期调研11
2.2 项目架构分析12
2.2.1 金融租赁行业简介12
2.2.2 金融租赁数据仓库产品描述12
2.2.3 系统功能结构13
2.2.4 系统流程图14
2.3 项目业务概述14
2.3.1 数据采集模块业务描述14
2.3.2 数据仓库需求业务描述15
2.3.3 数据可视化业务描述17
2.4 系统运行环境18
2.4.1 硬件环境18
2.4.2 软件环境19
2.5 本章总结21
第3章 项目部署的环境准备22
3.1 集群规划与服务器配置22
3.2 安装JDK与Hadoop22
3.2.1 准备虚拟机环境22
3.2.2 安装JDK26
3.2.3 安装Hadoop27
3.2.4 Hadoop的分布式集群部署28
3.3 本章总结35
第4章 业务数据采集模块36
4.1 金融租赁业务概述36
4.1.1 金融租赁业务流程36
4.1.2 业务表结构40
4.2 数据同步43
4.2.1 数据同步策略43
4.2.2 数据同步工具选择45
4.3 环境准备46
4.3.1 安装DataX46
4.3.2 安装Maxwell47
4.3.3 安装ZooKeeper52
4.3.4 安装Kafka54
4.3.5 安装Flume57
4.4 模拟业务数据59
4.4.1 MySQL安装59
4.4.2 数据模拟61
4.5 业务数据的采集62
4.5.1 全量同步62
4.5.2 增量同步67
4.6 采集通道启动和停止脚本76
4.7 本章总结77
第5章 数据仓库搭建模块78
5.1 数据仓库理论准备78
5.1.1 数据建模概述78
5.1.2 关系模型与范式理论79
5.1.3 维度模型82
5.1.4 维度建模理论之事实表83
5.1.5 维度建模理论之维度表86
5.1.6 星形模型、雪花模型与星座模型89
5.2 数据仓库建模实践91
5.2.1 名词概念91
5.2.2 为什么要分层92
5.2.3 数据仓库搭建流程93
5.2.4 数据仓库开发规范97
5.3 数据仓库搭建环境准备101
5.3.1 Hive安装101
5.3.2 Hive on Spark配置104
5.3.3 YARN容量调度器并发度问题106
5.3.4 数据仓库开发环境配置106
5.3.5 模拟数据准备109
5.3.6 复杂数据类型111
5.4 数据仓库搭建――ODS层112
5.4.1 ODS层表格的创建112
5.4.2 ODS层业务数据导入脚本116
5.5 数据仓库搭建――DIM层117
5.5.1 部门维度表(全量)117
5.5.2 员工维度表(全量)119
5.5.3 行业维度表(全量)120
5.5.4 DIM层每日数据装载脚本121
5.6 数据仓库搭建――DWD层121
5.6.1 审批域金融租赁全流程累积快照事实表121
5.6.2 DWD层首日数据装载脚本133
5.6.3 DWD层每日数据装载脚本133
5.7 数据仓库搭建――ADS层133
5.7.1 待审/在审项目主题指标133
5.7.2 已审项目主题指标154
5.7.3 已审项目转化主题指标167
5.7.4 ADS层数据导入脚本170
5.8 数据模型评估及优化170
5.9 本章总结171
第6章 DolphinScheduler全流程调度172
6.1 DolphinScheduler概述与安装部署172
6.1.1 DolphinScheduler概述172
6.1.2 DolphinScheduler安装部署173
6.2 创建MySQL数据库和表179
6.3 DataX数据导出188
6.4 全流程调度192
6.4.1 数据准备192
6.4.2 全流程调度配置192
6.5 电子邮件报警198
6.5.1 注册邮箱198
6.5.2 配置电子邮件报警199
6.6 本章总结202
第7章 数据可视化模块203
7.1 部署FineBI203
7.1.1 安装203
7.1.2 初始化205
7.2 数据源的配置210
7.2.1 配置数据连接210
……
内容摘要
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了金融租赁行业离线数据仓库的搭建过程。在整个数据仓库的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并在其中穿插了许多大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、金融租赁业务概述、数据仓库理论介绍和数据仓库建模等。
本书的第1章至第3章是项目前期准备阶段,主要为读者介绍了数据仓库的概念、应用场景和搭建需求等,并初步搭建了数据仓库项目所需的基本环境;第4章至第5章是数据仓库搭建的核心部分,详细为读者讲解了数据仓库建模理论和数据从采集到分层搭建的全过程,是本书的重点;第6章至第7章介绍了全流程调度和指标可视化。
本书适合具有一定编程基础的读者学习或作为参考资料,通过阅读本书,读者可以快速了解数据仓库,全面掌握数据仓库的相关技术。
— 没有更多了 —
以下为对购买帮助不大的评价