• 大数据湖最佳实践
21年品牌 40万+商家 超1.5亿件商品

大数据湖最佳实践

全新正版 极速发货

28.06 4.1折 68 全新

库存18件

广东广州
认证卖家担保交易快速发货售后保障

作者(美)亚历克斯·歌瑞克

出版社中国电力出版社

ISBN9787519845902

出版时间2020-07

装帧平装

开本16开

定价68元

货号1202101135

上书时间2024-06-04

徐小智的书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
    亚历克斯·歌瑞克(Alex Gorelik)是Waterline Data的首席技术官和创始人,也是三家初创公司的创始人。他曾经担任Informatica的数据质量部经理,负责管理公司的平台和数据集成技术。此外,他还曾是IBM的杰出工程师,也是Exeros和Acta Technology的联合创始人、首席技术官和工程副总裁。

目录
前言1

章数据湖概述7

数据湖的成熟度9

数据水洼11

数据池12

创建成功的数据湖12

适合的平台13

适合的数据14

适合的界面16

数据沼泽18

成功实施数据湖的路线图20

建立数据湖20

规划数据湖21

构建自助服务的数据湖23

构建数据湖28

云上数据湖29

逻辑数据湖29

小结34

第2章历史背景35

数据自助服务驱动——数据库的诞生36

分析必要性驱动——数据仓库的诞生39

数据仓库生态系统40

存储和查询数据41

加载数据——数据集成工具47

组织和管理数据51

消费数据57

小结58

第3章大数据和数据科学概述59

Hadoop引领大数据的历史性转变60

Hadoop文件系统60

MapReduce作业中计算和存储如何交互61

SchemaonRead63

Hadoop项目64

数据科学65

你的分析机构应该关注什么?67

机器学习71

可解释性72

变更管理73

小结74

第4章建立数据湖75

为什么是Hadoop75

防止数据水洼扩散78

利用大数据的优势79

以数据科学为先导80

策略1:迁移已有功能83

策略2:为新项目建立数据湖85

策略3:建立数据治理中心85

哪种策略最适合你?86

小结88

第5章从数据池/大数据仓库到数据湖89

数据仓库的基本功能90

用于分析的维度模型91

整合不同源的数据92

使用缓慢变化维保存历史记录93

数据仓库作为历史库的局限性93

迁移至数据池94

数据池中保存历史数据94

在数据池中使用缓慢变化维96

数据池演化为数据湖——加载数据仓库中未包含的数据98

原始数据98

外部数据99

IoT与其他流式数据102

实时数据湖103

Lambda架构105

数据转换106

目标系统108

数据仓库109

业务数据存储109

实时应用和数据产品110

小结111

第6章自助服务优化112

自助服务起源113

业务分析师115

发现和理解数据——企业数据归档116

建立信任119

数据预置126

为分析准备数据128

数据湖数据整理129

用Hadoop来准备数据129

数据预处理的常见案例130

分析和可视化133

自助式商业智能的新世界133

新的分析工作流134

门卫向店主的角色转变136

管理自助服务137

小结137

第7章数据湖架构139

规划数据湖139

原始区141

产品区142

工作区144

敏感区145

多数据湖146

保持各数据湖独立的优势147

合并多数据湖的优势147

云上数据湖148

虚拟数据湖151

数据联邦151

大数据虚拟化152

消除冗余154

小结156

第8章数据湖元数据157

组织数据157

技术元数据159

业务元数据164

打标166

自动编目167

逻辑数据管理169

敏感数据管理和访问控制169

数据质量170

连接分散的数据172

建立血缘关系174

数据预置176

创建目录的工具176

工具对比177

数据洋178

小结179

第9章数据访问控制180

授权与访问控制181

基于标签的控制策略182

数据脱敏186

数据主权与法规189

自助服务访问管理191

预置数据196

小结204

0章行业案例205

金融服务大数据206

消费者、数字化和数据正在改变我们所熟知的金融行业206

拯救银行208

新数据提供新机遇212

使用数据湖的关键过程215

数据湖为金融服务领域带来的价值218

保险行业中的数据湖220

智慧城市222

医疗大数据224

作者介绍227

封面介绍227

内容摘要
数据仓库、大数据、数据科学的简单介绍。

了解企业建立数据湖的各种途径。

探索如何构建自助服务模型,以及如何让分析师便捷访问数据的很好实践。

使用不同的方法来构建数据湖。

了解不同行业专家实现数据湖的方法。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP