作者简介
成于念
资深数据治理专家,具有近10年数据治理相关工作经验,曾就职于某世界500强企业,专门从事数据治理相关工作。曾为多家干亿级企业提供主数据、数据治理方向的培训服务,熟悉各种主流数据治理技术和产品,并发表过多篇数据相关文章及论文。DAMA中国会员,“人人都是产品经理”专栏作者,“PMTalk社区”专栏作者,“三节课”兼职讲师,“老司机聊数据”公众号主理人。
赛助力
资深数据治理专家,曾就职于某世界500强企业,负责数据管理相关工作,10余年ERP及数据管理类项目实践经验,曾为多家干亿级企业提供数据治理方案,行业覆盖地产、制造业、消费品、医药、汽车等,熟悉多种主流数据治理软件。发表过数据类相关文献20余篇,这些文献被多家企业推荐或引用。DAMA中国会员,“人人都是产品经理”专栏作者,“老司机聊数据”公众号主理人。
目录
目 录<br />前言<br />致谢<br />概念篇<br />第1章 走进数据血缘2<br />1.1 企业目前面临的问题与挑战2<br />1.1.1 互联网行业:数据安全面临<br />严峻挑战3<br />1.1.2 能源化工行业:数据共享互通能力待加强4<br />1.1.3 装备制造行业:产品数据采集难5<br />1.1.4 零售行业:数据分析势在必行5<br />1.1.5 建筑行业:大数据治理能力亟须提升6<br />1.1.6 从问题和挑战中找解决方案7<br />1.2 揭开数据血缘的面纱8<br />1.2.1 什么是数据和数据管理8<br />1.2.2 什么是数据血缘10<br />1.2.3 什么是数据血缘分析11<br />1.2.4 什么是数据血缘可视化14<br />1.2.5 数据血缘的特征16<br />1.2.6 与数据血缘相关的概念20<br />1.3 数据血缘分析是解决数据问题的灵丹妙药23<br />1.3.1 破除数据质疑23<br />1.3.2 数据变更影响范围快速评估24<br />1.3.3 数据资产价值评估度量工具25<br />1.3.4 为数据滥用加上一把“道德”<br /> 之锁26<br />1.4 本章小结27<br />第2章 数据血缘中的数据组成部分29<br />2.1 溯源血缘关系的重要依据—<br /> 元数据29<br />2.1.1 元数据的概念29<br />2.1.2 元数据的数据血缘特征31<br />2.2 确定血缘关系的黄金数据—<br /> 主数据32<br />2.2.1 主数据的概念32<br />2.2.2 主数据的数据血缘特征34<br />2.3 记录业务动态发生的数据—<br /> 业务数据35<br />2.3.1 业务数据的概念35<br />2.3.2 业务数据的数据血缘特征35<br />2.4 提供分析决策的重要成果—<br /> 指标数据36<br />2.4.1 指标数据的概念36<br />2.4.2 指标数据的数据血缘特征37<br />2.5 本章小结37<br />建设篇<br />第3章 数据血缘分析框架模型40<br />3.1 1个周期:数据全生命周期管理40<br />3.2 3种实体:数据血缘实体结构43<br />3.2.1 数据库血缘44<br />3.2.2 数据表血缘44<br />3.2.3 字段血缘46<br />3.3 5个类型:数据血缘分类48<br />3.3.1 逻辑血缘48<br />3.3.2 物理血缘48<br />3.3.3 时间血缘48<br />3.3.4 操作血缘48<br />3.3.5 业务血缘49<br />3.4 5个层级:构建基础平台,支撑<br /> 数据血缘分析49<br />3.4.1 血缘采集层50<br />3.4.2 血缘处理层52<br />3.4.3 血缘存储层52<br />3.4.4 血缘接口层53<br />3.4.5 血缘应用层53<br />3.5 本章小结57<br />第4章 数据血缘实施路径59<br />4.1 数据血缘实施过程中的问题与难点59<br />4.1.1 血缘质量不高59<br />4.1.2 实施路径不清晰61<br />4.1.3 数据血缘关系自动解析难62<br />4.2 数据血缘建设方式63<br />4.2.1 常见的3种建设方式的优劣势63<br />4.2.2 建设方式注意事项65<br />4.3 数据血缘建设步骤65<br />4.3.1 明确数据血缘目标66<br />4.3.2 制定数据血缘需求范围75<br />4.3.3 构建数据血缘系统77<br />4.3.4 完成数据血缘收集85<br />4.3.5 完成数据血缘初始化92<br />4.3.6 实现数据血缘的可视化93<br />4.4 本章小结98<br />技术篇<br />第5章 数据血缘分析应用100<br />5.1 数据开发应用场景100<br />5.2 数据资产应用场景102<br />5.3 数据安全应用场景103<br />5.4 本章小结106<br />第6章 数据血缘技术107<br />6.1 概述107<br />6.2 数据采集技术108<br />6.2.1 ETL技术应用108<br />6.2.2 SQL解析应用109<br />6.3 数据建模110<br />6.3.1 概念建模111<br />6.3.2 逻辑建模111<br />6.3.3 物理建模112<br />6.4 数据可视化技术112<br />6.4.1 数据可视化工具113<br />6.4.2 图形库和框架114<br />6.5 其他相关技术115<br />6.5.1 数据挖掘技术115<br />6.5.2 区块链技术116<br />6.5.3 人工智能技术117<br />6.5.4 大数据技术118<br />6.6 本章小结119<br />第7章 数据血缘产品121<br />7.1 国外主流数据血缘产品介绍121<br />7.1.1 开源的Apache Atlas平台121<br />7.1.2 社交网站LinkedIn的数据<br /> 平台123<br />7.2 国内主流数据血缘产品介绍126<br />7.2.1 马哈鱼数据血缘平台126<br />7.2.2 FineBI数据可视化工具129<br />7.2.3 亿信元数据管理平台129<br />7.2.4 飞算SoData数据机器人130<br />7.3 其他数据血缘产品介绍131<br />7.3.1 Informatica数据平台131<br />7.3.2 Alation数据平台131<br />7.3.3 Collibra数据平台132<br />7.4 本章小结133<br />第8章 数据治理中的数据血缘<br /> 应用134<br />8.1 数据治理体系简介134<br />8.1.1 数据管理、数据治理与数据<br /> 资产管理134<br />8.1.2 DAMA的数据治理体系136<br />8.1.3 DMM和DCMM138<br />8.1.4 华为的数据治理体系139<br />8.1.5 阿里的数据治理体系140<br />8.2 数据治理与数据血缘的关系140<br />8.3 数据血缘在数据治理中的应用141<br />8.3.1 数据血缘在数据质量提升中的<br /> 应用141<br />8.3.2 数据血缘在数据架构中的应用143<br />8.3.3 数据血缘在数据建模和设计<br /> 中的应用144<br />8.3.4 数据血缘在数据安全中的应用145<br />8.4 本章小结146<br />第9章 数据血缘的平台建设147<br />9.1 数据血缘相关平台介绍147<br />9.1.1 元数据管理平台147<br />9.1.2 主数据管理平台149<br />9.1.3 数据仓库155<br />9.1.4 数据治理平台158<br />9.1.5 数据管理驾驶舱161<br />9.2 数据相关平台建设路径163<br />9.2.1 需求分析及调研164<br />9.2.2 开发及测试165<br />9.2.3 上线试运行166<br />9.2.4 开展项目验收168<br />9.2.5 持续优化迭代169<br />9.3 本章小结171<br />案例篇<br />第10章 互联网行业:字节跳动的<br /> 数据血缘建设案例174<br />10.1 数据血缘建设背景175<br />10.2 数据血缘构建解析175<br />10.2.1 数据血缘采集175<br />10.2.2 数据血缘的关键指标176<br />10.3 数据血缘的未来趋势177<br />第11章 服务行业:四大全球知名<br /> 企业的数据实践179<br />11.1 民宿短租公寓预订平台<br /> Airbnb179<br />11.2 电子商务平台Amazon180<br />11.3 会员订阅制的流媒体播放平台<br /> Netflix180<br />11.4 叫车服务公司Uber181<br />第12章 制造行业:全球知名企业<br /> 的数据实践182<br />12.1 百年企业通用电气182<br />12.2 “欧洲工业之母”西门子183<br />第13章 零售快消行业:全球知名<br /> 企业的数据实践184<br />13.1 大型零售商沃尔玛185<br />13.2 西班牙快时尚零售商Zara185<br />展望篇<br />第14章 未来展望188<br />14.1 数据血缘与数据智能的结合189<br />14.2 数据血缘与数据隐私的平衡189<br />14.3 数据血缘在人工智能中的应用190<br />14.4 数据血缘在模型开发和模型审计<br /> 中的应用191<br />14.5 数据血缘在模型解释和模型可解释<br /> 性中的应用191<br />14.6 数据血缘在智能决策中的应用192<br />14.7 数据血缘与区块链的关系192<br />14.7.1 数据的确权问题192<br />14.7.2 数据的经济特征问题193<br />14.7.3 数据的价值测量问题194<br />后记1 数据血缘救赎之路196<br />后记2 从ERP咨询到数据治理199
内容摘要
这是一部可以帮助读者从0开始理解、建设并深度实践数据血缘及其系统的专业指导手册。全书所有内容均来自两位作者长期在世界500强企业从事数据相关工作的经验总结,书中不仅从原理层面带领读者深挖数据血缘本质,还有从实践层面对数据血缘的建设方法、核心技术、主流工具、在数据治理中的应用、典型行业应用案例进行了全方位剖析。
本书得到了美国南卡罗来纳大学教授、DAMA大中华区主席、中国大数据技术标准推进委员会专家、招商蛇口数字化管理及运营负责人、PowerData社区主理人等多位业界专家的鼎力推荐。
本书包括4篇14章,具体内容如下。
概念篇从企业面临的主要数据问题入手,逐渐延伸到对数据血缘的相关定义、特征、价值,以及数据组成的深度解读。这部分是真正落地数据血缘项目的基础,只有充分理解了这部分内容,才知道如何与上下游沟通协作。
建设篇先完整展示了一个可落地的数据血缘框架模型——“1355”框架模型,即1个周期、3种实体、5个类型、5个层级,这是数据血缘建设的基础模型;然后详细介绍了数据血缘实施路径,其中包括可能会面临的问题、具体建设方式和具体建设步骤。
技术篇重点数据血缘相关技术和产品,以及数据血缘分析的主要应用场景——数据治理。其中,包括3大数据血缘应用场景、7大数据血缘核心技术、9款主流的数据血缘产品,以及数据血缘在数据治理中的深度实践。
案例篇主要分享了互联网、服务、制造、零售快消等行业中数据血缘建设案例,帮助大家了解典型行业数据血缘的落地情况,以求获得一些启发。
主编推荐
数据资产化是大趋势,也是未来企业必须做的事情。而数据要想真正实现资产化,必须要有高质量的数据作为基础。数据血缘将成为高质量数据的最底层保障。数据血缘的重要性正在慢慢显现,建议所有数据相关的从业者都不要错过这波红利,也许这本书将为你的职业生涯打开新篇章。
精彩内容
这是一部可以帮助读者从0开始理解、建设并深度实践数据血缘及其系统的专业指导手册。全书所有内容均来自两位作者长期在世界500强企业从事数据相关工作的经验总结,书中不仅从原理层面带领读者深挖数据血缘本质,还有从实践层面对数据血缘的建设方法、核心技术、主流工具、在数据治理中的应用、典型行业应用案例进行了全方位剖析。 本书得到了美国南卡罗来纳大学教授、DAMA大中华区主席、中国大数据技术标准推进委员会专家、招商蛇口数字化管理及运营负责人、PowerData社区主理人等多位业界专家的鼎力推荐。 本书包括4篇14章,具体内容如下。 概念篇从企业面临的主要数据问题入手,逐渐延伸到对数据血缘的相关定义、特征、价值,以及数据组成的深度解读。这部分是真正落地数据血缘项目的基础,只有充分理解了这部分内容,才知道如何与上下游沟通协作。 建设篇先完整展示了一个可落地的数据血缘框架模型——“1355”框架模型,即1个周期、3种实体、5个类型、5个层级,这是数据血缘建设的基础模型;然后详细介绍了数据血缘实施路径,其中包括可能会面临的问题、具体建设方式和具体建设步骤。 技术篇重点数据血缘相关技术和产品,以及数据血缘分析的主要应用场景——数据治理。其中,包括3大数据血缘应用场景、7大数据血缘核心技术、9款主流的数据血缘产品,以及数据血缘在数据治理中的深度实践。 案例篇主要分享了互联网、服务、制造、零售快消等行业中数据血缘建设案例,帮助大家了解典型行业数据血缘的落地情况,以求获得一些启发。
以下为对购买帮助不大的评价