• DataOps实践手册:敏捷精益的数据运营
  • DataOps实践手册:敏捷精益的数据运营
  • DataOps实践手册:敏捷精益的数据运营
  • DataOps实践手册:敏捷精益的数据运营
  • DataOps实践手册:敏捷精益的数据运营
21年品牌 40万+商家 超1.5亿件商品

DataOps实践手册:敏捷精益的数据运营

正版保障 假一赔十 可开发票

55.07 5.6折 99 全新

库存12件

广东广州
认证卖家担保交易快速发货售后保障

作者哈文德

出版社机械工业出版社

ISBN9787111716068

出版时间2022-10

装帧精装

开本16开

定价99元

货号29472783

上书时间2024-10-31

兴文书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
前言
关于作者
    哈文德·阿特瓦尔(Harvinder Atwal)是一名数据专家,具备丰富的从业经验,擅于通过数据分析来增强客户体验和提高业务绩效。他不仅对算法十分感兴趣,还对从数据中获取价值所需的人员、流程和技术变革非常关注。他喜欢分享自己的想法,曾在伦敦的 O′Reilly Strata 数据会议、伦敦的开放数据科学会议 (ODSC) 和巴塞罗那的数据领袖峰会等活动中多次发表演讲。
    哈文德·阿特瓦尔目前在Moneysupermarket集团管理数据职能部门,负责数据全生命周期管理工作,包括数据采集、数据管理、数据治理、云和内部数据平台管理、数据工程、商业智能、产品分析和数据科学。此前,他曾在 Dunnhumby、英国劳埃德银行集团和英国航空公司管理数据分析团队。他先后获得了伦敦大学学院的本科学位和伯明翰大学工程学院的运筹学硕士学位。 

    关于技术审核
    大卫·佩珀(David Paper)博士是犹他州立大学管理信息系统系的教授。他撰写了《商业网络编程:基于Oracle数据库的PHP面向对象编程》一书,在《组织研究方法》《ACM通信》《信息与管理》《信息资源管理杂志》《AIS通信》《信息技术案例与应用研究》《长期规划》等权威期刊上发表了70多篇论文。
    大卫·佩珀还曾以包括副主编在内的各种身份在多个编辑委员会任职。除了在家族企业工作之外,他还曾在德州仪器、DLS公司和凤凰城小企业管理局工作,并曾为IBM、AT&T、Octel、犹他州交通部和空间动力学实验室提供信息系统咨询工作。其教学和研究领域包括数据科学、流程再造、面向对象编程、电子客户关系管理、变更管理、电子商务和企业集成。

    作者致谢
    本书是基于我25年的数据分析学习和工作经验完成的。在这期间,很多事情都发生了变化,但我始终要感谢前辈的领导、激励和指导。我希望以同样的方式帮助其他人成长。
    我很庆幸在优秀的数据分析领域组织中工作,特别是英国航空公司、英国劳埃德银行集团和Moneysupermarket集团。非常感谢皮尔斯·斯图伯斯(Piers Stobbs)给我这个机会让这本书问世。 
    如果没有在多个数据领导力社区中与同行进行讨论,就不会有创作本书的想法。我们面临的共同挑战和充满干货的对话是实践数据运营的灵感和基础。
    多亏了那些不为炒作而真正愿意分享想法解决实际问题的人们,才使得世界变得更加美好。我非常感激DataKitchen公司的克里斯托弗·伯格(Christopher Bergh)、吉尔·本吉亚特(Gil Benghiat)、埃兰·斯特罗德(Eran Strod)和迈克·亨蒂安(Mike Huntyan),Tamr公司的安迪·帕尔默(Andy Palmer),以及其他许多人,将DataOps作为公司数据价值转化过程中所面临的诸多问题的解决办法,并加以宣传。
    如果没有出版社编辑们的大力支持,这本书不可能与大家见面。感谢乔纳森·根尼克(Jonathan Gennick)对这部作品的信任,以及吉尔·巴尔扎诺(Jill Balzano)在编辑方面的帮助。特别感谢大卫博士为本书做技术评审,他的意见让本书内容更加全面。 后,感谢家人在我创作过程中给予的耐心和理解。

    引言
    现在正是数据工作的 时期。随着数据呈指数级增长,机器学习(ML)和人工智能(AI)算法不断完善,处理比十年前更多数据的软件数量爆炸式增长,用于存储和处理数据的大数据技术不断进步,为商业、科学和政府等领域带来了转型机遇。
    数据科学旨在帮助我们更好地做出决策,从而采取有益的行动,而不只是从数据中提取知识这么简单。数据科学通过将科学的方法、算法和过程应用于各种形式的数据来实现。数据科学不是独立存在的,它是包括数据工程以及更广泛的数据分析领域在内的技术生态系统的一部分。
    尽管任何技术变革都可能引起炒作的问题,数据科学也不例外,但许多行业和领域仍处于数据驱动的数字化转型初始阶段。未来十年,机器学习、深度学习和其他数据科学技术将改变我们生活的方方面面,这不仅包括个性化医疗、财务管理,还包括如何与机器交互,甚至是自动驾驶汽车或虚拟AI助理等。
    现在处于数据驱动转型的初始阶段,我们也才刚刚开始了解从原始数据到交付预期结果所需的 佳流程。现代数据科学仍处于类似19世纪初制造业面临的定制手工生产和机械自动化之间的过渡阶段。

    为什么要读这本书?
    不幸的是,缺乏成熟度意味着存在很多失败的可能性。有大量证据表明,尽管大多数公司在数据科学方面投入了大量资金,但回报与资金投入并不匹配,很多公司仍然无法从数据投资中创造业务价值。从Forrester的调查结果来看,目前只有22%的公司从数据科学方面的支出中获得了显著的回报。大多数数据科学实施要么是与客户毫无关系的实验室研究项目,要么是不面向产品开发的本地应用程序,或者是高成本的 IT 项目。
    尽管失败率很高,但有关数据科学的方法和讨论却还是老样子。许多数据科学家都在谈论如何创建机器学习或人工智能模型,但很少有人谈论如何将它们投入一个为客户服务的实时可靠的生产操作环境中。从数据中创造业务和客户价值方面考虑,算法只是冰山一角。
    大数据技术供应商喜欢推广 新的数据存储和处理解决方案,但很少有人讨论如何让非 IT 终端消费者可以轻松访问数据。解决方案供应商喜欢讨论使用 新的数据平台,但没有考虑如何克服有效使用数据时的流程障碍。在以往流程基础中增加新技术只会导致整个流程变得成本高昂。
    自从 20 多年前开始从事这个行业以来,我一直提倡使用软技能、数据可视化和洞察力来帮助组织做出更好的决策,而没有对数据生产力造成太大影响。软技能对于数据科学家来说至关重要,他们需要处理极其复杂的问题,并且必须将其转化为简单的术语供他人使用。然而,即使是拥有 佳软技能的数据科学家,在依赖人类直觉进行决策的组织文化中,也很难推动决策和后续行动。
    所以,仅仅专注于技术、算法和软技能是不够的。如果总是听到相同的解决方案,但结果一直很差,这说明与数据分析相关的普遍说法很可能是错误的。
    大多数管理和使用数据的方法都是在数据稀缺、计算机资源昂贵、存储受限、测试和学习机会极少,以及数字自动化匮乏的环境下研究出来的。数据的主要目的是用于运营,因此具有严格的管理和访问控制要求,从而避免出现问题。只有 型的组织(通常是政府、金融机构、运输公司和大型制造商)才会应用数据分析来解决其 重要的问题。例如,我 早的一个项目是帮助英国航空公司确定长途飞机的 佳购买组合方式,作为投入数十亿美元的机队更新计划的一部分。很大的不确定性使得决策变得困难,而且很多时间都花在了结果和潜在风险的范围建模上,通常这样的项目需要几年的时间才能下结论。
    我们现在生活在一个数据约束更少的世界。因此,无论是照片编辑手机App还是自动编写电子邮件,数据驱动的决策可以(并且有望)在任何地方以更小的变化发展。现在,生成经验数据来学习和减少决策的不确定性也比以往任何时候都容易。
    然而,大多数组织仍然将数据科学视为一系列大型定制瀑布式研究项目,在数据提供方面存在人为限制,而数据驱动的决策可以自动化、可扩展、可重复、可测试和更快速。数据科学投资的低回报仅仅是应用20世纪的方法来管理数据的结果,而现在应采用21世纪的方法来为 21 世纪的机遇提供更好的决策。
    到2016年底之前,我对数据科学家们在帮助客户和利益相关者的能力方面没有任何改善仍感到失望。尽管我们也在为公司增加价值,帮助公司完成为客户省钱的使命,但仍然存在大量障碍和挫折。大量的时间被用来帮助业务提出问题或解释为什么这个问题不值得花费数据科学家宝贵的时间来回答。
    数据科学家在不直接影响行动的情况下给出决策、支持洞察力。获取新数据和调查数据差异占用了大量资源。基于云的现代分析和数据湖的基础设施越来越难以维护和优化,这限制了我们从旧架构迁移的速度。旧架构和工具需要专业技能才能使用,这导致数据科学家成为业务利益相关者的瓶颈,或者成为制作临时数据分析的昂贵资源。总而言之,我们的效率没有达到应有的水平,需要采取完全不同的方法。

    DataOps 是什么?
    随着数据科学与分析技术的成熟,许多其他行业从业者也面临着和数据科学与分析类似的挑战,他们需要尽可能高效地增加价值,同时还要处理高度复杂的问题。 适用的两种应用是制造业和软件开发,它们创造了革命性的方法,如精益制造、敏捷开发和DevOps,可供数据科学与分析专业人士采用。
    出于必要性考虑,2017年,我决定测试一种不同的方法来帮助企业提供数据驱动的个性化,这已成为一项关键的营销策略,但企业希望快速看到结果以证明进一步投资的合理性。在一家互联网公司的工作经历使我熟悉了同事们在软件开发、产品工程和产品管理方面使用的许多概念和方法,这些概念和方法可以快速将想法转化为 小可行产品(MVP),然后随着时间的推移进行迭代优化。因此,我决定将这些方法应用于面向客户提供个性化体验所需的数据和机器学习模型生命周期。
    步是与营销团队密切合作,就项目目标达成共识并优先考虑要测试的假设条件。接下来,我们确定了实现目标所需的数据产品,如机器学习特征数据集、机器学习模型和仪表板,以衡量实验结果。新研发的模型帮助我们收集了来自外部客户的重要反馈。
在这个阶段,整合数据、构建模型和部署模型仍然是一个“绳子和胶带”的过程,因此有必要增加数据工程团队的参与程度。他们利用自己的技能来提高数据可用性、监控数据质量、自动化和加速大部分数据管道、重构数据转换以提高效率和可重用性,并对机器学习输出结果和下游平台进行严格测试和集成。
    接下来是一段持续改进的时期,因为实验的测量结果为我们提供了关于假设的具体反馈以及与其他团队合作整合的数据,这非常有利于后续测试。此外,对整个数据周期的分析确定了那些需要消除的瓶颈,以及需要与数据工程和技术团队解决的质量问题。
    结果大大超出预期。在3个月内,开发新的机器学习模型和分析实验所需的时间大大缩减。更重要的是,在6个月内,对客户和收入KPI的影响非常有效。如果继续采用零碎的项目优先顺序和交付方法,可能需要花费相当长的时间才能实现预期的成果。不知不觉地,我们意外开始了DataOps 驱动的数据科学之旅。

导语摘要
数据运营是指通过数据来分析和解决问题,利用各种数据科学技术挖掘数据价值,帮助企业优化业务管理和提升决策效率。随着我国数字化转型的深入,传统基于项目、人工处理的各类数据运营活动已经无法满足业务发展要求。集合了敏捷开发、精益制造以及DevOps理念的DataOps因此顺势而生,并且受到了业界的广泛关注。
    《DataOps实践手册:敏捷精益的数据运营》总结了作者25年的行业经验和对DataOps的认知,从当前数据科学交付面临哪些挑战、什么是DataOps、通过哪些手段可以建立对数据的信任,以及如何实现DataOps目标和成功实施DataOps几个方面进行了系统的阐述。 
    《DataOps实践手册:敏捷精益的数据运营》适合参与数字化转型的各类角色人员学习,尤其有助于数据科学高级管理岗位的专业人士开拓视野、提升领导力。

作者简介
马欢,本科毕业于同济大学,后获得上海交通大学工学硕士学位。从开发工程师做起,担任过系统分析师、系统架构师、项目经理等角色。具有20多年的信息系统开发设计经验,曾经两次获得部级科技发展奖项。主持翻译了《DAMA-DMBOK数据管理知识体系指南》系列等专业书籍,作为骨干编委参与编写《国际数据之都——上海城市数字化转型市民手册》,此外还翻译了《首席数据官管理手册:建立并运行组织的数据供应链》《区块链重构规则》《数据与现实》《星型模型》等多本译著。2011年首次把数据管理专业认证CDMP引入中国,并获得CDMP大师级认证,主理的“DAMA数据管理”是国内*活跃的专业社区之一。

目录
译者序
前言
第1部分 入门
第1章 数据科学中的问题
   有问题吗?
        现实
        数据价值
        技术、软件和算法
        数据科学家
        数据科学过程
        组织文化
   知识鸿沟
        数据科学家的知识鸿沟
        IT知识鸿沟
        技术知识鸿沟
        领导力知识鸿沟
        数据素养鸿沟
        缺乏支持
        教育和文化
        不明确的目标
        留给数据科学家来弄清楚
   总结
   尾注
第2章 数据战略
   我们为什么需要新的数据战略
        数据已不再属于IT
        数据战略的范围 
        战略时间跨度 
        战略发起人
        从识别现状开始
        组织方面
        人员方面
        技术方面
        流程方面
        数据资产方面
   识别分析用例
        使命、愿景和KPI
        构思——我们能做些什么?
   数据生命周期的基准能力
        差距分析——需要改变什么?
        定义数据战略目标——我们需要
        从哪里开始?
   交付数据战略
        定义数据战略举措——我们如何
        实现目标?
        制定执行和度量计划——如何
        知道进度?
   总结
   尾注
第2部分 迈向数据运营
第3章 精益思维
   精益思维简介
        丰田的起源
        精益软件开发
        精益产品开发
   精益思维和数据分析
        识别浪费
        价值流图
        快速交付
        拉动式系统
        看到整体
        根因分析
   总结
   尾注
第4章 敏捷协作
   为什么选择敏捷?
        瀑布式项目管理
        敏捷价值观
   敏捷框架
        Scrum
        XP及 Scrum/XP 混合
        看板方法
        Scrumban
   大规模敏捷
        SoS
        规范敏捷交付
        规模化敏捷框架
   DataOps的敏捷
        DataOps宣言
        DataOps原则
        数据科学生命周期
   敏捷DataOps 实践
        构思
        准备
        研发
        过渡/生产
   总结
   尾注
第5章 构建反馈和度量
   系统思维
        持续改进
        反馈循环
   团队健康
        回顾
        健康检查
        海星回顾
        帆船回顾
        事前检验
   服务交付
        服务交付审查会议
        改进服务交付
   产品健康
        数据产品监控的KPI
        监控
        概念漂移
   产品效益
        效益度量
        效益度量的挑战
        A/B测试和度量的替代方案
        指标的挑战
   总结
   尾注

第3部分 进一步措施
第6章 建立信任
   信任拥有数据和系统的人
        访问和供应数据
        数据安全和隐私
        资源利用率监控
   人们可以信任数据
        元数据
        加标签
        采集过程中的信任
        数据质量评估
        数据清理
        数据血缘
        数据发现
        数据治理
   总结
   尾注
第7章 面向 DataOps 的 DevOps
   开发和运营
        冲突
        打破螺旋
   持续交付的快速流程
        可重现的环境
        部署管道
        持续集成
        自动化测试
   部署和发布流程
        自动部署
        发布流程
        DevOps 度量
        审核流程
   数据分析的DevOps
        数据冲突
        数据管道环境
        数据管道编排
        数据管道持续集成
        简化和重用
   MLOps 和 AIOps
        机器学习模型开发
        机器学习模型投产
   总结
   尾注
第8章 DataOps 组织
   团队结构
        面向职能的团队
        面向领域的团队
        新技能矩阵
        核心角色
        支持角色
        团队不需要“I型人”
   优化团队
        沟通渠道和团队规模
        产品型而非项目型
        办公位置
   汇报关系
        数据平台管理
        跨职能角色
   总结
   尾注
第4部分 自服务组织
第9章 DataOps 技术
   基于DataOps的价值和原则选择
        工具
        调整脊椎模型
        对实践和工具的影响
   DataOps技术生态系统
        流水线
        数据集成
        数据准备
        流处理
        数据管理
        可重复性、部署、编排和监控
        计算基础设施和查询执行引擎
        数据存储
        DataOps平台
        数据分析工具
        挑战
   建造vs购买
        扩展
        内部构建
        购买或租赁现成产品
        借用开源软件
        扩建、构建、购买、出租或借用
        云原生架构
   不断发展的技术栈
        Wardley地图
        使用Wardley地图
        技术雷达
   总结
   尾注
第10章 DataOps工厂
   步
        从数据战略开始
        领导力
   小可行的DataOps
        个方案
        度量
        第

内容摘要
数据运营是指通过数据来分析和解决问题,利用各种数据科学技术挖掘数据价值,帮助企业优化业务管理和提升决策效率。随着我国数字化转型的深入,传统基于项目、人工处理的各类数据运营活动已经无法满足业务发展要求。集合了敏捷开发、精益制造以及DevOps理念的DataOps因此顺势而生,并且受到了业界的广泛关注。
    《DataOps实践手册:敏捷精益的数据运营》总结了作者25年的行业经验和对DataOps的认知,从当前数据科学交付面临哪些挑战、什么是DataOps、通过哪些手段可以建立对数据的信任,以及如何实现DataOps目标和成功实施DataOps几个方面进行了系统的阐述。 
    《DataOps实践手册:敏捷精益的数据运营》适合参与数字化转型的各类角色人员学习,尤其有助于数据科学高级管理岗位的专业人士开拓视野、提升领导力。

主编推荐
马欢,本科毕业于同济大学,后获得上海交通大学工学硕士学位。从开发工程师做起,担任过系统分析师、系统架构师、项目经理等角色。具有20多年的信息系统开发设计经验,曾经两次获得部级科技发展奖项。主持翻译了《DAMA-DMBOK数据管理知识体系指南》系列等专业书籍,作为骨干编委参与编写《国际数据之都——上海城市数字化转型市民手册》,此外还翻译了《首席数据官管理手册:建立并运行组织的数据供应链》《区块链重构规则》《数据与现实》《星型模型》等多本译著。2011年首次把数据管理专业认证CDMP引入中国,并获得CDMP大师级认证,主理的“DAMA数据管理”是国内*活跃的专业社区之一。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP