关键迭代:可信赖的线上对照实验
批量上传,套装书可能不全,下单前咨询在线客服!有特殊要求,下单前请咨询客服!
¥
46.9
4.7折
¥
99
全新
库存24件
作者罗恩
出版社机械工业出版社
ISBN9787111678809
出版时间2022-05
装帧平装
开本16开
定价99元
货号29226524
上书时间2024-11-02
商品详情
- 品相描述:全新
- 商品描述
-
前言
如何阅读本书
如果我们有数据,那就看数据。
如果我们只有观点,那就按我的观点来。
——Jim Barksdale,网景前首席执行官
本书旨在分享多年来Ron在亚马逊和微软、Diane在谷歌以及Ya在微软和领英大规模运行线上对照实验积累的实践经验。虽然我们不是代表谷歌、领英或微软官方,而是以个人身份写作此书,但书中凝聚了我们工作多年积累的关键经验教训和遇到的常见陷阱,并提供了软件平台的搭建以及公司文化的培养方面的指导:如何利用线上对照实验建立数据驱动文化而不是依赖HiPPO(Highest Paid Person’s Opinion, 高薪者的意见)(R. Kohavi, HiPPO FAQ 2019)。我们相信书中的很多经验适用于各种线上环境,不论是大大小小的公司,还是具体到公司内部的团队或组织。书中强调了评估实验结果可信赖度的必要性。我们相信特威曼定律蕴含的怀疑论:任何看起来有趣或与众不同的数字通常都是错的。我们鼓励读者对实验结果,尤其是有突破性的正面结果做二次检查,以及做验证性测试。获得数据很简单,但获得你能信任的数据很难!
本书部分适合所有读者,由四章组成。第1章概述运行线上对照实验的好处,并介绍实验相关术语。第2章用一个例子剖析运行实验的全过程。第3章描述常见的陷阱以及如何建立实验的可信赖度。第4章概述如何搭建实验平台并规模化线上实验。
第二部分到第五部分针对一些特定的读者群体,当然也欢迎其他读者按需阅读。第二部分的五章内容介绍实验的基础原理,比如机构指标。我们推荐所有人阅读这一部分,尤其是领导者和高管。第三部分的两章内容介绍线上对照实验的补充技法,可以帮助管理层、数据科学家、工程师、分析师、产品经理等进行资源和时间的投资。第四部分专注于实验平台的搭建,面向工程师群体。 后,第五部分深入讨论进阶的实验分析专题,面向数据科学家。
本书的配套网站为https://experimentguide.com,它囊括了更多的材料和勘误,并提供了开放性讨论的空间。本书作者的所有收益将捐献给慈善机构。
导语摘要
由谷歌(Google)、领英(LinkedIn)和微软(Microsoft)的实验领导者编写的这本实用指南将教你如何使用可信赖的线上对照实验(也就是A/B测试)来加速创新。根据每年每个公司运行的两万多个对照实验的实践经验,作者为准备着手运行实验的学生和行业的专业人员分享了一些实例、需要避免的陷阱以及建议,并为希望改善自身及其机构做出数据驱动决策方式的高级从业者深入探讨了进阶专题。
目录
本书赞誉
译者序
前言——如何阅读本书
致谢
部分 线上对照实验概览
第1章 概述和写作动机003
1.1 线上对照实验的术语005
1.2 为什么进行实验?相关性、因果关系和可信赖度008
1.3 有效运行对照实验的必要元素010
1.4 宗旨011
1.5 随时间推移的改进013
1.6 有趣的线上对照实验实例015
1.7 战略、战术及它们和实验的关系020
1.8 补充阅读 023
第2章 运行和分析实验——一个全程剖析的案例025
2.1 设立实验025
2.2 假设检验:确立统计显著性028
2.3 设计实验030
2.4 运行实验并获得数据032
2.5 分析结果033
2.6 从结果到决策034
第3章 特威曼定律与实验的可信赖度037
3.1 曲解统计结果038
3.2 置信区间041
3.3 对内部有效性的威胁041
3.4 对外部有效性的威胁046
3.5 细分群的差异049
3.6 辛普森悖论 052
3.7 鼓励健康的怀疑态度054
第4章 实验平台和文化055
4.1 实验成熟度模型055
4.2 基础设施和工具062
第二部分 基础原理
第5章 速度很重要:一个全程案例剖析075
5.1 关键假设:局部线性近似077
5.2 如何测量网站的性能078
5.3 减速实验的设计080
5.4 对不同页面元素的影响是不同的081
5.5 结果083
第6章 机构指标085
6.1 指标的分类086
6.2 指标的制定:原则和技术089
6.3 指标的评估091
6.4 指标的演变092
6.5 更多的资源093
6.6 补充材料:护栏指标093
6.7 补充材料:可操纵性095
第7章 实验指标和综合评估标准097
7.1 从业务指标到适用于实验的指标098
7.2 将关键指标组合成一个OEC099
7.3 案例:亚马逊电子邮件的OEC101
7.4 案例:必应搜索引擎的OEC103
7.5 Goodhart法则、Campbell法则以及Lucas批判104
第8章 机构的经验传承与统合分析107
8.1 什么是机构的经验传承107
8.2 为什么机构的经验传承有用108
第9章 对照实验中的伦理111
9.1 背景111
9.2 数据收集116
9.3 文化与流程117
9.4 补充材料:用户标识符117
第三部分 补充及替代技法
第10章 补充技法121
10.1 补充技法的空间121
10.2 基于日志的分析122
10.3 人工评估124
10.4 用户体验调研125
10.5 焦点小组125
10.6 问卷调查126
10.7 外部数据127
10.8 总结129
第11章 观察性因果研究131
11.1 对照实验不可行的情况131
11.2 观察性因果研究的设计133
11.3 陷阱138
11.4 补充材料:被驳斥的观察性因果研究141
第四部分 实验平台搭建
第12章 客户端实验145
12.1 服务器端和客户端的差异145
12.2 对实验的潜在影响148
12.3 结论152
第13章 工具化日志记录153
13.1 客户端与服务器端的工具化日志记录153
13.2 处理多源的日志155
13.3 工具化日志记录的文化156
第14章 选择随机化单元157
14.1 随机化单元和分析单元159
14.2 用户级别的随机化160
第15章 实验放量:权衡速度、质量与风险163
15.1 什么是放量163
15.2 SQR放量框架164
15.3 四个放量阶段165
15.4 终放量之后168
第16章 规模化实验分析169
16.1 数据处理169
16.2 数据计算170
16.3 结果汇总和可视化172
第五部分 实验分析
第17章 线上对照实验中的统计学知识177
17.1 双样本t检验177
17.2 p值和置信区间178
17.3 正态性假设179
17.4 /二型错误和统计功效181
17.5 偏差183
17.6 多重检验183
17.7 费舍尔统合分析184
第18章 方差估计和提高灵敏度:陷阱及解决方法185
18.1 常见陷阱186
18.2 提高灵敏度189
18.3 其他统计量的方差190
第19章 A/A测试193
19.1 为什么运行A/A测试193
19.2 如何运行A/A测试198
19.3 A/A测试失败时199
第20章 以触发来提高实验灵敏度201
20.1 触发示例201
20.2 数值示例204
20.3 佳的和保守的触发205
20.4 总体实验效应206
20.5 可信赖的触发207
20.6 常见的陷阱207
20.7 开放性问题209
第21章 样本比率不匹配与其他可信度相关的护栏指标211
21.1 样本比率不匹配212
21.2 调试SRM214
第22章 实验变体之间的泄露和干扰219
22.1 示例220
22.2 一些实际的解决方案223
22.3 检测和监控干扰227
第23章 测量实验的长期效应229
23.1 什么是长期效应229
23.2 短期效应和长期效应可能不同的原因230
23.3 为什么要测量长期效应232
23.4 长期运行的实验233
23.5 长期运行实验的替代方法235
参考文献241
索引261
内容摘要
由谷歌(Google)、领英(LinkedIn)和微软(Microsoft)的实验领导者编写的这本实用指南将教你如何使用可信赖的线上对照实验(也就是A/B测试)来加速创新。根据每年每个公司运行的两万多个对照实验的实践经验,作者为准备着手运行实验的学生和行业的专业人员分享了一些实例、需要避免的陷阱以及建议,并为希望改善自身及其机构做出数据驱动决策方式的高级从业者深入探讨了进阶专题。
— 没有更多了 —
以下为对购买帮助不大的评价