关键迭代:可信赖的线上对照实验9787111678809
正版图书,可开发票,请放心购买。
¥
70.72
7.1折
¥
99
全新
库存8件
作者[美]罗恩·科哈维(RonKohavi);[美]黛安
出版社机械工业出版社
ISBN9787111678809
出版时间2021-04
装帧其他
开本16开
定价99元
货号31127106
上书时间2024-07-30
商品详情
- 品相描述:全新
- 商品描述
-
目录
本书赞誉<br/>译者序<br/>前言——如何阅读本书<br/>致谢<br/>第一部分 线上对照实验概览<br/>第1章 概述和写作动机003<br/>1.1 线上对照实验的术语005<br/>1.2 为什么进行实验?相关性、因果关系和可信赖度008<br/>1.3 有效运行对照实验的必要元素010<br/>1.4 宗旨011<br/>1.5 随时间推移的改进013<br/>1.6 有趣的线上对照实验实例015<br/>1.7 战略、战术及它们和实验的关系020<br/>1.8 补充阅读 023<br/>第2章 运行和分析实验——一个全程剖析的案例025<br/>2.1 设立实验025<br/>2.2 假设检验:确立统计显著性028<br/>2.3 设计实验030<br/>2.4 运行实验并获得数据032<br/>2.5 分析结果033<br/>2.6 从结果到决策034<br/>第3章 特威曼定律与实验的可信赖度037<br/>3.1 曲解统计结果038<br/>3.2 置信区间041<br/>3.3 对内部有效性的威胁041<br/>3.4 对外部有效性的威胁046<br/>3.5 细分群的差异049<br/>3.6 辛普森悖论 052<br/>3.7 鼓励健康的怀疑态度054<br/>第4章 实验平台和文化055<br/>4.1 实验成熟度模型055<br/>4.2 基础设施和工具062<br/>第二部分 基础原理<br/>第5章 速度很重要:一个全程案例剖析075<br/>5.1 关键假设:局部线性近似077<br/>5.2 如何测量网站的性能078<br/>5.3 减速实验的设计080<br/>5.4 对不同页面元素的影响是不同的081<br/>5.5 极端结果083<br/>第6章 机构指标085<br/>6.1 指标的分类086<br/>6.2 指标的制定:原则和技术089<br/>6.3 指标的评估091<br/>6.4 指标的演变092<br/>6.5 更多的资源093<br/>6.6 补充材料:护栏指标093<br/>6.7 补充材料:可操纵性095<br/>第7章 实验指标和综合评估标准097<br/>7.1 从业务指标到适用于实验的指标098<br/>7.2 将关键指标组合成一个OEC099<br/>7.3 案例:亚马逊电子邮件的OEC101<br/>7.4 案例:必应搜索引擎的OEC103<br/>7.5 Goodhart法则、Campbell法则以及Lucas批判104<br/>第8章 机构的经验传承与统合分析107<br/>8.1 什么是机构的经验传承107<br/>8.2 为什么机构的经验传承有用108<br/>第9章 对照实验中的伦理111<br/>9.1 背景111<br/>9.2 数据收集116<br/>9.3 文化与流程117<br/>9.4 补充材料:用户标识符117<br/>第三部分 补充及替代技法<br/>第10章 补充技法121<br/>10.1 补充技法的空间121<br/>10.2 基于日志的分析122<br/>10.3 人工评估124<br/>10.4 用户体验调研125<br/>10.5 焦点小组125<br/>10.6 问卷调查126<br/>10.7 外部数据127<br/>10.8 总结129<br/>第11章 观察性因果研究131<br/>11.1 对照实验不可行的情况131<br/>11.2 观察性因果研究的设计133<br/>11.3 陷阱138<br/>11.4 补充材料:被驳斥的观察性因果研究141<br/>第四部分 实验平台搭建<br/>第12章 客户端实验145<br/>12.1 服务器端和客户端的差异145<br/>12.2 对实验的潜在影响148<br/>12.3 结论152<br/>第13章 工具化日志记录153<br/>13.1 客户端与服务器端的工具化日志记录153<br/>13.2 处理多源的日志155<br/>13.3 工具化日志记录的文化156<br/>第14章 选择随机化单元157<br/>14.1 随机化单元和分析单元159<br/>14.2 用户级别的随机化160<br/>第15章 实验放量:权衡速度、质量与风险163<br/>15.1 什么是放量163<br/>15.2 SQR放量框架164<br/>15.3 四个放量阶段165<br/>15.4 最终放量之后168<br/>第16章 规模化实验分析169<br/>16.1 数据处理169<br/>16.2 数据计算170<br/>16.3 结果汇总和可视化172<br/>第五部分 实验分析<br/>第17章 线上对照实验中的统计学知识177<br/>17.1 双样本t检验177<br/>17.2 p值和置信区间178<br/>17.3 正态性假设179<br/>17.4 第一/二型错误和统计功效181<br/>17.5 偏差183<br/>17.6 多重检验183<br/>17.7 费舍尔统合分析184<br/>第18章 方差估计和提高灵敏度:陷阱及解决方法185<br/>18.1 常见陷阱186<br/>18.2 提高灵敏度189<br/>18.3 其他统计量的方差190<br/>第19章 A/A测试193<br/>19.1 为什么运行A/A测试193<br/>19.2 如何运行A/A测试198<br/>19.3 A/A测试失败时199<br/>第20章 以触发来提高实验灵敏度201<br/>20.1 触发示例201<br/>20.2 数值示例204<br/>20.3 最佳的和保守的触发205<br/>20.4 总体实验效应206<br/>20.5 可信赖的触发207<br/>20.6 常见的陷阱207<br/>20.7 开放性问题209<br/>第21章 样本比率不匹配与其他可信度相关的护栏指标211<br/>21.1 样本比率不匹配212<br/>21.2 调试SRM214<br/>第22章 实验变体之间的泄露和干扰219<br/>22.1 示例220<br/>22.2 一些实际的解决方案223<br/>22.3 检测和监控干扰227<br/>第23章 测量实验的长期效应229<br/>23.1 什么是长期效应229<br/>23.2 短期效应和长期效应可能不同的原因230<br/>23.3 为什么要测量长期效应232<br/>23.4 长期运行的实验233<br/>23.5 长期运行实验的替代方法235<br/>参考文献241<br/>索引261
内容摘要
由谷歌(Google)、领英(LinkedIn)和微软(Microsoft)的实验领导者编写的这本实用指南将教你如何使用可信赖的线上对照实验(也就是A/B测试)来加速创新。根据每年每个公司运行的两万多个对照实验的实践经验,作者为准备着手运行实验的学生和行业的专业人员分享了一些实例、需要避免的陷阱以及建议,并为希望改善自身及其机构做出数据驱动决策方式的高级从业者深入探讨了进阶专题。
— 没有更多了 —
以下为对购买帮助不大的评价