商品简介
本书是一本概率编程的入门书。本书使用概率编程库 PyMC3以及可视化库 ArviZ对贝叶斯统计分析的相关知识进行讲解,包括概率思维、概率编程、线性回归建模、广义线性模型、模型比较、混合模型、高斯过程以及推断引擎等知识。全书图文并茂,通俗易懂,适合具备一定 Python基础的读者学习使用。学完本书,读者可以利用概率思维建立贝叶斯模型并解决自己的数据分析问题。
作者简介
奥斯瓦尔多·马丁( Osvaldo Martin)是阿根廷国家科学与技术研究理事会(CONICET)的一名研究员。他曾从事蛋白质、多糖及 RNA分子等结构生物信息学方面的研究,此外,在应用马尔可夫链蒙特卡洛方法模拟分子动力学方向上有着丰富的经验,他喜欢用 Python解决数据分析中的问题。
他曾讲授结构生物信息学、数据科学以及贝叶斯数据分析相关的课程,在 2017年带头组建了阿根廷圣路易斯 PyData委员会。同时,他也是 PyMC3以及 ArviZ两个项目的核心开发者之一。
目录
第 1 章 概率思维 1
1.1 统计学、模型以及本书采用的方法 1
1.1.1 与数据打交道 2
1.1.2 贝叶斯建模 3
1.2 概率论 4
1.2.1 解释概率 4
1.2.2 定义概率 6
1.3 单参数推断 14
1.4 报告贝叶斯分析结果 23
1.4.1 模型表示和可视化 23
1.4.2 总结后验 24
1.5 后验预测检查 26
1.6 总结 27
1.7 练习 28
第 2 章 概率编程 30
2.1 简介 31
2.2 PyMC3 指南 32
2.3 总结后验 34
2.4 随处可见的高斯分布 41
2.4.1 高斯推断 41
2.4.2 鲁棒推断 46
2.5 组间比较 50
2.5.1 Cohen’s d 52
2.5.2 概率优势 53
2.5.3 “小费”数据集 53
2.6 分层模型 57
2.6.1 收缩 60
2.6.2 额外的例子 63
2.7 总结 66
2.8 练习 67
第3 章 线性回归建模 69
3.1 一元线性回归 69
3.1.1 与机器学习的联系 70
3.1.2 线性回归模型的核心 71
3.1.3 线性模型与高自相关性 75
3.1.4 对后验进行解释和可视化 77
3.1.5 皮尔逊相关系数 80
3.2 鲁棒线性回归 84
3.3 分层线性回归 87
3.4 多项式回归 94
3.4.1 解释多项式回归的系数 96
3.4.2 多项式回归——终极模型 97
3.5 多元线性回归 97
3.5.1 混淆变量和多余变量 101
3.5.2 多重共线性或相关性太高 104
3.5.3 隐藏效果变量 107
3.5.4 增加相互作用 109
3.5.5 变量的方差 110
3.6 总结 113
3.7 练习 114
第4 章 广义线性模型 117
4.1 简介 117
4.2 逻辑回归 118
4.2.1 逻辑回归模型 119
4.2.2 鸢尾花数据集 120
4.3 多元逻辑回归 125
4.3.1 决策边界 125
4.3.2 模型实现 126
4.3.3 解释逻辑回归的系数 127
4.3.4 处理相关变量 130
4.3.5 处理不平衡分类 131
……
内容摘要
本书是一本概率编程的入门书。本书使用概率编程库 PyMC3以及可视化库 ArviZ对贝叶斯统计分析的相关知识进行讲解,包括概率思维、概率编程、线性回归建模、广义线性模型、模型比较、混合模型、高斯过程以及推断引擎等知识。全书图文并茂,通俗易懂,适合具备一定 Python基础的读者学习使用。学完本书,读者可以利用概率思维建立贝叶斯模型并解决自己的数据分析问题。
主编推荐
1.概率编程库PyMC3和可视化库ArviZ的核心开发者Osvaldo Martin多年的经验总结,内容可靠实用
2.应用广泛的统计学模型与计算机方法的巧妙结合,知识点丰富,易学易懂
3.帮助读者建立灵活的贝叶斯思维,有效提高数据可靠性,提升数据分析效率
以下为对购买帮助不大的评价