概率与统:据科学视角
新华书店全新正版书籍图书 保证_可开发票_极速发货支持7天无理由
¥
65.9
7.4折
¥
89
全新
库存3件
作者(美)诺曼·马特罗夫|责编:王春华|译者:王彩霞
出版社机械工业
ISBN9787111628941
出版时间2022-03
装帧平装
开本其他
定价89元
货号31405072
上书时间2024-10-19
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
诺曼·马特罗夫(NormanMatloff)是加州大学戴维斯分校计算机科学专业教授,并曾担任该校统计学专业教授。他是JournalofStatisticalSoftware和TheRJournal的编委会成员。他的著作StatisticalRegressionandClassification:FromLinearModelstoMachineLearning曾入选2017年国际Ziegel奖。他还是该校杰出教学奖的获得者。
目录
前言
作者简介
第一部分 概率论基础
第1章 基本的概率模型2
1.1 示例:公共汽车客流量2
1.2 “笔记本”视图:重复实验的概念3
1.2.1 理论方法3
1.2.2 更直观的方法3
1.3 我们的定义4
1.4 “邮寄筒”7
1.5 示例:公共汽车客流量(续)7
1.6 示例:ALOHA网络9
1.6.1 ALOHA网络模型总结10
1.6.2 ALOHA网络计算10
1.7 笔记本环境中的ALOHA12
1.8 示例:一个简单的棋盘游戏13
1.9 贝叶斯法则14
1.9.1 总则14
1.9.2 示例:文档分类15
1.10 随机图模型15
1.10.1 示例:择优连接模型16
1.11 基于组合数学的计算16
1.11.1 5张牌中哪一种情况更有可能:一张国王还是两张红心16
1.11.2 示例:学生的随机分组17
1.11.3 示例:彩票17
1.11.4 示例:数字之差18
1.11.5 多项式系数19
1.11.6 示例:打桥牌时得到4张A的概率19
1.12 练习20
第2章 蒙特卡罗模拟22
2.1 示例:掷骰子22
2.1.1 第一次改进22
2.1.2 第二次改进23
2.1.3 第三次改进24
2.2 示例:骰子问题24
2.3 使用runif()模拟事件25
2.4 示例:公共汽车客流量(续)25
2.5 示例:棋盘游戏(续)25
2.6 示例:断杆26
2.7 我们应该运行模拟多长时间26
2.8 计算补充26
2.8.1 replicate()函数的更多信息26
2.9 练习27
第3章 离散型随机变量:期望值28
3.1 随机变量28
3.2 离散型随机变量28
3.3 独立的随机变量29
3.4 示例:蒙提霍尔问题29
3.5 期望值31
3.5.1 一般性——不只是离散型随机变量31
3.5.2 用词不当31
3.5.3 定义和笔记本视图31
3.6 期望值的性质32
3.6.1 计算公式32
3.6.2 期望值的一些性质33
3.7 示例:公共汽车客流量35
3.8 示例:预测产品需求36
3.9 通过模拟求期望值36
3.10 赌场、保险公司和“总和使用者”与其他情况相比37
3.11 数学补充38
3.11.1 性质E的证明38
3.12 练习38
第4章 离散型随机变量:方差39
4.1 方差39
4.1.1 定义39
4.1.2 方差概念的核心重要性41
4.1.3 关于Var(X)大小的直觉41
4.2 有用的事实42
4.3 协方差43
4.4 指示随机变量及其均值和方差44
4.4.1 示例:图书馆图书归还时间(第一版)44
4.4.2 示例:图书馆图书归还时间(第二版)45
4.4.3 示例:委员会问题中的指示变量45
4.5 偏度47
4.6 数学补充47
4.6.1 切比雪夫不等式的证明47
4.7 练习48
第5章 离散参数分布族49
5.1 分布49
5.1.1 示例:掷硬币直到第一次出现正面为止49
5.1.2 示例:两个骰子的和49
5.1.3 示例:Watts-Strogatz随机图模型50
5.2 参数分布族51
5.3 对我们很重要的案例:pmf的参数族51
5.4 基于伯努利实验的分布51
5.4.1 几何分布族52
5.4.2 二项分布族55
5.4.3 负二项分布族56
5.5 两种主要的非伯努利模型58
5.5.1 泊松分布族58
5.5.2 幂律分布族59
5.5.3 根据数据拟合泊松和幂律模型60
5.6 其他示例62
5.6.1 示例:公共汽车客流量问题…62
5.6.2 示例:社交网络分析63
5.7 计算补充63
5.7.1 R中的图形和可视化63
5.8 练习64
第6章 连续型概率模型66
6.1 随机掷镖游戏66
6.2 单值点的概率为零66
6.3 现在我们有个问题67
6.4 解决该问题的方法:累积分布函数67
6.4.1 累积分布函数67
6.4.2 既非离散也非连续的分布68
6.5 密度函数69
6.5.1 密度函数的性质69
6.5.2 密度的直观含义70
6.5.3 期望值71
6.6 第一个示例71
6.7 著名的连续分布参数族72
6.7.1 均匀分布72
6.7.2 正态(高斯)分布族73
6.7.3 指数分布族74
6.7.4 伽马分布族76
6.7.5 贝塔分布族77
6.8 数学补充79
6.8.1 危险函数79
6.8.2 指数分布族与泊松分布族的对偶性79
6.9 计算补充80
6.9.1 R的integrate()函数80
6.9.2 从密度函数中抽样的逆方法…80
6.9.3 从泊松分布中抽样81
6.10 练习81
第二部分 统计基础
第7章 统计学:序言84
7.1 本章的重要性84
7.2 抽样分布84
7.2.1 随机抽样84
7.3 样本均值85
7.3.1 示例:玩具总体85
7.3.2 X的期望值和方差86
7.3.3 同样的示例:玩具总体87
7.3.4 解释87
7.3.5 笔记本视图88
7.4 简单随机抽样情况88
7.5 样本方差89
7.5.1 σ2的直观估计89
7.5.2 更易于计算的方法89
7.5.3 特殊情况:X为指示变量90
7.6 除以n还是n-190
7.6.1 统计偏差90
7.7 “标准误差”的概念91
7.8 示例:Pima糖尿病研究91
7.9 别忘了:样本≠总体93
7.10 模拟问题93
7.10.1 样本估计93
7.10.2 无限总体93
7.11 观测研究94
7.12 计算补充94
7.12.1 *apply()函数94
7.12.2 数据中的异常值/错误值95
7.13 练习97
第8章 拟合连续模型98
8.1 为什么要拟合参数模型98
8.2 基于样本数据的概率密度函数无模型估计98
8.2.1 仔细观察99
8.2.2 示例:BMI数据99
8.2.3 方块的数量100
8.3 无模型密度估计的高级方法102
8.4 参数估计103
8.4.1 矩量法103
8.4.2 示例:BMI数据103
8.4.3 极大似然估计104
8.4.4 示例:湿度数据105
8.5 MM与MLE106
8.6 拟合优度评估106
8.7 贝叶斯原理107
8.7.1 工作原理108
8.7.2 赞成和反对的理由108
8.8 数学补充108
8.8.1 核密度估计的详细信息108
8.9 计算补充109
8.9.1 常用函数109
8.9.2 gmm包109
8.10 练习110
第9章 正态分布族112
9.1 概率密度及其性质112
9.1.1 在仿射变换下封闭112
9.1.2 在独立求和下封闭113
9.1.3 奥秘113
9.2 R函数114
9.3 标准正态分布114
9.4 评估正态累积分布函数114
9.5 示例:网络入侵115
9.6 示例:班级注册人数116
9.7 中心极限定理116
9.7.1 示例:累积截断误差116
9.7.2 示例:抛硬币117
9.7.3 示例:博物馆演示117
9.7.4 对奥秘的一点洞察118
9.8 X近似服从正态分布118
9.8.1 X的近似分布118
9.8.2 X的精度改进评估119
9.9 建模的重要性119
9.10 卡方分布族119
9.10.1 概率密度及其性质119
9.10.2 示例:插针位置错误120
9.10.3 建模的重要性120
9.10.4 与伽马分布族的关系120
9.11 数学补充121
9.11.1 分布的收敛性和CLT的精确陈述121
9.12 计算补充121
9.12.1 示例:生成正态分布随机数121
9.13 练习122
第10章 统计推断导论123
10.1 正态分布的作用123
10.2 均值的置信区间123
10.2.1 基本方法123
10.3 示例:Pima糖尿病研究124
10.4 示例:湿度数据125
10.5 置信区间的含义125
10.5.1 戴维斯市的一项体重调查…125
10.6 比例的置信区间126
10.6.1 示例:森林覆盖的机器分类127
10.7 学生t分布128
10.8 显著性检验简介129
10.9 公认的均匀硬币129
10.10 基本原理130
10.11 广义的正态检验131
10.12 “p值”的概念131
10.13 什么是随机与非随机132
10.14 示例:森林覆盖率数据132
10.15 显著性检验问题133
10.15.1 显著性检验的历史133
10.15.2 基本问题133
10.15.3 替代方法134
10.16 “p-hacking”问题135
10.16.1 思维实验135
10.16.2 多重推断方法136
10.17 统计学原理136
10.17.1 关于置信区间的更多信息136
10.18 练习137
第三部分 多元分析
第11章 多元分布140
11.1 离散型多元分布140
11.1.1 示例:袋子里的弹珠140
11.2 连续型多元分布140
11.2.1 动机和定义140
11.2.2 利用多元概率密度函数求概率和期望值141
11.2.3 示例:列车交会141
11.3 协方差的度量142
11.3.1 协方差142
11.3.2 示例:委员会示例143
11.4 相关性143
11.4.1 样本估计144
11.5 独立随机变量集144
11.5.1 邮寄筒144
11.6 矩阵形式145
11.6.1 邮寄筒:均值向量145
11.6.2 协方差矩阵145
11.6.3 邮寄筒:协方差矩阵146
11.7 协方差矩阵的样本估计146
11.7.1 示例:Pima数据147
11.8 数学补充147
11.8.1 卷积147
11.8.2 变换方法148
11.9 练习149
第12章 多元正态分布152
12.1 概率密度152
12.2 几何解释152
12.3 R函数154
12.4 特殊情况:新变量是一个随机向量的单一线性组合154
12.5 多元正态分布的性质155
12.6 多元中心极限定理155
12.7 练习156
第13章 混合分布157
13.1 迭代期望157
13.1.1 条件分布157
13.1.2 定理158
13.1.3 示例:有奖掷硬币159
13.1.4 条件期望为随机变量159
13.1.5 方差会怎么样160
13.2 混合分布的进一步研究160
13.2.1 均值和方差的推导160
13.2.2 参数估计161
13.3 聚类162
13.4 练习163
第14章 多维描述与降维164
14.1 什么是过拟合165
14.1.1 “急需数据”165
14.1.2 已知分布165
14.1.3 估计的均值165
14.1.4 偏差/方差权衡:具体说明166
14.1.5 影响167
14.2 主成分分析167
14.2.1 直觉167
14.2.2 主成分分析的性质168
14.2.3 示例:土耳其语教学评估…169
14.3 对数线性模型170
14.3.1 示例:头发颜色、眼睛颜色和性别170
14.3.2 数据的维数171
14.3.3 参数估计171
14.4 数学补充171
14.4.1 PCA的统计推导171
14.5 计算补充172
14.5.1 R表172
14.5.2 对数线性模型的一些细节…173
14.6 练习175
第15章 预测建模176
15.1 示例:Heritage Health奖176
15.2 目标:预测和描述176
15.2.1 术语177
15.3 “关系”是什么意思177
15.3.1 精确定义177
15.3.2 回归函数m()的参数模型…178
15.4 线性参数回归模型中的估计179
15.5 示例:棒球数据180
15.6 多元回归182
15.7 示例:棒球数据(续)182
15.8 交叉项183
15.9 参数估计184
15.9.1 “线性”的含义184
15.9.2 随机X和固定X回归184
15.9.3 点估计和矩阵形式184
15.9.4 近似的置信区间186
15.10 示例:棒球数据(续)187
15.11 虚拟变量188
15.12 分类188
15.12.1 分类=回归189
15.12.2 Logistic回归189
15.12.3 示例:森林覆盖率数据…191
15.12.4 R代码191
15.12.5 分析结果192
15.13 机器学习:神经网络192
15.13.1 示例:预测脊椎畸形193
15.13.2 但是到底发生了什么194
15.13.3 R包194
15.14 计算补充195
15.14.1 15.5.1节中的计算细节…195
15.14.2 关于glm()的更多信息…195
15.15 练习196
第16章 模型简化和过拟合197
16.1 什么是过拟合197
16.1.1 示例:直方图197
16.1.2 示例:多项式回归197
16.2 有什么办法吗198
16.2.1 交叉验证198
16.3 预测子集选择199
16.4 练习199
第17章 离散时序马尔可夫链简介200
17.1 矩阵形式200
17.2 示例:骰子游戏201
17.3 长期状态概率202
17.3.1 平稳分布202
17.3.2 π的计算203
17.3.3 π的模拟计算204
17.4 示例:连续三个正面的游戏205
17.5 示例:公共汽车客流量问题205
17.6 隐马尔可夫模型206
17.6.1 示例:公共汽车客流量207
17.6.2 计算过程207
17.7 谷歌的PageRank207
17.8 计算补充207
17.8.1 矩阵初始化为零矩阵207
17.9 练习208
第四部分 附录
附录A R快速入门210
附录B 矩阵代数220
参考文献223
索引226
内容摘要
本书从数据科学视角,详细讲解概率分布、期望值、估计等概率统计知识,广泛使用真实的数据集,同时所有数据分析均由R编码支持。此外,本书包含许多数据科学应用,如主成分分析、混合分布、随机图模型、隐马尔科夫模型、线性回归、逻辑回归和神经网络等。
主编推荐
本书是一本面向数据科学、计算机科学专业学生的概率统计教材。全书共分为四部分:第壹部分(~6章)主要介绍概率论、蒙特卡罗模拟、离散型随机变量、期望值和方差、离散参数分布族、连续型概率模型;第二部分(第7~10章)主要介绍统计学基础知识,包括抽样分布、极大似然估计、中心极限定理、置信区间和显著性检验等;第三部分(第11~17章)主要介绍多元分析相关内容,包括多元分布、混合分布、主成分分析、对数线性模型、降维、过拟合和预测分析等;第四部分(附录)介绍R语言编程基础知识。
— 没有更多了 —
以下为对购买帮助不大的评价