全新正版书籍,24小时发货,可开发票。
¥ 62.1 5.2折 ¥ 119 全新
库存31件
作者李爽
出版社清华大学出版社
ISBN9787302616573
出版时间2023-04
装帧平装
开本其他
定价119元
货号29574386
上书时间2024-11-27
对于数据科学和人工智能的从业者和学生而言,概率论和数理统计是一门非常重要的基础课,因为现代人工智能和大数据理论是建立在概率统计之上的模型系统,它利用概率统计的“语言”完成人机交互和复杂系统的运行。笔者希望读者通过本书的学习,能打好概率统计基础,进而对后续人工智能、大数据挖掘等专业课起到良好的推动作用。
在广义的计算机科学的学习过程中,很多初学者遭遇的挫折大多来自抽象的数学推导。传统的概率论教学以板书的形式展开,强调理论的完整且细致的证明,这种带有浓重的数学风格的教学模式给很多学生造成了一定程度的困扰,特别是理工科学生,他们不学习数学专业,对数学的兴趣也不算高,他们更喜欢实现具体的模型和算法。笔者认为,要理解一个算法的内在逻辑,没有数学知识是不行的,但也不能一味地追求数学形式的完整,一般来讲,学生具备必要的能读懂文献的数学基础就可以工作了,不需要把书写得那么“数学化”。
本书内容
本书旨在帮助读者解决技术书籍过于“数学化”,一方面本书遵循概率论和数理统计的教学大纲,在数学方面不过于强调,没有过多展开; 另一方面,利用Python工具,实现了大部分的理论和模型,使读者通过“实践”简化学习过程,提高代码编写能力,增强动手能力,为进一步学习人工智能和大数据科学奠定良好的基础。
本书特色
本书在附录中提供了Python基础、微积分基础、线性代数基础和NumPy基础,零基础的读者也能入门。采用计算机程序模拟数学推导的方法使数学知识更为清晰易懂,对初学者更加友好。
本书适合大数据与人工智能相关专业师生和企业一线开发人员参考,也适合对数据科学有兴趣的研究人员学习。
李爽
2023年1月
本书源代码
教学课件(PPT)
本书以Python为工具,全面讲解概率论与数理统计的主要内容和多元统计分析常用技术。全书包括13章和4个附录,内容翔实,讲解深入浅出。概率论4章,讲解概率论基础知识,主要是随机变量的相关理论;数理统计4章,主要是样本理论、参数估计和假设检验;回归分析2章,包括一元和多元回归分析及其统计解释;多元统计3章,主要讲解主成分分析和因子分析理论。整书内容简明,易上手,实用性强。本书不需要读者有良好的数学基础,4个附录提供了Python基础知识、微积分与线性代数的必要基础,可满足不同层次的读者需求。本书的特色是将Python贯穿于内容之中,为读者提供实践练习,也便于读者学习用Python解决实际问题的能力。
本书适用于大数据与人工智能专业的教师和学生,也适用于对数据科学感兴趣的人士和企业界的工程师。
李爽,职业教育大数据研究院研究员,博士后。主持广东省教育厅科研项目一项,广州市科技计划项目一项。发表SCI检索论文4篇,EI检索5篇。现从事大数据及人工智能研究、数据挖掘和机器学习,以及高等教育研究等。
第1章概率论的基本概念
1.1随机试验、样本空间、事件
1.1.1随机试验
1.1.2样本空间
1.1.3事件
1.2事件的关系与运算
1.2.1事件的关系与运算
1.2.2事件的运算律
1.3频率与概率
1.3.1频率
1.3.2概率
1.4等可能概型
1.4.1古典概型
1.4.2几何概型
1.5条件概率与独立性
1.5.1条件概率
1.5.2独立性
1.6全概率公式与贝叶斯公式
1.6.1样本空间的划分
1.6.2全概率公式
1.6.3贝叶斯公式
1.7本章练习
1.8常见考题解析: 随机事件和概率
1.9本章常用的Python函数总结
1.10本章上机练习
第2章随机变量及其分布
2.1随机变量
2.2离散型随机变量及其分布律
2.2.1离散型随机变量
2.2.2离散型随机变量: 伯努利分布
2.2.3离散型随机变量: 几何分布
2.2.4离散型随机变量: 超几何分布
2.2.5离散型随机变量: 二项分布
2.2.6离散型随机变量: 泊松分布
2.3分布函数
2.4连续型随机变量及其概率密度
2.4.1连续型随机变量
2.4.2连续型随机变量: 均匀分布
2.4.3连续型随机变量: 指数分布
2.4.4连续型随机变量: 正态分布
2.5随机变量的函数分布
2.5.1离散型随机变量的函数
2.5.2连续型随机变量的函数
2.6本章练习
2.7常见考题解析: 随机变量及其分布
2.8本章常用的Python函数总结
2.9本章上机练习
第3章多维随机变量及其分布
3.1二维随机变量及其分布函数
3.1.1二维随机变量的分布函数
3.1.2二维离散型随机变量
3.1.3二维连续型随机变量
3.2边缘分布
3.3条件分布
3.4相互独立的随机变量
3.5二维正态分布随机变量
3.6随机变量函数的分布
3.6.1随机变量和的分布
3.6.2随机变量商的分布
3.6.3随机变量积的分布
3.6.4两个随机变量值与小值的分布
3.7本章练习
3.8常见考题解析: 多维随机变量及其分布
3.9本章常用的Python函数总结
3.10本章上机练习
第4章随机变量的数字特征
4.1数学期望
4.1.1离散型随机变量的数学期望
4.1.2连续型随机变量的数学期望
4.1.3随机变量函数的数学期望
4.1.4数学期望的重要性质
4.2方差和标准差
4.2.1方差
4.2.2方差的性质
4.2.3正态分布的均值和方差
4.3协方差和相关系数
4.3.1协方差的性质
4.3.2相关系数的性质
4.3.3相关性与独立性
4.4协方差矩阵
4.4.1协方差矩阵的性质
4.4.2多维正态分布的联合密度
4.5本章练习
4.6常见考题解析: 随机变量的数字特征
4.7本章常用的Python函数总结
4.8本章上机练习
第5章大数定律与中心极限定理
5.1大数定律
5.1.1切比雪夫不等式
5.1.2依概率收敛
5.1.3切比雪夫大数定律
5.1.4辛钦大数定律
5.1.5伯努利大数定律
5.2中心极限定理
5.3本章习题
5.4常见考题解析: 大数定律与中心极限定理
5.5本章常用的Python函数总结
5.6本章上机练习
第6章样本、统计量及抽样分布
6.1总体与样本
6.1.1总体
6.1.2样本
6.1.3样本分布
6.2统计量与抽样分布
6.2.1统计量
6.2.2经验分布函数
6.3三大抽样分布
6.3.1卡方分布(χ2分布)
6.3.2学生分布(t分布)
6.3.3F分布
6.4正态总体的抽样分布
6.5简单统计作图
6.5.1频率直方图
6.5.2箱线图
6.6本章练习
6.7常见考题解析: 样本、统计量及抽样分布
6.8本章常用的Python函数总结
6.9本章上机练习
第7章参数估计
7.1点估计
7.1.1矩估计法
7.1.2似然估计法
7.2估计量的评选标准
7.2.1无偏性
7.2.2有效性
7.2.3相合性
7.3区间估计
7.4正态总体均值与方差的区间估计
7.4.1单个正态总体
7.4.2两个正态总体
7.5单侧区间估计
7.6本章练习
7.7常见考题解析: 参数估计
7.8本章常用的Python函数总结
7.9本章上机练习
第8章假设检验
8.1假设检验的原理
8.2正态总体均值的假设检验
8.2.1单个正态总体均值的假设检验
8.2.2两个正态总体均值的假设检验
8.3正态总体方差的假设检验
8.3.1单个正态总体方差的假设检验
8.3.2两个正态总体方差的假设检验
8.4置信区间与假设检验之间的关系
8.5分布拟合检验
8.5.1单个分布的卡方拟合检验
8.5.2分布族的卡方拟合检验
8.6本章练习
8.7常见考题解析: 假设检验
8.8本章常用的Python函数总结
8.9本章上机练习
第9章一元线性回归
9.1回归分析概述
9.2一元线性回归
9.2.1一元线性回归的数学形式
9.2.2参数的普通小二乘估计
9.2.3参数的似然估计
9.2.4小二乘估计的性质
9.2.5回归方程的显著性检验
9.2.6决定系数
9.2.7残差分析
9.2.8回归系数的区间估计
9.2.9单值预测和区间预测
9.3本章练习
9.4常见考题解析: 一元线性回归
9.5本章常用的Python函数总结
9.6本章上机练习
第10章多元线性回归
10.1多元线性回归模型的数学形式
10.2多元线性回归模型的基本假定
10.3多元线性回归模型的解释
10.4回归参数的估计
10.4.1回归参数的普通小二乘估计
10.4.2回归参数的似然估计
10.4.3参数估计的性质
10.4.4回归方程的显著性检验
10.4.5回归系数的置信区间与拟合优度检验
10.5本章练习
10.6常见考题解析: 多元线性回归
10.7本章常用的Python函数总结
10.8本章上机练习
第11章多重共线性与岭回归
11.1多重共线性产生的原因及其影响
11.2多重共线性的诊断
11.2.1方差扩大因子法
11.2.2特征根判定法
11.3消除多重共线性的方法
11.3.1剔除不重要的解释变量
11.3.2增大样本量
11.3.3回归系数的有偏估计与岭回归
11.3.4岭回归估计的性质
11.3.5岭回归k的选择
11.4本章练习
第12章主成分分析
12.1总体主成分
12.1.1主成分的求法
12.1.2主成分的性质
12.1.3标准化变量的主成分
12.2样本主成分
12.2.1样本主成分的性质
12.2.2主成分的个数
12.3主成分分析的应用
12.4本章练习
12.5本章常用的Python函数总结
12.6本章上机练习
第13章因子分析
13.1因子模型
13.1.1因子载荷的统计意义
13.1.2变量共同度的统计意义
13.1.3公共因子的方差贡献
13.2参数估计
13.2.1主成分法
13.2.2主因子解
13.2.3似然法
13.2.4主成分估计法的步骤
13.3本章练习
13.4本章常用的Python函数总结
13.5本章上机练习
附录APython基础
A.1Python开发环境
A.2Python基础语法
A.2.1Python常用内置数据类型
A.2.2变量的赋值
A.2.3数字类型Numbers
A.2.4字符串类型String
A.3Python标准数据类型
A.3.1Python标准数据类型: 列表
A.3.2Python标准数据类型: 元组
A.3.3Python标准数据类型: 字典
A.3.4Python标准数据类型: 集合
A.4Python中的条件语句和循环语句
A.4.1Python条件语句
A.4.2Python循环语句
附录B微积分基础
B.1映射、函数与极限
B.1.1集合
B.1.2映射与函数
B.1.3极限与连续
B.2导数与微分
B.2.1一阶导数
B.2.2高阶导数
B.2.3泰勒公式
B.2.4函数的值与小值
B.2.5函数图形的绘制
B.3不定积分
B.4定积分
B.5常微分方程
B.6多元函数的偏导数
B.7多元函数的极值
B.8重积分
附录C线性代数基础
C.1向量与矩阵
C.1.1数域
C.1.2向量的代数意义
C.1.3向量的代数运算
C.1.4向量的几何意义
C.1.5矩阵
C.1.6常见特殊矩阵
C.1.7矩阵的运算
C.2线性方程组
C.2.1高斯消元法
C.2.2线性方程组的矩阵
C.2.3齐次线性方程组的解
C.3行列式
C.3.1二阶与三阶行列式
C.3.2排列与逆序数
C.3.3n阶行列式
C.3.4行列式的性质
C.3.5行列式的展开
C.3.6克莱姆法则
C.4矩阵的逆
C.5矩阵的对角化
C.5.1矩阵的相似
C.5.2特征值与特征向量
C.5.3矩阵的对角化
C.5.4正交矩阵
C.5.5实对称矩阵的对角化
附录DNumPy基础
D.1创建NumPy数组
D.1.1使用NumPy内部功能函数
D.1.2从Python列表转换
D.1.3使用特殊的库函数
D.2NumPy中的矩阵和向量
D.3数组属性和操作
D.4数组的索引
D.4.1花式索引
D.4.2布尔索引
D.4.3缺省索引
D.4.4where()函数
D.5通用函数
D.5.1数学运算
D.5.2三角函数
D.5.3位运算函数
D.5.4比较函数
D.6矩阵计算
D.6.1矩阵和向量积
D.6.2矩阵的分解
D.6.3矩阵的特征值
D.6.4矩阵的逆和解方程
参考文献
本书以Python为工具,全面讲解概率论与数理统计的主要内容和多元统计分析常用技术。全书包括13章和4个附录,内容翔实,讲解深入浅出。概率论4章,讲解概率论基础知识,主要是随机变量的相关理论;数理统计4章,主要是样本理论、参数估计和假设检验;回归分析2章,包括一元和多元回归分析及其统计解释;多元统计3章,主要讲解主成分分析和因子分析理论。整书内容简明,易上手,实用性强。本书不需要读者有良好的数学基础,4个附录提供了Python基础知识、微积分与线性代数的必要基础,可满足不同层次的读者需求。本书的特色是将Python贯穿于内容之中,为读者提供实践练习,也便于读者学习用Python解决实际问题的能力。
本书适用于大数据与人工智能专业的教师和学生,也适用于对数据科学感兴趣的人士和企业界的工程师。
李爽,职业教育大数据研究院研究员,博士后。主持广东省教育厅科研项目一项,广州市科技计划项目一项。发表SCI检索论文4篇,EI检索5篇。现从事大数据及人工智能研究、数据挖掘和机器学习,以及高等教育研究等。
— 没有更多了 —
以下为对购买帮助不大的评价