python机器学 基于pytorch和scikit-learn 人工智能 (美)塞巴斯蒂安·拉施卡,(美)刘玉溪,(美)瓦希德·米尔贾利利
none
¥
92.65
5.8折
¥
159
全新
库存84件
作者(美)塞巴斯蒂安·拉施卡,(美)刘玉溪,(美)瓦希德·米尔贾利利
出版社机械工业出版社
ISBN9787111726814
出版时间2023-06
版次1
装帧平装
开本16
页数620页
字数864千字
定价159元
货号xhwx_1202938256
上书时间2024-11-29
商品详情
- 品相描述:全新
-
正版特价新书
- 商品描述
-
主编:
本书是一本在pytorch环境下学机器学和深度学的综合指南,可以作为初学者的入门教程,也可以作为读者开发机器学项目时的参书。 本书讲解清晰、示例生动,深入介绍了机器学方法的基础知识,不仅提供了构建机器学模型的说明,而且提供了构建机器学模型和解决实际问题的基本准则。 本书添加了基于pytorch的深度学内容,介绍了新版cikitlearn。本书涵盖了多种用于文本和图像分类的机器学与深度学方法,介绍了用于生数据的生成对抗网络(gan)和用于训练智能体的强化学。后,本书还介绍了深度学的新动态,包括图神经网络和用于自然语言处理(nlp)的大型tranformer。 无论是机器学入门新手,还是计划跟踪机器学进展的研发人员,都可以将本书作为使用python进行机器学的。
目录:
译者序
序
前言
作者简介
审校者简介
章赋予计算机从数据中学的能力1
1.1将数据转化为知识的智能系统1
1.2三种机器学类型2
1.2.1用于预测未来的监督学2
1.2.2解决交互问题的强化学4
1.2.3发现数据中隐藏规律的无监督学 5
1.3基本术语与符号6
1.3.1本书中使用的符号和约定6
1.3.2机器学术语8
1.4构建机器学系统的路线图8
1.4.1数据预处理——让数据可用8
1.4.2训练和选择预测模型9
1.4.3使用未见过的数据对模型进行评估10
1.5使用python实现机器学算法10
1.5.1从python package index中安装python和其他软件包10
1.5.2使用anaconda python软件包管理器11
1.5.3科学计算、数据科学和机器学软件包12
1.6本章小结13
第2章训练简单的机器学分类算法14
2.1人工神经元——机器学早期历史一瞥14
2.1.1人工神经元的定义15
2.1.2感知机学规则16
2.2使用python实现感知机学算法19
2.2.1面向对象的感知机api19
2.2.2使用鸢尾花数据集训练感知机22
2.3自适应线神经元与算法收敛27
2.3.1使用梯度下降法小化损失函数28
2.3.2在python中实现adaline30
2.3.3通过特征缩放改进梯度下降34
2.3.4大规模机器学与梯度下降36
2.4本章小结41
第3章scikit-learn机器学分类算法之旅42
3.1分类算法的选择42
3.2学scikit-learn的步——训练感知机43
3.3用逻辑回归算法建模分类概率48
3.3.1逻辑回归与条件概率48
3.3.2用逻辑损失函数更新模型权重51
3.3.3从adaline的代码实现到逻辑回归的代码实现53
3.3.4用scikit-learn训练逻辑回归模型56
3.3.5使用正则化避模型过拟合59
3.4基于大分类间隔的支持向量机62
3.4.1理解大分类间隔62
3.4.2使用松弛变量解决非线可分问题62
3.4.3scikit-learn中另外一种实现64
3.5使用核支持向量机求解非线问题64
3.5.1处理线不可分数据的核方法64
3.5.2使用核方法在高维空间中寻找分离超面66
3.6决策树学69
3.6.1大化信息增益70
3.6.2构建决策树73
3.6.3多棵决策树组成森林76
3.7基于惰学策略的k近邻算法78
3.8本章小结81
第4章构建良好的训练数据集——数据预处理83
4.1处理缺失值83
4.1.1识别表格数据中的缺失值83
4.1.2删除含有缺失值的样本或特征85
4.1.3填补缺失值85
4.1.4scikit-learn的估计器86
4.2处理类别数据87
4.2.1用pandas实现类别数据编码88
4.2.2映有序特征88
4.2.3类别标签编码89
4.2.4标称特征的独热编码90
4.3将数据集划分为训练数据集和测试数据集93
4.4使特征具有相同的尺度95
4.5选择有意义的特征97
4.5.1用l1和l2正则化对模型复杂度进行惩罚98
4.5.2l2正则化的几何解释98
4.5.3l1正则化与稀疏解99
4.5.4序贯特征选择算法102
4.6用森林评估特征重要107
4.7本章小结109
第5章通过降维方法压缩数据110
5.1无监督降维的主成分分析方法110
5.1.1主成分分析的主要步骤110
5.1.2提取主成分的步骤112
5.1.3方差和被解释的方差114
5.1.4特征变换115
5.1.5用scikit-learn实现主成分分析118
5.1.6评估特征的贡献120
5.2监督数据压缩的线判别分析方法122
5.2.1主成分分析与线判别分析122
5.2.2线判别分析基本123
5.2.3计算散布矩阵124
5.2.4为新特征子空间选择线判别式126
5.2.5将样本投影到新的特征空间128
5.2.6用scikit-learn实现线判别分析128
5.3非线降维和可视化130
5.3.1非线降维的不足130
5.3.2使用t-sne可视化数据131
5.4本章小结135
第6章模型评估和超参数调优的佳实践136
6.1使用pipeline方法简化工作流程136
6.1.1加载威斯康星乳腺癌数据集136
6.1.2在pipeline中集成转换器和估计器138
6.2使用k折交验证评估模型能140
6.2.1holdout交验证140
6.2.2k折交验证140
6.3用学曲线和验证曲线调试算法144
6.3.1使用学曲线解决偏差和方差问题144
6.3.2使用验证曲线解决过拟合和欠拟合问题146
6.4通过网格搜索微调机器学模型148
……
内容简介:
本书深入介绍了机器学领域的基本概念和方法,除介绍了python机器学库和用机器学库搭建神经网络模型的方法外,还介绍了机器学算法的数学理论、工作、使用方法、实现细节以及如何避机器学算法实现过程中的常见问题。本书涵盖了多种用于文本和图像分类的机器学与深度学方法,以及用于生数据的生成对抗网络(gan)和用于训练智能体的强化学,还介绍了深度学的新动态,包括图神经网络和用于自然语言处理(nlp)的大型tranformer。本书讲解清晰,示例生动,理论和实践部分相对衡,既可以作为机器学领域初学者的入门教程,也可以作为读者开发机器学项目时的参书。
— 没有更多了 —
以下为对购买帮助不大的评价