• 机器学习基础——基于Python和scikit-learn的机器学习应用
21年品牌 40万+商家 超1.5亿件商品

机器学习基础——基于Python和scikit-learn的机器学习应用

全新正版 极速发货

40.42 5.8折 69.8 全新

库存5件

广东广州
认证卖家担保交易快速发货售后保障

作者(美)海特·萨拉赫

出版社中国水利水电出版社

ISBN9787517085065

出版时间2020-11

装帧平装

开本16开

定价69.8元

货号1202179404

上书时间2024-05-25

曲奇书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
章 scikit-learn简介

1.1 scikit-learn

1.1.1 scikit-learn的优点

1.1.2 scikit-learn的缺点

1.2 数据表示

1.2.1 数据表

1.2.2 特征矩阵和目标矩阵

1.2.3 练习1:加载实例数据集并创建特征矩阵和目标矩阵

1.2.4 活动1:选择目标特征并创建一个目标矩阵

1.3 数据预处理

1.3.1 混乱的数据

1.3.2 练习2:处理混乱的数据

1.3.3 处理分类特征

1.3.4 练习3:在文本数据上应用特征工程

1.3.5 重新缩放数据

1.3.6 练习4:归一化和标准化数据

1.3.7 活动2:预处理整个数据集

1.4 scikit-learn API

1.5 监督学习和无监督学习

1.5.1 监督学习

1.5.2 无监督学习

1.6 小结

第2章 无监督学习:Real-Life应用

2.1 聚类

2.1.1 聚类类型

2.1.2 聚类的应用

2.2 探索数据集:批发客户数据集

2.3 数据可视化

2.3.1 使用Pandas加载数据集

2.3.2 可视化工具

2.3.3 练习5:从noisy circles数据集中绘制一个特征的直方图

2.3.4 活动3:使用数据可视化来帮助预处理过程

2.4 k-means算法

2.4.1 理解算法

2.4.2 练习6:在数据集上导入和训练k-means算法

2.4.3 活动4:将k-means算法应用于数据集

2.5 mean-shift算法

2.5.1 理解算法

2.5.2 练习7:在数据集上导入和训练mean-shift算法

2.5.3 活动5:将mean-shift算法应用于数据集

2.6 DBSCAN算法

2.6.1 理解算法

2.6.2 练习8:在数据集上导入和训练DBSCAN算法

2.6.3 活动6:将DBSCAN算法应用于数据集

2.7 聚类性能的评估

2.7.1 scikit-learn的可用指标

2.7.2 练习9:评估Silhouette Coefficient分数和Calinski-Harabasz指数

2.7.3 活动7:测量和比较算法的性能

2.8 小结

第3章 监督学习:关键步骤

3.1 模型验证和测试

3.1.1 数据拆分

3.1.2 拆分比

3.1.3 练习10:对实例数据集进行数据拆分

3.1.4 交叉验证

3.1.5 练习11:使用交叉验证将训练集拆分为训练集和验证集

3.1.6 活动8:对手写数字数据集的数据拆分

3.2 评估指标

3.2.1 分类任务的评估指标

3.2.2 练习12:在分类任务上计算不同的评估指标

3.2.3 评估指标的选择

3.2.4 回归任务的评估指标

3.2.5 练习13:计算回归任务的评估指标

3.2.6 活动9:评估在手写数据集上训练的模型的性能

3.3 错误分析

3.3.1 偏差、方差、数据不匹配

3.3.2 练习14:计算不同数据集的错误率

3.3.3 活动10:对经过训练的手写数字识别模型执行错误分析

3.4 小结

第4章 监督学习算法:预测年收入

4.1 探索数据集

4.2 朴素贝叶斯算法

4.2.1 朴素贝叶斯算法的工作原理

4.2.2 练习15:朴素贝叶斯算法应用

4.2.3 活动11:为人口收入普查数据集训练朴素贝叶斯模型

4.3 决策树算法

4.3.1 决策树算法的工作原理

4.3.2 练习16:决策树算法应用

4.3.3 活动12:为人口收入普查数据集训练决策树模型

4.4 支持向量机算法

4.4.1 支持向量机算法的工作原理

4.4.2 练习17:支持向量机算法应用

4.4.3 活动13:为人口收入普查数据集训练支持向量机模型

4.5 错误分析

4.6 小结

第5章 人工神经网络:预测年收入

5.1 人工神经网络

5.1.1 它们是如何工作的

5.1.2 理解超参数

5.1.3 应用程序

5.1.4 局限性

5.2 应用人工神经网络

5.2.1 scikit-learn的多层感知器

5.2.2 练习18:多层感知器分类器的应用

5.2.3 活动14:为人口收入普查数据集训练多层感知器

5.3 性能分析

5.3.1 错误分析

5.3.2 超参数微调

5.3.3 模型比较

5.3.4 活动15:比较不同模型以选择最适合人口收入普查数据问题的方法

5.4 小结

第6章 建立自己的程序

6.1 项目的定义

6.1.1 制定计划:关键阶段

6.1.2 了解数据集

6.1.3 活动16:执行银行营销数据集的准备和创建阶段

6.2 存储并加载一个经过训练的模型

6.2.1 存储模型

6.2.2 练习19:存储经过训练的模型

6.2.3 加载模型

6.2.4 练习20:加载存储的模型

6.2.5 活动17:存储并加载银行营销数据集的最终模型

6.3 与经过训练的模型交互

6.3.1 练习21:创建一个类和一个通道来与经过训练的模型交互

6.3.2 活动18:允许与银行营销数据集模型交互

6.4 小结

附录

章:scikit-learn简介

活动1:选择目标特征并创建一个目标矩阵

活动2:预处理整个数据集

第2章:无监督学习:Real-Life应用

活动3:使用数据可视化来辅助预处理过程

活动4:将k-means算法应用于数据集

……

内容摘要
随着机器学习算法的普及,开发和优化这些算法的新工具也得到了发展。本书首先介绍了scikit-learn包,学习如何使用scikit-learn语法;学习监督模型和无监督模型之间的差异,以及为每个数据集选择适当算法的重要性;学习将无监督聚类算法应用到真实的数据集中,发现其中的规律,并在探索中解决无监督机器学习问题。其次,本书重点研究监督学习算法,学习如何使用scikit-learn包实现不同的监督算法以及如何开发神经网络架构;还将了解如何采用合乎逻辑的结果分析,并通过调节超参数来改善算法的性能。 本书理论讲解与练习实例相结合,并通过大量的活动指导读者进行真实数据集的模拟训练。学完本书将知道如何描述监督模型和无监督模型之间的差异,以及如何将一些流行的算法应用于现实生活中的数据集中,将获得诸多技能并有信心编写机器学习算法。本书面向机器学习领域的新手和希望学习如何使用scikit-learn库开发机器学习算法的开发人员。读者需要具备Python编程方面的一些知识和经验,但不需要任何关于scikit-learn或机器学习算法的先验知识。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP