机器学习基础--基于Python和scikit-learn的机器学习应用
①全新正版,现货速发,7天无理由退换货②天津、成都、无锡、广东等多仓就近发货,订单最迟48小时内发出③无法指定快递④可开电子发票,不清楚的请咨询客服。
¥
31.48
4.5折
¥
69.8
全新
库存7件
作者(美)海特·萨拉赫|责编:杨静华|译者:邹伟
出版社中国水利水电
ISBN9787517085065
出版时间2020-11
装帧平装
开本其他
定价69.8元
货号31005351
上书时间2024-10-12
商品详情
- 品相描述:全新
- 商品描述
-
目录
第1章 scikit-learn简介
1.1 scikit-learn
1.1.1 scikit-learn的优点
1.1.2 scikit-learn的缺点
1.2 数据表示
1.2.1 数据表
1.2.2 特征矩阵和目标矩阵
1.2.3 练习1:加载实例数据集并创建特征矩阵和目标矩阵
1.2.4 活动1:选择目标特征并创建一个目标矩阵
1.3 数据预处理
1.3.1 混乱的数据
1.3.2 练习2:处理混乱的数据
1.3.3 处理分类特征
1.3.4 练习3:在文本数据上应用特征工程
1.3.5 重新缩放数据
1.3.6 练习4:归一化和标准化数据
1.3.7 活动2:预处理整个数据集
1.4 scikit-learn API
1.5 监督学习和无监督学习
1.5.1 监督学习
1.5.2 无监督学习
1.6 小结
第2章 无监督学习:Real-Life应用
2.1 聚类
2.1.1 聚类类型
2.1.2 聚类的应用
2.2 探索数据集:批发客户数据集
2.3 数据可视化
2.3.1 使用Pandas加载数据集
2.3.2 可视化工具
2.3.3 练习5:从noisy circles数据集中绘制一个特征的直方图
2.3.4 活动3:使用数据可视化来帮助预处理过程
2.4 k-means算法
2.4.1 理解算法
2.4.2 练习6:在数据集上导入和训练k-means算法
2.4.3 活动4:将k-means算法应用于数据集
2.5 mean-shift算法
2.5.1 理解算法
2.5.2 练习7:在数据集上导入和训练mean-shift算法
2.5.3 活动5:将mean-shift算法应用于数据集
2.6 DBSCAN算法
2.6.1 理解算法
2.6.2 练习8:在数据集上导入和训练DBSCAN算法
2.6.3 活动6:将DBSCAN算法应用于数据集
2.7 聚类性能的评估
2.7.1 scikit-learn的可用指标
2.7.2 练习9:评估Silhouette Coefficient分数和Calinski-Harabasz指数
2.7.3 活动7:测量和比较算法的性能
2.8 小结
第3章 监督学习:关键步骤
内容摘要
随着机器学习算法的普及,开发和优化这些算法的新工具也得到了发展。本书首先介绍了scikit-learn包,学习如何使用scikit-learn语法;学习监督模型和无监督模型之间的差异,以及为每个数据集选择适当算法的重要性;学习将无监督聚类算法应用到真实的数据集中,发现其中的规律,并在探索中解决无监督机器学习问题。其次,本书重点研究监督学习算法,学习如何使用scikit-learn包实现不同的监督算法以及如何开发神经网络架构;还将了解如何采用合乎逻辑的结果分析,并通过调节超参数来改善算法的性能。
本书理论讲解与练习实例相结合,并通过大量的活动指导读者进行真实数据集的模拟训练。学完本书将知道如何描述监督模型和无监督模型之间的差异,以及如
何将一些流行的算法应用于现实生活中的数据集中,将获得诸多技能并有信心编写机器学习算法。
本书面向机器学习领域
的新手和希望学习如何使用scikit-learn库开发机器学习算法的开发人员。读者需要
具备Python编程方面的一些知识和经验,但不需要任何关于scikit-learn或机器学习算法的先验知识。
— 没有更多了 —
以下为对购买帮助不大的评价