作者简介
秋庭伸也(作者)
日本早稻田硕士,目前在Recruit Communications公司担任技术负责人。
杉山阿圣(作者)
具有多年研发经验,目前在AI创业公司SENSY担任机器学习研究员。
寺田学(作者)
CMS Communications公司董事长、日本PyCon会议组织者、Plone基金会大使、Python发展协会顾问理事、PSF(Python软件基金会)贡献成员。
郑明智(译者)
智慧医疗,翻译经验丰富,有《白话机器学习的数学》《用Python动手学机器学习》等多部译著。
目录
第1章 机器学习基础
1.1 机器学习概要
什么是机器学习
机器学习的种类
机器学习的应用
1.2 机器学习的步骤
数据的重要性
有监督学习(分类)的例子
无监督学习(聚类)的例子
可视化
图形的种类和画法:使用Matplotlib显示图形的方法
使用pandas理解和处理数据
本章小结
第2章 有监督学习
2.1 算法1:线性回归
概述
算法说明
详细说明
2.2 算法2:正则化
概述
算法说明
详细说明
2.3 算法3:逻辑回归
概述
算法说明
详细说明
2.4 算法4:支持向量机
概述
算法说明
详细说明
2.5 算法5:支持向量机(核方法)
概述
算法说明
详细说明
2.6 算法6:朴素贝叶斯
概述
算法说明
详细说明
2.7 算法7:随机森林
概述
算法说明
详细说明
2.8 算法8:神经网络
概述
算法说明
详细说明
2.9 算法9:KNN
概述
算法说明
详细说明
第3章 无监督学习
3.1 算法10:PCA
概述
算法说明
详细说明
3.2 算法11:LSA
概述
算法说明
详细说明
3.3 算法12:NMF
概述
算法说明
详细说明
3.4 算法13:LDA
概述
算法说明
详细说明
3.5 算法14:k-means算法
概述
算法说明
详细说明
3.6 算法15:混合高斯分布
概述
算法说明
详细说明
3.7 算法16:LLE
概述
算法说明
详细说明
3.8 算法17:t-SNE
概述
算法说明
详细说明
第4章 评估方法和各种数据的处理
4.1 评估方法
有监督学习的评估
分类问题的评估方法
回归问题的评估方法
均方误差和决定系数指标的不同
与其他算法进行比较
超参数的设置
模型的过拟合
防止过拟合的方法
将数据分为训练数据和验证数据
交叉验证
搜索超参数
4.2 文本数据的转换处理
基于单词出现次数的转换
基于tf-idf的转换
应用于机器学习模型
4.3 图像数据的转换处理
直接将像素信息作为数值使用
将转换后的向量数据作为输入来应用机器学习模型
第5章 环境搭建
5.1 Python 3的安装
Windows
macOS
Linu
使用Anaconda在Windows上安装
5.2 虚拟环境
通过官方安装程序安装Python的情况
通过Anaconda安装Python的情况
5.3 三方包的安装
什么是三方包
安装三方包的方法
参考文献
内容摘要
本书基于丰富的图示,详细介绍了有监督学习和无监督学习的17种算法,包括线性回归、正则化、逻辑回归、支持向量机、核方法、朴素贝叶斯、随机森林、神经网络、KNN、PCA、LSA、NMF、LDA、k-means算法、混合高斯分布、LLE和t-SNE。书中针对各算法均用Python代码进行了实现,读者可一边运行代码一边阅读,从而加深对算法的理解。
主编推荐
152张图表,轻松掌握17种常用算法!
没有复杂公式,零基础也可轻松读懂!
1.全面
网罗有监督学习和无监督学习的17种算法,涉及回归、分类、降维、聚类等问题。
2.直观
全彩图解,让原本抽象复杂的算法变得一目了然,方便读者快速了解各算法的特征,学会如何选择恰当的算法。
3.易懂
几乎没有数学公式和统计术语,零基础也可轻松读懂。
4.实现
各算法均用Python代码实现,基于Python 3.7版本,读者可下载配套代码资源,边试边学。
以下为对购买帮助不大的评价