商品简介
本书在不涉及大量数学模型与复杂算法实现的前提下,从机器学习概述开始,由“泰坦尼克号数据分析与预处理”“良/恶性乳腺癌肿瘤预测”“波士顿房价预测”“手写体数字聚类”“人脸特征降维”“在线旅行社酒店价格异常检测”6个案例分别引入数据分析、分类、回归、聚类、特征降维和异常检测的应用开发实战技术及其少量理论,能够帮助读者以快的速度掌握使用Scikit-learn库进行机器学习开发的实战技能。书末是学习机器学习时可能用到的附录。本书适合对机器学习感兴趣的初学者、需要快速入门机器学习的高职相关专业学生,以及期望快速进入机器学习任务的研发工程技术人员。
作者简介
张霞,南京航空航天大学博士,现任南京信息职业技术学院人工智能学院人工智能技术服务教研室主任,2019年江苏省高校青蓝工程优秀青年骨干教师培养对象,江苏省人工智能学会人工智能教育专业委员会委员,主要研究人工智能技术服务及信息职业教育。发表SCI论文2篇,EI论文1篇,中文核心论文2篇,主持中国电子教育学会课题1项获一等奖,主持横向课题2项,主持校社科课题1项,参与横向课题3项,参与国家骨干院校重点建设专业等。
目录
绪论1
0.1 机器学习综述1
0.1.1 机器学习的含义1
0.1.2 机器学习的应用场景1
0.1.3 机器学习类型3
0.1.4 相关术语5
0.1.5 人工智能、机器学习与深度学习6
0.2 开发环境搭建8
0.2.1 Windows系统环境8
0.2.2 Ubuntu系统环境17
0.3 Python编程基础17
0.3.1 Python简介17
0.3.2 Python基本语法18
0.3.3 Python数据类型19
0.3.4 Python常用语句28
0.3.5 Python函数(模块)设计33
0.3.6 Python编程库(包)的导入38
案例1 泰坦尼克号数据分析与预处理39
1.1 案例描述及实现39
1.2 案例详解及示例43
1.3 支撑技术45
1.3.1 Numpy45
1.3.2 Matplotlib52
1.3.3 Pandas61
1.3.4 Scikit-learn64
案例2 良/恶性乳腺癌肿瘤预测66
2.1 案例描述及实现66
2.2 案例详解及示例69
2.2.1 数据预处理69
2.2.2 linear_model71
2.2.3 KNeighborsClassifier74
2.2.4 SVM76
2.2.5 naive_bayes80
2.2.6 DecisionTreeClassifier82
2.2.7 ensemble85
2.2.8 classification_report87
2.3 支撑知识88
2.3.1 分类任务简介88
2.3.2 线性模型88
2.3.3 K近邻分类90
2.3.4 支持向量机91
2.3.5 朴素贝叶斯93
2.3.6 决策树95
2.3.7 集成模型96
2.3.8 神经网络97
案例3 波士顿房价预测98
3.1 案例描述及实现98
3.2 案例详解及示例102
3.2.1 数据预处理102
3.2.2 linear_model104
3.2.3 KNeighborsRegressor108
3.2.4 SVR110
3.2.5 DecisionTreeRegressor111
3.2.6 ensemble113
3.3 支撑知识119
3.3.1 回归任务简介119
3.3.2 线性回归120
3.3.3 K近邻回归121
3.3.4 支持向量机回归122
3.3.5 决策树回归122
3.3.6 集成模型回归124
案例4 手写体数字聚类125
4.1 案例描述及实现125
4.1.1 案例简介125
4.1.2 数据介绍125
4.1.3 案例实现126
4.2 案例详解及示例129
4.2.1 load_digits129
4.2.2 AgglomerativeClustering130
4.2.3 KMeans131
4.2.4 MeanShift133
4.2.5 DBSCAN134
4.2.6 AffinityPropagation136
4.2.7 v_measure_score137
4.3 支撑知识140
4.3.1 聚类任务简介140
4.3.2 层次聚类140
4.3.3 K均值聚类141
4.3.4 均值漂移聚类143
4.3.5 密度聚类143
4.3.6 近邻传播聚类144
案例5 人脸特征降维145
5.1 案例描述145
5.1.1 案例简介145
5.1.2 数据介绍145
5.1.3 案例实现145
5.2 案例详解及示例148
5.2.1 fetch_olivetti_faces148
5.2.2 PCA149
5.2.3 NMF155
5.2.4 FastICA156
5.2.5 FactorAnalysis157
5.3 支撑知识及示例158
5.3.1 特征降维简介158
5.3.2 主成分分析158
5.3.3 非负矩阵分解159
5.3.4 独立成分分析160
5.3.5 因子分析161
案例6 在线旅行社酒店价格异常检测162
6.1 案例描述162
6.1.1 案例简介162
6.1.2 数据介绍162
6.1.3 案例实现163
6.2 案例详解及示例168
6.2.1 导入数据168
6.2.2 基于聚类的异常检测168
6.2.3 基于孤立森林的异常检测169
6.2.4 基于支持向量机的异常检测172
6.2.5 基于高斯分布的异常检测173
6.3 支撑知识177
6.3.1 异常检测简介177
6.3.2 基于聚类的异常检测177
6.3.3 基于孤立森林的异常检测177
6.3.4 基于支持向量机的异常检测179
6.3.5 基于高斯分布的异常检测179
附录A VirtualBox虚拟机软件与Linux的安装和配置180
附录B Linux(Ubuntu 14.4)的基本命令与使用203
附录C GitHub代码托管平台208
附录D Docker技术与应用212
附录E 人工智能的数学基础与工具214
附录F 公开数据集介绍与下载225
附录G 人工智能的网络学习资源230
附录H 人工智能的技术图谱233
附录I 人工智能技术应用就业岗位与技能需求237
附录J Sklearn常用模块和函数242
参考文献248
内容摘要
本书在不涉及大量数学模型与复杂算法实现的前提下,从机器学习概述开始,由“泰坦尼克号数据分析与预处理”“良/恶性乳腺癌肿瘤预测”“波士顿房价预测”“手写体数字聚类”“人脸特征降维”“在线旅行社酒店价格异常检测”6个案例分别引入数据分析、分类、回归、聚类、特征降维和异常检测的应用开发实战技术及其少量理论,能够帮助读者以最快的速度掌握使用Scikit-learn库进行机器学习开发的实战技能。书末是学习机器学习时可能用到的附录。本书适合对机器学习感兴趣的初学者、需要快速入门机器学习的高职相关专业学生,以及期望快速进入机器学习任务的研发工程技术人员。
主编推荐
机器学习是人工智能的一个重要分支与核心研究内容,是目前实现人工智能的一条重要途径。机器学习的研究工作发展很快,其应用已遍及人工智能的各个领域,如数据挖掘、计算机视觉、自然语言处理、智能机器人等,也涌现出了很多机器学习库,帮助开发者搭建一个机器学习模型。本书以Python语言中专门针对机器学习应用而发展起来的Scikit-learn(0.22.2)库为基础,结合机器学习前辈们的经验,用6个真实数据的案例引入数据分析、分类、回归、聚类、特征降维和异常检测6个任务,帮助读者以最快的速度掌握机器学习开发的实战技能。
以下为对购买帮助不大的评价