商品简介
机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书涵盖了机器学习和深度学习的基础知识,主要包括机器学习的概述、统计学基础、分类、聚类、神经网络、贝叶斯网络、支持向量机、文本分析、分布式机器学习算法等经典的机器学习基础知识,还包括卷积神经网络、循环神经网络、生成对抗网络、目标检测、自编码器等深度学习的内容。此外,本书还介绍了机器学习的热门应用领域推荐系统以及强化学习等主题。
本书深入浅出、内容全面、案例丰富,每章都提供Python程序代码和习题,供读者巩固所学知识。另外,本书还为读者提供了配套的微课视频。
作者简介
赵卫东,复旦大学副教授,主要负责本科生和各类研究生机器学习、大数据核心技术和人工智能(机器学习)(商务数据分析)等课程的教学,2011年纽约大学访问学者。人工智能(机器学习)被评为上海市精品课程以及CMOOC联盟线上线下混合式教学改革项目,获得2013年高等教育上海市教学成果奖二等奖。目前主要研究方向包括机器学习应用和大数据分析等。主持国家自然科学基金2项、国家重点研发计划子课题、上海市浦江人才以及企业合作课题等30多项目。已在KnowledgeandInformationSystems,InformationProcessing&Management,InformationSystemsFrontiers,IntelligentDataAnalysis,AppliedIntelligence等国内外刊物和学术会议发表论文100多篇。出版专著、教材《机器学习》《机器学习案例实战》《Python机器学习实战案例》等10多部。获得上海市2015年上海市科技进步二等奖。CDA三级认证数据科学家,腾讯云和百度云机器学习认证讲师。
目录
第 1章 机器学习概述1
1.1 机器学习简介1
1.1.1 机器学习简史1
1.1.2 机器学习主要流派3
1.2 机器学习、人工智能和数据挖掘4
1.2.1 什么是人工智能4
1.2.2 什么是数据挖掘5
1.2.3 机器学习、人工智能与数据挖掘的关系6
1.3 典型机器学习应用领域6
1.4 机器学习算法12
1.5 机器学习的一般流程18
习题19
第 2章 机器学习基本方法20
2.1 统计分析20
2.1.1 统计基础20
2.1.2 常见概率分布25
2.1.3 参数估计26
2.1.4 假设检验28
2.1.5 线性回归28
2.1.6 逻辑回归32
2.1.7 判别分析33
2.1.8 非线性模型35
2.2 高维数据降维35
2.2.1 主成分分析35
2.2.2 奇异值分解38
2.2.3 线性判别分析39
2.2.4 局部线性嵌入42
2.2.5 拉普拉斯特征映射43
2.3 特征工程44
2.3.1特征构造44
2.3.2特征选择45
2.3.3特征提取46
2.4 模型训练46
2.4.1 模型训练常见术语46
2.4.2 训练数据收集47
2.5 可视化分析47
2.5.1 可视化分析的作用48
2.5.2 可视化的基本流程48
2.5.3 可视化分析方法48
2.5.4 可视化分析常用工具50
2.5.5 常见的可视化图表51
2.5.6 可视化分析面临的挑战61
习题61
第3章 决策树与分类算法63
3.1 决策树算法63
3.1.1 分支处理65
3.1.2 连续属性离散化70
3.1.3 过拟合问题72
3.1.4 分类效果评价75
3.2 集成学习79
3.2.1 装袋法79
3.2.2 提升法80
3.2.3 GBDT81
3.2.4 XGBoost算法82
3.2.5 随机森林86
3.3 决策树应用88
习题90
第4章 聚类分析92
4.1 聚类分析概念92
4.1.1 聚类方法分类92
4.1.2 良好聚类算法的特征93
4.2 聚类分析的度量94
4.2.1 外部指标94
4.2.2 内部指标95
4.3 基于划分的聚类96
4.3.1 k-均值算法97
4.3.2 k-medoids算法101
4.3.3 k-prototype算法102
4.4 基于密度的聚类102
4.4.1 DBSCAN算法102
4.4.2 OPTICS算法105
4.4.3 DENCLUE算法105
4.5 基于层次的聚类107
4.5.1 BIRCH聚类108
4.5.2 CURE算法110
4.6 基于网格的聚类112
4.7 基于模型的聚类113
4.7.1 概率模型聚类113
4.7.2 模糊聚类118
4.7.3 Kohonen神经网络聚类118
习题123
第5章 文本分析124
5.1 文本分析介绍124
5.2 文本特征提取及表示125
5.2.1 TF-IDF125
5.2.2 信息增益125
5.2.3 互信息126
5.2.4 卡方统计量127
5.2.5 词嵌入127
5.2.6 语言模型128
5.2.7 向量空间模型129
5.3 知识图谱131
5.3.1 知识图谱相关概念132
5.3.2 知识图谱的存储132
5.3.3 知识图谱挖掘与计算133
5.3.4 知识图谱的构建过程135
5.4 词法分析139
5.4.1 文本分词139
5.4.2 命名实体识别142
5.4.3 词义消歧142
5.5 句法分析143
5.6 语义分析145
5.7 文本分析应用146
5.7.1 文本分类146
5.7.2 信息抽取148
5.7.3 问答系统149
5.7.4 情感分析150
5.7.5 自动摘要151
习题152
第6章 神经网络153
6.1 神经网络介绍153
6.1.1 前馈神经网络153
6.1.2 反馈神经网络158
6.1.3 自组织神经网络160
6.2 神经网络相关概念161
6.2.1 激活函数162
6.2.2 损失函数171
6.2.3 学习率175
6.2.4 过拟合与网络正则化179
6.2.5 预处理181
6.2.6 训练方式182
6.2.7 模型训练中的问题182
6.2.8 神经网络效果评价190
6.3 神经网络应用190
习题195
第7章 贝叶斯网络196
7.1 贝叶斯理论概述196
7.2 贝叶斯概率基础196
7.2.1 概率论196
7.2.2 贝叶斯概率197
7.3 朴素贝叶斯分类模型198
7.4 贝叶斯网络推理201
7.5 贝叶斯网络的应用206
7.5.1 中文分词206
7.5.2 机器翻译206
7.5.3 故障诊断207
7.5.4 疾病诊断207
习题209
第8章 支持向量机210
8.1 线性可分SVM210
8.1.1 间隔与超平面210
8.1.2 支持向量210
8.1.3 对偶问题求解212
8.1.4 软间隔213
8.2 非线性SVM214
8.2.1 非线性SVM原理214
8.2.2 常见核函数214
8.3 支持向量机应用215
习题219
第9章 分布式机器学习220
9.1 分布式机器学习基础220
9.1.1 参数服务器220
9.1.2 分布式并行计算类型221
9.2 分布式机器学习框架222
9.3 并行决策树227
9.4 并行k-均值算法228
习题230
第 10章 深度学习基础231
10.1 卷积神经网络231
10.1.1 卷积神经网络简介232
10.1.2 卷积神经网络的结构232
10.1.3 卷积神经网络的训练241
10.1.4 常见卷积神经网络243
10.2 循环神经网络268
10.2.1 RNN基本原理269
10.2.2 长短期记忆网络276
10.2.3 门限循环单元280
10.2.4 循环神经网络的其他改进281
10.3 深度学习流行框架284
习题285
第 11章 高级深度学习286
11.1 高级循环神经网络286
11.1.1词嵌入286
11.1.2自注意力模型288
11.1.3多头注意力机制290
11.1.4 Transformer291
11.1.5 BERT模型294
11.2 无监督式深度学习295
11.2.1 深度信念网络295
11.2.2 自动编码器网络297
11.3 生成对抗网络299
11.3.1 生成对抗网络基本原理299
11.3.2 常见的生成对抗网络302
11.4 迁移学习305
11.5 对偶学习307
习题308
第 12章 推荐系统309
12.1 推荐系统基础309
12.1.1 推荐系统的应用场景309
12.1.2 相似度计算310
12.2 推荐系统通用模型312
12.2.1 推荐系统结构312
12.2.2 基于人口统计学的推荐313
12.2.3 基于内容的推荐313
12.2.4 基于协同过滤的推荐算法314
12.2.5 基于图的模型316
12.2.6 基于关联规则的推荐318
12.2.7 基于知识的推荐323
12.2.8 基于标签的推荐324
12.3 推荐系统评测325
12.3.1 评测方法325
12.3.2 评测指标326
12.4 推荐系统常见问题330
12.5 推荐系统实例333
12.6 深度学习在推荐系统中的应用340
习题343
第 13章 强化学习345
13.1 强化学习概况345
13.2 强化学习基础346
13.2.1 马尔可夫链346
13.2.2 强化学习基本概念346
13.2.3 强化学习的目标函数348
13.2.4 价值函数349
13.3 强化学习基本算法353
13.3.1 蒙特卡洛强化学习353
13.3.2 时序差分算法355
13.3.3 SARSA算法355
13.3.4 Q-Learning算法356
13.4 深度强化学习361
13.4.1 DQN算法361
13.4.2 运动员-裁判员算法367
习题373
内容摘要
机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书涵盖了机器学习和深度学习的基础知识,主要包括机器学习的概述、统计学基础、分类、聚类、神经网络、贝叶斯网络、支持向量机、文本分析、分布式机器学习算法等经典的机器学习基础知识,还包括卷积神经网络、循环神经网络、生成对抗网络、目标检测、自编码器等深度学习的内容。此外,本书还介绍了机器学习的热门应用领域推荐系统以及强化学习等主题。
本书深入浅出、内容全面、案例丰富,每章都提供Python程序代码和习题,供读者巩固所学知识。另外,本书还为读者提供了配套的微课视频。
主编推荐
(1)作者来自复旦大学,在国内具有一定的影响力,常举办相关的培训和讲座。
(2)教材难度适中、系统性强,内容基本覆盖了机器学习和深度学习的核心内容,深入浅出,适合初学者。知识与时俱进,进行了更新。
(3)教材配套资料齐全,包括对应的PPT、数据素材、程序源代码、测试题等,另外还提供配套的视频。
(4)实践指导性强。作者结合20多家企业的实战合作项目实践,提供300多道原创的选择题、填空和判断题。还有40多个实战案例供读者实验和实训。
(5)工信部“十四五”规划教材。
【内容简介】
以下为对购买帮助不大的评价