【假一罚四】机器学习基础 建模与问题求解
全新正版书籍,假一罚四,放心选购。可开发票,24小时内发货。
¥
53.5
7.8折
¥
69
全新
库存2件
作者金升渊
出版社人民邮电出版社
ISBN9787115539496
出版时间2020-07
装帧平装
开本16开
定价69元
货号30913393
上书时间2025-01-04
商品详情
- 品相描述:全新
- 商品描述
-
导语摘要
1.阐述机器学习的基础知识2.介绍机器学习的主要模型3.基于模型实现机器学习系统
4.本书理论、实践示例和解决方案三者相辅相成,旨在帮助机器学习的初学者能够基于理论实现并使用性能强劲的机器学习系统。
作者简介
金升渊 首尔大学计算机工程系毕业,在佐治亚理工学院研究针对高效能文本表达学习的机器学习,并获得计算机科学硕士和博士学位。现在谷歌Research任职,主要研发移动环境下的机器学习。 郑荣朱 首尔大学计算机工程与考古美术史学双学位,通过数据挖掘电算分析讲座体验到机器学习的无限可能后,进入东京大学研究利用机器学习识别垃圾网页,并获得硕士和博士学位。此后在日本电商乐天集团从事数据分析和诈骗探测,在斯坦福大学结束为期一年的访问研究后,目前在乐天集团美国分公司负责数据分析。
目录
第 一部分 机器学习基础知识
第 1 章 开始机器学习 2
1.1 机器学习简介 2
1.2 理解机器学习的背景知识 3
1.2.1 数学(线性代数、微分、统计和概率) 3
1.2.2 编程 4
1.3 机器学习发展史 4
1.3.1 机器学习的历史与现状 4
1.3.2 机器学习的三大学派 6
1.4 机器学习的分类 7
1.4.1 监督学习、无监督学习、强化学习 8
1.4.2 监督学习的详细分类 9
1.4.3 无监督学习详细分类 10
1.4.4 深度学习 11
1.5 小结 11
第 2 章 机器学习主要概念 12
2.1 模型:观察问题的角度 12
2.1.1 模型的定义 13
2.1.2 简单模型 14
2.1.3 复杂模型 15
2.1.4 结构模型 16
2.1.5 好模型的定义 17
2.2 损失函数:模型的公式化学习目标 19
2.2.1 算术损失函数 20
2.2.2 概率损失函数 21
2.2.3 排序损失函数 23
2.2.4 模型复杂度与相关损失函数 24
2.3 优化:实际训练的方法 25
2.3.1 梯度下降法 26
2.3.2 牛顿 拟牛顿法 28
2.3.3 随机梯度下降法 28
2.3.4 反向传播 30
2.3.5 最新的优化方法 31
2.4 模型评估:实际运用中的性能评估方法 31
2.4.1 模型的泛化特征评估 31
2.4.2 准确率 32
2.4.3 精确率与召回率 33
2.4.4 排序评估 34
2.5 小结 35
第二部分 机器学习的主要模型
第3 章 数据与问题 38
3.1 数据类型 38
3.1.1 文本数据 38
3.1.2 数值数据 39
3.1.3 图像数据 39
3.1.4 音频数据 40
3.1.5 混合数据 40
3.2 数据量与数据质量 40
3.2.1 数据量与机器学习的相关性 40
3.2.2 数据质量与机器学习的相关性 41
3.3 数据标准化 42
3.3.1 数值数据标准化 42
3.3.2 分类数据标准化 44
3.3.3 序数数据标准化 44
3.4 问题类型 45
3.4.1 回归 45
3.4.2 分类 46
3.4.3 聚类问题 46
3.4.4 表征学习(嵌入学习) 47
3.5 小结 48
第4 章 利用购买历史数据构建用户群 49
4.1 聚类 49
4.2 K 中心点聚类 50
4.3 层次聚类 53
4.4 基于密度的聚类 56
4.5 计算相似度 57
4.5.1 闵氏距离 58
4.5.2 马氏距离 59
4.6 小结 61
第5 章 构建文本分析系统 62
5.1 构建文本分类系统 62
5.1.1 文本分类的常用特征 62
5.1.2 利用特征进行分类操作 65
5.2 主题建模 69
5.3 语法分析 71
5.3.1 词性标注 71
5.3.2 命名实体识别 74
5.4 词嵌入学习——word2vec 75
5.5 小结 78
第6 章 构建电影推荐系统 79
6.1 电影推荐系统 79
6.2 相似度运算 80
6.2.1 杰卡德系数 80
6.2.2 余弦相似度 81
6.2.3 编辑距离 82
6.3 基于内容的推荐系统 83
6.4 协同过滤 84
6.4.1 均方根误差 85
6.4.2 基于用户 商品的协同过滤 86
6.4.3 隐因子模型 87
6.5 标准化 90
6.6 小结 91
第7 章 构建图像识别系统 92
7.1 图像处理基本概念 92
7.1.1 像素 92
7.1.2 滤波 93
7.1.3 卷积 95
7.2 图像识别 97
7.2.1 图像分类 98
7.2.2 图像检测 98
7.3 用于图像识别的特征 99
7.3.1 轮廓线 99
7.3.2 角点 100
7.3.3 SIFT 103
7.3.4 主成分分析 105
7.4 利用深度学习进行图像识别 107
7.4.1 关于CNN 107
7.4.2 卷积层 108
7.4.3 池化 109
7.4.4 激活函数 110
7.4.5 全连接层 111
7.5 小结 112
第8 章 解决机器学习中的多种问题 113
8.1 模型问题 113
8.1.1 过度学习 113
8.1.2 如何更轻松地找到好模型 119
8.2 数据问题 121
8.2.1 数据量过大 121
8.2.2 数据量过少 123
8.2.3 数据略微倾斜 124
8.3 速度问题 126
8.3.1 向量运算 126
8.3.2 机器学习高效运行系统 128
8.3.3 分布式处理 128
8.4 小结 129
第三部分 机器学习系统应用
第9 章 机器学习软件简介 132
9.1 安装Python 与库 132
9.2 著名数据库简介 133
9.2.1 机器学习库 133
9.2.2 深度学习库 134
9.2.3 与计算相关的库 136
9.3 本书使用的工具包 136
9.3.1 Scikit-learn 137
9.3.2 TensorFlow 140
9.4 小结 151
第 10 章 利用购买历史数据构建用户群——实战 152
10.1 数据集 152
10.2 数据预处理 153
10.3 K 均值聚类 160
10.4 确定正确的簇数K 161
10.4.1 定量评估 161
10.4.2 定性评估 164
10.5 分层聚类法 168
10.6 小结 173
第 11 章 构建文本分析系统——实战 174
11.1 构建垃圾短信过滤器(文本分类) 174
11.1.1 用于示例的数据处理 174
11.1.2 通过特征分类 179
11.2 构建主题模型系统 182
11.3 构建词性分析系统 184
11.4 构建专有名词标记系统 185
11.5 小结 187
第 12 章 构建电影推荐系统——实战 188
12.1 数据集 188
12.2 数据预处理 189
12.3 构建基于内容的电影推荐系统 192
12.4 构建基于协同过滤的电影推荐系统 198
12.4.1 实现奇异值分解 198
12.4.2 实现梯度下降法 203
12.4.3 评估近似结果 205
12.5 小结 209
第 13 章 构建图像识别系统——实战 210
13.1 图像数据的K 均值聚类 210
13.2 以主成分分析进行人脸识别 213
13.3 运用CNN 进行手写数字分类 223
13.3.1 生成特征 224
13.3.2 训练与测试 228
13.4 小结 234
内容摘要
本书作者曾就职美国谷歌公司和日本乐天集团,有着多年的机器学习开发经验。本书理论与实践相结合,通过直观具体、易于理解的图表、示例和代码,既讲述了有助机器学习入门者轻松、准确掌握的基础概念,也涵盖了机器学习开发者在不确定概念时可以查看的核心内容。书中列举的大量机器学习应用程序实例,即便不具备数学和统计学知识也能轻松阅读,进而熟悉机器学习的基本概念。
主编推荐
1.阐述机器学习的基础知识
2.介绍机器学习的主要模型
3.基于模型实现机器学习系统
4.本书理论、实践示例和解决方案三者相辅相成,旨在帮助机器学习的初学者能够基于理论实现并使用性能强劲的机器学习系统。
媒体评论
继“大数据”之后,“机器学习”也已成为人们耳熟能详的话题。这对于我来说的确是个好消息,因为我毕业于信息检索专业,以数据科学家的身份工作至今。很多人都有一种执念:通过机器学习可以解决并且应当解决所有事情。本书为那些对机器学习感兴趣却无缘学习的人提供了探索机器学习真相的机会,从文本处理到推荐系统、图像识别,涉及了多种领域的近期新方法,对已具备机器学习经验的人来说也很好有用。
近来,复杂的深度学习方法与大容量的运算能量占据主流,“机器学习应从基本着手,把握数据特性,从简单的学习方法起步”,作为一线数据科学家,我要再次强调作者的这个观点。
——金振英博士
Snapdata 数据科学家、《Hello 数据科学》作者
全世界都在热切关注着机器学习,然而适合初学者阅读的图书并不多。虽然也有一些有名教材,但那些书都以读者具备数学和统计学知识为前提,以学术内容而非实用的应用程序为中心,读起来艰难晦涩。本书列举了大量机器学习应用程序实例,即便不具备数学和统计学知识,也能轻松阅读,熟悉机器学习的基本概念。这可以很大程度上满足实用型初学者对于教材的渴望,值得期待。
——李俊硕博士
谷歌搜索软件工程师
本书既包含了机器学习入门者可以轻松、准确掌握的基础概念,也涵盖了机器学习开发者在不确定概念时可以查看的核心内容。一般的机器学习图书以理论为主,本书则说明与操作示例相辅相成,可为活跃的实战开发者直接帮助。
尤其是从传统的机器学习到深度学习(图像、自然语言)的有机结合,适合深度学习入门者掌握推荐的机器学习方法。
——范大炫博士
三星电子软件研发中心主任研究员
我向想要学习机器学习却因不知从何处着手而不知所措的读者推荐本书。两位作者在书中从机器学习的基本概念到主要应用领域,始终致力于浅显易懂地讲解,成果显著。尤其是书中包含很多应用示例,对于希望应用机器学习的业内人士来说,是一本不错的参考书。
——金道兼博士
Facebook 研究员
— 没有更多了 —
以下为对购买帮助不大的评价