商品简介
机器学习是计算机科学和人工智能的重要分支之一,它被广泛应用在多种领域,如机器人、无人驾驶汽车等。
本书是“达人迷”经典系列中关于机器学习的一本。本书内容分为6个部分,共计23 章,由浅入深地讲解机器学习的基本知识、本书使用的语言——Python 和 R、必备的数学知识、处理数据的常用工具、机器学习的应用以及常见的学习包和模型 6 个方面,以帮助读者了解并掌握机器学习的相关知识,并能将其应用于自己的工作中。
本书适合Python程序员、R程序员、数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。
作者简介
约翰·保罗·穆勒是一位多产的自由撰稿人和技术编辑。他的作品涵盖了从网络、家庭安全到数据库管理和日常编程的方方面面。
卢卡·马萨罗是一名数据科学家,他擅长大数据处理,可通过数据挖掘和机器学习技术将处理后的数据转化为智能数据。
目录
第1部分 关于机器如何学习的介绍 1
第1章 有关 AI 的真实故事 3
1.1 超越炒作 4
1.2 梦到电子羊 5
1.2.1 了解 AI 和机器学习的历史 5
1.2.2 机器学习能为 AI 做什么 6
1.2.3 机器学习的目标 7
1.2.4 硬件决定了机器学习的极限 7
1.3 克服 AI 幻想 8
1.3.1 AI 和机器学习的时髦用途 9
1.3.2 AI 和机器学习的真正用途 9
1.3.3 讲究实用性,讲究普通性 11
1.4 AI 和机器学习之间的关系 11
1.5 AI 和机器学习的规范 12
1.6 定义艺术与工程之间的界限 13
第2章 大数据时代的学习 14
2.1 定义大数据 15
2.2 考虑大数据源 16
2.2.1 构建一个新的数据源 16
2.2.2 使用现有的数据源 18
2.2.3 寻找用于测试的数据源 18
2.3 确立统计学在机器学习中的角色 19
2.4 理解算法的角色 20
2.4.1 定义算法要做什么 20
2.4.2 考虑五大主流技术 20
2.5 定义训练的含义 22
第3章 对未来的设想 24
3.1 为将来创造有用的技术 25
3.1.1 考虑机器人领域中机器学习的角色 25
3.1.2 在医疗领域使用机器学习 26
3.1.3 为各种需求创建智能的系统 26
3.1.4 在工业界使用机器学习 27
3.1.5 理解更新的处理器和其他硬件的角色 28
3.2 通过机器学习发现新的工作机会 28
3.2.1 为机器工作 28
3.2.2 和机器一起工作 29
3.2.3 修复机器 30
3.2.4 创建新的机器学习任务 30
3.2.5 设计新的机器学习环境 30
3.3 避免未来技术中潜在的陷阱 31
第2部分 准备你的学习工具 33
第4章 安装 R 35
4.1 为机器学习选择 R 的版本 36
4.2 在 Windows 系统上安装 R 37
4.3 在 Linux 系统上安装 R 43
4.4 在 Mac OS X 系统上安装 R 45
4.5 下载数据集和示例代码 46
4.5.1 了解本书使用的数据集 47
4.5.2 定义代码库 48
第5章 使用 RStudio 在 R 中编码 50
5.1 理解基本的数据类型 51
5.2 使用向量 52
5.3 使用列表组织数据 53
5.4 使用矩阵 54
5.4.1 创建基本矩阵 54
5.4.2 修改向量的排列 55
5.4.3 访问单个元素 56
5.4.4 对行和列进行命名 56
5.5 使用数组处理多维 57
5.5.1 创建一个基本的数组 58
5.5.2 命名行和列 59
5.6 创建一个数据框 60
5.6.1 理解因子 60
5.6.2 创建一个基本的数据框 62
5.6.3 和数据框的交互 63
5.6.4 扩展一个数据框 64
5.7 执行基本的统计任务 66
5.7.1 进行决策 66
5.7.2 使用循环 68
5.7.3 不使用循环语句来执行循环的任务 69
5.7.4 使用函数 70
5.7.5 查找平均值和中位数 70
5.7.6 通过图表来表示你的数据 71
第6章 安装 Python 73
6.1 为机器学习选择 Python 的版本 74
6.1.1 获取 Continuum Analytics Anaconda 75
6.1.2 获取 Enthought Canopy Express 76
6.1.3 获取 pythonxy 76
6.1.4 获取 WinPython 77
6.2 在 Linux 系统上安装 Python 77
6.3 在 Mac OS X 上安装 Python 78
6.4 在 Windows 系统上安装Python 79
6.5 下载数据集和示例代码 83
6.5.1 使用 Jupyter Notebook 83
6.5.2 定义代码库 85
6.5.3 了解本书所使用的数据集 90
第7章 使用 Anaconda 进行 Python编程 92
7.1 使用数字和逻辑 93
7.1.1 执行变量赋值 95
7.1.2 做算术 95
7.1.3 使用布尔表达式来比较数据 97
7.2 创建并使用字符串 99
7.3 和日期打交道 100
7.4 创建并使用函数 101
7.4.1 创建可重用的函数 101
7.4.2 调用函数 102
7.4.3 使用全局变量和局部变量 104
7.5 使用条件和循环语句 105
7.5.1 使用 if 语句进行决策 105
7.5.2 使用嵌套的决策,在多个选项中进行选择 106
7.5.3 使用 for 执行重复的任务 107
7.5.4 使用 while 语句 108
7.6 使用集合、列表和元组来存储数据 109
7.6.1 创建集合 109
7.6.2 在集合上进行运算 109
7.6.3 创建列表 110
7.6.4 创建并使用元组 111
7.7 定义有用的迭代器 113
7.8 使用字典来索引数据 114
7.9 将代码存储在模块中 114
第8章 探索其他的机器学习工具 116
8.1 SAS、Stata 和 SPSS 117
8.2 用 Weka 做学术 119
8.3 使用 LIBSVM 轻松访问复杂的算法 120
8.4 使用 Vowpal Wabbit,运行起来像闪电那么快 120
8.5 使用 KNIME 和 RapidMiner进行可视化 121
8.6 使用 Spark 处理海量数据 122
第3部分 从数学的基础知识开始 123
第9章 揭秘机器学习背后的数学 125
9.1 处理数据 126
9.1.1 创建矩阵 127
9.1.2 理解基本的运算 129
9.1.3 进行矩阵的乘法 130
9.1.4 了解高级的矩阵运算 132
9.1.5 有效地使用向量 132
9.2 探索概率的世界 135
9.2.1 概率的运算 136
9.2.2 贝叶斯理论的条件概率 137
9.3 介绍统计的使用 139
第10章 降低合适的曲线 142
10.1 将学习解释为优化 143
……
内容摘要
机器学习是计算机科学和人工智能的重要分支之一,它被广泛应用在多种领域,如机器人、无人驾驶汽车等。
本书是“达人迷”经典系列中关于机器学习的一本。本书内容分为6个部分,共计23 章,由浅入深地讲解机器学习的基本知识、本书使用的语言——Python 和 R、推荐的数学知识、处理数据的常用工具、机器学习的应用以及常见的学习包和模型 6 个方面,以帮助读者了解并掌握机器学习的相关知识,并能将其应用于自己的工作中。
本书适合Python程序员、R程序员、数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。
主编推荐
1.机器学习入门与实战指南:深入浅出,适合初学者和从业人员。
2.实战应用,轻松掌握机器学习:重实践,通过案例帮助读者快速掌握机器学习技术。
3.详细解析常见算法及其原理,易懂易学。
4.Python 和 R 两种主要编程语言全覆盖,提供详细代码实现和算法分析,详细解析算法原理和应用。
5.实际案例展示,帮助你从现实世界角度理解机器学习技术,了解机器学习技术在现实世界中的应用和局限性。
6.详细介绍机器学习常用工具、库和框架,并提供实践案例,教你使用正确的工具编写有效的机器学习程序。
以下为对购买帮助不大的评价