机器学习基础(原理算法与实践)
全新正版 极速发货
¥
41.83
6.1折
¥
69
全新
库存4件
作者袁梅宇
出版社清华大学出版社
ISBN9787302500148
出版时间2018-08
装帧其他
开本其他
定价69元
货号1201742793
上书时间2024-06-22
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
袁梅宇,北航工学博士,硕士导师,现在昆明理工大学计算机系任教。为本科生和研究生主讲Java程序设计、JavaEE技术、数据库原理、人工智能、DotNet技术等核心课程,参加过863CIMSNet建设、中欧合作项目DRAGON和多项国家基金和省基金项目,第一作者公开发表论文十余篇,软件著作权(颁证)六项。第一作者专著有《JavaEE企业级编程开发实例详解》、《数据挖掘与机器学习——WEKA应用技术与实践》(第一版、第二版)、《求精要诀——JavaEE编程开发案例精讲》。
目录
目录
第1章 机器学习介绍1
1.1 机器学习简介2
1.1.1 什么是机器学习2
1.1.2 机器学习与日常生活3
1.1.3 如何学习机器学习4
1.1.4 MATLAB优势5
1.2 基本概念5
1.2.1 机器学习的种类6
1.2.2 有监督学习6
1.2.3 无监督学习7
1.2.4 机器学习术语7
1.2.5 预处理9
1.3 MATLAB数据格式10
1.3.1 标称数据10
1.3.2 序数数据11
1.3.3 分类数据11
1.4 示例数据集12
1.4.1 天气问题12
1.4.2 鸢尾花15
1.4.3 其他数据集16
1.5 了解你的数据16
习题20
第2章 线性回归21
2.1 从一个实际例子说起22
2.1.1 模型定义23
2.1.2 模型假设23
2.1.3 模型评估24
2.2 最小二乘法24
2.2.1 最小二乘法求解参数25
2.2.2 用最小二乘法来拟合奥运会数据26
2.2.3 预测比赛结果27
2.3 梯度下降27
2.3.1 基本思路28
2.3.2 梯度下降算法29
2.3.3 梯度下降求解线性回归问题30
2.4 多变量线性回归32
2.4.1 多变量线性回归问题33
2.4.2 多变量梯度下降34
2.4.3 随机梯度下降38
2.4.4 正规方程40
2.5 多项式回归42
2.5.1 多项式回归算法42
2.5.2 正则化45
习题47
第3章 逻辑回归49
3.1 逻辑回归介绍50
3.1.1 线性回归用于分类50
3.1.2 假设函数51
3.1.3 决策边界52
3.2 逻辑回归算法53
3.2.1 代价函数53
3.2.2 梯度下降算法54
3.2.3 MATLAB优化函数56
3.2.4 多项式逻辑回归58
3.3 多元分类60
3.3.1 一对多60
3.3.2 一对一62
3.3.3 Softmax回归64
习题66
第4章 贝叶斯分类器67
4.1 简介68
4.1.1 概述68
4.1.2 判别模型和生成模型68
4.1.3 极大似然估计69
4.2 高斯判别分析72
4.2.1 多元高斯分布72
4.2.2 高斯判别模型73
4.3 朴素贝叶斯75
4.3.1 朴素贝叶斯算法76
4.3.2 文本分类81
习题86
第5章 模型评估与选择87
5.1 简介88
5.1.1 训练误差与泛化误差88
5.1.2 偏差和方差89
5.2 评估方法90
5.2.1 训练集、验证集和测试集的划分91
5.2.2 交叉验证92
5.3 性能度量95
5.3.1 常用性能度量95
5.3.2 查准率和查全率96
5.3.3 ROC和AUC98
5.4 偏差与方差折中100
5.4.1 偏差与方差诊断101
5.4.2 正则化与偏差方差102
5.4.3 学习曲线103
习题104
第6章 K-均值算法和EM算法107
6.1 聚类分析108
6.1.1 K-means算法描述108
6.1.2 K-means算法应用112
6.1.3 注意事项113
6.2 EM算法114
6.2.1 基本EM算法114
6.2.2 EM算法的一般形式115
6.2.3 混合高斯模型118
习题123
第7章 决策树125
7.1 决策树介绍126
7.2 ID3算法127
7.2.1 信息熵127
7.2.2 信息增益计算示例127
7.2.3 ID3算法描述132
7.2.4 ID3算法实现134
7.3 C4.5算法134
7.3.1 基本概念135
7.3.2 剪枝处理139
7.3.3 C4.5算法描述140
7.3.4 C4.5算法实现142
7.4 CART算法144
7.4.1 CART算法介绍144
7.4.2 CART算法描述147
7.4.3 CART算法实现149
习题150
第8章 神经网络151
8.1 神经网络介绍152
8.1.1 从一个实例说起152
8.1.2 神经元153
8.1.3 神经网络结构154
8.1.4 简化的神经网络模型157
8.1.5 细节说明160
8.2 神经网络学习161
8.2.1 代价函数161
8.2.2 BP算法162
8.2.3 BP算法实现166
8.2.4 平方代价函数的情形171
习题171
第9章 隐马尔科夫模型173
9.1 隐马尔科夫模型基本概念174
9.1.1 离散马尔科夫过程174
9.1.2 扩展至隐马尔科夫模型176
9.1.3 HMM的组成和序列生成179
9.1.4 三个基本问题181
9.2 求解HMM三个基本问题182
9.2.1 评估问题183
9.2.2 解码问题187
9.2.3 学习问题190
习题196
第10章 支持向量机197
10.1 支持向量机介绍198
10.2 最大间隔超平面198
10.2.1 SVM问题的形式化描述199
10.2.2 函数间隔和几何间隔199
10.2.3 最优间隔分类器201
10.2.4 使用优化软件求解SVM203
10.3 对偶算法204
10.3.1 SVM对偶问题204
10.3.2 使用优化软件求解对偶 SVM206
10.4 非线性支持向量机208
10.4.1 核技巧208
10.4.2 常用核函数210
10.5 软间隔支持向量机213
10.5.1 动机及原问题213
10.5.2 对偶问题214
10.5.3 使用优化软件求解软间隔 对偶SVM215
10.6 SMO算法218
10.6.1 SMO算法描述218
10.6.2 简化SMO算法实现221
10.7 LibSVM226
10.7.1 LibSVM的安装226
10.7.2 LibSVM函数228
10.7.3 LibSVM实践指南230
习题232
第11章 推荐系统233
11.1 推荐系统介绍234
11.1.1 什么是推荐系统234
11.1.2 数据集描述235
11.1.3 推荐系统符号236
11.2 基于用户的协同过滤236
11.2.1 相似性度量237
11.2.2 算法描述239
11.2.3 算法实现240
11.3 基于物品的协同过滤241
11.3.1 调整余弦相似度和预测241
11.3.2 Slope One算法描述 与实现243
11.4 基于内容的协同过滤算法与实现247
11.4.1 算法描述247
11.4.2 算法实现250
习题251
第12章 主成分分析253
12.1 主成分分析介绍254
12.2 本征值与奇异值分解255
12.2.1 本征值分解255
12.2.2 奇异值分解256
12.3 PCA算法描述256
12.3.1 PCA算法257
12.3.2 从压缩表示中重建258
12.3.3 确定主成分数量258
12.4 PCA实现260
12.4.1 假想实例260
12.4.2 MNIST实例264
习题265
习题参考答案267
符号表294
参考文献295
内容摘要
\"《机器学习基础——原理、算法与实践》讲述机器学习的基本原理,使用MATLAB实现涉及的各种机器学习算法。通过理论学习和实践操作,使读者了解并掌握机器学习的原理和技能,拉近理论与实践的距离。《机器学习基础——原理、算法与实践》共分12章,主要内容包括:机器学习介绍、线性回归、逻辑回归、贝叶斯分类器、模型评估与选择、K-均值和EM算法、决策树、神经网络、HMM、支持向量机、推荐系统、主成分分析。全书源码全部在MATLABR2015b上调试通过,每章都附有习题和习题参考答案,供读者参考。
《机器学习基础——原理、算法与实践》系统讲解了机器学习的原理、算法和应用,内容全面、实例丰富、可操作性强,做到理论与实践相结合。《机器学习基础——原理、算法与实践》适合机器学习爱好者作为入门和提高的技术参考书使用,也适合用作计算机专业高年级本科生和研究生的教材或教学参考书。
\"
精彩内容
第1章机器学习介绍机器学习试图让机器像人类那样去理解数据,从大量的数据中发现规律和提取知识,不断地完善自我。机器学习是人工智能的一个重要研究方向,研究如何从数据中提取一些潜在的有用模式的算法。
本章首先介绍机器学习的基本概念,然后介绍MATLAB的数据格式和示例数据集,最后介绍如何使用各种统计度量来描述数据分布特征。
1.1机器学习简介机器学习是人工智能研究领域中极其重要的研究方向,也是发展最快的分支。每过一段时间,我们都能听到一些新的应用在各个领域大展宏图的消息,如谷歌DeepMind团队研发的人工智能程序AlphaGo战胜世界围棋名将李世石、最强最新AlphaGoZero的横空出世、无人驾驶公交客车正式上路,等等。相比这些新闻,我们也许更关心其背后的支撑技术,机器学习就是AlphaGo和无人驾驶等背后的重要技术。
1.1.1什么是机器学习机器学习是一门多领域交叉学科,其涉及概率论、统计学、优化理论、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构并使之不断改善自身的性能。
至今,还没有统一的机器学习定义,而且也很难给出一个公认和准确的定义。一种经常引用的英文定义来自TomMitchell的《机器学习》一书,原文是:AcomputerprogramissaidtolearnfromexperienceEwithrespecttosomeclassoftasksTandperformancemeasureP,ifits’performanceattasksinT,asmeasuredbyP,improveswithexperienceE.对应的中文译文是:如果用P来衡量计算机程序在任务T上的性能,根据经验E在任务T上获得性能改善,那么我们称该程序从经验E中学习。
不同于通过编程告诉计算机如何计算来完成特定任务,机器学习是一种数据驱动方法(data-drivenapproach),意味着方法的核心是数据。也许读者对此有疑问,让我们举例进行说明。
普通意义上的学习是通过观察获得技能的过程,学习过程如图1-1所示。例如,某天大人告诉小孩子前面那只深棕色的小动物是猫,小孩子通过观察认识猫的颜色和形态。另一天大人告诉小孩子前面那只白色的小动物也是猫,小孩子观察到尽管毛色不同,但猫的形态一样,学习到辨识猫的技能是不管毛色,只重形态。因此,下次如果遇到一只黑猫,小孩子也能准确地叫出猫。
图1-1普通学习过程机器学习是通过数据来获取模式的过程,模式可以视为对象的组成成分或影响因素间存在的规律性关系,简单地说,模式相当于事物的规律,机器学习过程如图1-2所示。机器学习能够自动识别数据中的模式,然后使用已发现的模式去预测未来的数据,或者在不确定条件下进行某种决策。
图1-2机器学习过程我们已经知道,使用计算机语言编程能够做很多事情,但是,如果要求编程实现在一堆照片中识别并标记出猫或狗,我们却不知道该怎样做。技术难点在于我们不知道该怎样对猫和狗的照片进行建模,也就是说,一些模式我们无法通过数据直接进行归纳总结。机器学习恰好能解决这类问题,我们将一些标记为猫和狗的照片让某个分类器(如神经网络)进行学习,分类器自动识别照片中猫和狗的模式,经过训练后,分类器分别得到猫和狗的模型,然后使用模型来识别未标记照片中是否有猫或狗。
机器学习的主要内容是研究如何从数据中构建模型的学习算法。有了学习算法之后,将已有数据(称为训练数据集)提供给它,算法就能根据这些数据构建模型,从而使用模型进行预测。因此,机器学习的一个核心内容就是研究学习算法。
— 没有更多了 —
以下为对购买帮助不大的评价