机器学习中的统计思维
¥
51.31
5.2折
¥
99
九五品
仅1件
作者董平
出版社清华大学出版社
ISBN9787302634010
出版时间2023-09
版次1
装帧平装
开本16开
纸张胶版纸
定价99元
上书时间2024-05-01
商品详情
- 品相描述:九五品
- 商品描述
-
基本信息
书名:机器学习中的统计思维
定价:99.00元
作者:董平
出版社:清华大学出版社
出版日期:2023-09-01
ISBN:9787302634010
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
本书从统计学的角度来理解机器学习模型的本质。
内容提要
机器学习是人工智能的核心,而统计思维则是机器学习方法的核心:从随机性中寻找规律性。例如,利用损失最小化思想制定学习策略,采用概率化思想估计模型参数,利用方差对不确定性的捕捉构造 k维树,采用贝叶斯公式构建分类决策模型,等等。只有树立正确的统计思维,才能准确高效地运用机器学习方法开展数据处理与分析。本书以统计思维的视角,揭示监督学习中回归和分类模型的核心思想,帮助读者构建理论体系。具体模型包括线性回归模型、K近邻模型、贝叶斯推断、逻辑回归模型、熵模型、决策树模型、感知机模型、支持向量机、EM算法和提升方法。本书共 12章,绪论介绍贯穿本书的两大思维模式,以及关于全书的阅读指南;章介绍一些基本术语,并给出监督学习的流程;第 2章介绍关于回归问题的机器学习方法;第 3~9章介绍关于分类问题的机器学习方法;0章介绍可应用于具有隐变量模型的参数学习算法——EM算法;1章简单介绍集成学习,并重点阐述其中的提升(Boosting)方法。为满足个性化学习需求的不同需求,本书从核心思想、方法流程及实际案例应用等不同角度,详细描述各种方法的原理和实用价值,非常适合数据科学、机器学习专业的本科生和研究生学习,也可供相关从业者参考。
目录
目录绪论10.1本书讲什么,初衷是什么 10.2贯穿本书的两大思维模式 30.2.1提问的思维方式 30.2.2发散的思维方式 40.3这本书决定它还想要这样 50.3.1第一性原理 . 50.3.2奥卡姆剃刀原理 70.4如何使用本书 8第 1章步入监督学习之旅 .111.1机器学习从数据开始 111.2监督学习是什么 . 141.2.1基本术语 161.2.2学习过程如同一场科学推理 171.3如何评价模型的好坏 211.3.1评价模型的量化指标 211.3.2拟合能力 241.3.3泛化能力 241.4损失化思想 . 251.5怎样理解模型的性能:方差-偏差折中思想 . 271.6如何选择模型 281.6.1正则化:对模型复杂程度加以惩罚 281.6.2交叉验证:样本的多次重复利用 . 301.7本章小结 . 311.8习题 31第 2章线性回归模型 332.1探寻线性回归模型 332.1.1诺贝尔奖中的线性回归模型 332.1.2回归模型的诞生 342.1.3线性回归模型结构 . 382.2二乘法 392.2.1回归模型用哪种损失:平方损失 . 40机器学习中的统计思维 (Python实现)2.2.2如何估计模型参数:二乘法 . 412.3线性回归模型的预测 442.3.1一元线性回归模型的预测 . 442.3.2多元线性回归模型的预测 . 482.4拓展部分:岭回归与套索回归 . 492.4.1岭回归 502.4.2套索回归 512.5案例分析——共享单车数据集 . 532.6本章小结 . 562.7习题 57第 3章 K近邻模型 593.1邻友思想 . 593.2 K近邻算法. 603.2.1聚合思想 603.2.2 K近邻模型的具体算法 613.2.3 K近邻算法的三要素 . 633.2.4 K近邻算法的可视化 . 673.3最近邻分类器的误差率 . 673.4 k维树. 703.4.1 k维树的构建 703.4.2 k维树的搜索 733.5拓展部分:距离度量学习的 K近邻分类器 763.6案例分析——莺尾花数据集 793.7本章小结 . 833.8习题 83第 4章贝叶斯推断 .854.1贝叶斯思想 854.1.1什么是概率 . 864.1.2从概率到条件概率 . 914.1.3贝叶斯定理 . 934.2贝叶斯分类器 974.2.1贝叶斯分类 . 974.2.2朴素贝叶斯分类 984.3如何训练贝叶斯分类器 1034.3.1极大似然估计:概率化思想 1044.3.2贝叶斯估计:贝叶斯思想 1114.4常用的朴素贝叶斯分类器.1154.4.1离散属性变量下的朴素贝叶斯分类器 .1154.4.2连续特征变量下的朴素贝叶斯分类器 .1154.5拓展部分 1164.5.1半朴素贝叶斯.116目录4.5.2贝叶斯网络 1194.6案例分析——蘑菇数据集 .1224.7本章小结 1244.8习题.1244.9阅读时间:贝叶斯思想的起源 125第 5章逻辑回归模型 1315.1一切始于逻辑函数.1315.1.1逻辑函数 .1315.1.2逻辑斯谛分布.1335.1.3逻辑回归 .1345.2逻辑回归模型的学习 .1365.2.1加权二乘法 .1365.2.2极大似然法 1395.3逻辑回归模型的学习算法.1415.3.1梯度下降法 1415.3.2牛顿法.1435.4拓展部分 1445.4.1拓展 1:多分类逻辑回归模型 1445.4.2拓展 2:非线性逻辑回归模型 1475.5案例分析——离职数据集 .1475.6本章小结 1495.7习题.1505.8阅读时间:牛顿法是牛顿提出的吗 .150第 6章熵模型 . 1536.1问世间熵为何物 1536.1.1热力学熵 .1536.1.2信息熵.1556.2熵思想.1566.2.1离散随机变量的分布.1566.2.2连续随机变量的分布.1606.3熵模型的学习问题 1636.3.1熵模型的定义 1636.3.2熵模型的原始问题与对偶问题.1676.3.3熵模型的学习 1696.4模型学习的化算法 1736.4.1最速梯度下降法 .1776.4.2拟牛顿法:DFP算法和 BFGS算法 1786.4.3改进的迭代尺度法 1796.5案例分析——汤圆小例子 .1836.6本章小结 1856.7习题.186机器学习中的统计思维 (Python实现)6.8阅读时间:奇妙的对数 187第 7章决策树模型 . 1917.1决策树中蕴含的基本思想.1917.1.1什么是决策树.1917.1.2决策树的基本思想 1957.2决策树的特征选择.1957.2.1错分类误差 1957.2.2基于熵的信息增益和信息增益比 1967.2.3基尼不纯度 1997.2.4比较错分类误差、信息熵和基尼不纯度 2017.3决策树的生成算法.2017.3.1 ID3算法2027.3.2 C4.5算法 2057.3.3 CART算法2057.4决策树的剪枝过程.2117.4.1预剪枝.2117.4.2后剪枝.2137.5拓展部分:随机森林 .2237.6案例分析——帕尔默企鹅数据集 .2237.7本章小结 2267.8习题.2267.9阅读时间:经济学中的基尼指数.227第 8章感知机模型 . 2318.1感知机制——从逻辑回归到感知机 .2318.2感知机的学习 .2338.3感知机的优化算法.2348.3.1原始形式算法.2358.3.2对偶形式算法.2398.4案例分析——莺尾花数据集 .2418.5本章小结 2438.6习题.243第 9章支持向量机 . 2459.1从感知机到支持向量机 2459.2线性可分支持向量机 .2489.2.1线性可分支持向量机与间隔算法 .2489.2.2对偶问题与硬间隔算法 .2549.3线性支持向量机 2589.3.1线性支持向量机的学习问题.2599.3.2对偶问题与软间隔算法 .2609.3.3线性支持向量机之合页损失.2639.4非线性支持向量机.265目录9.4.1核变换的根本——核函数 2669.4.2非线性可分支持向量机 .2779.4.3非线性支持向量机 2789.5 SMO优化方法 .2799.5.1“失败的”坐标下降法 .2799.5.2“成功的”SMO算法.2809.6案例分析——电离层数据集 .2879.7本章小结 2889.8习题.289第 10章 EM算法 29110.1极大似然法与 EM算法 .29110.1.1具有缺失数据的豆花小例子29110.1.2具有隐变量的硬币盲盒例子29510.2 EM算法的迭代过程29810.2.1 EM算法中的两部曲 29810.2.2 EM算法的合理性 .30210.3 EM算法的应用 30510.3.1高斯混合模型30510.3.2隐马尔可夫模型 30910.4本章小结 31610.5习题 .317第 11章提升方法. 31911.1提升方法(Boosting)是一种集成学习方法.31911.1.1什么是集成学习 31911.1.2强可学习与弱可学习32111.2起步于 AdaBoost算法 32311.2.1两大内核:前向回归和可加模型 .32311.2.2 AdaBoost的前向分步算法.32411.2.3 AdaBoost分类算法 .32611.2.4 AdaBoost分类算法的训练误差 33311.3提升树和 GBDT算法 .33911.3.1回归提升树 .33911.3.2 GDBT算法 34211.4拓展部分:XGBoost算法34411.5案例分析——波士顿房价数据集 .34611.6本章小结 34711.7习题 .348参考文献 . 349
作者介绍
董平(博士),上海对外经贸大学统计与信息学院讲师。曾获概率论与数理统计理学博士学位(山东大学2018)、 理学学士学位和经济学学士学位(山东大学2012);美国迈阿密大学访问学者。主要研究领域为高维数据、假设检验、半监督回归、统计机器学习等。参与多项科研项目和工程类项目,主持多项校级课程建设项目,曾获第三届上海市高校教师教学创新大赛二等奖。
序言
— 没有更多了 —
以下为对购买帮助不大的评价