消息首页搜索举报

机器学习中的统计思维

52.33 5.3折 99 九五品

仅1件

北京通州

认证卖家担保交易快速发货售后保障

作者董平

出版社清华大学出版社

ISBN9787302634010

出版时间2023-09

版次1

装帧平装

开本16开

纸张胶版纸

定价99元

上书时间2024-07-08

灵感飞驰

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 22小时
好评率暂无

最新上架

特色营队活动案例集 ¥11.38

数字图像处理 ¥9.55

互联网金融 ¥14.31

人力资源管理 ¥31.48

线性代数 ¥15.11

文化遗产导论 ¥16.22

基础会计 ¥14.31

市场营销学 ¥9.90

物流与供应链管理 ¥14.74

商品详情

品相描述：九五品

商品描述: 基本信息
书名:机器学习中的统计思维
定价：99.00元
作者:董平
出版社：清华大学出版社
出版日期：2023-09-01
ISBN：9787302634010
字数：
页码：
版次：
装帧：平装
开本：16开
商品重量：
编辑推荐
本书从统计学的角度来理解机器学习模型的本质。
内容提要
机器学习是人工智能的核心，而统计思维则是机器学习方法的核心：从随机性中寻找规律性。例如，利用损失最小化思想制定学习策略，采用概率化思想估计模型参数，利用方差对不确定性的捕捉构造 k维树，采用贝叶斯公式构建分类决策模型，等等。只有树立正确的统计思维，才能准确高效地运用机器学习方法开展数据处理与分析。本书以统计思维的视角，揭示监督学习中回归和分类模型的核心思想，帮助读者构建理论体系。具体模型包括线性回归模型、K近邻模型、贝叶斯推断、逻辑回归模型、熵模型、决策树模型、感知机模型、支持向量机、EM算法和提升方法。本书共 12章，绪论介绍贯穿本书的两大思维模式，以及关于全书的阅读指南；章介绍一些基本术语，并给出监督学习的流程；第 2章介绍关于回归问题的机器学习方法；第 3～9章介绍关于分类问题的机器学习方法；0章介绍可应用于具有隐变量模型的参数学习算法——EM算法；1章简单介绍集成学习，并重点阐述其中的提升（Boosting）方法。为满足个性化学习需求的不同需求，本书从核心思想、方法流程及实际案例应用等不同角度，详细描述各种方法的原理和实用价值，非常适合数据科学、机器学习专业的本科生和研究生学习，也可供相关从业者参考。
目录
目录绪论10.1本书讲什么，初衷是什么 10.2贯穿本书的两大思维模式 30.2.1提问的思维方式 30.2.2发散的思维方式 40.3这本书决定它还想要这样 50.3.1第一性原理 . 50.3.2奥卡姆剃刀原理 70.4如何使用本书 8第 1章步入监督学习之旅 .111.1机器学习从数据开始 111.2监督学习是什么 . 141.2.1基本术语 161.2.2学习过程如同一场科学推理 171.3如何评价模型的好坏 211.3.1评价模型的量化指标 211.3.2拟合能力 241.3.3泛化能力 241.4损失化思想 . 251.5怎样理解模型的性能：方差-偏差折中思想 . 271.6如何选择模型 281.6.1正则化：对模型复杂程度加以惩罚 281.6.2交叉验证：样本的多次重复利用 . 301.7本章小结 . 311.8习题 31第 2章线性回归模型 332.1探寻线性回归模型 332.1.1诺贝尔奖中的线性回归模型 332.1.2回归模型的诞生 342.1.3线性回归模型结构 . 382.2二乘法 392.2.1回归模型用哪种损失：平方损失 . 40机器学习中的统计思维 (Python实现)2.2.2如何估计模型参数：二乘法 . 412.3线性回归模型的预测 442.3.1一元线性回归模型的预测 . 442.3.2多元线性回归模型的预测 . 482.4拓展部分：岭回归与套索回归 . 492.4.1岭回归 502.4.2套索回归 512.5案例分析——共享单车数据集 . 532.6本章小结 . 562.7习题 57第 3章 K近邻模型 593.1邻友思想 . 593.2 K近邻算法. 603.2.1聚合思想 603.2.2 K近邻模型的具体算法 613.2.3 K近邻算法的三要素 . 633.2.4 K近邻算法的可视化 . 673.3最近邻分类器的误差率 . 673.4 k维树. 703.4.1 k维树的构建 703.4.2 k维树的搜索 733.5拓展部分：距离度量学习的 K近邻分类器 763.6案例分析——莺尾花数据集 793.7本章小结 . 833.8习题 83第 4章贝叶斯推断 .854.1贝叶斯思想 854.1.1什么是概率 . 864.1.2从概率到条件概率 . 914.1.3贝叶斯定理 . 934.2贝叶斯分类器 974.2.1贝叶斯分类 . 974.2.2朴素贝叶斯分类 984.3如何训练贝叶斯分类器 1034.3.1极大似然估计：概率化思想 1044.3.2贝叶斯估计：贝叶斯思想 1114.4常用的朴素贝叶斯分类器.1154.4.1离散属性变量下的朴素贝叶斯分类器 .1154.4.2连续特征变量下的朴素贝叶斯分类器 .1154.5拓展部分 1164.5.1半朴素贝叶斯.116目录4.5.2贝叶斯网络 1194.6案例分析——蘑菇数据集 .1224.7本章小结 1244.8习题.1244.9阅读时间：贝叶斯思想的起源 125第 5章逻辑回归模型 1315.1一切始于逻辑函数.1315.1.1逻辑函数 .1315.1.2逻辑斯谛分布.1335.1.3逻辑回归 .1345.2逻辑回归模型的学习 .1365.2.1加权二乘法 .1365.2.2极大似然法 1395.3逻辑回归模型的学习算法.1415.3.1梯度下降法 1415.3.2牛顿法.1435.4拓展部分 1445.4.1拓展 1：多分类逻辑回归模型 1445.4.2拓展 2：非线性逻辑回归模型 1475.5案例分析——离职数据集 .1475.6本章小结 1495.7习题.1505.8阅读时间：牛顿法是牛顿提出的吗 .150第 6章熵模型 . 1536.1问世间熵为何物 1536.1.1热力学熵 .1536.1.2信息熵.1556.2熵思想.1566.2.1离散随机变量的分布.1566.2.2连续随机变量的分布.1606.3熵模型的学习问题 1636.3.1熵模型的定义 1636.3.2熵模型的原始问题与对偶问题.1676.3.3熵模型的学习 1696.4模型学习的化算法 1736.4.1最速梯度下降法 .1776.4.2拟牛顿法：DFP算法和 BFGS算法 1786.4.3改进的迭代尺度法 1796.5案例分析——汤圆小例子 .1836.6本章小结 1856.7习题.186机器学习中的统计思维 (Python实现)6.8阅读时间：奇妙的对数 187第 7章决策树模型 . 1917.1决策树中蕴含的基本思想.1917.1.1什么是决策树.1917.1.2决策树的基本思想 1957.2决策树的特征选择.1957.2.1错分类误差 1957.2.2基于熵的信息增益和信息增益比 1967.2.3基尼不纯度 1997.2.4比较错分类误差、信息熵和基尼不纯度 2017.3决策树的生成算法.2017.3.1 ID3算法2027.3.2 C4.5算法 2057.3.3 CART算法2057.4决策树的剪枝过程.2117.4.1预剪枝.2117.4.2后剪枝.2137.5拓展部分：随机森林 .2237.6案例分析——帕尔默企鹅数据集 .2237.7本章小结 2267.8习题.2267.9阅读时间：经济学中的基尼指数.227第 8章感知机模型 . 2318.1感知机制——从逻辑回归到感知机 .2318.2感知机的学习 .2338.3感知机的优化算法.2348.3.1原始形式算法.2358.3.2对偶形式算法.2398.4案例分析——莺尾花数据集 .2418.5本章小结 2438.6习题.243第 9章支持向量机 . 2459.1从感知机到支持向量机 2459.2线性可分支持向量机 .2489.2.1线性可分支持向量机与间隔算法 .2489.2.2对偶问题与硬间隔算法 .2549.3线性支持向量机 2589.3.1线性支持向量机的学习问题.2599.3.2对偶问题与软间隔算法 .2609.3.3线性支持向量机之合页损失.2639.4非线性支持向量机.265目录9.4.1核变换的根本——核函数 2669.4.2非线性可分支持向量机 .2779.4.3非线性支持向量机 2789.5 SMO优化方法 .2799.5.1“失败的”坐标下降法 .2799.5.2“成功的”SMO算法.2809.6案例分析——电离层数据集 .2879.7本章小结 2889.8习题.289第 10章 EM算法 29110.1极大似然法与 EM算法 .29110.1.1具有缺失数据的豆花小例子29110.1.2具有隐变量的硬币盲盒例子29510.2 EM算法的迭代过程29810.2.1 EM算法中的两部曲 29810.2.2 EM算法的合理性 .30210.3 EM算法的应用 30510.3.1高斯混合模型30510.3.2隐马尔可夫模型 30910.4本章小结 31610.5习题 .317第 11章提升方法. 31911.1提升方法（Boosting）是一种集成学习方法.31911.1.1什么是集成学习 31911.1.2强可学习与弱可学习32111.2起步于 AdaBoost算法 32311.2.1两大内核：前向回归和可加模型 .32311.2.2 AdaBoost的前向分步算法.32411.2.3 AdaBoost分类算法 .32611.2.4 AdaBoost分类算法的训练误差 33311.3提升树和 GBDT算法 .33911.3.1回归提升树 .33911.3.2 GDBT算法 34211.4拓展部分：XGBoost算法34411.5案例分析——波士顿房价数据集 .34611.6本章小结 34711.7习题 .348参考文献 . 349
作者介绍
董平（博士），上海对外经贸大学统计与信息学院讲师。曾获概率论与数理统计理学博士学位（山东大学2018）、理学学士学位和经济学学士学位（山东大学2012）；美国迈阿密大学访问学者。主要研究领域为高维数据、假设检验、半监督回归、统计机器学习等。参与多项科研项目和工程类项目，主持多项校级课程建设项目，曾获第三届上海市高校教师教学创新大赛二等奖。
序言

【封面】

— 没有更多了 —

机器学习中的统计思维

灵感飞驰

商品详情

相关推荐