• 现代决策树模型及其编程实践
21年品牌 40万+商家 超1.5亿件商品

现代决策树模型及其编程实践

正版全新 可开发票

96.75 7.5折 129 全新

库存19件

北京朝阳
认证卖家担保交易快速发货售后保障

作者黄智濒编著

出版社机械工业出版社

ISBN9787111706366

出版时间2022-07

装帧平装

开本其他

定价129元

货号4165836

上书时间2024-09-25

宏铭图书店

十二年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
前言

第1章决策树与人工智能1
1.1决策与智能1
1.2决策树算法的起源2
1.3决策树的核心术语4
1.4决策树的可解释性5
1.5作为决策分析工具的决策树7
1.5.1决策分析8
1.5.2基于决策分析流程的决策树9
1.6作为机器学习算法的决策树15
1.6.1机器学习算法的类型15
1.6.2基于数据的决策树18
1.6.3决策树算法面临的基本问题24
1.6.4基于规则的机器学习27
1.7作为特征学习与决策融合的决策树30
1.8参考文献31
第2章经典决策树算法33
2.1经典决策树应用的一般流程33
2.1.1缺失值的处理33
2.1.2连续数值属性的离散化处理34
2.2CART算法34
2.2.1基尼不纯度、基尼增益与基尼指数34
2.2.2CART分类决策树的原理38
2.2.3CART分类决策树的编程实践43
2.2.4回归问题与回归算法55
2.2.5CART回归决策树的特征和分割点选择准则65
2.2.6CART回归决策树的原理66
2.2.7CART回归决策树的编程实践70
2.3ID3算法75
2.3.1信息熵与信息增益75
2.3.2ID3算法示例78
2.3.3ID3算法的编程实践84
2.4C4.5算法87
2.4.1信息增益率88
2.4.2连续属性的处理88
2.4.3缺失值的处理88
2.4.4基于C4.5算法处理连续属性生成分类决策树的示例91
2.4.5C4.5算法的后续改进——C5.0算法96
2.5决策树的评估98
2.6决策树的5种可视化方法100
2.7小结107
2.8参考文献107
第3章决策树的剪枝109
3.1代价复杂度剪枝110
3.1.1CCP算法的基本原理110
3.1.2CCP算法的编程实践113
3.1.3基于sklearn的CCP示例121
3.2错误率降低剪枝127
3.2.1REP算法的基本原理127
3.2.2REP算法的编程实践128
3.3悲观错误剪枝133
3.3.1PEP算法的基本原理133
3.3.2PEP算法的编程实践135
3.4最小错误剪枝139
3.4.1MEP算法的基本原理139
3.4.2MEP算法的编程实践140
3.5其他决策树剪枝算法简介145
3.6小结147
3.7参考文献147
第4章随机森林149
4.1随机森林的基本原理149
4.1.1构造随机森林的步骤150
4.1.2随机森林的简单示例151
4.1.3基于sklearn的随机森林编程示例152
4.1.4选择最优的随机特征属性数量153
4.2套袋法156
4.2.1套袋法的算法流程157
4.2.2套袋法的偏差和方差157
4.2.3套袋法的优缺点159
4.3随机森林的参数设置与调优159
4.3.1sklearn随机森林的参数159
4.3.2调参示例161
4.3.3OOB错误率与交叉验证166
4.4随机森林的优缺点174
4.5使用随机森林进行特征属性的重要性区分的示例175
4.5.1基于基尼指数的特征属性重要性评估175
4.5.2基于袋外数据错误率的特征属性重要性评估177
4.6使用随机森林进行无监督聚类的示例179
4.7使用随机森林进行回归分析的示例182
4.8随机森林与核方法的结合184
4.9小结186
4.10参考文献186
第5章集成学习方法188
5.1提升法188
5.1.1AdaBoost算法原理189
5.1.2AdaBoost算法实现199
5.1.3AdaBoost算法的编程实践——基于sklearn解决分类问题203
5.1.4AdaBoost算法的编程实践——基于sklearn解决回归问题205
5.1.5提升法的分类、优点和挑战207
5.2梯度提升法208
5.2.1梯度提升法的原理和示例208
5.2.2梯度提升决策树211
5.2.3梯度提升分类决策树213
5.2.4梯度提升回归决策树223
5.2.5随机梯度提升树227
5.2.6基于梯度提升法的机器学习库228
5.3堆叠法233
5.3.1简单的二阶段堆叠算法234
5.3.2基于K折交叉验证的二阶段堆叠法237
5.3.3基于sklearn的K折交叉验证的二阶段堆叠法的编程实践238
5.3.4多阶段堆叠模型247
5.4套袋法、提升法、堆叠法的比较250
5.5小结252
5.6参考文献253
第6章并行决策树256
6.1随机森林的并行化256
6.2XGBoost基础259
6.2.1XGBoost核心原理260
6.2.2XGBoost系统设计及其并行化加速270
6.2.3XGBoost编程基础272
6.2.4XGBoost回归问题编程275
6.2.5XGBoost分类问题编程277
6.2.6XGBoost随机森林编程278
6.2.7XGBoost特征筛选编程281
6.2.8XGBoost与传统提升树的比较283
6.2.9XGBoost的缺点284
6.3LightGBM基础284
6.3.1LightGBM核心原理285
6.3.2LightGBM系统设计及其并行化加速291
6.3.3LigthGBM编程基础294
6.3.4LightGBM与sklearn结合的示例300
6.3.5LightGBM回归问题编程302
6.3.6LightGBM分类问题编程303
6.3.7LightGBM的优缺点305
6.4CatBoost基础306
6.4.1CatBoost核心原理306
6.4.2CatBoost系统设计及其并行化加速313
6.4.3CatBoost编程基础313
6.4.4CatBoost分类问题编程(不带分类特征属性)317
6.4.5CatBoost回归问题编程(不带分类特征属性)319
6.4.6CatBoost回归问题编程(带分类特征属性)321
6.4.7CatBoost的优缺点323
6.4.8XGBoost、LightGBM、CatBoost的比较324
6.5NGBoost简介325
6.6小结326
6.7参考文献326
第7章蚁群决策树329
7.1蚁群元启发式算法329
7.1.1典型蚁群算法330
7.1.2MMAS算法331
7.1.3ACS算法332
7.2基于蚁群的分类规则提取333
7.2.1Ant-Miner规则提取方法334
7.2.2Ant-Miner算法实现339
7.2.3Ant-Miner算法的早期变种345
7.2.4MYRA——开源实现349
7.2.5Ant-MinerMA G算法350
7.2.6AMclr算法353
7.3蚁群

生活中,我们处处在做决策,这类决策也许是快速而直接的。工作中,我们可能要做出一些重大而复杂的决策,这类决策往往需要我们细致地收集各种影响要素,量化分析其权重,最终得到符合意图的决策结果。正是这种认知行为意识使得决策分析和基于树的决策工具在1500年前就开始使用了,长期的树形分析实践为后来决策树方法的诞生提供了丰富的养分。现代决策树算法的演化是人工智能深入发展过程中的重要组成部分。由于优秀的可解释性、模型的简单性、算法的快速性,使得决策树算法受到了越来越广泛的关注,正在成为数据科学和智能科学领域技术人员的必备工具。我相信决策树还将深入影响未来人工智能模式的发展。
在过去的三年中,我有幸参与了一个以决策树作为主要工具的重点项目。我们通过深入学习、探索和研究各类决策树模型,最终实现了具有良好可解释性、能有效处理超大规模数据且能快速实现预测评估的机器学习模型。本书是我们在项目实践过程中的积累与总结。
本书从决策分析及其应用引入主题,首先介绍决策树与人工智能的关系(第1章),然后介绍经典的决策树算法(第2章),通过对CART、ID3和C4.5等算法的介绍,帮助读者对决策树形成明确且清晰的概念。之后结合分类问题和回归问题进行实践,特别是对回归问题进行了深入讨论——回归模型正成为现代决策树模型与深度学习模型的有效结合点。第3章深入讲解经典的决策树剪枝方法,特别是代价复杂度剪枝、错误率降低剪枝、悲观错误剪枝和最小错误剪枝,通过示例和编程实践进行详细描述。第4章介绍随机森林的基本原理,结合示例和编程实践详细描述了随机森林的构造过程,并对套袋法进行分析。第5章介绍当前较为热门的集成学习方法(提升法、梯度提升法、堆叠法),通过示例和编程实践详细讲解AdaBoost和梯度提升法。第6章着重介绍并行决策树的几种主流算法,包括XGBoost、LightGBM和CatBoost,并简要介绍了较新的NGBoost算法。该章首先对各算法的核心原理做了分析,然后从工程化角度介绍其并行化加速方法,同时还提供了一些应用实例。第7章介绍常见的几类蚁群算法以及在此基础上的蚁群决策树算法和自适应蚁群决策森林。群智模型作为人工智能2.0时代的典型智能模型,其群体智能的全局搜索能力与决策树的可解释性的有效结合,也许会带来预料之外的成功。第8章介绍深度决策树算法,包括深度森林、深度神经决策树、自适应神经决策树、神经支持决策树和深度神经决策森林,并借助PyTorch等工具对程序和示例进行分析。
本书围绕决策树算法和现代决策树模型,通过大量的示例和完整的代码实现详细讲解决策树的精髓,既涵盖必要的公式推导,又考虑具体的应用需求。本书的所有代码均可免费获取,有需要的读者请访问华章网站(www.hzbook.com)搜索本书并下载。通过阅读本书,希望读者能对决策树有系统和全面的了解,并能够将其快速应用在工作和生活实践中。如果这本书能给你带来“开卷有益”的感受,那将是我最大的欣慰了。
最后,感谢家人和朋友的支持和帮助。感谢在本书撰写过程中做出贡献的人,特别是常霄、曹凌婧、刘小萌、洪艺宾、张瑞涛、刘涛、傅广涛、董丹阳、法天昊、靳梦凡、汪鑫等,常霄负责全书代码的编写和整理工作。还要感谢机械工业出版社的各位编辑,以及北京邮电大学计算机学院(国家示范性软件学院)的大力支持。

黄智濒

商品简介

决策树是数据分析中广泛使用的机器学习模型,其模型简单、算法快速且具有可解释性。但随着大数据的涌现,将决策树真正应用到实践中还面临诸多困难。本书正是为解决这一痛点而作,旨在帮助读者系统且全面地了解决策树,并成功地将其用于工程实践。

作者简介
    黄智濒,计算机系统结构博士,北京邮电大学计算机学院讲师。长期从事智能机器学习、超大规模并行计算、三维计算机视觉和深度学习架构方面的研究。

目录
本书围绕现代决策树模型, 通过原理解析、应用示例和完整的代码实现详细讲解决策树算法, 既涵盖必要的公式推导, 又考虑具体的应用需求。书中讨论的主要算法和技术包括: CART、ID3和C4.5等经典决策树算法, 代价复杂度剪枝、错误率降低剪枝和悲观错误剪枝等决策树剪枝方法, 随机森林的构造和参数调优, 套袋法、梯度提升法和堆叠法等集成学习方法, XGBoost、LightBoost和CatBoost等主流并行决策树, 常见蚁群算法、蚁群决策树算法和自适应蚁群决策森林, 深度森林、深度神经决策树和深度神经决策森林等深度决策树算法。

内容摘要
决策树是数据分析中广泛使用的机器学习模型,其模型简单、算法快速且具有可解释性。但随着大数据的涌现,将决策树真正应用到实践中还面临诸多困难。本书正是为解决这一痛点而作,旨在帮助读者系统且全面地了解决策树,并成功地将其用于工程实践。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP