• Python机器学习——数据建模与分析(第2版)
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

Python机器学习——数据建模与分析(第2版)

58.21 5.9折 99 全新

库存9件

山东泰安
认证卖家担保交易快速发货售后保障

作者薛薇

出版社电子工业出版社

出版时间2023-07

版次1

装帧其他

货号604 11-6

上书时间2024-11-07

邹鲁文化书店

十一年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 薛薇
  • 出版社 电子工业出版社
  • 出版时间 2023-07
  • 版次 1
  • ISBN 9787121459351
  • 定价 99.00元
  • 装帧 其他
  • 开本 16开
  • 页数 392页
  • 字数 647千字
【内容简介】
本书将引领读者进入Python机器学习领域。机器学习是一套先进、深刻且内容丰富的算法集合,已成为数据科学中数据建模与分析的重要方法。Python是一款简明、高效且功能强大的开源工具,也是数据科学实践中最常用的计算机语言。学好机器学习的理论方法,掌握Python这个实用工具,是成长为数据科学人才所必需的。本书采用理论与实践相结合的方式,理论上突出可读性并兼具知识深度和广度,实践上强调可操作性并兼具应用广泛性,对机器学习的原理部分进行了深入透彻的讲解,对机器学习的算法部分给出了Python代码,并且在各章中设置了Python编程示例。全彩呈现机器学习的数据建模可视化图例(80多幅彩图),扫描书中相应二维码即可查看。提供配套数据集、源代码、教学PPT等学习资源,登录华信教育资源网(www.hxedu.com.cn)即可免费下载。本书可作为高等院校机器学习、数据分析等专业课程的教材,也可作为数据科学应用研究者及对Python机器学习感兴趣的数据建模与分析从业者的参考书。
【作者简介】
薛薇,工学硕士,经济学博士,中国人民大学应用统计学科研究中心副主任,中国人民大学统计学院副教授。主要研究领域:机器学习和文本挖掘、复杂网络建模等。关注统计和数据挖掘算法及软件应用。涉足企业客户终身价值测算,基于文本挖掘的热点事件主题提取和分类,金融、贸易等复杂网络动态建模等方面。主要代表性教材:《SPSS统计分析方法及应用》《R语言数据挖掘方法及应用》《R语言:大数据分析中的统计方法及应用》《SPSS Modeler数据挖掘方法及应用》《数据科学概论——从概念到应用》《Python机器学习——数据建模与分析》等。
【目录】
目    录

第1章  机器学习概述1

1.1  机器学习的发展:人工智能中的机器学习1

1.1.1  符号主义人工智能2

1.1.2  基于机器学习的人工智能2

1.2  机器学习的核心:数据和数据建模4

1.2.1  机器学习的对象:数据集4

1.2.2  机器学习的任务:数据建模6

1.3  机器学习的典型应用11

1.3.1  机器学习的典型行业应用11

1.3.2  机器学习在客户细分中的应用12

1.3.3  机器学习在客户流失分析中的应用13

1.3.4  机器学习在营销响应分析中的应用14

1.3.5  机器学习在交叉销售中的应用15

1.3.6  机器学习在欺诈甄别中的应用16

本章总结16

本章习题16

第2章  Python机器学习基础17

2.1  Python:机器学习的首选工具17

2.2  Python的集成开发环境:Anaconda18

2.2.1  Anaconda的简介19

2.2.2  Anaconda Prompt的使用19

2.2.3  Spyder的使用20

2.2.4  Jupyter Notebook的使用22

2.3  Python第三方包的引用23

2.4  NumPy使用示例23

2.4.1  NumPy数组的创建和访问24

2.4.2  NumPy的计算功能26

2.5  Pandas使用示例28

2.5.1  Pandas的序列和索引28

2.5.2  Pandas的数据框29

2.5.3  Pandas的数据加工处理30

2.6  NumPy和Pandas的综合应用:空气质量监测数据的预处理和基本分析32

2.6.1  空气质量监测数据的预处理32

2.6.2  空气质量监测数据的基本分析34

2.7  Matplotlib的综合应用:空气质量监测数据的图形化展示37

2.7.1  AQI的时间序列变化特点37

2.7.2  AQI的分布特征及相关性分析38

本章总结40

本章相关函数列表40

本章习题47

第3章  数据预测与预测建模48

3.1  从线性回归模型说起49

3.1.1  线性回归模型的含义49

3.1.2  线性回归模型的几何理解50

3.1.3  线性回归模型的评价50

3.1.4  Python应用实践:PM2.5浓度预测51

3.2  认识线性分类模型56

3.2.1  线性分类模型的含义56

3.2.2  线性分类模型的几何理解58

3.2.3  线性分类模型的评价60

3.2.4  Python应用实践:空气质量等级预测62

3.3  从线性预测模型到非线性预测模型67

3.4  预测模型的参数估计68

3.4.1  损失函数与有监督学习68

3.4.2  参数搜索策略70

3.5  预测模型的选择72

3.5.1  泛化误差的估计72

3.5.2  Python模拟和启示:理解泛化误差75

3.5.3  预测模型过拟合问题78

3.5.4  模型选择:偏差和方差79

本章总结82

本章相关函数列表83

本章习题83

第4章  数据预测建模:贝叶斯分类器84

4.1  贝叶斯概率和贝叶斯法则84

4.1.1  贝叶斯概率84

4.1.2  贝叶斯法则85

4.2  朴素贝叶斯分类器85

4.2.1  从顾客行为分析角度看朴素贝叶斯分类器85

4.2.2  Python模拟和启示:认识朴素贝叶斯分类器的分类边界88

4.2.3  Python应用实践:空气质量等级预测91

4.3  朴素贝叶斯分类器在文本分类中的应用93

4.3.1  Python文本数据预处理:文本分词和量化计算94

4.3.2  Python文本描述性分析:词云图和文本相似性97

4.3.3  Python文本分析综合应用:裁判文书的要素提取99

4.4  贝叶斯参数估计简介*102

4.4.1  从科比投篮分析角度看贝叶斯参数估计的基本思想102

4.4.2  共轭先验分布103

4.4.3  Python应用实践:科比投篮命中率的研究106

本章总结108

本章相关函数列表108

本章习题109

第5章  数据预测建模:近邻分析110

5.1  近邻分析:K-近邻法110

5.1.1  距离:K-近邻法的近邻度量111

5.1.2  参数K:1-近邻法和K-近邻法112

5.2  回归预测中的K-近邻法113

5.2.1  Python模拟和启示:认识K-近邻回归线113

5.2.2  Python模拟和启示:认识K-近邻回归面115

5.3  分类预测中的K-近邻法117

5.3.1  基于1-近邻法和K-近邻法的分类117

5.3.2  Python模拟和启示:参数K和分类边界118

5.4  基于观测相似性的加权K-近邻法120

5.4.1  加权K-近邻法的权重121

5.4.2  Python模拟和启示:认识加权K-近邻分类边界123

5.5  K-近邻法的Python应用实践124

5.5.1  空气质量等级的预测124

5.5.2  国产电视剧大众评分的预测126

5.6  K-近邻法的适用性探讨*127

本章总结129

本章相关函数列表130

本章习题130

第6章  数据预测建模:决策树131

6.1  决策树的基本概念131

6.1.1  什么是决策树131

6.1.2  决策树的深层含义133

6.2  回归预测中的决策树134

6.2.1  决策树的回归面134

6.2.2  Python模拟和启示:树深度对回归面的影响135

6.3  分类预测中的决策树136

6.3.1  决策树的分类边界137

6.3.2  Python模拟和启示:树深度对分类边界的影响137

6.4  决策树的生长和剪枝139

6.4.1  决策树的生长140

6.4.2  决策树的剪枝141

6.5  经典决策树算法:CART142

6.5.1  CART的生长142

6.5.2  CART的后剪枝145

6.6  决策树的Python应用实践148

6.6.1  PM2.5浓度的预测148

6.6.2  空气质量等级的预测149

6.6.3  药物适用性研究151

6.7  决策树的高方差性*153

本章总结154

本章相关函数列表154

本章习题155

第7章  数据预测建模:集成学习156

7.1  集成学习概述156

7.1.1  高方差性问题的解决途径157

7.1.2  从弱模型到强模型的构建157

7.2  基于重抽样自举法的集成学习158

7.2.1  重抽样自举法158

7.2.2  袋装法的基本思想158

7.2.3  随机森林的基本思想160

7.2.4  Python应用实践:基于袋装法和随机森林预测PM2.5浓度162

7.3  从弱模型到强模型的构建:提升法165

7.3.1  提升法的基本思路165

7.3.2  Python模拟和启示:弱模型联合成为强模型166

7.3.3  分类预测中的提升法:AdaBoost.M1算法168

7.3.4  Python模拟和启示:认识AdaBoost.M1算法中高权重的样本观测171

7.3.5  回归预测中的提升法173

7.3.6  Python应用实践:基于AdaBoost预测PM2.5浓度174

7.3.7  提升法的推广算法*176

7.4  梯度提升决策树179

7.4.1  梯度提升算法179

7.4.2  梯度提升回归树183

7.4.3  Python模拟和启示:认识梯度提升回归树184

7.4.4  梯度提升分类树185

7.4.5  Python模拟和启示:认识梯度提升分类树186

7.5  XGBoost算法188

7.5.1  XGBoost算法的目标函数188

7.5.2  目标函数的近似表达189

7.5.3  决策树的求解190

7.5.4  Python应用实践:基于XGBoost算法预测空气质量等级191

本章总结194

本章相关函数列表194

本章习题195

第8章  数据预测建模:人工神经网络197

8.1  人工神经网络的基本概念198

8.1.1  人工神经网络的基本构成198

8.1.2  人工神经网络节点的功能199

8.2  感知机网络200

8.2.1  感知机网络中的节点200

8.2.2  感知机网络节点中的加法器201

8.2.3  感知机网络节点中的激活函数202

8.2.4  Python模拟和启示:认识激活函数203

8.2.5  感知机网络的权重训练206

8.3  多层感知机网络211

8.3.1  多层感知机网络的结构211

8.3.2  多层感知机网络中的隐藏节点213

8.3.3  Python模拟和启示:认识隐藏节点215

8.4  反向传播算法218

8.4.1  反向传播算法的基本思想218

8.4.2  局部梯度和连接权重更新218

8.5  多层神经网络的其他问题*220

8.6  人工神经网络的Python应用实践221

8.6.1  手写体邮政编码的识别221

8.6.2  PM2.5浓度的回归预测224

本章总结225

本章相关函数列表225

本章习题226

第9章  数据预测建模:支持向量机227

9.1  支持向量分类概述228

9.1.1  支持向量分类的基本思路228

9.1.2  支持向量分类的三种情况230

9.2  完全线性可分下的支持向量分类231

9.2.1  完全线性可分下的超平面231

9.2.2  参数求解和分类预测233

9.2.3  Python模拟和启示:认识支持向量236

9.3  广义线性可分下的支持向量分类238

9.3.1  广义线性可分下的超平面238

9.3.2  广义线性可分下的误差惩罚和目标函数239

9.3.3  Python模拟和启示:认识惩罚参数C240

9.3.4  参数求解和分类预测242

9.4  线性不可分下的支持向量分类243

9.4.1  线性不可分问题的一般解决方式243

9.4.2  支持向量分类克服维灾难的途径244

9.4.3  Python模拟和启示:认识核函数246

9.5  支持向量回归概述*249

9.5.1  支持向量回归的基本思路249

9.5.2  支持向量回归的目标函数和约束条件251

9.5.3  Python模拟和启示:认识参数? 253

9.6  支持向量机的Python应用实践:老人风险体位预警254

9.6.1  示例背景和数据说明255

9.6.2  Python实现255

本章总结260

本章相关函数列表260

本章习题260

第10章  特征选择:过滤、包裹和嵌入策略261

10.1  过滤策略下的特征选择262

10.1.1  低方差过滤法263

10.1.2  高相关过滤法中的方差分析264

10.1.3  高相关过滤法中的卡方检验268

10.1.4  Python应用实践:过滤策略下手写体邮政编码数字的特征选择270

10.1.5  其他高相关过滤法*272

10.2  包裹策略下的特征选择274

10.2.1  包裹策略的基本思路274

10.2.2  递归式特征剔除算法275

10.2.3  基于交叉验证的递归式特征剔除算法276

10.2.4  Python应用实践:包裹策略下手写体邮政编码数字
点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP