• R语言机器学习实战
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

R语言机器学习实战

全新正版未拆封

69.44 5.8折 119.8 全新

库存2件

山东济宁
认证卖家担保交易快速发货售后保障

作者[美]弗雷德·恩旺加(Fred Nwanganga)

出版社人民邮电出版社

出版时间2022-12

版次1

装帧其他

上书时间2024-10-03

天吾之青豆的书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 [美]弗雷德·恩旺加(Fred Nwanganga)
  • 出版社 人民邮电出版社
  • 出版时间 2022-12
  • 版次 1
  • ISBN 9787115583932
  • 定价 119.80元
  • 装帧 其他
  • 开本 其他
  • 纸张 胶版纸
  • 页数 286页
  • 字数 427千字
【内容简介】
:
    本书探讨了如何使用R语言进行机器学习,涵盖基本的原理和方法,并通过大量的示例和练习,让读者掌握R语言的数据处理技巧。本书包括入门、回归、分类、模型的评估和改进、无监督学习五大部分,涉及线性回归、logistic回归、k近邻、朴素贝叶斯、决策树、聚类和关联规则等机器学习模型。本书配套提供相关的代码和数据,方便读者学习和使用。本书适合R语言和机器学习的爱好者、从业者以及相关院校的师生选用。
【作者简介】
:
    李毅,男,韩国岭南大学理学博士,中国人民大学统计学博士后,现任山西财经大学统计学院教授兼博士生导师,研究方向为大数据推断与抽样调查。主讲的“数据挖掘”课程获批山西省一流课程;主持或完成国家自然基金项目、教育部人文社会科学基金项目等国家级和省部级课题十余项,发表高质量学术论文30余篇,著作5部;获山西省社会科学研究优秀成果一等奖、山西省教学成果一等奖、山西省五一劳动奖章等10余项奖励;被遴选为山西省学术技术带头人、山西省青年拔尖人才等。
【目录】


部分 入门

章 什么是机器学2

1.1 从数据中发现知识2

1.1.1 算介绍3

1.1.2 人工智能、机器学和深度学3

1.2 机器学技术4

1.2.1 监督学4

1.2.2 无监督学7

1.3 模型选择9

1.3.1 分类技术9

1.3.2 回归技术9

1.3.3 相似学技术10

1.4 评估模型10

1.4.1 分类错误11

1.4.2 回归错误12

1.4.3 错误类型13

1.4.4 分割数据集14

1.5 练15

第2章 r和rstudio简介17

2.1 欢迎来到r17

2.2r和rstudio组件18

2.2.1r语言18

2.2.2rstudio19

2.2.3r包26

2.3 编写和运行r脚本29

2.4r中的数据类型31

2.4.1 向量32

2.4.2 测试数据类型33

2.4.3 转换数据类型36

2.4.4 缺失值36

2.5 练37

第3章 数据管理38

3.1tidyverse38

3.2 数据收集39

3.2.1 主要虑因素39

3.2.2 导入数据40

3.3 数据探索43

3.3.1 数据描述43

3.3.2 数据可视化48

3.4 数据准备52

3.4.1 数据清洗53

3.4.2 数据转换59

3.4.3 减少数据64

3.5 练69

第二部分 回归

第4章 线回归72

4.1 自行车租赁与回归72

4.2 变量之间的关系73

4.2.1 相关74

4.2.2 回归79

4.3 简单线回归80

4.3.1 普通小二乘81

4.3.2 简单线回归模型82

4.3.3 评估模型82

4.4 多元线回归85

4.4.1 多元线回归模型86

4.4.2 评估模型86

4.4.3 改进模型93

4.4.4 优缺点100

4.5 案例研究:预测血压101

4.5.1 导入数据102

4.5.2 探索数据102

4.5.3 简单线回归模型的拟合104

4.5.4 多元线回归模型的拟合105

4.6 练111

第5章 logistic回归113

5.1 寻找潜在捐赠者113

5.2 分类115

5.3logistic回归116

5.3.1 优势比117

5.3.2 二分类logistic回归模型120

5.3.3 评估模型129

5.3.4 改进模型135

5.3.5 优缺点140

5.4 案例研究:收入预测140

5.4.1 导入数据141

5.4.2 探索和准备数据141

5.4.3 训练模型144

5.4.4 评估模型146

5.5 练147

第三部分 分类

第6章 k近邻152

6.1 检测心脏病152

6.2k近邻154

6.2.1 发现近邻居155

6.2.2 标记未标记数据157

6.2.3 选择合适的k157

6.2.4k近邻模型158

6.2.5 评估模型162

6.2.6 改进模型163

6.2.7 优缺点164

6.3 案例研究:重新分析捐赠者数据集165

6.3.1 导入数据165

6.3.2 探索和准备数据165

6.3.3 建立模型169

6.3.4 评估模型170

6.4 练170

第7章 朴素贝叶斯171

7.1 垃圾邮件分类171

7.2 朴素贝叶斯172

7.2.1 概率173

7.2.2 联合概率173

7.2.3 条件概率174

7.2.4 朴素贝叶斯分类175

7.2.5 可加滑177

7.2.6 朴素贝叶斯模型178

7.2.7 评估模型182

7.2.8 朴素贝叶斯分类器的优缺点183

7.3 案例研究:重新审视心脏病检测问题183

7.3.1 导入数据183

7.3.2 探索和准备数据184

7.3.3 建立模型185

7.3.4 评估模型186

7.4 练186

第8章 决策树188

8.1 预测许可证决策188

8.2 决策树189

8.2.1 递归分区190

8.2.2 熵193

8.2.3 信息增益194

8.2.4 基尼不纯度196

8.2.5 剪枝196

8.2.6 建立分类树模型197

8.2.7 评估模型200

8.2.8 决策树的优缺点202

8.3 案例研究:重新审视收入预测问题203

8.3.1 导入数据203

8.3.2 探索和准备数据204

8.3.3 建立模型205

8.3.4 评估模型205

8.4 练206

第四部分 模型的评估和改进

第9章 评估模型208

9.1 评估未来表现208

9.1.1 交验证210

9.1.2 自助抽样215

9.2 预测准确217

9.2.1kappa218

9.2.2 查准率和查全率220

9.2.3 灵敏度和特异222

9.3 可视化模型能225

9.3.1 接收者作特曲线225

9.3.2 曲线下面积228

9.4 练230

0章 改进模型232

10.1 调整参数232

10.1.1 自动参数调整232

10.1.2 自定义参数调整236

10.2 集成方240

10.2.1 装袋241

10.2.2 提升243

10.2.3 堆叠245

10.3 练249

第五部分 无监督学

1章 用关联规则发现模式252

11.1 超市购物篮分析252

11.2 关联规则253

11.2.1 识别强规则254

11.2.2apriori算255

11.3 发现关联规则256

11.3.1 生成规则257

11.3.2 评估规则260

11.3.3 优缺点263

11.4 案例研究:识别杂货店购买模式263

11.4.1 导入数据264

11.4.2 探索和预处理数据264

11.4.3 生成规则265

11.4.4 评估规则266

11.5 练268

11.6 参文献268

2章 用聚类对数据分组269

12.1 聚类269

12.2k均值聚类271

12.3 基于k均值聚类的大学细分274

12.3.1 创建簇275

12.3.2 分析簇277

12.3.3 选择很好簇数278

12.3.4k均值聚类的优缺点282

12.4 案例研究:对购物中心客户进行细分282

12.4.1 探索和准备数据283

12.4.2 聚类数据283

12.4.3 评估簇284

12.5 练285

12.6 参文献286

点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP