消息首页搜索举报

图书条目标准图

R语言机器学习实战

全新正版未拆封

69.44 5.8折 119.8 全新

库存2件

山东济宁

认证卖家担保交易快速发货售后保障

作者[美]弗雷德·恩旺加（Fred Nwanganga）

出版社人民邮电出版社

出版时间2022-12

版次1

装帧其他

上书时间2024-10-03

天吾之青豆的书店

三年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 42小时
好评率暂无

最新上架

办公自动化高级应用案例教程：Office2010（微课版） ¥25.80

齐鲁针灸医籍集成:校注版金元.V ¥57.18

<限量特签>你当像杜甫悲悯度人间--以深情爱苍生，以悲悯度人间，三万里长安，五千年中华，仅此一杜甫。人间万事非，在谷底也要仰望星空 ¥20.88

云南省铅锌矿床遥感地质特征研究 ¥82.92

全球文化创意产业上市公司发展报告 ¥128.58

旅游规划与设计——地学旅游 ¥28.31

多彩的文明共同的命运(英俄对照)(精) ¥37.98

新编英汉互译教程 ¥31.62

阮刻毛诗注疏（典藏版） ¥348.78

商品详情

品相描述：全新

图书标准信息

作者 [美]弗雷德·恩旺加（Fred Nwanganga）
出版社人民邮电出版社
出版时间 2022-12
版次 1
ISBN 9787115583932
定价 119.80元
装帧其他
开本其他
纸张胶版纸
页数 286页
字数 427千字

【内容简介】: :
本书探讨了如何使用R语言进行机器学习，涵盖基本的原理和方法，并通过大量的示例和练习，让读者掌握R语言的数据处理技巧。本书包括入门、回归、分类、模型的评估和改进、无监督学习五大部分，涉及线性回归、logistic回归、k近邻、朴素贝叶斯、决策树、聚类和关联规则等机器学习模型。本书配套提供相关的代码和数据，方便读者学习和使用。本书适合R语言和机器学习的爱好者、从业者以及相关院校的师生选用。
【作者简介】: :
李毅，男，韩国岭南大学理学博士，中国人民大学统计学博士后，现任山西财经大学统计学院教授兼博士生导师，研究方向为大数据推断与抽样调查。主讲的“数据挖掘”课程获批山西省一流课程；主持或完成国家自然基金项目、教育部人文社会科学基金项目等国家级和省部级课题十余项，发表高质量学术论文30余篇，著作5部；获山西省社会科学研究优秀成果一等奖、山西省教学成果一等奖、山西省五一劳动奖章等10余项奖励；被遴选为山西省学术技术带头人、山西省青年拔尖人才等。
【目录】: 部分入门

章什么是机器学2

1.1 从数据中发现知识2

1.1.1 算介绍3

1.1.2 人工智能、机器学和深度学3

1.2 机器学技术4

1.2.1 监督学4

1.2.2 无监督学7

1.3 模型选择9

1.3.1 分类技术9

1.3.2 回归技术9

1.3.3 相似学技术10

1.4 评估模型10

1.4.1 分类错误11

1.4.2 回归错误12

1.4.3 错误类型13

1.4.4 分割数据集14

1.5 练15

第2章 r和rstudio简介17

2.1 欢迎来到r17

2.2r和rstudio组件18

2.2.1r语言18

2.2.2rstudio19

2.2.3r包26

2.3 编写和运行r脚本29

2.4r中的数据类型31

2.4.1 向量32

2.4.2 测试数据类型33

2.4.3 转换数据类型36

2.4.4 缺失值36

2.5 练37

第3章数据管理38

3.1tidyverse38

3.2 数据收集39

3.2.1 主要虑因素39

3.2.2 导入数据40

3.3 数据探索43

3.3.1 数据描述43

3.3.2 数据可视化48

3.4 数据准备52

3.4.1 数据清洗53

3.4.2 数据转换59

3.4.3 减少数据64

3.5 练69

第二部分回归

第4章线回归72

4.1 自行车租赁与回归72

4.2 变量之间的关系73

4.2.1 相关74

4.2.2 回归79

4.3 简单线回归80

4.3.1 普通小二乘81

4.3.2 简单线回归模型82

4.3.3 评估模型82

4.4 多元线回归85

4.4.1 多元线回归模型86

4.4.2 评估模型86

4.4.3 改进模型93

4.4.4 优缺点100

4.5 案例研究：预测血压101

4.5.1 导入数据102

4.5.2 探索数据102

4.5.3 简单线回归模型的拟合104

4.5.4 多元线回归模型的拟合105

4.6 练111

第5章 logistic回归113

5.1 寻找潜在捐赠者113

5.2 分类115

5.3logistic回归116

5.3.1 优势比117

5.3.2 二分类logistic回归模型120

5.3.3 评估模型129

5.3.4 改进模型135

5.3.5 优缺点140

5.4 案例研究：收入预测140

5.4.1 导入数据141

5.4.2 探索和准备数据141

5.4.3 训练模型144

5.4.4 评估模型146

5.5 练147

第三部分分类

第6章 k近邻152

6.1 检测心脏病152

6.2k近邻154

6.2.1 发现近邻居155

6.2.2 标记未标记数据157

6.2.3 选择合适的k157

6.2.4k近邻模型158

6.2.5 评估模型162

6.2.6 改进模型163

6.2.7 优缺点164

6.3 案例研究：重新分析捐赠者数据集165

6.3.1 导入数据165

6.3.2 探索和准备数据165

6.3.3 建立模型169

6.3.4 评估模型170

6.4 练170

第7章朴素贝叶斯171

7.1 垃圾邮件分类171

7.2 朴素贝叶斯172

7.2.1 概率173

7.2.2 联合概率173

7.2.3 条件概率174

7.2.4 朴素贝叶斯分类175

7.2.5 可加滑177

7.2.6 朴素贝叶斯模型178

7.2.7 评估模型182

7.2.8 朴素贝叶斯分类器的优缺点183

7.3 案例研究：重新审视心脏病检测问题183

7.3.1 导入数据183

7.3.2 探索和准备数据184

7.3.3 建立模型185

7.3.4 评估模型186

7.4 练186

第8章决策树188

8.1 预测许可证决策188

8.2 决策树189

8.2.1 递归分区190

8.2.2 熵193

8.2.3 信息增益194

8.2.4 基尼不纯度196

8.2.5 剪枝196

8.2.6 建立分类树模型197

8.2.7 评估模型200

8.2.8 决策树的优缺点202

8.3 案例研究：重新审视收入预测问题203

8.3.1 导入数据203

8.3.2 探索和准备数据204

8.3.3 建立模型205

8.3.4 评估模型205

8.4 练206

第四部分模型的评估和改进

第9章评估模型208

9.1 评估未来表现208

9.1.1 交验证210

9.1.2 自助抽样215

9.2 预测准确217

9.2.1kappa218

9.2.2 查准率和查全率220

9.2.3 灵敏度和特异222

9.3 可视化模型能225

9.3.1 接收者作特曲线225

9.3.2 曲线下面积228

9.4 练230

0章改进模型232

10.1 调整参数232

10.1.1 自动参数调整232

10.1.2 自定义参数调整236

10.2 集成方240

10.2.1 装袋241

10.2.2 提升243

10.2.3 堆叠245

10.3 练249

第五部分无监督学

1章用关联规则发现模式252

11.1 超市购物篮分析252

11.2 关联规则253

11.2.1 识别强规则254

11.2.2apriori算255

11.3 发现关联规则256

11.3.1 生成规则257

11.3.2 评估规则260

11.3.3 优缺点263

11.4 案例研究：识别杂货店购买模式263

11.4.1 导入数据264

11.4.2 探索和预处理数据264

11.4.3 生成规则265

11.4.4 评估规则266

11.5 练268

11.6 参文献268

2章用聚类对数据分组269

12.1 聚类269

12.2k均值聚类271

12.3 基于k均值聚类的大学细分274

12.3.1 创建簇275

12.3.2 分析簇277

12.3.3 选择很好簇数278

12.3.4k均值聚类的优缺点282

12.4 案例研究：对购物中心客户进行细分282

12.4.1 探索和准备数据283

12.4.2 聚类数据283

12.4.3 评估簇284

12.5 练285

12.6 参文献286

点击展开点击收起

— 没有更多了 —

R语言机器学习实战

天吾之青豆的书店

商品详情

图书标准信息

相关推荐