数据分析与挖掘――R语言
①全新正版,现货速发,7天无理由退换货②天津、成都、无锡、广东等多仓就近发货,订单最迟48小时内发出③无法指定快递④可开电子发票,不清楚的请咨询客服。
¥
33.47
6.4折
¥
52
全新
仅1件
作者蔡银英
出版社电子工业
ISBN9787121415388
出版时间2021-07
装帧平装
开本16开
定价52元
货号31226691
上书时间2024-10-13
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
蔡银英,女,副教授,就职于重庆第二师范学院,主持市级重点项目一项,主研市级项目四项,主要负责数据分析,模型构建相关的工作。
目录
第1章 R语言简介1
1.1 获取R1
1.2 R使用入门4
1.2.1 R操作界面4
1.2.2 RStudio窗口介绍5
1.2.3 R的常用操作6
1.3 R的简单操作8
1.3.1 基本数学运算8
1.3.2 变量8
1.3.3 数据结构9
1.4 R数据分析包12
1.5 小结12
参考文献13
第2章 数据挖掘基础14
2.1 数据挖掘的定义14
2.2 数据探索及预处理15
2.2.1 脏数据分析15
2.2.2 数据特征分析19
2.2.3 数据预处理23
2.3 模型简介27
2.3.1 聚类模型27
2.3.2 回归模型31
2.3.3 决策树34
2.3.4 人工神经网络35
2.3.5 关联规则分析模型38
2.4 小结42
参考文献42
第3章 数据挖掘网站用户行为分析及网页智能推荐44
3.1 背景与挖掘目标44
3.2 用户分群47
3.2.1 用户分群的分析方法47
3.2.2 数据的抽取48
3.2.3 数据的预处理与探索分析49
3.2.4 用户分群结果57
3.2.5 用户分群的应用66
3.3 网页智能推荐66
3.3.1 网页智能推荐的分析方法66
3.3.2 数据的预处理67
3.3.3 组合推荐模型68
3.3.4 组合推荐结果78
3.4 总结78
3.4.1 相关结论及应用78
3.4.2 相关的问题思考78
参考文献79
第4章 生活服务点评网站客户分群80
4.1 背景与挖掘目标80
4.2 分析方法与过程81
4.2.1 数据抽取82
4.2.2 数据探索82
4.2.3 数据预处理94
4.2.4 模型构建102
4.3 小结113
第5章 水冷中央空调系统的优化控制策略114
5.1 背景及挖掘目标114
5.2 分析的方法及流程115
5.3 数据预处理118
5.3.1 变量选取118
5.3.2 数据探索120
5.3.3 数据变换130
5.4 优化控制模型131
5.4.1 总耗电量与可控变量132
5.4.2 冷却负载与可控变量140
5.5 模型求解144
5.5.1 工作日模型求解144
5.5.2 确定状态值148
5.6 总结155
参考文献156
第6章 电商评价文本的主题特征词分析157
6.1 背景与挖掘目标157
6.2 分析的方法及过程158
6.2.1 评论数据采集159
6.2.2 文本数据预处理161
6.2.3 基于LDA主题模型的特征词分析167
6.3 小结169
参考文献169
第7章 均线投资策略171
7.1 背景及投资策略介绍171
7.1.1 移动平均线相关理论介绍172
7.1.2 名词及概念介绍175
7.2 基于移动平均线的投资策略176
7.2.1 单均线投资策略177
7.2.2 双均线投资策略177
7.3 双均线投资策略实际应用178
7.3.1 双均线投资策略总体流程178
7.3.2 数据获取178
7.3.3 简单的K线图实现179
7.3.4 均线模型180
7.3.5 其他双均线策略的收益188
7.4 主要结论及展望189
7.4.1 结论189
7.4.2 后续策略的展望190
参考文献191
致谢192
内容摘要
本书以R语言简介、数据挖掘基础为开篇,旨在让读者对所用工具及数据挖掘方法有所了解。随后的章节借助实际案例(数据挖掘网站用户行为分析及网页智能推荐、生活服务点评网站客户分群、水冷中央空调系统的优化控制策略、电商评价文本的主题特征词分析、均线投资策略等),从数据预处理、模型选择、算法介绍、R语言实现、结论分析及评价等方面进行详尽的论述,希望读者既可以了解数据分析与挖掘的一般流程及方法,又能对常用的算法及模型有所了解。每个案例分析都是一篇完整的论文,初学者通过它们可以了解数据分析与挖掘的一般流程及方法,有一定基础的读者可以思考算法的优劣与选择。不管是对数据分析与挖掘感兴趣的入门者,还是希望获得实践经验的初学者,都可以从本书中获得支持。
主编推荐
数据分析与挖掘以统计学为基础,实现描述性、预测性、指导性三个层次的分析目标与应用。常用的实现方法及模型有聚类分析、回归分析、决策树(分类算法)、关联规则分析、人工神经网络、遗传算法、可视化等。本书在第2章中简单介绍了分类与预测的部分模型,力图采用简明扼要的语言使读者能够对模型有所了解。
— 没有更多了 —
以下为对购买帮助不大的评价