• R语言与数据挖掘最佳实践和经典案例
21年品牌 40万+商家 超1.5亿件商品

R语言与数据挖掘最佳实践和经典案例

6 1.2折 49 九品

仅1件

河北廊坊
认证卖家担保交易快速发货售后保障

作者[澳]Yanchang Zhao 著;陈建、黄琰 译

出版社机械工业出版社

出版时间2014-09

版次1

装帧平装

货号130--4--A--240418

上书时间2024-04-18

京华书店

十五年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
图书标准信息
  • 作者 [澳]Yanchang Zhao 著;陈建、黄琰 译
  • 出版社 机械工业出版社
  • 出版时间 2014-09
  • 版次 1
  • ISBN 9787111475415
  • 定价 49.00元
  • 装帧 平装
  • 开本 16开
  • 纸张 胶版纸
  • 页数 234页
  • 原版书名 R and Data Mining: Examples and Case Studies
  • 丛书 计算机科学丛书
【内容简介】
  《R语言与数据挖掘实践和经典案例》为研究人员、高校学生、数据分析人员介绍了使用R语言进行数据挖掘应用的实用方法和技术。读者会从《R语言与数据挖掘实践和经典案例》中发现使用R语言完成数据挖掘任务(如分类和预测、聚类、孤立点检测、关联规则、序列分析、文本挖掘、社会网络分析、情感分析等)的非常有价值的指导。数据挖掘技术在广泛领域都发展迅速。《R语言与数据挖掘实践和经典案例》重点关注数据挖掘过程的建模阶段,以及数据探查和模型评估问题。《R语言与数据挖掘实践和经典案例》讲述简洁实用,配有现实应用案例和代码示例以及数据,在线资源及时丰富,是一本数据分析的实战技术图书。
【作者简介】
  YanchangZhao,从2009年起担任澳大利亚政府部门的高级数据挖掘分析师。在加入澳大利亚政府部门之前,他是悉尼科技大学工程和信息技术学院博士后研究员。他的研究兴趣包括聚类分析、关联规则、时间序列、孤立点检测、数据挖掘应用等,当前关注在数据挖掘应用中使用R语言。他是IEEE高级会员和澳大利亚分析专业人员协会成员。他发表了50多篇数据挖掘研究和应用方面的论文,并独立或与他人合作编写了3本著作。
【目录】
出版者的话
译者序
缩写词表

第1章简介
1.1数据挖掘
1.2R
1.3数据集
1.3.1iris数据集
1.3.2bodyfat数据集

第2章数据的导入与导出
2.1R数据的保存与加载
2.2.CSV文件的导入与导出
2.3从SAS中导人数据
2.4通过ODBC导人与导出数据
2.4.1从数据库中读取数据
2.4.2从Excel文件中导入与导出数据

第3章数据探索
3.1查看数据
3.2探索单个变量
3.3探索多个变量
3.4更多探索
3.5将图表保存到文件中

第4章决策树与随机森林
4.1使用party包构建决策树
4.2使用rpart包构建决策树
4.3随机森林

第5章回归分析
5.1线性回归
5.2逻辑回归
5.3广义线性回归
5.4非线性回归

第6章聚类
6.1k?means聚类
6.2k?medoids聚类
6.3层次聚类
6.4基于密度的聚类

第7章离群点检测
7.1单变量的离群点检测
7.2局部离群点因子检测
7.3用聚类方法进行离群点检测
7.4时间序列数据的离群点检测
7.5讨论

第8章时间序列分析与挖掘
8.1R中的时间序列数据
8.2时间序列分解
8.3时间序列预测
8.4时间序列聚类
8.4.1动态时间规整
8.4.2控制图的时间序列数据
8.4.3基于欧氏距离的层次聚类
8.4.4基于DTW距离的层次聚类
8.5时间序列分类
8.5.1基于原始数据的分类
8.5.2基于特征提取的分类
8.5.3k——NN分类
8.6讨论
8.7延伸阅读

第9章关联规则
9.1关联规则的基本概念
9.2Titanic数据集
9.3关联规则挖掘
9.4消除冗余
9.5解释规则
9.6关联规则的可视化
9.7讨论与延伸阅读

第10章文本挖掘
10.1Twitter的文本检索
10.2转换文本
10.3提取词干
10.4建立词项椢牡稻卣
10.5频繁词项与关联
10.6词云
10.7词项聚类
10.8推文聚类
10.8.1基于k——means算法的推文聚类
10.8.2基于k——medoids算法的推文聚类
10.9程序包、延伸阅读与讨论

第11章社交网络分析
11.1词项网络
11.2推文网络
11.3双模式网络
11.4讨论与延伸阅读

第12章案例Ⅰ:房价指数的分析与预测
12.1HPI数据导入
12.2HPI数据探索
12.3HPI趋势与季节性成分
12.4HPI预测
12.5房地产估价
12.6讨论

第13章案例Ⅱ:客户回复预测与效益最大化
13.1简介
13.2KDDCup1998的数据
13.3数据探索
13.4训练决策树
13.5模型评估
13.6选择最优决策树
13.7评分
13.8讨论与总结

第14章案例Ⅲ:内存受限的大数据预测模型
14.1简介
14.2研究方法
14.3数据与变量
14.4随机森林
14.5内存问题
14.6样本数据的训练模型
14.7使用已选变量建立模型
14.8评分
14.9输出规则
14.9.1以文本格式输出规则
14.9.2输出SAS规则的得分
14.10总结与讨论

第15章在线资源
15.1R参考文档
15.2R
15.3数据挖掘
15.4R的数据挖掘
15.5R的分类与预测
15.6R的时间序列分析
15.7R的关联规则挖掘
15.8R的空间数据分析
15.9R的文本挖掘
15.10R的社交网络分析
15.11R的数据清洗与转换
15.12R的大数据与并行计算
R语言数据挖掘参考文档
参考资料
通用索引
包索引
函数索引
点击展开 点击收起

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP