【正版二手】数据科学:R语言实现9787111568315
正版旧书 85成新左右 里面部分划线标记 内容完好 可正常使用 旧书不附带光盘
¥
18.73
2.4折
¥
79
八五品
仅1件
作者丘祐玮
出版社机械工业出版社
ISBN9787111568315
出版时间2017-06
装帧其他
开本16开
定价79元
货号9787111568315
上书时间2024-12-20
商品详情
- 品相描述:八五品
- 商品描述
-
作者简介
丘祐玮(David Chiu),Largit Data公司创始人,资历数据科学家,之前曾就职于趋势科技公司,主要负责为商务智能及客户关系管理系统构建大型数据处理平台。他专注于在数据分析中使用Spark和Hadoop技术来实现海量数据挖掘。同时,他还是一位资历讲师,在各类Python、R、Hadoop及相关会议上多次发表演讲。此外,David还撰写了《机器学习与R语言实战》(机械工业出版社,2016)。
魏博,欧普拉软件科技(北京)有限公司新闻推荐不错算法工程师。本科毕业于武汉大学数学系,博士毕业于中国科学院数学与系统科学研究院计算机软件与理论专业。曾任中航工业软件工程师、阿里巴巴优酷事业部视频搜索算法专家。长期关注于用户需求建模、用户行为建模和自动推理,是数据挖掘、机器学习和数据可视化爱好者,尤其热衷于海量数据中用户视角和用户行为模式的刻画和推断。
目录
推荐序
译者序
前言
第1章 R中的函数
1.1 引言
1.2 创建R函数
1.3 匹配参数
1.4 理解环境
1.5 使用词法域
1.6 理解闭包
1.7 执行延迟计算
1.8 创建中缀操作符
1.9 使用替代函数
1.10 处理函数中的错误
1.11 调试函数
第2章 数据抽取、转换和加载
2.1 引言
2.2 下载公开数据
2.3 读取和写入CSV文件
2.4 扫描文本文件
2.5 使用Excel文件
2.6 从数据库中读取数据
2.7 爬取网络数据
2.8 获取Facebook数据
2.9 使用twitteR
第3章 数据预处理和准备
3.1 引言
3.2 重命名数据变量
3.3 转换数据类型
3.4 使用日期格式
3.5 添加新的记录
3.6 过滤数据
3.7 舍弃数据
3.8 合并数据
3.9 排列数据
3.10 重塑数据
3.11 检测缺失数据
3.12 估计缺失数据
第4章 数据操作
4.1 引言
4.2 使用data.table加强data.frame
4.3 使用data.table管理数据
4.4 使用data.table执行快速聚合
4.5 使用data.table合并大型数据集
4.6 使用dplyr进行数据抽取和切片
4.7 使用dplyr进行数据抽样
4.8 使用dplyr选取列
4.9 使用dplyr进行链式操作
4.10 使用dplyr整理行
4.11 使用dplyr消除重复行
4.12 使用dplyr添加新列
4.13 使用dplyr汇总数据
4.14 使用dplyr合并数据
第5章 使用ggplot2可视化数据
5.1 引言
5.2 使用ggplot2创建基础图形
5.3 改变美学映射
5.4 引入几何对象
5.5 执行变换
5.6 调整图形尺度
5.7 分面
5.8 调整主题
5.9 组合图形
5.10 创建地图
第6章 制作交互式报告
6.1 引言
6.2 创建R Markdown报告
6.3 学习markdown语法
6.4 嵌入R代码块
6.5 使用ggvis创建交互式图形
6.6 理解基础语法
6.7 控制坐标轴和图例
6.8 使用尺度
6.9 给ggvis图形添加交互
6.10 创建R Shiny文档
6.11 发布R Shiny报告
第7章 概率分布模拟
7.1 引言
7.2 生成随机样本
7.3 理解均匀分布
7.4 生成二项随机变量
7.5 生成泊松随机变量
7.6 从正态分布中抽样
7.7 从卡方分布中抽样
7.8 理解学生t-分布
7.9 从数据集中抽样
7.10 模拟随机过程
第8章 R中的统计推断
8.1 引言
8.2 获取置信区间
8.3 执行Z-检验
8.4 执行学生T-检验
8.5 执行精确二项检验
8.6 执行Kolmogorov-Smirnov检验
8.7 使用Pearson卡方检验
8.8 理解Wilcoxon秩和检验
8.9 执行单因素方差分析
8.10 执行双因素方差分析
第9章 R语言规则和模式挖掘
9.1 引言
9.2 把数据转换为事务
9.3 展示事务和关联
9.4 使用Apriori规则挖掘关联关系
9.5 对冗余规则剪枝
9.6 可视化关联规则
9.7 使用Eclat挖掘频繁项集
9.8 使用时序信息创建事务
9.9 使用cSPADE挖掘频繁序列模式
第10章 R语言时间序列挖掘
10.1 引言
10.2 创建时间序列数据
10.3 绘制时间序列对象
10.4 分解时间序列
10.5 平滑时间序列
10.6 预测时间序列
10.7 选取ARIMA模型
10.8 创建ARIMA模型
10.9 使用ARIMA模型预测
10.10 使用ARIMA模型预测股票价格
第11章 监督式机器学习
11.1 引言
11.2 使用lm拟合线性回归模型
11.3 汇总线性模型拟合
11.4 使用线性回归来预测未知值
11.5 度量回归模型的性能
11.6 执行多元回归分析
11.7 使用逐步回归选取最优拟合回归模型
11.8 应用高斯模型泛化线性回归
11.9 执行逻辑斯谛回归分析
11.10 使用递归分割树构建分类模型
11.11 可视化递归分割树
11.12 使用混淆矩阵度量模型性能
11.13 使用ROCR度量预测性能
第12章 非监督式机器学习
12.1 引言
12.2 使用层次聚类法对数据聚类
12.3 切割树成聚类
12.4 使用k-means方法对数据聚类
12.5 使用基于密度的方法对数据聚类
12.6 从聚类中抽取轮廓信息
12.7 比较多种聚类方法
12.8 使用基于密度的聚类识别数字
12.9 使用k-means聚类方法分组相似文本文档
12.10 使用主成分分析法进行数据降维
12.11 使用陡坡图确定主成分数量
12.12 使用Kaiser方法确定主成分数量
12.13 使用双标图可视化多变元数据
内容摘要
丘祐玮著,魏博译的《数据科学(R语言实现)/数据科学与工程技术丛书》介绍了R语言在数据科学领域应用的方方面面,包括数据处理、数据操作、数据可视化、概率模拟、序列预测、频繁项集挖掘、监督式算法和非监督式算法等。本书注重对R语言程序包的介绍和使用,可操作性强。并且提供了关于高级技
术的扩展阅读资料,供学有余力的读者钻研探讨。本书适合数据科学相关专业的本科生和研究生使用,也
可作为数据领域从业人员的参考书。
精彩内容
。。。
— 没有更多了 —
以下为对购买帮助不大的评价