R语言
¥
24.51
4.2折
¥
59
九五品
仅1件
作者刘鹏,程显毅,孙丽丽,林道荣
出版社清华大学出版社
ISBN9787302610229
出版时间2022-07
版次1
装帧平装
开本16开
纸张胶版纸
页数223页
字数99999千字
定价59元
上书时间2024-05-06
商品详情
- 品相描述:九五品
- 商品描述
-
基本信息
书名:R语言
定价:59.00元
作者:刘鹏,程显毅,孙丽丽,林道荣
出版社:清华大学出版社
出版日期:2022-07-01
ISBN:9787302610229
字数:351000
页码:223
版次:2
装帧:平装
开本:16开
商品重量:
编辑推荐
本书深入浅出地介绍了 R 语言在大数据分析应用中的相关知识,全书分为绪论( 章)、基础篇、应用篇和进阶篇。基础篇(第2~10 章)学习如何用R 语言完成数据处理,包括数据准备、数据探索、数据变换、数据可视化和数据建模等;应用篇(1、12 章)学习如何用R 语言完成实际的数据分析报告撰写,包括背景与目标、指标设计、描述性分析、模型分析和结论与建议;进阶篇(3、14 章)学习如何使用R 语言提高大数据处理性能,包括RHadoop、SparkR。 本书特点如下。 (1)知识学习的重点是模型的运用,而不是模型的原理。 (2)注重数据变成价值。 (3)关注大数据分析。 (4)向读者提供了书中所用的配套代码、数据及PPT,读者可通过上机实验,快速掌握书中所介绍的R 语言的使用方法。 第2 版对 版的内容和结构都做了较大的调整。 (1)去掉了数据分析师素养等宏观内容,而更加注重实操和解决实际问题。 (2)全书的实验数据以Titanic 项目为切入点,贯穿数据处理的全过程。从实际项目出发讲解相关知识点,因此增强了业务场景的体验。 (3)去掉了大数据处理的章节,因为大数据处理的方法、思维和小数据没有本质区别,只是平台不同。 (4)增加了字符串处理、特征工程、数据建模、模型评估方面的内容。 (5)增加了大量的学习资料:PPT、习题、代码、数据集、扩展阅读、微课视频等。 (6)增加了近几年R 语言的成果:pacman、caret、tidyverse、mlr 等。
内容提要
本书通过Titanic 数据分析案例,深入浅出地介绍了R 语言在大数据分析应用中的相关知识,包括:数据准备、数据清洗、数据探索、数据变换、特征工程、数据建模、模型评估、模型部署等。全书共13章,~3 章介绍R 语言的开发环境和基本语法;第4~8 章按数据分析生命周期讨论R语言的实现;第9 章高级编程相对独立,主要解决复杂问题可能用到的程序结构;0、11 章与机器学习有关,内容偏难,但通过Rattle 包回避了算法底层技术的难点;2、13 章通过两个实际项目,让读者体验数据处理的全过程以及业务对分析的重要性。本书力求以简洁、精练、理论与实践相结合的方式,让读者快速掌握R 语言。 本书既可作为数据分析相关课程的教材,也可作为数据分析爱好者的参考资料。
目录
章 绪论1.1 R 语言概述 11.1.1 R 语言现状 11.1.2 R 语言主要优势 21.1.3 学R 语言的理由 31.2 新手上路 41.3 R 语言开发环境部署 51.3.1 安装R 51.3.2 安装RStudio 61.4 获取帮助 81.5 工作空间 81.6 脚本 91.7 R 包 9习题 10第2 章 基本语法2.1 变量 112.1.1 变量及其作用 112.1.2 变量命名 122.1.3 变量赋值 122.1.4 变量值输出 122.2 常量 132.2.1 逻辑常量 132.2.2 符号常量 132.2.3 标量 132.3 向量 152.3.1 向量产生 152.3.2 向量引用 162.3.3 向量化运算 16XII R 语言(第2 版)2.3.4 向量排序 172.4 运算符 182.4.1 算术运算符 182.4.2 关系运算符 182.4.3 逻辑运算符 192.4.4 其他运算符 202.5 命令 202.6 重要内置函数 21习题 23第3 章 数据类型3.1 基本数据类型 273.2 结构数据类型 283.2.1 矩阵 283.2.2 数组 303.2.3 数据框 323.2.4 因子 333.2.5 列表 343.3 字符串操作 353.3.1 分割 353.3.2 拼接 353.3.3 正则表达式 363.3.4 替换 393.3.5 提取 423.3.6 测定字符串长度 423.3.7 匹配 433.4 数据类型判断和转换 433.5 日期和时间数据操作 443.5.1 日期数据基本操作 443.5.2 时间数据基本操作 45习题 45第4 章 数据导入导出4.1 数据导入 494.1.1 键盘输入数据 49目 录 XIII4.1.2 导入文本文件 504.1.3 导入csv 文件 514.1.4 导入Excel 文件 514.1.5 导入数据库文件 514.2 数据导出 524.2.1 导出文本文件 524.2.2 保存图片 53习题 53第5 章 数据可视化5.1 一图胜千言 555.2 低水平绘图命令 565.2.1 点图 565.2.2 线图 585.2.3 面图 605.3 高水平绘图命令 635.3.1 认识ggplot2 635.3.2 几何对象 635.3.3 映射 645.3.4 统计对象 665.3.5 标度 675.3.6 分面 685.3.7 其他修饰 695.4 交互式绘图命令 725.4.1 rCharts 包 725.4.2 plotly 包 745.4.3 Shiny 765.5 数据可视化图形选择建议 83习题 84第6 章 数据清洗6.1 缺失值分析 876.1.1 缺失值检测 876.1.2 缺失数据处理 886.2 异常值分析 89XIV R 语言(第2 版)6.2.1 箱线图检测离群点 896.2.2 点图检测离群点 906.3 数据去重 916.4 规范化 926.4.1 数据的中心化 926.4.2 数据标准化 926.5 格式转换 93习题 95第7 章 数据探索7.1 单一变量分析 977.1.1 定量变量 977.1.2 定性变量 997.2 双变量分析 1007.2.1 一个定性变量和一个定量变量 1007.2.2 两个定性变量 1007.2.3 两个定量变量 1017.3 多变量分析 1027.3.1 集中趋势度量 1027.3.2 离中趋势度量 1037.4 相关分析 1047.4 1 相关系数 1047.4.2 直接绘制点图 1057.4.3 绘制点图矩阵 106习题 106第8 章 数据变换8.1 数据集划分与选择 1098.1.1 数据集划分 1098.1.2 数据集选择 1108.2 特征工程 1108.2.1 特征工程概述 1108.2.2 特征构建 1118.2.3 特征选择 1128.2.4 特征抽取 1158.2.5 自动化特征工程 1178.3 数据整合 1188.3.1 通过向量化重构数据 1198.3.2 为数据添加新变量 1198.3.3 变形与融合 1208.3.4 列联表 1238.3.5 分组汇总 1238.3.6 连接表 125习题 127第9 章 高级编程9.1 条件表达式 1319.2 选择结构 1329.3 循环结构 1359.4 用户自定义函数 138习题 1390 章 数据建模10.1 Rattle 包 14110.2 变量的类别 14310.3 聚类分析 14510.3.1 背景 14510.3.2 K-means 聚类 14610.3.3 层次聚类 14810.4 关联规则挖掘 15010.4.1 背景 15010.4.2 基本术语 15110.4.3 关联规则的分类 15210.4.4 Apriori 算法 15310.4.5 实验指导 15410.5 传统决策树模型 15610.5.1 背景 15610.5.2 ID3 算法 15710.5.3 C4.5 算法 15810.5.4 实验指导 159XVI R 语言(第2 版)10.6 随机森林决策树模型 16110.6.1 背景 16110.6.2 随机森林算法 16110.6.3 实验指导 16310.7 自适应选择决策树模型 16610.7.1 背景 16610.7.2 Boosting 算法 16610.7.3 adaboost 算法 16710.7.4 实验指导 16710.8 SVM 17110.8.1 背景 17110.8.2 SVM 算法 17110.8.3 实验指导 17310.9 线性回归模型 17410.9.1 背景 17410.9.2 一元线性回归方法 17410.9.3 实验指导 17610.10 神经网络模型 17710.10.1 背景 17710.10.2 人工神经网络模型 17810.10.3 实验指导 179习题 1811 章 模型评估11.1 Rattle 模型评估选项卡 18511.2 混淆矩阵 18611.2.1 二分类混淆矩阵 18611.2.2 模型评价指标 18711.2.3 多分类混淆矩阵 18811.3 风险图 18811.3.1 风险图的作用 18811.3.2 实验指导 18811.4 ROC 曲线 19011.4.1 ROC 曲线概述 19011.4.2 ROC 曲线的作用 19011.4.3 实验指导 19011.5 交叉验证 192习题 1932 章 影响大学平均录取分数线因素分析12.1 背景与目标 19512.2 数据说明 19512.3 描述性分析 19612.4 数据建模 19912.5 总结 2013 章 收视率分析13.1 背景介绍 20213.2 数据说明 20213.3 描述性分析 20313.4 数据建模 20913.5 总结 212参考文献附录A附录B
作者介绍
序言
— 没有更多了 —
以下为对购买帮助不大的评价