R语言实战(第3版)
全新正版 极速发货
¥
45.89
3.8折
¥
119.8
全新
库存104件
作者(美)罗伯特·I.卡巴科弗
出版社人民邮电出版社
ISBN9787115615039
出版时间2023-05
装帧平装
开本16开
定价119.8元
货号1202895496
上书时间2024-09-05
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
[美]Robert I. Kabacoff
数据科学家、统计编程专家、R语言社区专家及Quick-R网站运营者。拥有30多
年的教学、科研和实践经验,曾在全球多家公司和科研机构任数据科学家。目前任教于美国文理学院维思大学(Wesleyan University)。
目录
第一部分入门
第1章R介绍3
1.1为何要使用R4
1.2R的获取和安装6
1.3R的使用6
1.3.1新手上路7
1.3.2使用RStudio9
1.3.3获取帮助11
1.3.4工作区12
1.3.5项目13
1.4包14
1.4.1什么是包14
1.4.2安装包14
1.4.3包的载入15
1.4.4包的使用方法15
1.5将输出用作输入:结果的复用16
1.6处理大型数据集16
1.7示例实践17
1.8小结18
第2章创建数据集19
2.1理解数据集19
2.2数据结构20
2.2.1向量21
2.2.2矩阵22
2.2.3数组23
2.2.4数据框24
2.2.5因子26
2.2.6列表28
2.2.7tibble数据框30
2.3数据的输入31
2.3.1使用键盘输入数据32
2.3.2从带分隔符的文本文件导入数据33
2.3.3导入Excel数据37
2.3.4导入JSON数据37
2.3.5从网页抓取数据37
2.3.6导入SPSS数据38
2.3.7导入SAS数据38
2.3.8导入Stata数据39
2.3.9访问数据库管理系统39
2.3.10通过StatTransfer导入数据40
2.4数据集的标注41
2.4.1变量标签41
2.4.2值标签41
2.5处理数据对象的实用函数41
2.6小结42
第3章基本数据管理43
3.1一个示例43
3.2创建新变量45
3.3变量的重编码46
3.4变量的重命名47
3.5缺失值48
3.5.1重编码某些值为缺失值49
3.5.2在分析中排除缺失值49
3.6日期值50
3.6.1将日期变量转换为字符型变量52
3.6.2更进一步52
3.7类型转换52
3.8数据排序53
3.9数据集的合并54
3.9.1在数据框中添加列54
3.9.2在数据框中添加行54
3.10切分数据集54
3.10.1选取变量55
3.10.2剔除变量55
3.10.3选入观测值56
3.10.4subset()函数57
3.10.5随机抽样57
3.11使用dplyr包操作数据框58
3.11.1基本的dplyr函数58
3.11.2使用管道操作符对语句进行串接61
3.12使用SOL语句操作数据框61
3.13小结62
第4章图形初阶63
4.1使用gplot2包创建图形64
4.1.1函数ggplot()64
4.1.2geom_函数65
4.1.3分组68
4.1.4标尺69
4.1.5刻面72
4.1.6标签73
4.1.7主题74
4.2ggplot2包的详细信息75
4.2.1放置数据和映射选项76
4.2.2将图形作为对象使用77
4.2.3保存图形78
4.2.4常见错误79
4.3小结80
第5章高级数据管理81
5.1一个数据处理难题81
5.2数值处理函数和字符处理函数82
5.2.1数学函数82
5.2.2统计函数83
5.2.3概率函数86
5.2.4字符处理函数89
5.2.5其他实用函数90
5.2.6将函数应用于矩阵和数据框91
5.2.7数据处理难题的一套解决方案92
5.3控制流96
5.3.1重复和循环97
5.3.2条件执行98
5.4用户自定义函数99
5.5数据重塑101
5.5.1转置101
5.5.2将宽表数据集格式转换为长表数据集格式101
5.6数据汇总103
5.7小结105
第二部分基本方法
第6章基本图形108
6.1条形图108
6.1.1简单的条形图109
6.1.2堆积、分组和填充条形图110
6.1.3均值条形图111
6.1.4条形图的微调114
6.1.1简单的条形图109
6.1.2堆积、分组和填充条形图110
6.1.3均值条形图111
6.1.4条形图的微调114
6.2饼图119
6.3树形图121
6.4直方图124
6.5核密度图126
6.6箱线图129
6.6.1使用并列箱线图进行跨组比较130
6.6.2小提琴图133
6.7点图134
6.8小结136
第7章基本统计分析137
7.1描述性统计分析138
7.1.1方法云集138
7.1.2更多方法139
7.1.3分组计算描述性统计量141
7.1.4使用dplyr进行交互式汇总数据143
7.1.5结果的可视化145
7.2频数表和列联表145
7.2.1生成频数表145
7.2.2独立性检验151
7.2.3相关性度量153
7.2.4结果的可视化153
7.3相关分析153
7.3.1相关的类型154
7.3.2相关性的显著性检验156
7.3.3相关关系的可视化158
7.4t检验158
7.4.1独立样本的t检验158
7.4.2非独立样本的t检验159
7.4.3多于两组的情况160
7.5组间差异的非参数检验160
7.5.1两组的比较160
7.5.2多于两组的比较161
7.6组间差异的可视化163
7.7小结163
第三部分中级方法
第8章回归166
8.1回归的多面性167
8.1.1OLS回归的适用场景167
8.1.2基础回顾168
8.2OLS回归168
8.2.1用函数lm()拟合回归模型169
8.2.2简单线性回归170
8.2.3多项式回归172
8.2.4多元线性回归175
8.2.5带交互项的多元线性回归177
8.3回归模型的诊断179
8.3.1标准方法179
8.3.2改进的方法181
8.3.3多重共线性185
8.3.1标准方法179
8.3.2改进的方法181
8.3.3多重共线性185
8.4异常观测值186
8.4.1离群点186
8.4.2高杠杆值点187
8.4.3强影响点188
8.5改进措施190
8.5.1删除观测点191
8.5.2变量变换191
8.5.3增删变量193
8.5.4尝试其他方法193
8.6选择“很好”的回归模型193
8.6.1模型比较193
8.6.2变量选择194
8.7深层次分析197
8.7.1交叉验证197
8.7.2相对重要性199
8.8小结201
第9章方差分析202
9.1术语速成202
9.2ANOVA模型拟合204
9.2.1aov()函数205
9.2.2表达式中各项的顺序205
9.3单因素方差分析206
9.3.1多重比较208
9.3.2评估检验的假设条件212
9.4单因素协方差分析213
9.4.1评估检验的假设条件215
9.4.2结果的可视化215
9.5双因素方差分析216
9.6重复测量方差分析219
9.7多元方差分析222
9.7.1评估检验的假设条件223
9.7.2稳健多元方差分析224
9.8用回归来做方差分析225
9.9小结227
第10章功效分析228
10.1假设检验速览228
10.2用pwr包做功效分析230
10.2.1t检验231
10.2.2方差分析233
10.2.3相关性233
10.2.4线性模型234
10.2.5比例检验235
10.2.6卡方检验235
10.2.7在新情况中选择合适的效应值237
10.3绘制功效分析图239
10.4其他功效分析包240
10.5小结241
第11章中级绘图242
11.1散点图243
11.1.1散点图矩阵245
11.1.2高密度散点图248
11.1.3三维散点图251
11.1.4旋转三维散点图254
11.1.5气泡图255
11.2折线图257
11.3相关图260
11.4马赛克图264
11.5小结267
第12章重抽样与自助法268
12.1置换检验268
12.2用coin包做置换检验270
12.2.1独立双样本和K样本检验271
12.2.2列联表中的独立性272
12.2.3数值变量间的独立性273
12.2.4双样本和K样本检验273
12.2.5深入探究274
12.3用lmPerm包做置换检验274
12.3.1简单回归和多项式回归274
12.3.2多元回归276
12.3.3单因素方差分析和协方差分析276
12.3.4双因素方差分析277
12.4置换检验点评278
12.5自助法278
12.6boot包中的自助法279
12.6.1对单个统计量使用自助法.280
12.6.2多个统计量的自助法282
12.7小结284
第四部分高级方法
第13章广义线性模型287
13.1广义线性模型和glm()函数288
13.1.1glm()函数288
13.1.2连用的函数289
13.1.3模型拟合和回归诊断290
13.2Logistic回归291
13.2.1解释模型参数293
13.2.2评价自变量对结果概率的影响294
13.2.3过度离势295
13.2.4扩展296
13.3泊松回归296
13.3.1解释模型参数298
13.3.2过度离势299
13.3.3扩展300
13.4小结302
第14章主成分分析和因子分析303
14.1R中的主成分分析和因子分析304
14.2主成分分析305
14.2.1判断需提取的主成分数306
14.2.2提取主成分307
14.2.3主成分旋转310
14.2.4获取主成分得分311
14.3探索性因子分析313
14.3.1判断需提取的公共因子数314
14.3.2提取公共因子315
14.3.3因子旋转315
14.3.4因子得分319
14.3.5其他与探索性因子分析
相关的包319
14.4其他潜变量模型319
14.5小结320
第15章时间序列322
15.1在R中生成时序对象324
15.2时序的平滑化和季节项分解326
15.2.1通过简单移动平均进行平滑处理327
15.2.2季节项分解328
15.3指数预测模型334
15.3.1单指数平滑334
15.3.2Holt指数平滑和HoltWinters指数平滑337
15.3.3ets()函数和自动预测339
15.4ARIMA预测模型341
15.4.1概念介绍341
15.4.2ARMA和ARIMA模型342
15.4.3ARIMA模型的自动预测347
15.5小结348
第16章聚类分析349
16.1聚类分析的一般步骤350
16.2计算距离351
16.3层次聚类分析353
16.4划分聚类分析357
16.4.1K均值聚类357
16.4.2围绕中心点的划分364
16.5避免不存在的聚类簇365
16.6小结369
第17章分类370
17.1数据准备371
17.2Logistic回归372
17.3决策树374
17.3.1经典决策树374
17.3.2条件推断树377
17.4随机森林378
17.5支持向量机381
17.6选择预测效果优选的模型384
17.7理解黑箱预测387
17.7.1绘制细分图388
17.7.2绘制Shapley值图390
17.8深入探究391
17.9小结391
第18章处理缺失数据的高级方法393
18.1处理缺失值的步骤394
18.2识别缺失值395
18.3探索缺失值模式396
18.3.1缺失值的可视化396
18.3.2用相关性探索缺失值400
18.4理解缺失数据的来由和影响401
18.5合理推断不完整数据.402
18.6删除缺失数据403
18.6.1完整观测值分析(行删除)403
18.6.2可获取的观测值分析(成对删除)404
18.7单一插补405
18.7.1简单插补405
18.7.2k近邻插补405
18.7.3missForest插补407
18.8多重插补408
18.9处理缺失数据的其他方法410
18.10小结411
第五部分技能扩展
第19章高级绘图414
19.1修改标尺415
19.1.1自定义坐标轴415
19.1.2自定义颜色420
19.2修改主题424
19.2.1预置主题424
19.2.2自定义字体426
19.2.3自定义图例428
19.2.4自定义绘图区430
19.3添加标注432
19.3.1给数据点添加标签432
19.3.2给条形添加标签434
19.4图形的组合437
19.5绘制交互式图形439
19.6小结442
第20章高级编程443
20.1R语言回顾443
20.1.1数据类型444
20.1.2控制结构450
20.1.3创建函数452
20.2使用环境454
20.3非标准计算456
20.4面向对象编程458
20.4.1泛型函数458
20.4.2S3模型的局限性460
20.5编写高效的代码460
20.5.1高效的数据输入460
20.5.2向量化461
20.5.3准确调整对象的大小462
20.5.4并行化462
20.6调试464
20.6.1常见的错误来源464
20.6.2调试工具465
20.6.3支持调试的会话选项468
20.6.4使用RStudio的可视化调试器471
20.7小结473
第21章创建动态报告474
21.1用模板生成报告476
21.2用R和RMarkdown创建报告478
21.3用R和LaTeX创建报告483
21.4避免常见的RMarkdown错误488
21.5深入探讨489
21.6小结489
第22章创建包490
22.1edatools包491
22.2创建包492
22.2.1安装开发工具493
22.2.2创建包项目493
22.2.3添加函数494
22.2.4添加函数文档499
22.2.5添加一般帮助文件(可选)501
22.2.6添加样本数据到包(可选)502
22.2.7添加简介文档(可选)503
22.2.8编辑DESCRIPTION文件503
22.2.9生成并安装包505
22.3分发包508
22.3.1分发包的源文件508
22.3.2提交到CRAN509
22.3.3托管到GitHub509
22.3.4创建包网站511
22.4深入探讨512
22.5小结513
附录A图形用户界面514
附录B自定义启动环境516
附录C从R中导出数据519
附录DR中的矩阵运算521
附录E本书中用到的包523
附录F处理大型数据集527
附录G更新R531
后记:探索R的世界533
内容摘要
本书是一本全面翔实的R指南,介绍了R的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。新版做了大量更新和修正,包括tidyverse系列包在数据管理和数据分析方面的各种功能、tibble数据结构、使用RStudio进行编程等内容。本书适合数据分析人员及R用户学习参考。
主编推荐
1.深入讲解全球数据科学家、量化分析师以及数据从业者的"标配"——R语言,让你在面对工作与研究时如虎添翼、游刃有余。
2.30 万中文版读者的认可与好评,数据分析教程重磅升级,全面扩充 ggplot2、tidyverse、 RStudio、R Markdown 用法。
3.内容循序渐进,讲解深入浅出,丰富生动的真实案例,让你有效掌握 R 数据挖掘与数据可视化。
4.提供完整实用的学习资源,易学易用,致力于帮助读者轻松上手R语言,学会统计分析及数据可视化的方法与技巧。
媒体评论
第3版更新了R语言的新数据分析包,是提升数据分析能力的实战用书,可助力大家在编写R代码的过程中熟练掌握数据分析方法。
——王小宁 中国传媒大学数据科学与智能媒体学院副教授,统计之都秘书长
— 没有更多了 —
以下为对购买帮助不大的评价