• R语言实战(第3版) 9787115615039
  • R语言实战(第3版) 9787115615039
  • R语言实战(第3版) 9787115615039
  • R语言实战(第3版) 9787115615039
  • R语言实战(第3版) 9787115615039
21年品牌 40万+商家 超1.5亿件商品

R语言实战(第3版) 9787115615039

可开发票,支持7天无理由

57.8 4.8折 119.8 全新

库存216件

天津西青
认证卖家担保交易快速发货售后保障

作者(美)罗伯特·I.卡巴科弗

出版社人民邮电出版社

ISBN9787115615039

出版时间2023-05

装帧平装

开本16开

定价119.8元

货号1202895496

上书时间2024-04-12

果然是好书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
[美]Robert I. Kabacoff
数据科学家、统计编程专家、R语言社区专家及Quick-R网站运营者。拥有30多
年的教学、科研和实践经验,曾在全球多家公司和科研机构任数据科学家。目前任教于美国文理学院维思大学(Wesleyan University)。

目录
第一部分入门

第1章R介绍3

1.1为何要使用R4

1.2R的获取和安装6

1.3R的使用6

1.3.1新手上路7

1.3.2使用RStudio9

1.3.3获取帮助11

1.3.4工作区12

1.3.5项目13

1.4包14

1.4.1什么是包14

1.4.2安装包14

1.4.3包的载入15

1.4.4包的使用方法15

1.5将输出用作输入:结果的复用16

1.6处理大型数据集16

1.7示例实践17

1.8小结18

第2章创建数据集19

2.1理解数据集19

2.2数据结构20

2.2.1向量21

2.2.2矩阵22

2.2.3数组23

2.2.4数据框24

2.2.5因子26

2.2.6列表28

2.2.7tibble数据框30

2.3数据的输入31

2.3.1使用键盘输入数据32

2.3.2从带分隔符的文本文件导入数据33

2.3.3导入Excel数据37

2.3.4导入JSON数据37

2.3.5从网页抓取数据37

2.3.6导入SPSS数据38

2.3.7导入SAS数据38

2.3.8导入Stata数据39

2.3.9访问数据库管理系统39

2.3.10通过StatTransfer导入数据40

2.4数据集的标注41

2.4.1变量标签41

2.4.2值标签41

2.5处理数据对象的实用函数41

2.6小结42

第3章基本数据管理43

3.1一个示例43

3.2创建新变量45

3.3变量的重编码46

3.4变量的重命名47

3.5缺失值48

3.5.1重编码某些值为缺失值49

3.5.2在分析中排除缺失值49

3.6日期值50

3.6.1将日期变量转换为字符型变量52

3.6.2更进一步52

3.7类型转换52

3.8数据排序53

3.9数据集的合并54

3.9.1在数据框中添加列54

3.9.2在数据框中添加行54

3.10切分数据集54

3.10.1选取变量55

3.10.2剔除变量55

3.10.3选入观测值56

3.10.4subset()函数57

3.10.5随机抽样57

3.11使用dplyr包操作数据框58

3.11.1基本的dplyr函数58

3.11.2使用管道操作符对语句进行串接61

3.12使用SOL语句操作数据框61

3.13小结62

第4章图形初阶63

4.1使用gplot2包创建图形64

4.1.1函数ggplot()64

4.1.2geom_函数65

4.1.3分组68

4.1.4标尺69

4.1.5刻面72

4.1.6标签73

4.1.7主题74

4.2ggplot2包的详细信息75

4.2.1放置数据和映射选项76

4.2.2将图形作为对象使用77

4.2.3保存图形78

4.2.4常见错误79

4.3小结80

第5章高级数据管理81

5.1一个数据处理难题81

5.2数值处理函数和字符处理函数82

5.2.1数学函数82

5.2.2统计函数83

5.2.3概率函数86

5.2.4字符处理函数89

5.2.5其他实用函数90

5.2.6将函数应用于矩阵和数据框91

5.2.7数据处理难题的一套解决方案92

5.3控制流96

5.3.1重复和循环97

5.3.2条件执行98

5.4用户自定义函数99

5.5数据重塑101

5.5.1转置101

5.5.2将宽表数据集格式转换为长表数据集格式101

5.6数据汇总103

5.7小结105

第二部分基本方法

第6章基本图形108

6.1条形图108

6.1.1简单的条形图109

6.1.2堆积、分组和填充条形图110

6.1.3均值条形图111

6.1.4条形图的微调114

6.1.1简单的条形图109

6.1.2堆积、分组和填充条形图110

6.1.3均值条形图111

6.1.4条形图的微调114

6.2饼图119

6.3树形图121

6.4直方图124

6.5核密度图126

6.6箱线图129

6.6.1使用并列箱线图进行跨组比较130

6.6.2小提琴图133

6.7点图134

6.8小结136

第7章基本统计分析137

7.1描述性统计分析138

7.1.1方法云集138

7.1.2更多方法139

7.1.3分组计算描述性统计量141

7.1.4使用dplyr进行交互式汇总数据143

7.1.5结果的可视化145

7.2频数表和列联表145

7.2.1生成频数表145

7.2.2独立性检验151

7.2.3相关性度量153

7.2.4结果的可视化153

7.3相关分析153

7.3.1相关的类型154

7.3.2相关性的显著性检验156

7.3.3相关关系的可视化158

7.4t检验158

7.4.1独立样本的t检验158

7.4.2非独立样本的t检验159

7.4.3多于两组的情况160

7.5组间差异的非参数检验160

7.5.1两组的比较160

7.5.2多于两组的比较161

7.6组间差异的可视化163

7.7小结163

第三部分中级方法

第8章回归166

8.1回归的多面性167

8.1.1OLS回归的适用场景167

8.1.2基础回顾168

8.2OLS回归168

8.2.1用函数lm()拟合回归模型169

8.2.2简单线性回归170

8.2.3多项式回归172

8.2.4多元线性回归175

8.2.5带交互项的多元线性回归177

8.3回归模型的诊断179

8.3.1标准方法179

8.3.2改进的方法181

8.3.3多重共线性185

8.3.1标准方法179

8.3.2改进的方法181

8.3.3多重共线性185

8.4异常观测值186

8.4.1离群点186

8.4.2高杠杆值点187

8.4.3强影响点188

8.5改进措施190

8.5.1删除观测点191

8.5.2变量变换191

8.5.3增删变量193

8.5.4尝试其他方法193

8.6选择“很好”的回归模型193

8.6.1模型比较193

8.6.2变量选择194

8.7深层次分析197

8.7.1交叉验证197

8.7.2相对重要性199

8.8小结201

第9章方差分析202

9.1术语速成202

9.2ANOVA模型拟合204

9.2.1aov()函数205

9.2.2表达式中各项的顺序205

9.3单因素方差分析206

9.3.1多重比较208

9.3.2评估检验的假设条件212

9.4单因素协方差分析213

9.4.1评估检验的假设条件215

9.4.2结果的可视化215

9.5双因素方差分析216

9.6重复测量方差分析219

9.7多元方差分析222

9.7.1评估检验的假设条件223

9.7.2稳健多元方差分析224

9.8用回归来做方差分析225

9.9小结227

第10章功效分析228

10.1假设检验速览228

10.2用pwr包做功效分析230

10.2.1t检验231

10.2.2方差分析233

10.2.3相关性233

10.2.4线性模型234

10.2.5比例检验235

10.2.6卡方检验235

10.2.7在新情况中选择合适的效应值237

10.3绘制功效分析图239

10.4其他功效分析包240

10.5小结241

第11章中级绘图242

11.1散点图243

11.1.1散点图矩阵245

11.1.2高密度散点图248

11.1.3三维散点图251

11.1.4旋转三维散点图254

11.1.5气泡图255

11.2折线图257

11.3相关图260

11.4马赛克图264

11.5小结267

第12章重抽样与自助法268

12.1置换检验268

12.2用coin包做置换检验270

12.2.1独立双样本和K样本检验271

12.2.2列联表中的独立性272

12.2.3数值变量间的独立性273

12.2.4双样本和K样本检验273

12.2.5深入探究274

12.3用lmPerm包做置换检验274

12.3.1简单回归和多项式回归274

12.3.2多元回归276

12.3.3单因素方差分析和协方差分析276

12.3.4双因素方差分析277

12.4置换检验点评278

12.5自助法278

12.6boot包中的自助法279

12.6.1对单个统计量使用自助法.280

12.6.2多个统计量的自助法282

12.7小结284

第四部分高级方法

第13章广义线性模型287

13.1广义线性模型和glm()函数288

13.1.1glm()函数288

13.1.2连用的函数289

13.1.3模型拟合和回归诊断290

13.2Logistic回归291

13.2.1解释模型参数293

13.2.2评价自变量对结果概率的影响294

13.2.3过度离势295

13.2.4扩展296

13.3泊松回归296

13.3.1解释模型参数298

13.3.2过度离势299

13.3.3扩展300

13.4小结302

第14章主成分分析和因子分析303

14.1R中的主成分分析和因子分析304

14.2主成分分析305

14.2.1判断需提取的主成分数306

14.2.2提取主成分307

14.2.3主成分旋转310

14.2.4获取主成分得分311

14.3探索性因子分析313

14.3.1判断需提取的公共因子数314

14.3.2提取公共因子315

14.3.3因子旋转315

14.3.4因子得分319

14.3.5其他与探索性因子分析

相关的包319

14.4其他潜变量模型319

14.5小结320

第15章时间序列322

15.1在R中生成时序对象324

15.2时序的平滑化和季节项分解326

15.2.1通过简单移动平均进行平滑处理327

15.2.2季节项分解328

15.3指数预测模型334

15.3.1单指数平滑334

15.3.2Holt指数平滑和HoltWinters指数平滑337

15.3.3ets()函数和自动预测339

15.4ARIMA预测模型341

15.4.1概念介绍341

15.4.2ARMA和ARIMA模型342

15.4.3ARIMA模型的自动预测347

15.5小结348

第16章聚类分析349

16.1聚类分析的一般步骤350

16.2计算距离351

16.3层次聚类分析353

16.4划分聚类分析357

16.4.1K均值聚类357

16.4.2围绕中心点的划分364

16.5避免不存在的聚类簇365

16.6小结369

第17章分类370

17.1数据准备371

17.2Logistic回归372

17.3决策树374

17.3.1经典决策树374

17.3.2条件推断树377

17.4随机森林378

17.5支持向量机381

17.6选择预测效果优选的模型384

17.7理解黑箱预测387

17.7.1绘制细分图388

17.7.2绘制Shapley值图390

17.8深入探究391

17.9小结391

第18章处理缺失数据的高级方法393

18.1处理缺失值的步骤394

18.2识别缺失值395

18.3探索缺失值模式396

18.3.1缺失值的可视化396

18.3.2用相关性探索缺失值400

18.4理解缺失数据的来由和影响401

18.5合理推断不完整数据.402

18.6删除缺失数据403

18.6.1完整观测值分析(行删除)403

18.6.2可获取的观测值分析(成对删除)404

18.7单一插补405

18.7.1简单插补405

18.7.2k近邻插补405

18.7.3missForest插补407

18.8多重插补408

18.9处理缺失数据的其他方法410

18.10小结411

第五部分技能扩展

第19章高级绘图414

19.1修改标尺415

19.1.1自定义坐标轴415

19.1.2自定义颜色420

19.2修改主题424

19.2.1预置主题424

19.2.2自定义字体426

19.2.3自定义图例428

19.2.4自定义绘图区430

19.3添加标注432

19.3.1给数据点添加标签432

19.3.2给条形添加标签434

19.4图形的组合437

19.5绘制交互式图形439

19.6小结442

第20章高级编程443

20.1R语言回顾443

20.1.1数据类型444

20.1.2控制结构450

20.1.3创建函数452

20.2使用环境454

20.3非标准计算456

20.4面向对象编程458

20.4.1泛型函数458

20.4.2S3模型的局限性460

20.5编写高效的代码460

20.5.1高效的数据输入460

20.5.2向量化461

20.5.3准确调整对象的大小462

20.5.4并行化462

20.6调试464

20.6.1常见的错误来源464

20.6.2调试工具465

20.6.3支持调试的会话选项468

20.6.4使用RStudio的可视化调试器471

20.7小结473

第21章创建动态报告474

21.1用模板生成报告476

21.2用R和RMarkdown创建报告478

21.3用R和LaTeX创建报告483

21.4避免常见的RMarkdown错误488

21.5深入探讨489

21.6小结489

第22章创建包490

22.1edatools包491

22.2创建包492

22.2.1安装开发工具493

22.2.2创建包项目493

22.2.3添加函数494

22.2.4添加函数文档499

22.2.5添加一般帮助文件(可选)501

22.2.6添加样本数据到包(可选)502

22.2.7添加简介文档(可选)503

22.2.8编辑DESCRIPTION文件503

22.2.9生成并安装包505

22.3分发包508

22.3.1分发包的源文件508

22.3.2提交到CRAN509

22.3.3托管到GitHub509

22.3.4创建包网站511

22.4深入探讨512

22.5小结513

附录A图形用户界面514

附录B自定义启动环境516

附录C从R中导出数据519

附录DR中的矩阵运算521

附录E本书中用到的包523

附录F处理大型数据集527

附录G更新R531

后记:探索R的世界533

内容摘要
本书是一本全面翔实的R指南,介绍了R的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。新版做了大量更新和修正,包括tidyverse系列包在数据管理和数据分析方面的各种功能、tibble数据结构、使用RStudio进行编程等内容。本书适合数据分析人员及R用户学习参考。

主编推荐
1.深入讲解全球数据科学家、量化分析师以及数据从业者的"标配"——R语言,让你在面对工作与研究时如虎添翼、游刃有余。
2.30 万中文版读者的认可与好评,数据分析教程重磅升级,全面扩充 ggplot2、tidyverse、 RStudio、R Markdown 用法。
3.内容循序渐进,讲解深入浅出,丰富生动的真实案例,让你有效掌握 R 数据挖掘与数据可视化。
4.提供完整实用的学习资源,易学易用,致力于帮助读者轻松上手R语言,学会统计分析及数据可视化的方法与技巧。

媒体评论
第3版更新了R语言的新数据分析包,是提升数据分析能力的实战用书,可助力大家在编写R代码的过程中熟练掌握数据分析方法。
——王小宁 中国传媒大学数据科学与智能媒体学院副教授,统计之都秘书长

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP