R语言实战
全新正版 极速发货
¥
44.04
5.6折
¥
79
全新
仅1件
作者左飞 著
出版社电子工业出版社
ISBN9787121286698
出版时间2016-05
装帧平装
开本16开
定价79元
货号1201304066
上书时间2024-12-02
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
左飞,技术作家、译者。他的著作涉及图像处理、程序开发和数据挖掘等多个领域,并译有《编码》、《提高C++性能的编程技术》等经典名著。曾荣获“很受读者喜爱的IT图书作译者”奖,并被授予“电子工业出版社创立30周年很好作译者”荣称。
目录
第1章初识R语言1
1.1R语言简介1
1.2安装与运行3
1.3开始使用R5
1.4包的使用7
1.5使用帮助8
第2章探索R数据10
2.1向量的创建10
2.2向量的运算13
2.3向量的筛选15
2.4矩阵的创建17
2.5矩阵的使用20
2.5.1矩阵的代数运算20
2.5.2修改矩阵的行列22
2.5.3对行列调用函数23
2.6矩阵的筛选25
第3章编写R程序28
3.1流程的控制28
3.1.1条件选择结构的概念28
3.1.2条件选择结构的语法29
3.1.3循环结构的基本概念30
3.1.4循环结构的基本语法31
3.2算术与逻辑33
3.3使用函数34
3.3.1函数式语言34
3.3.2默认参数值35
3.3.3自定义函数36
3.3.4递归的实现38
3.4编写代码40
第4章概率统计基础42
4.1概率论的基本概念42
4.2随机变量数字特征45
4.2.1期望45
4.2.2方差46
4.3基本概率分布模型48
4.3.1离散概率分布48
4.3.2连续概率分布52
4.3.3使用内嵌分布55
4.4大数定理及其意义59
4.5中央极限定理62
4.6随机采样分布65
第5章实用统计图形71
5.1饼状图71
5.2直方图74
5.3核密图78
5.4箱线图81
5.4.1箱线图与分位数81
5.4.2使用并列箱线图84
5.5条形图87
5.5.1基本条形图及调整87
5.5.2堆砌与分组条形图88
5.6分位数与QQ图91
第6章数据输入/输出99
6.1数据的载入99
6.1.1基本的数据导入方法99
6.1.2处理其他软件的格式103
6.1.3读取来自网页的数据104
6.1.4从数据库中读取数据106
6.2数据的保存108
6.3数据预处理109
6.3.1常用数学函数110
6.3.2修改数据标签113
6.3.3缺失值的处理114
第7章高级数据结构118
7.1列表118
7.1.1列表的创建118
7.1.2列表元素的访问120
7.1.3增删列表元素121
7.1.4拼接列表123
7.1.5列表转化为向量123
7.1.6列表上的运算124
7.1.7列表的递归125
7.2数据框126
7.2.1数据框的创建126
7.2.2数据框元素的访问128
7.2.3提取子数据框129
7.2.4数据框行列的添加130
7.2.5数据框的合并132
7.2.6数据框的其他操作134
7.3因子135
7.3.1因子的创建136
7.3.2因子中插入水平137
7.3.3因子和常用函数138
7.4表140
7.4.1表的创建141
7.4.2表中元素的访问143
7.4.3表中变量的边际值143
第8章统计推断146
8.1参数估计146
8.1.1参数估计的基本原理146
8.1.2单总体参数区间估计149
8.1.3双总体均值差的估计155
8.1.4双总体比例差的估计161
8.2假设检验162
8.2.1基本概念162
8.2.2两类错误166
8.2.3均值检验167
8.3极大似然估计172
8.3.1极大似然法的基本原理172
8.3.2求极大似然估计的方法174
8.3.3极大似然估计应用举例176
第9章非参数检验方法181
9.1列联分析181
9.1.1类别数据与列联表181
9.1.2皮尔逊(Pearson)的卡方检验182
9.1.3列联分析应用条件186
9.1.4费希尔(Fisher)的确切检验188
9.2符号检验190
9.3威尔科克森(Wilcoxon)符号秩检验195
9.4威尔科克森(Wilcoxon)的秩和检验199
9.5克鲁斯卡尔-沃利斯(Kruskal-Wallis)检验204
第10章一元线性回归208
10.1回归分析的性质208
10.2回归的基本概念210
10.2.1总体的回归函数210
10.2.2随机干扰的意义211
10.2.3样本的回归函数213
10.3回归模型的估计214
10.3.1普通最小二乘法原理214
10.3.2一元线性回归的应用216
10.3.3经典模型的基本假定218
10.3.4总体方差的无偏估计222
10.3.5估计参数的概率分布225
10.4正态条件下的模型检验227
10.4.1拟合优度的检验227
10.4.2整体性假定检验231
10.4.3单个参数的检验233
10.5一元线性回归模型预测234
10.5.1点预测234
10.5.2区间预测235
第11章线性回归进阶239
11.1多元线性回归模型239
11.2多元回归模型估计241
11.2.1最小二乘估计量241
11.2.2多元回归的实例242
11.2.3总体参数估计量245
11.3多元回归模型检验247
11.3.1线性回归的显著性247
11.3.2回归系数的显著性249
11.4多元线性回归模型预测250
11.5其他回归模型函数形式253
11.5.1双对数模型以及生产函数253
11.5.2倒数模型与斯曲线255
11.5.3多项式回归模型及其分析258
11.6回归模型的评估与选择260
11.6.1嵌套模型选择261
11.6.2赤池信息准则262
11.6.3逐步回归方法265
11.7现代回归方法的新进展269
11.7.1多重共线性269
11.7.2岭回归270
11.7.3从岭回归到Lasso271
第12章方差分析方法275
12.1方差分析的基本概念275
12.2单因素方差分析方法278
12.2.1基本原理278
12.2.2分析步骤279
12.2.3强度测量280
12.3双因素方差分析方法281
12.3.1无交互作用的分析281
12.3.2有交互作用的分析286
12.4多重比较289
12.4.1多重t检验290
12.4.2"Dunnett"检验291
12.4.3"Tukey"的"HSD"检验294
12.4.4"Newman"-"Keuls"检验298
12.5方差齐性的检验方法301
12.5.1"Bartlett"检验法301
12.5.2"Levene"检验法303
第13章聚类分析307
13.1聚类的概念307
13.2K均值算法308
13.2.1距离度量309
13.2.2算法描述310
13.2.3应用实例312
13.3最大期望算法314
13.3.1算法原理314
13.3.2收敛探讨319
13.4高斯混合模型320
13.4.1模型推导320
13.4.2应用实例323
第14章支持向量机326
14.1从逻辑回归到线性分类326
14.2线性可分的支持向量机330
14.2.1函数距离与几何距离330
14.2.2最大间隔分类器332
14.2.3拉格朗日乘数法334
14.2.4对偶问题的求解339
14.3松弛因子与软间隔模型343
14.4非线性支持向量机方法345
14.4.1从更高维度上分类345
14.4.2非线性核函数方法347
14.4.3默瑟定理与核函数350
14.5对数据进行分类的实践350
14.5.1基本建模函数351
14.5.2分析建模结果355
第15章人工神经网络358
15.1从感知机开始358
15.1.1感知机模型358
15.1.2感知机学习360
15.1.3多层感知机362
15.2基本神经网络365
15.2.1神经网络结构365
15.2.2符号标记说明366
15.2.3后向传播算法368
15.3神经网络实践370
15.3.1核心函数介绍370
15.3.2应用分析实践372
参考文献375
内容摘要
经典统计理论和机器学习方法为数据挖掘提供了必要的分析技术。本书系统地介绍统计分析和机器学习领域中很为重要和流行的多种技术及其基本原理,在详解有关算法的基础上,结合大量R语言实例演示了这些理论在实践中的使用方法。具体内容被分成三个部分,即R语言编程基础、基于统计的数据分析方法以及机器学习理论。统计分析与机器学习部分又具体介绍了参数估计、假设检验、极大似然估计、非参数检验方法(包括列联分析、符号检验、符号秩检验等)、方差分析、线性回归(包括岭回归和Lasso方法)、逻辑回归、支持向量机、聚类分析(包括K均值算法和EM算法)和人工神经网络等内容。同时,统计理论的介绍也为深化读者对于后续机器学习部分的理解提供了很大助益。知识结构和阅读进度的安排上既兼顾了循序渐进的学习规律,亦统筹考虑了夯实基础的必要性。本书内容与实际应用结合紧密,又力求突出深入浅出、系统翔实之特色,对算法原理的解释更是细致入微。
— 没有更多了 —
以下为对购买帮助不大的评价