统计分析软件
全新正版 极速发货
¥
55.7
8.1折
¥
69
全新
库存2件
作者编者:王洪|
出版社机械工业
ISBN9787111757061
出版时间2024-08
装帧平装
开本其他
定价69元
货号32173176
上书时间2024-11-04
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
作者简介王洪,男,统计学博士,副教授,博士生导师。美国加利福尼亚大学洛杉矶分校(UCLA)生物统计专业博士后,国家认证系统分析师,主要从事机器学习和生物统计等方面的研究工作。以第一作者或通讯作者的身份发表SCI论文30余篇,获软件著作权1项。主持和参加多项国家社科基金、国家自科基金项目,主持多项全国统计科研项目重点项目、教育部人文社科基金等省部级项目,主持多项企业合作横向课题。
目录
目 录
前言
第 1 章 引言 1
1.1 统计分析的未来 1
1.2 常见统计分析软件比较 2
1.3 R 语言软件的下载、安装及基本操作3
1.3.1 下载和安装 R 语言软件 3
1.3.2 R 语言软件基本操作与控制 4
1.3.3 常用的 R 程序包7
1.3.4 RStudio 10
1.3.5 Markdown12
1.4 Python 语言软件的下载、安装及运行 14
1.4.1 下载与安装 Python 语言软件14
1.4.2 Anaconda15
1.4.3 运行 Python 15
1.5 本章小结 16
1.6 练习题17
1.7 实验题17
第 2 章 R 语言编程基础 18
2.1 R 语言版的 “Hello World!” 18
2.2 R 语言脚本运行 18
2.3 R 语言常量和变量19
2.4 R 语言对象基本操作 20
2.4.1 R 语言对象属性20
2.4.2 列出对象与删除对象 22
2.5 R 语言数据类型 23
2.5.1 向量23
2.5.2 数组32
2.5.3 矩阵33
2.5.4 数据框 35
2.5.5 列表36
2.6 R 语言流程控制 38
VI
2.6.1 分支条件语句 39
2.6.2 循环语句 41
2.7 R 语言自定义函数45
2.8 本章小结 48
2.9 练习题49
2.10 实验题 50
第 3 章 R 语言数据处理 51
3.1 数据的输入与输出51
3.1.1 终端输出 51
3.1.2 读取数据 53
3.1.3 保存数据 57
3.2 数据选择 59
3.2.1 常见数据操作函数59
3.2.2 取子集 63
3.2.3 常见数据选择函数68
3.3 数据整理 71
3.3.1 修改变量名称 71
3.3.2 增加新变量72
3.3.3 彻底删除新变量72
3.3.4 类型转换函数 73
3.3.5 排序74
3.3.6 数据合并 76
3.3.7 缺失数据处理 80
3.4 本章小结 81
3.5 练习题82
3.6 实验题82
第 4 章 R 语言可视化 84
4.1 R 语言基础绘图 84
4.1.1 高级绘图函数 84
4.1.2 低级绘图函数 96
4.1.3 交互式绘图函数98
4.1.4 使用图形参数 99
4.1.5 图形保存101
4.2 ggplot2 绘图包 102
4.2.1 ggplot 语法 103
4.2.2 ggplot 绘图函数103
4.3 增强型绘图 plotly 包 112
VII
4.3.1 将 ggplot2 对象转换为 plotly 对象112
4.3.2 直接创建 plotly 对象112
4.4 交互式动态网页 Shiny 包 115
4.4.1 Shiny 简介115
4.4.2 Shiny 应用程序的结构115
4.4.3 编写简单的 Shiny 应用117
4.4.4 运行 Shiny 应用程序121
4.5 本章小结 122
4.6 练习题 123
4.7 实验题 123
第 5 章 R 语言随机抽样和随机数 124
5.1 随机变量分布 124
5.2 随机抽样 125
5.3 生成已知分布的随机数129
5.3.1 R 语言函数生成随机数129
5.3.2 逆变换法生成随机数 131
5.3.3 舍选法 133
5.4 随机数的应用 134
5.4.1 估计参数134
5.4.2 验证大数定律 135
5.4.3 验证中心极限定理 136
5.5 本章小结 138
5.6 练习题 138
5.7 实验题 138
第 6 章 R 语言基本统计推断 140
6.1 R 语言汇总统计量函数140
6.2 R 语言参数估计方法 144
6.2.1 点估计 144
6.2.2 区间估计146
6.3 假设检验 148
6.3.1 t 检验 149
6.3.2 二项分布的总体检验 156
6.3.3 泊松分布的总体检验 157
6.3.4 样本比例的总体检验 158
6.3.5 方差分析160
6.4 非参数统计推断162
6.4.1 K-S 检验162
VIII
6.4.2 Wilcoxon 符号秩检验163
6.4.3 Wilcoxon 秩和检验 165
6.4.4 Pearson 卡方检验 166
6.4.5 Fisher 精确检验170
6.5 本章小结 171
6.6 练习题 171
6.7 实验题 172
第 7 章 R 语言回归分析173
7.1 一元回归模型 173
7.1.1 R 语言回归函数173
7.1.2 一元回归分析示例 175
7.2 多元回归模型 178
7.2.1 多元回归分析示例 178
7.2.2 处理类别变量 180
7.2.3 回归系数的置信区间 182
7.2.4 标准化的回归系数 182
7.3 回归模型的拟合优度 183
7.3.1 R2183
7.3.2 调整后的 R2 184
7.4 回归模型诊断 184
7.4.1 残差的分类184
7.4.2 线性假设诊断 186
7.4.3 残差分析和异常点检测186
7.4.4 多重共线性检测189
7.5 模型选择 196
7.5.1 最佳子集回归 196
7.5.2 逐步回归197
7.6 模型的预测203
7.6.1 回归模型的预测203
7.6.2 标准化数据的预测 204
7.7 本章小结 205
7.8 练习题 206
7.9 实验题 206
第 8 章 R 语言大数据分析 207
8.1 R 语言效率编程207
8.1.1 检查代码运行时间 207
8.1.2 优化 R 循环 208
IX
8.1.3 向量化运算209
8.1.4 优先使用 base 包命令210
8.1.5 使用 C++ 编程211
8.1.6 使用 apply 族函数 211
8.2 内存管理 214
8.2.1 内存使用214
8.2.2 内存清理215
8.3 R 并行处理包 216
8.3.1 parallel 软件包216
8.3.2 foreach 软件包218
8.4 R 高效读取大数据219
8.4.1 提升读取效率的函数 219
8.4.2 在内存外存储数据 221
8.5 本章小结 222
8.6 练习题 222
8.7 实验题 223
第 9 章 Python 语言基础 224
9.1 在 R 中调用 Python 224
9.2 Python 入门 225
9.2.1 Python 版 “Hello World!”225
9.2.2 关键字和标识符226
9.2.3 变量和常量226
9.2.4 Python 语句、缩进和注释 228
9.2.5 Python 数据类型229
9.2.6 数据类型转换 232
9.2.7 运算符和操作对象 233
9.3 Python 数据结构236
9.3.1 序列236
9.3.2 列表241
9.3.3 元组246
9.3.4 字符串 247
9.3.5 字典252
9.4 Python 流程控制256
9.4.1 条件语句256
9.4.2 循环语句258
9.5 函数262
9.5.1 调用函数262
X
9.5.2 定义函数262
9.5.3 函数参数263
9.5.4 匿名函数265
9.5.5 pass 语句266
9.5.6 Python 模块 267
9.6 本章小结 269
9.7 练习题 269
9.8 实验题 270
第 10 章 Python 数据处理 271
10.1 数据文件的读写操作 271
10.1.1 数据的读取 271
10.1.2 数据的写入 272
10.1.3 文本文件的操作272
10.1.4 CSV 文件的操作 273
10.2 NumPy 科学计算库 275
10.2.1 NumPy 的安装275
10.2.2 NumPy 中的数组创建275
10.2.3 数组操作278
10.2.4 数组索引284
10.2.5 多维数组285
10.2.6 ufunc 函数 286
10.2.7 NumPy 随机数287
10.3 Pandas 数据处理库288
10.3.1 Pandas 数据结构 289
10.3.2 Pandas 数据索引 292
10.3.3 利用 Pandas 查询数据 292
10.4 Matplotlib 绘图库 295
10.4.1 安装和导入 Matplotlib 295
10.4.2 plot 绘图 296
10.4.3 常见统计图形300
10.5 本章小结302
10.6 练习题 303
10.7 实验题 303
参考文献305
内容摘要
本书选用统计学和数据科学中常见的R语言和Python语言“双语”编写,主要内容包括:引言、R语言编程基础、R语言数据处理、R语言可视化、R语言随机抽样和随机数、R语言基本统计推断、R语言回归分析、 R语言大数据分析、Python语言基础、Python数据处理等内容。此外,本书在每章正文后设置主要函数列表、练习题和实验题,以帮助学生复习巩固和自主练习。同时,还为教师配备了课程教学大纲(含课程思政内容)、 课件、习题解答、模拟试题及配套答案等丰富的教学资源。 本书结构严谨,逻辑清晰,叙述清楚,说明到位,行文流畅,习题配备合理,可读性强,可作为高等学校统计学、大数据科学与技术等专业的教材或相关专业的教学参考书,也可供统计分析软件初学者或从业者参考。
主编推荐
本书遵循教育部教指委相关指导文件和高等院校学生学习规律编写而成。践行四新理念,融入思政元素,注重理论与实践相结合。
— 没有更多了 —
以下为对购买帮助不大的评价