r语言大数据分析 大中专文科文教综合 董东,高峰 新华正版
¥
60.3
7.6折
¥
79
全新
库存16件
作者董东,高峰
出版社清华大学出版社
ISBN9787302677017
出版时间2024-12
版次1
装帧平装
开本16
页数404页
字数0.61千字
定价79元
货号xhwx_1203487324
上书时间2024-12-29
商品详情
- 品相描述:全新
-
正版特价新书
- 商品描述
-
目录:
篇 r语言
章 r语言概览
1.1 下载和安装r
1.2 安装和加载r程序包
1.3 r的基本使用
1.4 工作文件夹与工作空间
1.5 数据集
第2章 表达式
2.1 字面量
2.2 运算符和表达式
2.3 期时间
第3章 字符串与正规表达式
3.1 字符串处理
3.1.1 字符个数
3.1.2 子串
3.1.3 拆分
3.1.4 连接
3.1.5 查找
3.1.6 替换
3.1.7 大小写转换
3.1.8 格式化
3.2 正规表达式
第4章 函数
4.1 函数声明和调用
4.2 环境
4.2.1 环境的嵌套
4.2.2 访问环境
4.2.3 与函数相关的环境
4.3 控制结构
第5章 向量
5.1 创建向量
5.1.1 枚举法
5.1.2 描述法
5.1.3 数列法
5.1.4 向量元素的命名
5.1.5 类型判断与类型转换
5.2 访问向量
5.3 算术运算
5.4 逻辑运算和关系运算
5.5 查询
5.5.1 条件查询
5.5.2 聚合查询
5.6 面向集合的查询
5.7 面向向量的程序设计
5.8 因子
第6章 矩阵
6.1 创建矩阵
6.2 访问矩阵
6.3 矩阵运算
第7章 数据框
7.1 创建数据框
7.2 访问数据框
7.3 tibble对象
第8章 列表
8.1 创建列表
8.2 访问列表
8.3 泛函数
第9章 面向对象程序设计
9.1 类的定义
9.2 静态属
9.3 面向对象的r脚本设计
0章 数据存储
10.1 导入导出
10.1.1 函数read.table和write.table
10.1.2 函数read.csv和write.csv
10.1.3 函数readlines和writelines
10.1.4 读取excel工作表
10.1.5 odbc数据源
10.2 持久化r数据对象
10.3 格式化输出
10.4 虚拟内存
10.5 作文件和文件夹
第2篇 可视化
1章 统计绘图
11.1 绘图设备
11.2 布局
11.3 绘图函数
11.4 常用绘图参数
11.5 散点图
11.6 核密度图
11.7 箱线图
11.8 柱形图
11.9 饼图
11.10 直方图
11.11 折线图
2章 图形文法ggplot
12.1 ggplot2简介
12.2 散点图
12.3 直方图
12.4 箱线图
12.5 柱形图
12.6 折线图
12.7 标注
12.8 统计变换
12.9 位置调整
12.10 尺度变换
12.11 切面
12.12 主题
12.13 彩与构成
12.13.1 与的属
12.13.2 彩搭配
12.14 调板
12.15 案例研究
第3篇 数据分析
3章 数据分析基础
13.1 数据质量的度量
13.2 数据清洗变换
13.2.1 缺失值
13.2.2 重复
13.2.3 有效
13.2.4 统计量
13.3 可视化
13.4 查询型大数据分析
13.5 探索大数据分析
13.6 挖掘型大数据分析
4章 查询型分析与数据表
14.1 数据表
14.2 创建和引用数据表
14.2.1 创建数据表
14.2.2 引用数据表
14.3 查询数据表
14.3.1 按行号查询
14.3.2 条件查询
14.3.3 查询结果的类型
14.3.4 分组汇
14.3.5 键和索引
14.3.6 应用只读变量查询
14.3.7 其他
14.4 去重
14.5 上卷
14.6 连接
14.7 集合运算
14.8 更新
14.9 行列变换
5章 描述统计与探索分析
15.1 体与样本
15.2 概率分布
15.3 联合分布
15.4 可视化分布
15.5 样本均数的分布
15.6 描述统计
15.6.1 集中趋势
15.6.2 变异
15.7 探索数据分析
15.7.1 皮尔逊相关
15.7.2 斯皮尔曼等级相关
15.7.3 肯德尔相关
15.8 z分数
15.9 设检验
15.10 卡方检验
15.11 抽样
6章 挖掘型分析
16.1 数据挖掘任务
16.2 决策树分类
16.3 朴素贝叶斯分类
16.4 k近邻分类
16.5 一元线回归
16.6 logistic回归
16.7 分类算法的能评估
16.7.1 查准率和查全率
16.7.2 roc曲线
16.8 k均值聚类
16.9 em聚类
16.10 apriori关联规则
16.11 序列模式挖掘
7章 离群点检测
17.1 基于统计的检测
17.2 基于近邻的方法
17.3 基于划分的算法
17.3.1 隔离森林算法
17.3.2 扩展的隔离森林算法
17.4 基于聚类的方法
17.5 多变量离群点检测
17.6 单变量离群点检测
17.7 贡献分析
8章 文本挖掘
18.1 文本挖掘简介
18.2 语
内容简介:
大数据分析包括查询型
分析、描述分析、探索
分析、挖掘型分析等。本书
介绍基于r语言的大数据分
析解决方案。全书分3篇共
18章。篇r语言,包括
~10章,分别为r语言
概览、表达式、字符串与正
规表达式、函数、向量、矩
阵、数据框、列表、面向对
象程序设计、数据存储;第
2篇可视化,包括1、12
章,分别为统计绘图、图形
文法ggplot2;第3篇数据分
析,包括3~18章,分
别为数据分析基础、查询型
分析与数据表、描述统计
与探索分析、挖掘型分析
、离群点检测、文本挖掘。
本书力求通俗易懂、简
单实用,示例丰富,可供大
数据领域工程技术人员、计
算机类专业高年级本科
和硕士使用。
— 没有更多了 —
以下为对购买帮助不大的评价