【现货】基于R语言的数据清洗技术 白世贞,魏胜,薛宁 著 经济管
二手会有少量涂画,整体不影响再次阅读使用!套装不一定齐全,请下单前咨询在线客服!
¥
32.64
5.5折
¥
59
八五品
库存2件
作者白世贞,魏胜,薛宁 著
出版社经济管理出版社
ISBN9787509683149
出版时间2022-03
版次1
装帧平装
开本16开
纸张胶版纸
页数117页
字数85000千字
定价59元
货号9787509683149
上书时间2024-07-08
商品详情
- 品相描述:八五品
- 商品描述
-
基本信息
书名:基于R语言的数据清洗技术
定价:59.00元
作者:白世贞,魏胜,薛宁 著
出版社:经济管理出版社
出版日期:2022-03-01
ISBN:9787509683149
字数:85000
页码:117
版次:
装帧:平装
开本:32开
商品重量:
编辑推荐
内容提要
数据分析指的是将数据转化为价值的一个完整过程,而分析数据只是其中的一个环节而已,步工作应该是梳理业务目标。人们在进行数据分析的时候,业务目标与分析数据之间还有一个环节的工作——数据清洗。当你辛辛苦苦梳理完业务目标,结果还没有对数据进行必要的清洗工作就去分析,那么分析的结果很有可能是完全错误的。而《基于R语言的数据清洗技术》的目标就是带领读者去识别数据中可能存在的问题,并借助R语言这个工具将问题数据清洗干净,这样才会使得后续的分析结果更加真实可信。
目录
1 认识本书的数据集1.1 引言1.2 涉及数据清洗的基本函数1.2.1 进行缺失值判断-is.na函数1.2.2 进行频次统计-table函数1.2.3 进行数据定位-which函数1.2.4 进行数据概览-summar函数1.2.5 输出选定部分-head函数1.3 读入数据1.4 数据的结构与基本信息1.4.1 该数据集的结构1.4.2 该数据集的基本信息1.5 业务目标与数据清洗工作2 识别与清洗数值型数据中的异常值2.1 引言2.2 梳理业务目标2.3 快速清洗异常数据2.3.1 快速识别与删除缺失值2.3.2 快速识别离群值2.4 清洗离群值2.4.1 利用经验清洗离群值2.4.2 利用均值与标准差检测离群值2.4.3 截去部分离群值2.4.4 利用四分位差检测离群值2.5 其他数值数据清洗技术2.5.1 值与最小值2.5.2 排序2.5.3 数值变量的分位数2.5.4 自定义函数:数据截断2.6 小结……3 利用正则表达式检测字符型数据4 处理时间与日期类型的数据5 重复数据及其异常值6 多数据集处理7 用户分析与数据清洗工作8 清洗字符型数据参考文献后记
作者介绍
序言
— 没有更多了 —
以下为对购买帮助不大的评价