深入浅出R语言数据分析
¥
17.48
2.5折
¥
69
九五品
仅1件
作者米霖
出版社清华大学出版社
ISBN9787302543886
出版时间2020-09
版次1
装帧平装
开本16开
纸张胶版纸
定价69元
上书时间2024-05-20
商品详情
- 品相描述:九五品
- 商品描述
-
基本信息
书名:深入浅出R语言数据分析
定价:69.00元
作者:米霖
出版社:清华大学出版社
出版日期:2020-09-01
ISBN:9787302543886
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
内容提要
目录
章 数据分析项目的流程1.1 数据分析项目中的角色·····11.2 数据分析项目的阶段········21.2.1 制定目标··················31.2.2 收集数据··············31.2.3 数据处理和分析············41.2.4 构建模型··········71.2.5 评估模型··········81.2.6 展示结果·········91.2.7 部署与维护模型···········101.3 总结··················10第2章 数据的读取2.1 RData数据 ·················112.2 readr高效读取数据 ·········132.3 读取Excel数据 ········162.4 读取SPSS、SAS、STATA数据 ·······172.5 R语言操作数据库 ·······192.6 总结·····················23第3章 数 据 探 索3.1 缺失值的识别与处理···········243.1.1 缺失值的识别与描述性统计····253.1.2 缺失值的可视化展示················263.1.3 缺失值的处理方法····················283.2 异常值············333.3 dlookr数据处理包 ···············383.3.1 所有变量的一般性诊断····383.3.2 数值型变量的诊断············393.3.3 分类变量的诊断····393.3.4 异常值的诊断········403.3.5 创建诊断报告········413.3.6 数据处理················423.3.7 缺失值处理············433.3.8 异常值处理············443.3.9 数据转换················463.3.10 数据分箱··············493.3.11 创建数据转换报告··········523.4 数据相关性··················533.5 自动化创建数据探索报告·····573.6 总结··········60第4 章生存分析4.1 生存分析的基本内容·········614.2 使用R 语言进行生存分析·······644.3 非参数模型······664.3.1 使用Kaplan-Meier 方法拟合数据 ··········664.3.2 Kaplan-Meier 方法的可视化 ······684.4 半参数模型生存分析方法·······704.4.1 构建Cox 模型···········704.4.2 检查假设·············714.4.3 Coxph 模型可视化········734.4.4 预测··················744.4.5 分层·············754.5 参数模型···················774.6 随机生存森林模型···804.7 总结·············82第5 章主成分分析5.1 概述······························835.1.1 维度相关的问题···············835.1.2 检测多重共线性···············845.1.3 方差膨胀因子···················845.2 主成分分析详解··········855.2.1 主成分分析的定义···········855.2.2 主成分分析的简单原理···865.2.3 主成分分析的算法···········875.3 使用R 语言进行主成分分析·············885.3.1 主成分分析的实现···895.3.2 主成分分析案例·······915.4 总结········96第6 章多维缩放6.1 MDS 的工作原理·······976.3 MDS 的优点·················1056.2 在R 语言中实现MDS··986.4 总结··········106第7 章线性回归模型7.1 线性回归模型概述··············1077.2 在R 语言中实现回归模型········1087.2.1 图形分析·············1097.2.2 建立线性模型·····1147.2.3 回归模型的图形诊断······1197.2.4 预测模型··························1227.2.5 抽样方法··························1247.3 总结··········126第8 章逻辑回归模型8.1 逻辑回归的原理········1278.2 在R 语言中实现逻辑回归模型·······1288.2.1 数据探索·····················1298.2.2 构建逻辑回归模型·····1318.2.3 逻辑回归预测·············1338.2.4 逻辑回归模型评估·····1338.3 总结···············136第9 章聚类模型9.1 概述·····················1379.1.1 聚类算法···················1379.1.2 K均值聚类的原理··1389.2 在R 语言中实现聚类模型········1399.2.1 K均值聚类······1409.2.2 层次聚类··········1439.2.3 Medoids 聚类(PAM) ········1449.3 总结·········1460 章关联规则10.1 关联规则概述············14710.2 关联规则的基本概念··········14810.3 在R 语言中实现关联规划·······14810.3.1 训练模型···········15110.3.2 模型的评估········15310.3.3 提升关联规则的效果····15410.3.4 关联规则的可视化········15510.4 总结············1581 章随机森林11.1 随机森林的基本概念·······15911.3 总结·······16711.2 在R 语言中实现随机森林 ····1612 章支持向量机12.1 概述······16812.3 总结······17912.2 在R 语言中实现支持向量机·········1713 章神经网络13.2.2 评估模型效果··············18713.1 概述·················18013.2 在R 语言中实现神经网络·············18213.3 总结·························19213.2.1 构建神经网络模型······1854 章文本挖掘14.1 概述············19314.2 text2vec 背景及其基本原理 ···········19414.3 DTM 与TFIDF 的原理和实现·······19414.3.1 DTM 和TFIDF 的原理·····19414.3.2 DTM 的实现··············19614.3.3 TFIDF 的实现·········19914.4 情感分析············19914.5 LDA 主题模型及其实现 ·········20614.6 构建自动问答系统·············20814.7 总结·········2115 章社交网络分析15.1 社交网络概述·········21215.2 igraph 简介 ············21315.2.1 准备工作················21415.2.2 图的指标计算··········21515.3 社交网络的常见结构····21715.4 社交网络分析算法····22015.4.1 Girvan-Newman ········ 22115.4.2 基于传播标签的社区检测··········· 22315.4.3 基于贪婪优化模块的社区检测··········· 22415.4.4 自旋转玻璃社群················ 22415.5 微博社交群体分析······· 22515.5.1 自旋转玻璃社群··············· 22615.5.2 社群检测············ 22815.6 总结·········· 2296 章 H2O 机器学习16.1 H2O 机器学习平台······ 23016.2 在R 语言中使用H2O ·· 23116.2.1 H2O 的安装··········· 23116.2.2 案例应用··············· 23116.2.3 H2O 常用API ······· 23416.2.4 模型的通用参数···· 23516.2.5 参数调整··········· 23516.3 H2O Flow·············· 23816.3.1 H2O Flow 的安装·············· 23816.3.2 H2O Flow 的基本使用方法······ 23916.4 总结··········· 2447 章 R 语言爬虫17.1 快速爬取网页数据···· 24517.2 rvest 简介····· 24717.2.1 rvest API················· 24817.2.2 rvest API 详解············· 24917.3 爬取BOSS 直聘数据··· 25017.4 模拟登录······················· 254
作者介绍
米霖,毕业于华中农业大学,本科数学专业,研究生统计学专业,8年R语言项目经验,擅长机器学习、统计模型。曾开发了多门R语言相关课程,课程包括《Shiny 初级教程》《R包开发》《H2O机器学习模型》《信用评分模型开发》《R语言文本挖掘》等,学员累计超过5000人。完成过很多数据分析项目,例如广告虚假流量识别项目(通过虚假流量数据的挖掘帮助企业节省了上百万元的营销成本),信贷中的信用评分项目,电商风控项目等。
序言
— 没有更多了 —
以下为对购买帮助不大的评价