R语言医学数据分析实践
全新正版 极速发货
¥
65.25
6.6折
¥
99
全新
仅1件
作者李丹,宋立桓,蔡伟祺 著
出版社清华大学出版社
ISBN9787302673484
出版时间2024-10
装帧平装
开本16开
定价99元
货号1203402841
上书时间2024-11-14
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
"李丹,福建医科大学附属协和医院消化内科主任医师,教授,博士生导师,福建省高层次人才,福建省青年五四奖章、福建省青年科技奖获得者。中华医学会消化病分会青年委员。以通讯作者或第一作者身份发表SCI论文16篇。
宋立桓,曾服务于微软中国有限公司,国内互联网头部企业解决方案资深架构师,专注于人工智能和大数据挖掘分析,拥有多项人工智能发明专利。著有《Python深度学习从零开始学》《云原生构建数字世界》《MySQL性能优化和高可用架构实践》《PyTorch深度学习与企业级项目实战》等科技著作。
蔡伟祺,福建医科大学协和临床医学院2022级专业学位硕士研究生,精通R语言和公共医学数据库挖掘。"
目录
第1章 R语言介绍1
1.1 R语言概述1
1.1.1 什么是R语言1
1.1.2 临床医生使用R语言的优势1
1.2 R编程环境的搭建2
1.2.1 R语言的下载和安装3
1.2.2 RStudio的下载和安装5
1.2.3 RStudio操作6
1.3 R语言包8
1.3.1 什么是R包8
1.3.2 R包的安装8
1.4 初识R语言的注意事项9
第2章 R语言的基本语法11
2.1 R语言的数据结构11
2.1.1 向量11
2.1.2 矩阵13
2.1.3 数组15
2.1.4 数据框16
2.2 R语言函数简介17
2.2.1 函数的定义17
2.2.2 常用内置函数的使用18
2.3 R语言中的数据读写19
2.3.1 读取文件19
2.3.2 写入文件20
2.3.3 读写其他数据文件21
2.4 R语言流程控制21
2.4.1 判断语句21
2.4.2 循环语句23
2.5 字符串操作24
2.6 R语言数据保存26
第3章 R语言数据清洗27
3.1 数据清洗的重要性27
3.2 数据质量评估28
3.3 数据清洗30
3.3.1 缺失值检查及处理30
3.3.2 异常值检查及处理32
3.3.3 重复值检查及处理34
3.4 数据清洗dplyr包的使用34
3.5 数据清洗实战37
第4章 R语言数据可视化42
4.1 基础绘图42
4.2 ggplot2绘图45
4.2.1 ggplot2语法入门及相关软件包46
4.2.2 ggplot2绘制简单的统计图形46
4.2.3 ggplot2绘制复杂图形(统计图的组合、分面展示)54
4.3 高质量SCI论文绘图58
4.3.1 聚类分析和相关分析的热图详解58
4.3.2 ROC曲线的绘制63
4.3.3 火山图的绘制67
第5章 R语言统计建模分析71
5.1 经典统计分析71
5.1.1 t检验71
5.1.2 方差分析73
5.1.3 卡方检验74
5.1.4 简单线性回归分析75
5.2 高级回归分析77
5.2.1 多重线性回归分析77
5.2.2 Logistic回归分析78
5.2.3 回归分析实战80
5.3 SCI文章两表一图实战84
5.3.1 SCI文章—基线资料表84
5.3.2 SCI文章—单因素回归分析表或多因素回归分析表88
5.3.3 SCI文章—亚组分析的森林图89
5.3.4 限制性立方样条图92
第6章 R语言机器学习实战入门95
6.1 什么是机器学习95
6.2 机器学习的流程96
6.2.1 数据收集96
6.2.2 数据预处理97
6.2.3 特征工程97
6.2.4 模型构建和训练98
6.3 机器学习分类98
6.3.1 监督学习98
6.3.2 无监督学习99
6.3.3 强化学习100
6.4 过拟合和欠拟合101
6.4.1 过拟合101
6.4.2 欠拟合101
6.5 衡量机器学习模型的指标102
6.5.1 正确率、精确率和召回率102
6.5.2 几个常见的比率104
6.5.3 混淆矩阵104
6.5.4 F1 score和ROC曲线105
6.6 K折交叉验证108
6.7 支持向量机概述108
6.8 随机森林概述110
6.9 糖尿病风险预测实战110
6.9.1 数据集背景110
6.9.2 数据预处理112
6.9.3 模型建立113
6.9.4 模型评估113
6.10 ICU患者死亡率预测实战115
6.10.1 数据集背景115
6.10.2 数据预处理115
6.10.3 模型建立118
6.10.4 模型评估120
第7章 列线图在预测模型中的应用122
7.1 列线图基本原理122
7.2 列线图的三大要素123
7.3 列线图解读123
7.4 列线图的实战124
7.4.1 列线图R实例一124
7.4.2 列线图R实例二126
7.5 列线图在数据挖掘中的应用128
第8章 临床数据挖掘中的生存分析133
8.1 基本概念和原理133
8.1.1 什么是生存数据133
8.1.2 生存分析的含义134
8.1.3 为什么要用生存分析134
8.1.4 生存分析的删失135
8.1.5 生存分析的常用方法135
8.2 Kaplan-Meier法生存分析实战137
8.2.1 Kaplan-Meier法介绍137
8.2.2 Kaplan-Meier生存曲线R语言实战137
8.3 Cox生存分析实战142
8.3.1 Cox回归模型介绍142
8.3.2 Cox回归模型实战143
8.4 竞争风险模型144
8.4.1 临床研究中如何处理竞争事件145
8.4.2 竞争风险模型R语言实战145
第9章 NHANES数据库挖掘实战149
9.1 NHANES数据库介绍149
9.2 NHANES数据库的下载与合并152
9.3 NHANES权重介绍及使用155
9.3.1 什么是权重156
9.3.2 NHANES权重分析的必要性156
9.3.3 NHANES权重如何选择158
9.3.4 NHANES权重实战160
9.4 NHANES数据分析实战162
9.5 NHANES数据库发文选题介绍173
第10章 GEO数据库挖掘实战175
10.1 GEO数据库介绍175
10.1.1 GEO数据库概况175
10.1.2 GEO数据库组织结构176
10.2 GEO数据库检索176
10.3 芯片基础知识179
10.4 GEO数据库分析实战179
10.4.1 找GSE编号180
10.4.2 安装生物信息分析所需的R包181
10.4.3 下载表达矩阵182
10.4.4 获取分组信息184
10.4.5 获取表达矩阵并检查数据185
10.4.6 转换探针ID186
10.4.7 差异分析189
10.4.8 分析结果可视化—火山图、热图192
10.5 GEO多数据集差异分析195
第11章 孟德尔随机化分析实战200
11.1 什么是孟德尔随机化200
11.1.1 基因型和表型200
11.1.2 孟德尔随机化简介201
11.2 孟德尔随机化研究流程204
11.2.1 MR研究流程七步法204
11.2.2 MR分析数据库介绍207
11.3 孟德尔随机化分析实战211
11.3.1 TwoSampleMR包双样本MR分析211
11.3.2 MR分析网站—MR-Base实战219
11.4 孟德尔随机化研究论文复现实战225
11.5 孟德尔随机化分析的优势和论文选题236
第12章 单细胞测序实战239
12.1 单细胞测序概述239
12.1.1 为什么要做单细胞测序239
12.1.2 单细胞测序技术原理240
12.2 单细胞测序分析流程241
12.2.1 读取原始数据并建立表达矩阵241
12.2.2 消除技术误差242
12.2.3 细胞聚类与可视化244
12.3 单细胞转录组分析实战248
12.3.1 安装Seurat包248
12.3.2 数据导入249
12.3.3 数据质控251
12.3.4 寻找高变基因253
12.3.5 PCA降维254
12.3.6 细胞聚类258
12.3.7 寻找差异表达标记基因260
12.3.8 细胞注释262
12.4 单细胞测序多样本分析实战267
12.5 单细胞测序临床应用278
内容摘要
公共医学数据库的应用越来越广泛,利用这些数据库进行论文写作可以显著减少研究成本和时间。本书以公共医学数据为例,讲解如何使用R语言进行数据挖掘和统计分析。本书通过大量精选的实例,对统计分析方法进行了深入浅出的介绍,旨在帮助读者解决医学数据分析中遇到的实际问题。本书配套提供示例源码、PPT课件、作者微信群答疑服务。
本书共分为12章,内容包括R语言介绍、R语言基本语法、R语言数据清洗、R语言数据可视化、R语言统计建模分析方法、R语言机器学习实战入门、列线图在预测模型中的应用、临床数据挖掘中的生存分析、NHANES数据库挖掘实战、GEO数据库挖掘实战、孟德尔随机化分析实战、单细胞测序实战。
本书适用于临床医学、公共卫生及其他医学相关专业的本科生和研究生使用,也可作为其他专业的学生和科研工作者学习数据分析的参考书。阅读本书,读者不仅能够掌握使用R语言及相关包快速解决实际问题的方法,还能更深入地理解公共医学数据库挖掘的实战精髓。
— 没有更多了 —
以下为对购买帮助不大的评价