医学数据挖掘与R语言实现
全新正版 极速发货
¥
44.84
5.0折
¥
89
全新
库存20件
作者李姣
出版社中国协和医科大学
ISBN9787567917705
出版时间2022-09
装帧平装
开本其他
定价89元
货号1202748636
上书时间2024-06-10
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
李姣研究员,中国医学科学院北京协和医学院医学信息研究所,医学信息创新研究中心主任,医学信息学教研室主任,担任中华医学会医学信息学分会常委,医学大数据与人工智能学组组长。李姣博士毕业于清华大学,获计算机科学与技术专业博士学位,在美国国立卫生研究院开展医学信息学方向博士后研究工作。2012年回国,在中国医学科学院北京协和医学院医学信息研究所开展科研和教学工作。主持开展国家重点研发计划、国家自然科学基金医学人工智能先导专项等课题研究,其研究成果发表在国际医学信息学领域核心期刊,发表学术论文80余篇,授权发明专利5项。面向北京协和医学院研究生开设《医学数据挖掘实用技术》课程,获协和医学院优秀教师、师德先锋称号。指导学生参加“共享杯”大学生科技资源共享服务创新大赛获优异成绩,被评为优秀指导教师荣誉称号。
目录
第一章 医学数据挖掘导论
第一节 数据挖掘基本概念
第二节 开放医学数据资源及利用遵循原则
第三节 医学数据挖掘研究设计要点
第四节 医学数据挖掘研究的应用
第二章 R语言数据操作与可视化
第一节 R语言概述
第二节 R环境配置
第三节 R基本数据类型与数据操作
第四节 绘图基础
第三章 数据获取与数据清洗技术
第一节 基于R的数据采集与数据获取
第二节 数据清洗实用技术
第四章 数据描述性分析与探索性分析
第一节 数据描述性分析
第二节 数据探索性分析
第三节 案例:住院患者人口学特征可视化展示
第四节 案例:住院患者可视化探索性分析
第五章 医学数据建模与机器学习
第一节 机器学习概述
第二节 有监督学习
第三节 模型评价
第四节 无监督学习
第六章 基于电子病历的疾病风险预测
第一节 电子病历数据特点
第二节 疾病风险预测研究概述
第三节 统计分析与集成学习
第四节 特征重要性分析
第五节 研究案例
第七章 临床电子病历文本挖掘
第一节 文本挖掘概述
第二节 电子病历文本特点
第三节 中文电子病历命名实体识别
第四节 研究案例
第八章 肿瘤基因表达数据的关联分析及可视化
第一节 肿瘤组学数据及挖掘概述
第二节 基因表达数据表示与获取
第三节 基因表达数据关联分析
第四节 关联分析结果可视化
第五节 研究案例
参考文献
内容摘要
本书主要内容涵盖从医学数据采集、处理、组织、整合、挖掘等方面的知识,介绍数据科学家常用的数据挖掘理论和R语言编程工具,并针对具体的医学数据类型医学数据场景,提供中文电子病历文本挖掘、疾病风险预测、肿瘤分子标志物识别等医学数据挖掘的案例实践。本书共分为八章,第一章导论,主要介绍医学数据挖掘的基本概念、医学数据资源及其利用原则、医学数据挖掘研究的设计要点及应用;第二章R语言数据操作与可视化,主要介绍如何配置一个可用的R环境和R基本数据操作及绘图,包括R基本数据类型、数据操作函数、程序编写结构、ggplot2绘图;第三章数据获取与数据清洗技术,首先介绍了基于R语言进行数据获取的常用方法(带分隔符的本地文本文件数据获取、Excel数据获取、网页数据采集等),再重点介绍了医学数据清洗中缺失值的识别和常用处理方法,包括删除法、单值插补、多重插补,最后介绍了数据清洗中的异常值处理和数据变换方法;第四章数据描述性分析与探索性分析,主要介绍了如何利用R语言进行数据基本特征的展示和探索,包括频数表、列联表、假设检验分析和回归分析等方法,并对实际住院患者数据进行处理;第五章医学数据建模与机器学习,首先介绍了医学数据建模的常规流程,再重点介绍K近邻分类器、朴素贝叶斯分类器、决策树分类器、线性非线性回归、K-均值聚类模型等机器学习算法和模型评价方法,最后提供了一个完整的机器学习预测实例;第六章基于电子病历的疾病风险预测,主要介绍了疾病风险预测研究的类型、机器学习方法的集成及其在疾病预测领域中的应用,最后基于卒中患者的病历数据,给出疾病风险预测实例;第七章电子病历文本挖掘,主要介绍了医学文本挖掘的基本概述,重点介绍中文电子病历命名实体识别的处理方法,包括词典法和基于条件随机场的方法,最后基于实际中文电子病历数据对两种方法进行比较评估;第八章肿瘤基因表达数据的关联分析及可视化,讨论了肿瘤基因表达数据的获取与表示、关联分析与可视化,最后结合实例数据,开展基于表达数据的分析实践。
— 没有更多了 —
以下为对购买帮助不大的评价