• 玩转大数据:SAS+R+Stata+Python
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

玩转大数据:SAS+R+Stata+Python

全新正版未拆封

85.61 4.3折 198 全新

仅1件

山东济宁
认证卖家担保交易快速发货售后保障

作者孙江伟 王韵章 宁铮 李夏 王吟曦 李琳 卞伟玮

出版社清华大学出版社

出版时间2021-06

版次1

装帧其他

上书时间2024-01-13

天吾之青豆的书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 孙江伟 王韵章 宁铮 李夏 王吟曦 李琳 卞伟玮
  • 出版社 清华大学出版社
  • 出版时间 2021-06
  • 版次 1
  • ISBN 9787302570677
  • 定价 198.00元
  • 装帧 其他
  • 开本 16开
  • 纸张 胶版纸
  • 页数 640页
  • 字数 1,123.000千字
【内容简介】


面对渐复杂的大数据,科技工作者很难用单一的统计软件高效、地完成从数据挖掘、数据清洗、统计分析到结果呈现的工作,因此需要熟悉和掌握多种统计工具,各取所长、整合使用。本书立足于大数据研究的现状,基于实际医疗案例,介绍数学基础知识和统计学基础知识a、r语言、tata和python这4款大数据常用分析工具的基础编程知识及实践作。
本书主要面向在校本科生、,以及要掌握a、r语言、tata和python的数据工作者,熟悉四个软件的任意一个且想要在短时间内掌握其他软件的读者,也适合医科、临床医生或药企人员等医疗相关人员学使用。

【作者简介】


孙江伟  复旦大学流行病与卫生统计学专业硕士,曾在强生公司(johnon johnon)任生物统计师,对医药临床领域及国外医疗注册系统等大数据的数据管理、数据清洗、研究设计及统计分析,有丰富的理论及实践经验,现于瑞典卡罗林斯卡医学院进行卫生统计学方面的研究深造。在american journal of epidemiology、european journal of neurology等杂志发表相关领域ci10篇。
【目录】


章数学基础1

1.1常用的数学符号1

1.2常见概念2

1.2.1集合2

1.2.2极限3

1.3微积分5

1.3.1导数与微分5

1.3.2基本初等函数的导函数和微分公式6

1.3.3导数与微分的运算法则7

1.3.4定积分与不定积分8

1.3.5基本的不定积分公式9

1.3.6定积分与不定积分的质10

1.4线代数11

1.4.1标量与向量11

1.4.2矩阵与线方程组11

1.4.3行列式的定义与运算12

1.4.4矩阵的运算法则14

1.4.5特殊的矩阵16

1.4.6矩阵的秩17

1.4.7矩阵的转置与矩阵的逆18

1.4.8特征向量与特征值18

第2章统计学基础20

2.1概率论的基本概念20

2.2变量与分布21

2.2.1变量21

2.2.2累积分布函数222.2.3概率函数22

2.3变量的数学特征23

2.3.1数学期望23

2.3.2期望值的规律24

2.3.3条件期望25

2.3.4协方差与相关系数25

2.3.5样本均值和方差26

2.4常见的变量分布27

2.4.1离散变量分布27

2.4.2连续变量分布28

2.5统计学基本概念32

2.5.1体与样本32

2.5.2参数和统计量32

2.5.3中心极限定理32

2.6统计描述32

2.6.1定量资料的统计描述32

2.6.2分类资料的统计描述34

2.7统计推断34

2.7.1参数估计34

2.7.2设检验38

2.8多因素回归模型40

2.8.1多因素线回归模型40

2.8.2多因素logistic回归模型41

2.8.3多因素cox回归模型43

第3章软件基础论45

3.1软件初识45

3.1.1sas45

3.1.2r语言45

3.1.3stata45

3.1.4python46

3.24个软件的比较46

第4章sas基础52

4.1sas介绍与资源52

4.1.1sas语言及程序结构52

4.1.2sas工作界面53

4.1.3获得帮助54

4.2数据的导入与导出55

4.2.1导入数据55

4.2.2导出数据67

4.3sas中常用的函数70

4.3.1字符型函数70

4.3.2数值型函数80

4.3.3期型函数84

4.3.4特殊函数86

4.3.5其他函数89

4.4sas变量91

4.4.1变量属92

4.4.2自动变量92

4.4.3变量列表的缩写规则92

4.4.4创建变量94

4.4.5改变变量属96

4.4.6改变变量类型96

4.5sas数据处理97

4.5.1选取变量97

4.5.2创建变量99

4.5.3对观测求和100

4.5.4选取并作部分观测102

4.5.5循环和数组104

4.5.6数据集的横向合并和纵向合并107

4.5.7增加数据集处理灵活的sas选项111

4.6sas中常见的proc步113

4.6.1proccontents113

4.6.2procdatasets114

4.6.3procfreq116

4.6.4procmeans118

4.6.5procsort120

4.6.6proctranse121

4.6.7procunivariate123

4.6.8proccorr125

4.6.9procreg126

4.6.10proclogistic128

4.6.11proclifetest129

4.6.12procphreg130

4.7procsql131

4.7.1检索数据131

4.7.2合并数据集135

4.7.3使用procsql管理表137

4.8sas宏介绍143

4.8.1宏变量143

4.8.2宏函数147

4.8.3宏程序151

4.8.4宏参数152

4.8.5宏语言与data步153

4.8.6宏语言与procsql157

4.8.7条件语句和循环语句在宏语言中的使用161

第5章r语言基础163

5.1r语言介绍163

5.1.1r语言的特点与资源163

5.1.2rstudio使用简介163

5.2r语言的基本规则164

5.2.1对象165

5.2.2函数使用基础165

5.2.3扩展包166

5.2.4帮助167

5.3数据类型167

5.3.1vector167

5.3.2factor169

5.3.3date171

5.3.4matrix172

5.3.5list175

5.3.6data.frame179

5.3.7formula181

5.4常用函数介绍182

5.4.1数据的读入和导出182

5.4.2条件判断183

5.4.3循环186

5.4.4文本处理188

5.4.5基本作图190

5.4.6自定义函数192

5.5常用数据处理与统计分析函数195

5.5.1单变量分析195

5.5.2双变量、多变量分析198

5.5.3线回归模型200

5.5.4logistic回归模型202

5.5.5生存分析模型203

5.6dplyr包简介206

5.6.1安装dplyr包206

5.6.2dplyr包中常用的5个函数206

5.6.3用%>%运算符连接多个函数211

5.6.4dplyr包中其他实用的函数212

5.7ggplot2包简介214

5.7.1安装ggplot2包214

5.7.2使用ggplot2画图的基本思路214

5.7.3使用geom_histogram函数绘制直方图215

5.7.4使用geom_bar函数绘制柱状图217

5.7.5使用geom_boxplot函数绘制箱形图217

5.7.6使用geom_point函数绘制散点图220

5.7.7使用geom_smooth函数在散点图上添加线回归结果223

5.7.8对图中细节进行微调224

5.7.9将多个图合并为一个图225

5.7.10保存图228

第6章stata基础229

6.1stata简介229

6.1.1界面介绍229

6.1.2在菜单栏中选择命令230

6.1.3输入命令代码230

6.2获得帮助230

6.2.1检索关键词230

6.2.2查看帮助231

6.2.3帮助建议231

6.3语法结构231

6.3.1变量集232

6.3.2by前缀233

6.3.3命令234

6.3.4=表达式234

6.3.5if表达式236

6.3.6in范围236

6.3.7权重237

6.3.8命令选项237

6.3.9数值集合238

6.3.10文件名238

6.4数据转换与分析239

6.4.1导入数据239

6.4.2浏览数据与基本描述240

6.4.3数值变量243

6.4.4文本变量247

6.4.5期变量252

6.4.6缺失值253

6.4.7注释变量254

6.4.8调整数据结构256

6.4.9基本描述258

6.4.10统计检验260

6.4.11相关分析262

6.4.12回归分析263

6.4.13导出数据267

6.5输出结果调用268

6.5.1一般统计命令结果调用268

6.5.2估计命令结果调用269

6.6重复命令271

6.6.1by前缀271

6.6.2foreach循环274

6.6.3forvalues循环275

6.7编程工具275

6.7.1do文件275

6.7.2标量变量276

6.7.3宏变量277

6.7.4矩阵279

6.7.5程序283

第7章python基础284

7.1python的安装284

7.1.1使用python安装包安装python3284

7.1.2通过anaconda安装python3285

7.2常用交互式语言开发环境287

7.2.1编辑器288

7.2.2控制台289

7.2.3变量管理器290

7.3常用数据类型、数据结构与基本语句291

7.3.1python中的变量命名规则291

7.3.2常见的数据类型及运算291

7.3.3常见的数据结构及运算291

7.3.4个程序295

7.3.5函数295

7.3.6常用逻辑语句298

7.4数据的导入与导出302

7.4.1数据的读取302

7.4.2数据存储304

7.5基础运算常用包——numpy304

7.5.1基本质304

7.5.2矢量化运算306

7.5.3numpy中的函数306

7.5.4ndarray的轴、索引与切片309

7.5.5实战举例:用numpy进行图像处理313

7.6数据处理常用包——pandas316

7.6.1主要数据类型316

7.6.2对dataframe的描述318

7.6.3缺失值的检测与处理319

7.6.4dataframe的索引321

7.6.5常见作325

7.6.6字符处理专题328

7.6.7apply专题331

7.6.8groupby专题333

7.7统计分析常用包338

7.7.1单样本t检验339

7.7.2独立样本t检验340

7.7.3两个连续型变量的相关341

7.7.4两个分类变量的频数统计341

7.7.5线回归模型342

7.7.6logistic回归模型345

7.7.7生存分析347

7.8绘图常用包352

7.8.1pandas352

7.8.2matplotlib356

7.8.3seaborn360

第8章软件实践论366

8.1本书使用的数据集366

8.1.1病人基本信息数据集366

8.1.2诊断信息数据集367

8.1.3实验室检测结果数据集(一)368

8.1.4实验室检测结果数据集(二)368

8.1.5用药信息数据集368

8.1.6急心肌梗死数据集369

8.2软件实践步骤369

8.2.1数据清洗369

8.2.2数据准备370

8.2.3数据分析370

8.2.4结果整理370

8.2.5代码的重复使用370

8.3实例:拟研究的课题371

第9章sas实践部分372

9.1数据的清洗与管理372

9.1.1病人基本信息数据集372

9.1.2诊断信息数据集376

9.1.3实验室检测结果数据集(一)381

9.1.4实验室检测结果数据集(二)387

9.1.5用药信息数据集390

9.2数据分析与结果整理393

9.2.1定量数据的统计描述394

9.2.2分类数据的统计描述398

9.2.3相关分析402

9.2.4线回归分析406

9.2.5logistic回归分析412

9.2.6cox回归分析418

0章r语言实践部分425

10.1数据的清洗与管理425

10.1.1病人基本信息数据集425

10.1.2诊断信息数据集431

10.1.3实验室检测结果数据集(一)435

10.1.4实验室检测结果数据集(二)439

10.1.5用药信息数据集442

10.2数据分析与结果整理445

10.2.1定量数据的统计描述446

10.2.2分类数据的统计描述449

10.2.3相关分析452

10.2.4线回归分析453

10.2.5logistic回归分析457

10.2.6cox回归分析463

1章stata实践部分470

11.1数据的清洗与管理470

11.1.1病人基本信息数据集470

11.1.2诊断信息数据集483

11.1.3实验室检测结果数据集(一)490

11.1.4实验室检测结果数据集(二)495

11.1.5用药信息数据集500

11.2数据分析与结果整理504

11.2.1定量数据的统计描述504

11.2.2分类数据的统计描述511

11.2.3相关分析516

11.2.4一般线回归分析519

11.2.5logistic回归分析526

11.2.6cox回归分析535

11.3stata在meta分析中的应用545

11.3.1meta分析简介545

11.3.2二分类变量的meta分析548

11.3.3连续变量的meta分析552

11.3.4发表偏倚分析553

2章python实践部分557

12.1数据的清洗与管理557

12.1.1病人基本信息数据集557

12.1.2诊断信息数据集566

12.1.3实验室检测结果数据集(一)571

12.1.4实验室检测结果数据集(二)578

12.1.5用药信息数据集582

12.2数据准备和数据分析584

12.2.1定量数据的统计描述584

12.2.2分类数据的统计描述587

12.2.3相关分析589

12.2.4线回归分析591

12.2.5logistic回归分析595

12.2.6cox回归分析602

参文献609

附录a常用设检验方法610

附录b正则表达式619

附录c系统综述与meta分析技术路线图622

点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP