新书 PYTHON统计分析
部分是库存书(库存书指的是未使用过、没塑封的、外观95成新的书)
¥
16.73
2.1折
¥
79
全新
仅1件
作者 Haslwanter
出版社 人民邮电出版社
ISBN 9787115493842
出版时间 2018-12
装帧 平装
开本 16开
定价 79元
货号 9787115493842
上书时间 2024-11-04
商品详情
品相描述:全新
商品描述
作者简介 作者简介 托马斯·哈斯尔万特(Thomas Haslwanter)在学术机构中有超过10年的教学经验,是林茨上奥地利州应用科学大学(University of Applied Sciences Upper Austria in Linz)医学工程系的教授,瑞士苏黎世联邦理工学院讲师,并曾在澳大利亚悉尼大学和德国图宾根大学担任过研究员。他在医学研究方面经验丰富,专注于眩晕症的诊断、治疗和康复。在深入使用Matlab十五年后,他发现Python很好强大,并将其用于统计数据分析、声音和图像处理以及生物仿真应用。 译者简介 李锐,复旦大学公共卫生学院流行病与生物统计专业博士生,Python、R和Lisp语言的爱好者,主要研究方向为统计学习和机器学习建模以及组学数据的数据挖掘。先后以作者身份发表学术论文6篇,其中SCI论文4篇。参编中文专著2本。 审校者简介 张志杰,复旦大学公共卫生学院副教授,多本靠前医疗卫生期刊的特邀编辑,研究方向为统计建模和医学领域的统计分析方法。参与并完成国家重大科技专项、“863”、国家“十五”科技攻关课题、自然科学基金重大项目等多项重量课题的研究,研究成果先后获2010年全国百篇很好博士学位论文、2012年上海市医学奖二等奖、上海市科技进步奖二等奖以及中华医学奖三等奖,2011年入选复旦大学首批“卓学人才计划”,2013年入选上海市第二批新优青人才计划。 目录 第 一部分 Python和统计学 第 1章 为什么学习统计学 2 第 2章 Python 4 2.1 开始 4 2.1.1 惯例 4 2.1.2 发行版和包 5 2.1.3 安装Python 7 2.1.4 安装R和rpy2 8 2.1.5 个性化IPython/Jupyter 9 2.1.6 Python资源 12 2.1.7 第 一个Python程序 13 2.2 Python数据结构 14 2.2.1 Python数据类型 14 2.2.2 索引和切片 16 2.2.3 向量和数组 17 2.3 IPython/Jupyter:一个交互式的Python编程环境 18 2.3.1 Qt控制台的第 一个会话 19 2.3.2 Notebook和rpy2 21 2.3.3 IPython小贴士 23 2.4 开发Python程序 24 2.4.1 将交互式命令转化为一个Python程序 24 2.4.2 函数、模块和包 26 2.4.3 Python小贴士 30 2.4.4 代码版本控制 31 2.5 Pandas:用于统计学的数据结构 31 2.5.1 数据处理 31 2.5.2 分组(Grouping) 33 2.6 Statsmodels:统计建模的工具 34 2.7 Seaborn:数据可视化 35 2.8 一般惯例 36 2.9 练习 36 第3章 数据输入 38 3.1 从文本文件中输入 38 3.1.1 目视检查 38 3.1.2 读入ASCII数据到Python中 38 3.2 从MS Excel中导入 42 3.3 从其他格式导入数据 43 第4章 统计数据的展示 45 4.1 数据类型 45 4.1.1 分类数据 45 4.1.2 数值型 46 4.2 在Python中作图 46 4.2.1 函数式和面向对象式的绘图方法 47 4.2.2 交互式绘图 48 4.3 展示统计学数据集 52 4.3.1 单变量数据 53 4.3.2 二元变量和多元变量绘图 59 4.4 练习 61 第二部分 分布和假设检验 第5章 背景 63 5.1 总体和样本 63 5.2 概率分布 64 5.2.1 离散分布 64 5.2.2 连续分布 65 5.2.3 期望值和方差 65 5.3 自由度 66 5.4 研究设计 66 5.4.1 术语 67 5.4.2 概述 67 5.4.3 研究类型 68 5.4.4 实验设计 69 5.4.5 个人建议 72 5.4.6 临床研究计划 73 第6章 单变量的分布 74 6.1 分布的特征描述 74 6.1.1 分布中心 74 6.1.2 量化变异度 76 6.1.3 分布形状的参数描述 79 6.1.4 概率密度的重要展示 81 6.2 离散分布 82 6.2.1 伯努利分布 82 6.2.2 二项分布 83 6.2.3 泊松分布 85 6.3 正态分布 86 6.3.1 正态分布的例子 88 6.3.2 中心极限定理 88 6.3.3 分布和假设检验 89 6.4 来自正态分布的连续型分布 90 6.4.1 t分布 90 6.4.2 卡方分布 92 6.4.3 F分布 94 6.5 其他连续型分布 95 6.5.1 对数正态分布 96 6.5.2 韦伯分布 96 6.5.3 指数分布 97 6.5.4 均匀分布 98 6.6 练习 98 第7章 假设检验 100 7.1 典型分析步骤 100 7.1.1 数据筛选和离群值 100 7.1.2 正态性检验 101 7.1.3 转换 104 7.2 假设概念、错误、p值和样本量 104 7.2.1 一个例子 104 7.2.2 推广和应用 105 7.2.3 p值的解释 106 7.2.4 错误的类型 107 7.2.5 样本量 108 7.3 灵敏度和特异度 110 7.4 受试者操作特征(ROC)曲线 113 第8章 数值型数据的均值检验 114 8.1 样本均值的分布 114 8.1.1 单样本均值的t检验 114 8.1.2 Wilcoxon符号秩和检验 116 8.2 两组之间的比较 117 8.2.1 配对t检验 117 8.2.2 独立组别之间的t检验 118 8.2.3 两组之间的非参数比较:Mann-Whitney检验 118 8.2.4 统计学假设检验与统计学建模 118 8.3 多组比较 120 8.3.1 方差分析(ANOVA) 120 8.3.2 多重比较 123 8.3.3 Kruskal–Wallis检验 125 8.3.4 两因素方差分析 126 8.3.5 三因素方差分析 126 8.4 总结:选择正确的检验方法进行组间比较 127 8.4.1 典型的检验 127 8.4.2 假设的例子 128 8.5 练习 129 第9章 分类数据的检验 131 9.1 单个率 131 9.1.1 置信区间 131 9.1.2 解释 132 9.1.3 例子 132 9.2 频数表 133 9.2.1 单因素卡方检验 133 9.2.2 卡方列联表检验 134 9.2.3 Fisher精确检验 136 9.2.4 McNemar检验 139 9.2.5 Cochrans Q检验 140 9.3 练习 141 第 10章 生存时间分析 144 10.1 生存分布 144 10.2 生存概率 145 10.2.1 删失 145 10.2.2 Kaplan–Meier生存曲线 146 10.3 在两组间比较生存曲线 148 第三部分 统计建模 第 11章 线性回归模型 150 11.1 线性相关 150 11.1.1 相关系数 150 11.1.2 秩相关 151 11.2 一般线性回归模型 152 11.2.1 例子1:简单线性回归 153 11.2.2 例子2:二次方拟合 153 11.2.3 决定系数 154 11.3 Patsy:公式的语言 155 11.4 用Python进行线性回归分析 158 11.4.1 例子1:拟合带置信区间的直线 158 11.4.2 例子2:嘈杂的二次多项式 159 11.5 线性回归模型的结果 162 11.5.1 例子:英国的烟草和酒精 162 11.5.2 带有截距的回归的定义 165 11.5.3 R2值 165 11.5.4 调整后的R2值 165 11.5.5 模型的系数和它们的解释 168 11.5.6 残差分析 171 11.5.7 异常值 174 11.5.8 用Sklearn进行回归 175 11.5.9 结论 176 11.6 线性回归模型的假设 177 11.7 线性回归模型结果的解释 180 11.8 Bootstrapping 180 11.9 练习 181 第 12章 多元数据分析 182 12.1 可视化多元相关 182 12.1.1 散点图矩阵 182 12.1.2 相关性矩阵 182 12.2 多重线性回归 184 第 13章 离散数据的检验 185 13.1 等级资料的组间比较 185 13.2 Logistic回归 186 13.3 广义线性模型 188 13.3.1 指数族分布 189 13.3.2 线性预测器和连接函数 189 13.4 有序Logistic回归 189 13.4.1 问题定义 189 13.4.2 优化 191 13.4.3 代码 191 13.4.4 性能 191 第 14章 贝叶斯统计学 193 14.1 贝叶斯学派与频率学派的解释 193 14.2 计算机时代的贝叶斯方法 195 14.3 例子:用马尔可夫链蒙特卡洛模拟分析挑战者号灾难 195 14.4 总结 198 参考答案 199 术语表 219 参考文献 223 内容摘要 本书以基础的统计学知识和假设检验为重点,简明扼要地讲述了Python在数据分析、可视化和统计建模中的应用。主要包括Python的简单介绍、研究设计、数据管理、概率分布、不同数据类型的假设检验、广义线性模型、生存分析和贝叶斯统计学等从入门到不错的内容。 本书利用Python这门开源语言,不仅在直观上对数据分析和统计检验提供了很好的理解,而且在相关数学公式的讲解上也能够做到深入浅出。本书的可操作性很强,配套提供相关的代码和数据,读者可以依照书中所讲,复现和加深对相关知识的理解。 本书适合对统计学和Python有兴趣的读者,特别是在实验学科中需要利用Python的强大功能来进行数据处理和统计分析的学生和研究人员。 主编推荐 近年来Python生态系统不断完善,Python这门语言已经成为科学计算的流行语言,它为统计数据分析提供了强大的操作环境。 本书主要介绍了Python在统计数据分析中的应用,内容涵盖连续、离散和分类数据的常见统计检验,以及线性回归分析、生存分析和贝叶斯统计等主题。 本书的特色:针对每种检验方法,提供了Python解决方案的代码和数据,以及便于实际操作的Python示例。借此,读者可以重现这些问题并加强他们对这些统计分析方法的理解。本书所用数据主要来自生命科学和医学科学,因此对这些领域的学生可能更有针对性。不过,本书也介绍了Python的基础知识以及一些统计学的基础知识,任何想要进行统计数据分析的人都可以阅读本书。 媒体评论 本书强调实际问题的解决方法,是统计学家/计算机科学家和实验专家(如生物学家、物理学家、医生等)之间一个很好的桥梁。为了让读者更好地理解本书的内容,作者还提供了实际的例子和动手练习(书末附有答案),这使得本书受众广泛——从各个专业的本科生到寻求特定问题答案的成熟的研究人员。 —— Irina Ioana Mohorianu, zbMATH
— 没有更多了 —
以下为对购买帮助不大的评价