• 复杂数据统计方法——基于R与Python(第4版)
21年品牌 40万+商家 超1.5亿件商品

复杂数据统计方法——基于R与Python(第4版)

全新正版 假一赔十 可开发票

37.6 7.7折 49 全新

库存6件

北京海淀
认证卖家担保交易快速发货售后保障

作者吴喜之,张敏

出版社中国人民大学出版社

ISBN9787300307268

出版时间2022-07

装帧平装

开本16开

定价49元

货号1202706479

上书时间2024-05-26

轻阅书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
第1章 引言

1.1 作为科学的统计

1.1.1 统计应该是科学,但发展成两种文化

1.1.2 从模型驱动主导的现实转向数据驱动的未来

1.1.3 关于统计显著性和p值

1.2 数据分析的实践

1.3 数据和变量

1.3.1 变量和观测值

1.3.2 变量的种类

1.3.3 有监督学习:具有目标变量的预测模型

1.3.4 无监督学习:没有目标变量,为探索数据间结构的模型

1.4 R软件及Python软件

第一部分 经典统计篇

第2章 经典线性模型

2.1 简单最小二乘线性回归回顾

2.1.1 基于数据的最小二乘线性回归

2.1.2 传统统计模型驱动的线性模型

2.1.3 线性最小二乘回归的拟合

2.1.4 线性最小二乘回归的预测及交叉验证

2.1.5 对例2.1回归的6个模型交叉验证比较

2.2 线性模型没有“可解释性”

2.2.1 例2.1的多自变量和单自变量线性回归系数比较

2.2.2 随机生成的独立变量数据回归的多自变量和单自变量线性回归系数比较

2.3 “多重共线性”及“线性相关”在数学及统计学中的不同含义

2.3.1 矩阵的秩以及在数学及统计学中“多重共线性”的不同含义

2.3.2 线性回归中统计多重共线性的度量

2.4 传统统计对自变量统计多重共线性的应对方法

2.4.1 岭回归

2.4.2 lasso回归

2.4.3 偏最小二乘回归

2.5 关于分类自变量的截距效应

2.5.1 直接用软件函数计算参数估计

2.5.2 把分类变量哑元化后用式(2.1.4)计算参数估计

2.6 损失函数及分位数回归简介

2.7 生存分析数据的Cox回归模型

2.8 本章的Python代码

2.8.1 2.1节的代码

2.8.2 2.2节的代码

2.8.3 2.4节的代码

2.8.4 2.6节的代码

2.8.5 2.7节的代码

第3章 广义线性模型方法

3.1 广义线性模型简单回顾

3.1.1 作为特例的正态线性模型

3.1.2 一般情况

3.2 logistic回归

3.2.1 logistic回归模型参数估计

3.2.2 logistic模型的预测

3.2.3 阀值的选择及ROC曲线

3.2.4 例3.1数据的logistic方法和决策树分类的交叉验证比较

3.3 多项logit模型

3.3.1 多项logit模型回顾

3.3.2 多项logit模型对简单数据的拟合

3.3.3 例3.2数据的多项logit方法和机器学习分类方法的交叉验证比较

3.3.4 多项logit对嵌套数据的处理

3.3.5 例3.3数据的多项logit方法和机器学习分类方法的交叉验证比较

……

内容摘要
数据主导的学习方式有助于读者理解数据科学的本质,读者可以通过分析数据学会多种统计方法的应用。本书以数据形式为导向,对应不同的数据形式介绍可能使用的一些统计方法。这些统计方法可能属于不同的模型和统计方向,但只要适用于同一类数据,本书就尽量都予以介绍,以此启发读者探索及创新。 本书初版以来,在广大读者的支持和鼓励下,10年间不断更新。第4版在第3版的基础上做了增补及修正,并且重新安排了部分章节。本书始终坚持以下特色: 用实际数据做案例,这些数据都是真实的,有理论及应用方面的背景,而且能从网上下载。 书中所有结论都可以通过Python与R软件得出,并给出所有例子的代码。 没有太多数学公式,但能让读者直观理解各种方法的含义。 宗旨是训练处理不同数据的动手能力,面不是面面俱到地告知所有细节。 本书适合用作统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业本科生、硕士生及博士生的教材,也可作为各领域的实际工作者的参考用书。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP