批量上传,套装书可能不全,下单前咨询在线客服! 正版书 !!!
¥ 68.97 5.0折 ¥ 139 全新
库存118件
作者陈文贤
出版社清华大学出版社
ISBN9787302593515
出版时间2022-05
装帧平装
开本16开
定价139元
货号29403294
上书时间2024-10-20
百闻不如一见,兵难隃度,臣愿驰至金城,图上方略。
—《汉书·赵充国传》公元前61年
千言不如一图。(One picture is worth a thousand words.)
—F. R. Barnard 1921
没有图画或对话的书,有什么用?(What is the use of a book without pictures or
conversations?)
—刘易斯·卡罗《爱丽丝梦游仙境》1865
统计学因为计算机的普及,在教程与教学方法方面有结构性的改变,尤其是有关
“数学计算”或“图形显示”的课程。这些教程应该附有应用软件的使用以配合教学。
“统计学”就是有数学计算与图形显示的课程。本书附有《中文统计》软件,在
Excel上安装“加载项”操作,还有 R 语言—以数据分析为主要目的的程序语言。
统计软件并非计算机辅助教学(CAI),因为它们并非“教你学会统计”,而是你“学
会了统计”以后再来用它。有了统计软件以后,大多数的统计问题,只要选择统计功能
(菜单),输入数据,就可以得到答案。虽然 R 语言没有菜单,但是绘图功能强,又有强大
的支持软件包。使用统计软件要注意下列应用:
■能够判断统计数据应该(适合)用哪一个统计方法(模型)。
■了解并解释统计方法计算结果(答案)的意义。
学习要有地图,学习地图会告诉你:你在这里(here),要往那里去(where),如何去
(how),会得到什么(what),为什么这样走(why)。其中,here是当前课程,where是目的,
how是方法模型,what是答案,why是假定条件(为何适用这个方法)。
1980年Wonnacott 统计学第1章开头引用一句话:
“He uses statistics as a drunken man uses lampposts —for support rather than for
illumination.”
“人们利用统计,就好像醉汉利用路灯,是为了支撑,而不是照明。”
还有一个醉汉与路灯的故事:
一个醉汉在夜晚的路灯下找东西,有个路人问他在找什么,醉汉说:“钱包”。
路人就帮他找,两个人找了很久,但就是找不到。路人问:“你确定是掉在‘这里’
吗?”醉汉说:“我不知道掉在‘哪里’。”路人问:“为什么要在‘这里’找?”醉
汉说:“因为‘这里’有路灯比较亮。”钱包是答案,路灯是统计模型,‘哪里’是用
哪个模型。
II
大话统计学(溢彩实训版)—基于R语言 中文统计工具
利用统计学,要注意是否符合假定条件,不要削足适履,不要因为“这个”方法比
较熟悉、比较容易用,就要用它来找答案,结果找到的答案根本不对。
Statisticians, like artists,have the bad habit of falling in love with their models.
—George Box
统计学者像艺术家,有坏习惯:爱上他们的模型(模特儿)。
1976年统计学者、时间序列专家George Box说:
所有的模型都是错误的,但是有些是有用的。(All models are wrong, but some are
useful.)
40多年后的现在,这两句话应该改为:
所有的模型都是基于错误的。统计学是为了照明。
本书目标是统计学的航拍机、学习地图和交通工具,可以站在更高的视野,看得
广,走得对,跑得快。《大话统计学》不是说大话的统计学,而是让读者可以“大声说
话”的统计学。因为图表很多,所以也是“大画统计学”,但不是“漫画统计学”,而
是能让老师和计算机对话“对话统计学”。
本书特色
1. 本书前后连贯,有前言、总论、结语。后结语有统计问题分类、统计概念
复习。
2. 各章之间先后呼应。例如:从概率到抽样,从描述到推断,从检验到因果。
3. 每章也有连贯,开头有引言、概念图,结尾有流程图、思维导图。
4. 书中有许多阶层图、分类图、关联图、步骤图、流程图,以及因果表、比较表、
决策法则表等。
5.《中文统计》软件是在Excel (2016—2019版本适用)环境下,安装一个“加载
项”,输入统计数据资料,就可以得到统计结果。《中文统计》软件仅提供给教师和购
买本书的读者使用。
6.《中文统计》的功能列表(菜单),配合本书章节设计。输入原始数据(观测值),可
进行描述或推断统计的计算。如果只有样本容量、样本平均数、方差、比例等数据,有
“快速估计”或“快速检验”,可以得到推断结果。
7. 每章有例题、习题,为了节省篇幅,放在互联网供下载。
8. 补充教材,如分组资料描述统计、Bootstrap估计法、非参数统计补充、多因素方
差分析、多元回归等,也放在互联网。
9. 因为配合计算机程序,包括Excel函数和R语言,所有的统计公式和计算步骤,都
很清楚地一一列举出来。由于强调应用导向,所以多数公式没有证明。
10. 再版增加时间序列的Holt指数平滑ETS模型和Box自回归ARIMA模型。
大话统计学(溢彩实训版)—基于R语言 中文统计工具
表 《中文统计》软件的菜单
主菜单
次菜单
子菜单
1.描述统计
描述统计
原始数据,分组数据
位置量数
四分位数,Z分数,百分等级
区间尺度统计图
直方图,茎叶图,箱线图,多边形图
分类尺度统计图
饼图,条形图,帕累托图
散点图
2.时间序列
移动平均法,指数平滑法,趋势指数平滑,季节指数,
季节因素考虑,预测误差
3.统计指数
个体指数,简单指数(物价指数),简单指数(数量指数),加权指数(3个商品),
加权指数(4个商品),加权指数(5个商品)
4.概率理论
排列组合,贝叶斯定理,Monty Hall问题,贝叶斯公式计算
5.随机变量
一个离散型随机变量的统计值,两个离散型随机变量的统计值,
多个随机变量的线性组合
6.概率分布
离散型概率分布
二项,泊松,超几何,负二项,几何
连续型概率分布
正态,指数,卡方,t,F,对数正态,Weibull
正态分数qqplot,概率分布查表
7.抽样理论
随机数产生器,抽样(重置抽样),中心极限定理
8.区间估计(一个
总体)
z分布:总体均值估计;t分布:总体均值估计;z分布:总体比例估计;
卡方分布:总体方差估计,计算样本量,刀切法(Jackknife方法)
快速估计
z估计-均值,t估计-均值,总体方差估计,z估计-比例值,
总体比例值估计
9.假设检验(一个
总体)
z检验:总体均值检验;t检验:总体均值检验;z检验:总体比例检验;
卡方检验:总体方差检验,计算样本量
快速检验
z检验-均值,t检验-均值,总体方差检验,z检验-比例,
二项检验-比例
计算第二类错误、功效、QC曲线
均值检验,比例检验,方差检验
10.假设检验(两个
总体)
z检验:两个总体均值之差估计检验;t检验:两个总体均值之差(方差相等);
t检验:两个总体均值之差(方差不相等);t检验:配对样本总体均值之差;
z检验:两个总体比例之差;F检验:两个总体方差比;
McNemar检验:配对样本总体比例差检验
快速检验
均值差检验(总体方差已知),均值差检验(总体方差未知但相等),
均值差检验(总体方差未知且不等),比例值差检验(比例差=0),
比例值差检验(比例差<>0),F检验-双总体方差检定
11.方差分析
单因素方差分析,多重比较法,双因素方差分析:无重复(无交互作用),
双因素方差分析:有重复(有交互作用),Baetlett检验
快速检验
2总体,3总体,4总体,5总体,6总体,7总体,Hartley
12.相关与回归
一元线性回归,一元与多元线性回归,均值预测与个值预测,逆矩阵与行列
式相关系数与协方差,Dubin-Watson检验,逐步回归法,多元回归之偏相关
系数
V
前 言
主菜单
次菜单
子菜单
13.分类数据分析
拟合优度检验,列联表—独立性检验,列联表—独立性检验(原始数据),
卡方检验—正态分布检验,卡方检验—中位数检验
14.非参数统计
符号检验,Wilcoxon符号秩检验,游程检验,秩和检验,Friedman检验,
Kruskal-Wallis检验,Spearman秩相关系数,Lilliefors检验,快速检验与查表,
Bootstrap自助法估计,Kendall相关系数
R 语言安装说明
1. 下载R软件,到 www.r-project.org。
2. 在R 主页左上角 Download下单击 CRAN。
3. CRAN链接,选择一个镜像Mirrors链接地址,如 China 选项下的清华大学
https://mirrors.tuna.tsinghua.edu.cn/CRAN/
4. 选择Download R for Windows [或 Download R for Linux,Download R for (Mac) OS]。
5. 如果选择Download R for Windows,单击 base 基础包。
6. 单击Download R 4.0.3 for Windows,下载执行文件 R-4.0.3-win.exe ,安装 R。
7. 启动R,出现 R 的提示符 > ,开始 R的命令内容。
8. R的 # 表示文件批注,程序不会执行。
9. 一行多个表达式可以使用;号隔开,一个表达式可分成多行。
10.“ ”表示尚未输入完成,接续上一个命令,可按“Esc”键离开。
11.“↑”键可自动重复上一个命令,如果打错一个命令行,可以按此方法修改。
12. 对象(数据)名称是英文和数字加底线或句点,个字符是英文,大小写有
差异。
13. 创建对象用 <- 或 = 号,以“( )”括住命令直接显示数据。
14. 文件路径可写成 “C:/R/babies.txt” 或 “C:\\R\\babies.txt”。
15. 下载R 程序包 (packages) ,输入“> install.packages("arules")”选择一个镜像
链接。
16. 调用已安装的包,输入“> library(arules)”。
17. > if(!require(zoo)){install.packages("zoo")};library(zoo) # 若尚未下载R 包,则下
载并调用。数据的衡量尺度有定比尺度、定距尺度、定序尺度、定类尺度。R 语言是以
面向对象为主的程序设计语言,R的数据对象属性有数值(numeric)、整数(integer)、因子
(factor)、逻辑(logical)和字符串(character),数据对象结构有向量(vector)、因子(factor)、
矩阵(matrix)、数据框(data.frame)、数组(array)、列表(list)、时间序列(time series)等。
> install.packages("zoo") # 下载并安装R 程序包 zoo
> library(zoo) # 每次重新执行 R 要调用library载入包
续表
大话统计学(溢彩实训版)—基于R语言 中文统计工具
> if(!require(zoo)){install.packages("zoo")} ; library(zoo)
# 若尚未下载R 包,则下载并调用
> search() # 了解目前 R 工作空间已调用的 library
> AB <- read.csv("C:/STAT/Chap2_1.csv",header=F)
# 读入Excel数据 Chap2_1.csv,命名称为 AB
> str(AB) # 查看 AB 的数据结构,输出结果如下:
‘data.frame’: 30 obs. of 1 variable:
$ V1: int 25 32 35 35 35 36 40 42 44 46 ...
> CD <- as.matrix(AB) # 将数据框对象 AB 转换为矩阵对象 CD
> AB <- as.data.frame(CD) # 将矩阵对象CD 转换为数据框对象 AB
> write.csv(AB, file = "C:/ STAT/Chap2_1.csv")
# 保存AB 为Excel 数据命名为Chap2_1.csv
> aTSA::MA() # 调用包 aTSA 函数 MA
R语言的数据对象介绍,请见《大话数据科学》(清华大学出版社,2020年)。
统计学R语言程序包::函数
本书章节
R 语言 程序包::函数 Package::functions
1. 安装加载程序包
if(!require(qcc)){install.packages("qcc")} ; library(qcc)
2. 描述统计
stats::summary , mean , median , quantile , IQR , weighted.mean, var, sd
matrixStats::weightedMean , weightedMedian , weightedVar
spatstat.geom::weighted.quantile; modi::weighted.quantile; pastecs::stat.desc
DescTools::PercentRank, PlotQQ, SD; TSA:: skewness, kurtosis
EnvStats::geoMean, skewness, kurtosis; e1071:: skewness, kurtosis
SparkR::percent_rank; dplyr::percent_rank; fBasics:: skewness, kurtosis
graphics::hist, boxplot, pie; plotrix::pie3D; graphics::mosaicplot
aplpack::stem.leaf; qcc::pareto.chart; profvis::pause; ggpubr::ggviolin
3. 概率理论
LaplacesDemon::BayesTheorem; VennDiagram::venn.diagram
gtools::permutations; DescTools::CombN (请见C:/R-code/R_Chap3.doc)
4. 随机变量
discreteRV::RV, P, E, V, SD, SKEW, KURT
5. 概率分布
stats::dbinom, pbinom, qbinom, rbinom, dnorm, pnorm, qnorm, rnorm, ecdf
distr::Binom, Norm, Hyper, Pois, Td, Chisq, Fd, Exp, Geom, Unif
fitdistrplus::fitdist(x, "norm"), descdist; MASS::fitdistr (分布拟合)
正态分布检验
stats::shapiro.test, ks.test, qqnrom; nortest::ad.test, sf.test, cvm.test, lillie.test
moments::jarque.test , agostino.test (检验偏度); car::qqPlot
6. 抽样理论
base::sample
ConvergenceConcepts::investigate, generate, law.plot3d
7. 区间估计(一个总体)
stats::binom.test; epitools::binom.exact
exactci::binom.exact; boot::boot, boot.ci; PASWR::CIsim (模拟置信区间)
DescTools::MeanCI, MedianCI, MeanDiffCI, VarCI
“统计学”是兼具数学计算与图形可视化的课程,也是大数据、运筹学、数据挖掘、数据科学、统计计算、统计学习、机器学习、深度学习和人工智能等技术的基础学科。 目前学习统计学的难点在于先学理论还是先学统计工具。统计学的理论体系庞杂而精密,学习起来枯燥艰辛;而如果从统计工具应用上手,则会有其他问题出现,所有的统计软件(如SPSS),并非计算机辅助教学(CAI),它们并非“教你学会统计”,而是应该在“学会了统计”以后,再来用它。针对这个矛盾,《大话统计学溢彩实训版:基于R语言 中文统计工具》将从零开始接触统计学,利用自行开发的统计小工具配合理论学习,将其真正应用到工作中,稳步跟进大数据时代。 《大话统计学溢彩实训版:基于R语言 中文统计工具》内容前后连贯—从概率到抽样,从描述到推断,从检验到因果。全书思路清晰,用大量图表将内容贯穿到一起。形式上有引言、观念图、流程图、思维导图、阶层图、分类图、关联图、步骤图、流程图,以及因果表、比较表、决策法则表等。 《大话统计学溢彩实训版:基于R语言 中文统计工具》因图表和数据可视化的需要,采用彩色印刷,不仅可以更好地展示统计图表细节,更让《大话统计学溢彩实训版:基于R语言 中文统计工具》的各类流程图、思维导图等学习图谱更精准易读。 《大话统计学溢彩实训版:基于R语言 中文统计工具》专门的配套软件《中文统计》是在Excel(2003—2016版本适用)环境下,安装一个“加载项”,输入统计资料,就可以得到统计结果。另外,《大话统计学溢彩实训版:基于R语言 中文统计工具》提供PPT课件和代码。 《大话统计学溢彩实训版:基于R语言 中文统计工具》适合所有想掌握统计学的读者,也可以作为高校教材,由于内容较多,教师可自行选择教学内容。
陈文贤 加州大学伯克利分校(University of California, Berkeley)工业工程博士,台湾大学信息管理系教授兼系主任,雪城大学(Syracuse University)客座教授,悉尼科技大学(UTS)客座教授,德明财经科技大学信息管理系特聘教授。
第1章总论 · 1
1.1 统计是什么 ·2
1.2 统计学的基本概念 4
1.3 统计学的分类 6
1.4 抽样误差 7
1.5 统计数据的收集 ·9
1.6 变量与数据的衡量尺度 10
1.7
— 没有更多了 —
以下为对购买帮助不大的评价