正版保障 假一赔十 可开发票
¥ 25.04 6.4折 ¥ 39 全新
库存2件
作者樊玲,曹聪
出版社北京邮电大学出版社有限公司
ISBN9787563562527
出版时间2020-10
装帧平装
开本16开
定价39元
货号10840861
上书时间2024-01-24
第3章
抽
样
样本(Sampie)是从总体中抽出的一部分个体。样本中所包含的个体数目称样本容量或含量,用符号N或”表示。样本有大小之分,大样本(Large Sample)的容量一般在30以上,小样本(Small Sampie)的容量在30以下。一般而言,样本越大从总体中提取的信息就越多,对总体的代表性就越好,因此一般情况都抽取大样本进行研究。
抽样又称取样,是指从待研究的总体中抽取一部分个体作为样本,对这些样本进行分析、研究以此来估计和推断总体特性的过程。抽样是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法,抽样的基本要求是要保证所抽取的样本对总体具有充分的代表性。样本作为总体的缩影,因此选取样本的过程必须非常谨慎,否则就会对总体的判断造成很大的偏差。
1936年,民主党人罗斯福担任美国总统期满,共和党人兰登与他竞选总统。当时著名的杂志《文学摘要》组织大约240万人参加了预测谁是下一任总统的民意测验,结果预测兰登将以57%对43%的优势获胜。当时《文学摘要》杂志影响力很大,自1916年之后的连续五届总统选举中,《文学摘要》杂志都正确地预测出获胜的一方。而当时名不见经传的盖洛普刚刚成立盖洛普民意调查研究所,他们根据一个约5万人的样本得出了不一样的结论,预测罗斯福会以56%对44%的优势获胜。
在这次竞选总统的预测调研中,《文学摘要》杂志样本远远大于盖洛普民意调查的样本量,那么是不是样本数大结果就更加准确呢?实际的结果却是,罗斯福以62%对38%的优势胜出。从常理来看,《文学摘要》调查的样本量比盖洛普高达几十倍,样本越多,结论不是应该更可靠吗?罗斯福的实际得票率为62%,《文学摘要》杂志的预测为43%,误差达到19%。《文学摘要》杂志的大样本调查为什么反而出现更大的误差呢?
后来经过研究发现,出现偏差的主要原因在于《文学摘要》杂志选取样本有偏性。《文学摘要》杂志是根据电话簿和俱乐部会员的名册,将问卷邮寄给1 000万人。当时美国四个家庭中仅有一家装电话,这样《文学摘要》杂志选取的样本有排斥穷人的选择偏性,所以《文学摘要》杂志的民意测验非常不利于民主党人罗斯福,结论出现了比较大的偏差。此外,《文学摘要》杂志调查的1(000万人中只有240万人回答了问卷,不回答者可能非常有别于回答者,这240万人代表不了被邮寄问卷的1(000万人。所以当出现不回答率偏高的时候,谨防不回答偏性。
因此,我们在进行抽样时,必须充分考虑样本对总体的代表性。明确调查对象总体的内涵和外延,选择恰当的抽样方法,最后还需评估样本质量。
3.1
抽样方法
抽样方法可简单地分为两大类:概率抽样和非概率抽样。
概率抽样又称为随机抽样,总体中哪个成员被抽取完全取决于客观机会,任何一个个体被抽中都属于相互独立的随机事件,例如简单随机抽样、整群抽样。
非概率抽样则是有意识地选取样本的抽样方法,样本的抽取往往不随机,例如周期抽样。
还有一些综合型的抽样方法,将概率抽样与非概率抽样结合在一起,例如等距抽样、分层抽样。具体的方法在后面会一一介绍。
抽样是少数样本代替总体进行研究的过程,因此一定会产生误差。样本的误差按其性质可以分为两类:一类是抽样误差,它是由于抽选样本的随机性而产生的误差。只有采用概率抽样的方式才可能估计抽样误差。另一类是非抽样误差,它是指除抽样误差以外的、由于各种原因而引起的误差。在概率抽样、非概率抽样和全面调查中,非抽样误差都有可能存在。
如果采用了概率抽样方法,那么我们可以估计出抽样误差的大小,还可以通过选择样本量的大小来控制抽样误差。在谨慎执行的抽样调查中,抽样误差通常不大。而非抽样误差相对比较难以估计和控制。下面我们具体来看一下抽样的方法。
3.1.1
简单随机抽样
一般的,设一个总体个数为N,如果通过逐个抽取的方法抽取一个样本,且每次抽取时,每个个体被抽到的概率相等,这样的抽样方法为简单随机抽样,也称为纯随机抽样。简单随机抽样是其他抽样方法的基础,适用于总体个数较少的情况,也可以作为综合抽样中部分样品的抽样方法。简单随机抽样又分为重复抽样与不重复抽样。
重复抽样又称放回式抽样,每次从总体中抽取的样本经检验之后,又重新放回总体,参加下次抽样。E:xcel可以通过随机函数与随机数发生器生成随机数实现简单随机抽样。
不重复抽样也叫作不重置抽样、无放回抽样。不重复抽样是从总体中每抽取一个样本后,不再将其放回总体内,因而任何单位一经抽出,就不会有再被抽取的可能性。不重复抽样中,每个样本最多只有一次被抽中的机会。随着抽中样本个数的不断增多,剩下的样本被抽中的机会不断增大(条件概率)。一般来说,不重复抽样的误差小于重复抽样的误差。当总体个数较大时,我们用重复抽样近似不重复抽样。
简单随机抽样在整个抽样过程中完全遵循随机原则,因此在Excel中要实现简单随机抽样,有以下四种方法。
1.使用RAND函数进行抽样
RAND函数的功能是产生大于等于0及小于1的平均分布随机数,每次计算工作表时都将返回一个新的随机实数。其表达式为
RAND()函数无参数。
如果要使用RAND函数生成一个随机数,并且使之不随单元格计算而改变,可以在编辑栏中输入“一RAND()”,保持编辑状态,然后按F9键,将公式永久性地改为随机数。对于多个包含RAND()函数的单元格,也可以复制后,使用“选择性粘贴”对话框中“粘贴”组的“数值”选项(如图3 1所示),将随机函数的值保存在指定单元格内。......
— 没有更多了 —
以下为对购买帮助不大的评价