三种抽样方法数理统计是研究如何有效地收集,整理,分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。它是一门应用性很强的学科,凡是有大量数据出现的地方,都要用到数理统计。现在,数理统计的内容已异常丰富,成为数学中最活跃的学科之一。教科书选择了数理统计中最基本问题来介绍这门学科的思想与方法。数理统计所要解决的问题是如何根据样本来推断总体,第一个问题就是采集样本,然后才能作统计推断。注意以下四点:(1)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;(4)它是一种等概率抽样。简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。如果用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概卒等于Nn一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。1、简单随机抽样抽签法简单随机抽样的方法:随机数表法练习:将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。分析并说明整个抽签过程中每个同学被抽到的概率是相等的。1、抽签法先将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。2、用随机数表法进行抽取随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。(2)随机数表并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。(3)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。随机数表法例下面举例说明如何用随机数表来抽取样本。为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行:第一步,先将40件产品编号,可以编为00,01,02,,38,39。第二步,在附录1随机数表中任选一个数作为开始,例如从第8行第9列的数5开始,为便于说明,我们将附录1中的第6行至第10行摘录如下。1622779439495443548217379323788735209643842634916484421753315724550688770474476721763350258392120676630163785916955567199810507175128673580744395238793321123429786456078252420744381551001342996602795457608632440947279654491746096290528477270802734328第三步,从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34。至此,10个样本号码已经取满,于是,所要抽取的样本号码是16191012073938332134注将总体中的N个个体编号时可以从0开始,例如N=100时编号可以是00,01,02,99,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表。注:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。在上面每两位、每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的。因而利用随机数表抽取样本保证了各个个体被抽取的概率相等。由于每排的座位有40个,各排每个号码被抽取的概率都是,因而第1排被抽取前,其他各排中各号码被抽取哪率也是,也就是说被抽取的概率是,每排的抽样也是简单随机抽样,这种抽样的方法是系统抽样。401401401(1)一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为系统抽样。2.系统抽样系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔k。是整数时,;不是整数时,从N中剔除一些个体,使得其为整数为止。nNnNknN(3)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:l;l+k;l+2k;……l+nk系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的;如总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。需要说明的是整个抽样过程中每个个体被抽到的概率仍然相等。例如,为了了解参加某种知识竞赛的1000名学生的成绩,打算从中抽取一个容量为50的样本。假定这1000名学生的编号是1,2,…,1000,由于50:1000=1:20,我们将总体均分成50个部分,其中每一部分包括20个个体,例如第1部分的个体编号是1,2,…,20。然后在第一部分随机抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998在上面的抽样中,由于在第1部分(个体编号1~20)中的起始号码是随机确定的,每个号码被抽取的概率都等于0.05,所以在抽取第1部分的个体前,其他各部分中每个号码被抽取的概率也都是0.05.就是说,在这个系统抽样中,每个个体被抽到的概率都是0.05.思考1:下列抽样中不是系统抽样的是()A、从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样;B、工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验;C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止;D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈。C思考2:从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25B、3,13,23,33,43C、1,2,3,4,5D、2,4,6,16,32B思考3:从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为()A.99B、99.5C.100D、100.5C思考4:某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是抽样方法。系统思考5:采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为_________.思考6:从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000个再按系统抽样的方法进行,则每人入选的机会()A.不全相等B.均不相等C.都相等D.无法确定C1083系统抽样与简单随机抽样比较,有何优、缺点?点评:(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;(2)系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部男生或全部女生.(3)系统抽样比简单随机抽样的应用范围更广.3.分层抽样•当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样。其中所分成的各部分叫做层。由于分层抽样的要求不同,各层的抽样的样本容量也不相同,所以,应当按照实际情况,合理地将样本容量分配到各个层,以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随机抽样。这种方法较充分地利用了总体己有信息,是一种实用、操作性强的方法。分层抽样的一个重要问题是一个总体如何分层。分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。例如一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?分析:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;35~49岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。解:抽取人数与职工总数的比是100:500=1:5,则各年龄段(层)的职工人数依次是125:280:95=25:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、35~49岁、50岁以上的三个年龄段分别抽取25人、56人和19人。思考1、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()A.15,5,25B.15,15,15C.10,5,30D15,10,20思考2:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。D解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层。(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。300×3/15=60(人),300×2/15=100(人),300×2/15=40(人),300×2/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60人。(3)将300人组到一起,即得到一个样本。练习:分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行()A、每层等可能抽样B、每层不等可能抽样C、所有层按同一抽样比等可能抽样c分层抽样的抽取步骤:(1)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。4.三种抽样方法的比较课堂练习1、某单位有老年人28人,中年人54人,青年人81人,为了调查他