总体、样本和抽样方法情境一:某校高中学生有900人,校医务室想对全校高中学生的身高情况做一次调查,为了不影响正常教学活动,准备抽取50名学生作为调查对象.你能帮医务室设计一个抽取方案吗?总体:我们一般把所考察对象的某一数值指标的全体作为总体.个体:构成总体的每一个元素作为个体.样本:从总体中抽出若干个体所组成的集合叫样本.样本容量:样本中所包含的个体数量叫样本容量.说出这次调查中的总体、个体、样本和样本容量分别是什么.情境二:在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿和罗斯福谁将当选下一届总统.为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有),通过分析收回的调查表,显示兰顿非常受欢迎.于是此杂志预测兰顿将在选举中获胜.候选人预测结果选举结果兰顿5738罗斯福4352实际选举结果正好相反,最后罗斯福在选举中获胜.其数据如下:为什么实际选举结果与预测相反?问题:如何抽样才能正确估计总体?⑴抽样时要保证每一个个体都可能被抽到;满足这样条件的抽样就是随机抽样.⑵每一个个体被抽到的机会是均等的.注意(1)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;(4)它是一种等概率抽样。一般地,从元素个数为N的总体中逐个、不放回地抽取容量为n的样本,如果每次抽取时各个个体被抽到的概率相等,这样的抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。1、概念(一)简单随机抽样抽签法、随机数表法2、简单随机抽样的方法:(1)抽签法ⅰ步骤①将总体中的所有个体(共N个)编号(号码可以从1到N),对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。②把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。③抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。。方案:①将这100支日光灯管编号;②把这100个号分别写在相同的100张纸片上;③将100张纸片放在一个箱子中搅匀;④按要求随机抽取号签,并记录;⑤将编号与号签一致的个体抽出.例:从一个100支日光灯管的总体中,用不放回的方法抽取10支日光灯管构成一个简单随机样本.⑴抽签法:编号制签搅拌均匀逐个不放回抽取步骤:ⅱ优缺点优点:简单易行缺点:仅适用于个体数较少的总体。当总体个数较多时,搅拌得有可能不均匀,导致抽样不公平。费时费力。例:要考察某种品牌的850颗种子的发芽率,从中抽取10颗种子作为样本进行试验.第一步,先将850颗种子编号,可以编为001,002,…,850.由于需要编号,如果总体中的个体数太多,采用随机表法进行抽样就显得不太方便了第二步,在随机数表中任选一个数作为开始,例如从第1行第1列的数4开始.为了保证所选定数字的随机性,应在面对随机数表之前就指出开始数字的纵横位置第三步,获取样本号码.不大于850且不与前面重复的取出,否则就跳过不取,如此下去直到得出10个三位数48628500893815569882277617390353014987204157179413536660891248395326163490563640579317232849195176990062079613299019236438659645262023629793090639939898246189579196513529971689729968402683788920167871011141904800895917709593431491725293998045750141554141051595899838233096809938779281884875459384849030009185735893435285146843526044253645176612814585646878477197114939086557033972155393112656349822157837970304756498682928720572751069525678608801560331238954193470807892343732582360086335233977375483(2)随机数表法ⅰ(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。(2)随机数表并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。(3)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素注意ⅱ优缺点优点简单易行,很好地解决了当总体个数较多时抽签法制签难的问题。缺点当总体个数很多,需要的样本容量也很大时,用此法很不方便当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为系统抽样,也被称为等距抽样。1、概念系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的;若总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。说明(二)系统抽样2、步骤(1)先将总体中的N个体编号.有时可直接利用个体自身所带的号码.(2)根据样本容量n把总体均分为n段,确定分段间隔k。是整数时,;不是整数时,先从N中随机剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:l,l+k,l+2k,……l+(n-1)k3、适用情况总体容量较大,并且个体之间无明显差异引例2为了了解高一年级12000名学生的数学成绩,需要抽取容量为120的样本,用简单随机抽样还方便吗?请用合适的方法抽取.解:(1)对全体学生的数学成绩进行编号:1,2,3……,12000.(2)分段:由于样本容量与总体容量的比是1:100,我们将总体平均分为120个部分,其中每一部分包含100个个体.(3)在第一部分即1号到100号用简单随机抽样,抽取一个号码,比如是50.(4)以50作为起始数,然后顺序抽取150,250,350,…..11950.这样就得到容量为120的一个样本.5、系统抽样与简单随机抽样的比较类别特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取系统抽样在起始部分抽样时,采用简单随机抽样。总体个数较少在抽样过程中每个个体被抽到的可能性相等系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分抽取总体个数较多且分布均衡6、方法取舍(1)当总体个数较少,样本容量也较小时(2)当总体个数较多,样本容量较小时(3)当总体个数较多,样本容量也较大时抽签法或随机数表法随机数表法系统抽样法分层抽样引例3某中学有学生900名,已知高一有400名学生,高二300名,高三200名。为了考察他们的体重情况,如何抽取容量为45的一个样本?分析:“900名学生的体重”这一总体是由高一、高二、高三学生的体重三部分组成,这三部分有明显的差别。我们可以把总体分成三“层”,在各层中按比例进行简单随机抽样或系统抽样!例、一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?分析:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;35~49岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。