2.1.3分层抽样分层抽样[提出问题]某市为调查中小学生的近视情况,在全市范围内分别对小学生、初中生、高中生三个群体抽样,进而了解中小学生的总体情况和三个群体近视情况的差异大小.问题1:上述问题中样本总体有什么特征?提示:此总体,小学生、初中生、高中生三个群体在年龄、体质等方面存在着明显的差异.问题2:若采用抽签法或系统抽样法会出现什么结果?提示:抽取的样本可能集中于某一个群体,不具有代表性.问题3:为使抽取的样本更合理,更有代表性,有更好的抽样方法解决该问题吗?提示:有.可分不同群体抽取.[导入新知]1.分层抽样的概念在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.[化解疑难]简单随机抽样、系统抽样、分层抽样的联系和区别类别简单随机抽样系统抽样分层抽样各自特点从总体中逐个抽取将总体均分成几个部分,按事先确定的规则在各部分抽取将总体分成几层,分层进行抽取相互联系在起始部分采用简单随机抽样在各层抽样时采用简单随机抽样或系统抽样适用范围总体中的个体数较少总体中的个体数较多总体由存在明显差异的几部分组成共同点①抽样过程中每个个体被抽到的可能性相等;②每次抽出个体后不再放回,即不放回抽样分层抽样的概念[例1](1)某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适()A.系统抽样法B.简单随机抽样法C.分层抽样法D.随机数法(2)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行()A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽个体数量相同[解析](1)总体由差异明显的三部分构成,应选用分层抽样.(2)保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽取.[答案](1)C(2)C[类题通法]1.使用分层抽样的前提分层抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.2.使用分层抽样应遵循的原则(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.[活学活用]下列问题中,最适合用分层抽样抽取样本的是()A.从10名同学中抽取3人参加座谈会B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C.从1000名工人中,抽取100名调查上班途中所用时间D.从生产流水线上,抽取样本检查产品质量解析:选BA中总体个体无明显差异且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,适合用系统抽样;B中总体个体差异明显,适合用分层抽样.分层抽样的应用[例2](1)将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取________个个体.[解析]∵A,B,C三层个体数之比为5∶3∶2,又有总体中每个个体被抽到的概率相等,∴分层抽样应从C中抽取100×210=20.[答案]20(2)一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.[解]因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法.具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层.(2)按照样本容量的比例求得各乡镇应抽取的人数分别为60人、40人、100人、40人、60人.(3)按照各层抽取的人数随机抽取各乡镇应抽取的样本.(4)将300人合到一起,即得到一个样本.[类题通法]1.分层抽样的步骤2.确定每层抽取的个体数的方法(1)已知总体容量、样本容量及各层的个体数时,首先确定抽样比nN,其中N为总体容量,n为样本容量;然后确定每层抽取的个体的个数ni=Ni×nN,其中Ni为第i(i=1,2,…,k)层的个体数,ni为第i层应抽取的样本数.(2)已知各层个体数之比为m1∶m2∶…∶mk,样本容量为n时,每层抽取的个体数为ni=n×mim1+m2+…+mk.[活学活用]某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层抽样的方法从中抽20人,各年龄段分别抽取的人数为()A.7,5,8B.9,5,6C.7,5,9D.8,5,7解析:选B由于样本容量与总体个体数之比为20100=15,故各年龄段抽取的人数依次为45×15=9(人),25×15=5(人),20-9-5=6(人).三种抽样方法的综合应用[例3]某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3000名初中生、4000名高中生中做问卷调查,如果要在所有答卷中抽出120份用于评估.(1)应如何抽取才能得到比较客观的评价结论?(2)要从3000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?(3)为了从4000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取到所需的样本?[解](1)由于这次活动对教职员工、初中生和高中生产生的影响不会相同,所以应当采取分层抽样的方法进行抽样.因为样本容量=120,总体个数=500+3000+4000=7500,则抽样比:1207500=2125,所以有500×2125=8,3000×2125=48,4000×2125=64,所以在教职员工、初中生、高中生中抽取的个体数分别是8、48、64.分层抽样的步骤是:①分层:分为教职员工、初中生、高中生,共三层.②确定每层抽取个体的个数:在教职员工、初中生、高中生中抽取的个体数分别是8、48、64.③各层分别按简单随机抽样或系统抽样的方法抽取样本.④综合每层抽样,组成样本.这样便完成了整个抽样过程,就能得到比较客观的评价结论.(2)由于简单随机抽样有两种方法:抽签法和随机数法.如果用抽签法,要作3000个号签,费时费力,因此采用随机数表法抽取样本,步骤是:①编号:将3000份答卷都编上号码:0001,0002,0003,…,3000.②在随机数表上随机选取一个起始位置.③规定读数方向:向右连续取数字,以4个数为一组,如果读取的4位数大于3000,则去掉,如果遇到相同号码则只取一个,这样一直到取满48个号码为止.(3)由于4000÷64=62.5不是整数,则应先使用简单随机抽样从4000名学生中随机剔除32个个体,再将剩余的3968个个体进行编号:1,2,…,3968,然后将整体分为64个部分,其中每个部分中含有62个个体,如第1部分个体的编号为1,2,…,62.从中随机抽取一个号码,如若抽取的是23,则从第23号开始,每隔62个抽取一个,这样得到容量为64的样本:23,85,147,209,271,333,395,457,…,3929.[类题通法]选择抽样方法的步骤及注意事项(1)选择抽样方法的步骤:第一步,看总体是否由差异明显的几个层次组成.若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样.第二步,看总体容量和样本容量的大小.当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样.(2)注意事项:①弄清三种抽样方法的使用范围和实际情况是灵活选用抽样方法的前提.②三种抽样都是等可能抽样.③简单随机抽样是系统抽样和分层抽样的基础,三种抽样方法经常交叉使用.例如,在分层抽样中,各层抽样时可采用系统抽样或简单随机抽样.在系统抽样中,起始部分可采用简单随机抽样.[活学活用]为了评估某学校的教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行考察.为全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个教学班,并且每个班内的学生按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的学习成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中共抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?按每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中,各自采用何种抽样方法?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.解:(1)上面三种抽取方式中,其总体都是高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的100名学生本学年的考试成绩,样本容量为100.(2)上面三种抽取方式中,第一种方式采用的是简单随机抽样法;第二种方式采用的是系统抽样法和简单随机抽样法;第三种方式采用的是分层抽样法和简单随机抽样法.(3)第一种方式抽样的步骤如下:第一步,在这20个班中用抽签法任意抽取一个班;第二步,从这个班中按学号用随机数法或抽签法抽取20名学生,考察其考试成绩.第二种方式抽样的步骤如下:第一步,在第一个班中,用简单随机抽样法任意抽取某一学生,记其学号为a;第二步,在其余的19个班中,选取学号为a的学生,共计20人.第三种方式抽样的步骤如下:第一步,分层.由于按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,故在抽取样本时,应把全体学生分成三层;第二步,确定各个层抽取的人数.由于样本容量与总体的个体数的比为100∶1000=1∶10,故在每层抽取的个体数依次为15010,60010,25010,即15,60,25;第三步,按层分别抽取.在优秀生中用简单随机抽样法抽取15人;在良好生中用简单随机抽样法抽取60人;在普通生中用简单随机抽样法抽取25人.5.抽样方法中考虑不全致误[典例]某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为________.[解析]总体容量N=36.当样本容量为n时,系统抽样间隔为36n∈N*,所以n是36的约数;分层抽样的抽样比为n36,求得工程师、技术员、技工的抽样人数分别为n6、n3、n2,所以n应是6的倍数,所以n=6或12或18或36.当样本容量为n+1时,总体中先剔除1人时还有35人,系统抽样间隔为35n+1∈N*,所以n只能是6.[答案]6[易错防范]1.若没有考虑样本容量为n+1时的变化情况,会得到n=6或12或18或36的错误结论.2.样本容量增加1个个体,若总体没有剔除1人,没有考虑到系统抽样的间隔为35n+1∈N*,而是利用n+1是36的约数,则易得n=5,从而导致解题错误.[成功破障]某企业三月中旬生产A,B,C三种产品共3000