2.1.3分层抽样例1:假设某地区有高中生2400人,初中生10900人,小学生11000人.此地区探究小学初中高中年级020406080近视率/%教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?你认为哪些因素可能影响学生的视力?设计抽样方法时需要考虑这些因素吗?学段对视力有影响问题1:请问例1中的总体是什么?总体可看成由几部分组成?总体中的个体数是多少?问题2:1%的样本是什么含义?问题3:请问例1中样本可看成由几部分组成?问题4:你怎么从各部分中抽取样本?为什么要这样取各个学段的个体数?【分析】因为样本容量与总体中的个数的比是1:100,所以样本中包含的个部分的个体数分别是2400/100,10900/100,11000/100,即抽取24名高中生,109名初中生和110名小学生作为样本。这样从学生人数这个角度来看,样本结构与总体结构基本相同。问题5:什么是分层抽样?一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫作分层抽样。概念解读注意:(2)分层抽样要保持样本结构与总体结构的一致性。(1)当总体是由差异明显的几部分组成时,往往选用分层抽样。应用分层抽样应遵循以下要求:(1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样或系统抽样,每层样本数量与每层个体数量的比与样本容量与总体容量的比相等。二、分层抽样的步骤:(1)按某种特征将总体分成互不相交的层(2)按比例k=n/N确定每层抽取个体的个数(n/N)*Ni个。(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。练习:分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行()A、每层等可能抽样B、每层不等可能抽样C、所有层按同一抽样比等可能抽样例2、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()A.15,5,25B.15,15,15C.10,5,30D15,10,20例3:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层。(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。300×3/15=60(人),300×2/15=100(人),300×2/15=40(人),300×2/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60人。(3)将300人组到一起,即得到一个样本。探究?比较简单随机抽样、系统抽样、分层抽样的优点、缺点及适用范围类别简单随机抽样系统抽样分层抽样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样共同点各自特点从总体中逐个抽取将总体均分成几部分,按预先制定的规则在各部分抽取将总体分成几层,分层进行抽取联系在起始部分样时采用简随机抽样分层抽样时采用简单随机抽样或系统抽样适用范围总体个数较少总体个数较多总体由差异明显的几部分组成例4:某校有在校高中生1350人,高一,高二、高三学生人数和男、女生分布情况如下表:年级人数男生女生高一450240210高二440240200高三460240220问:如果想通过抽查学校中10%学生来调查学生身高,以了解青少年生长发育情况,应采用怎样的抽样方法?如何抽样?问题6:分层抽样的具体步骤是什么?步骤1:根据已经掌握的信息,将总体分成互不相交的层步骤2:根据总体的个体数N和样本容量n计算抽样比k=n:N步骤3:确定每一层应抽取的个体数目,并使每一层应抽取的个体数目之和为样本容量n步骤4:按步骤3确定的数目在各层中随机抽取个体,合在一起得到容量为n样本分层求比定数抽样练习P62练习1.2.3目标检测(1)某校有1000名学生,其中O型血的有400人,A型血的人有250人,B型血的有250人,AB型血的有100人,为了研究血型与色弱的关系,要从中抽取一个40人的样本,按分层抽样,O型血应抽取的人数为___人,A型血应抽取的人数为___人,B型血应抽取的人数为___人,AB型血应抽取的人数为___人。(2)某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()A.简单随机抽样B.系统抽样C.分层抽样(2)某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()A.简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除1人,然后再分层抽样3、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,若该校取一个容量为n的样本,每个学生被抽到的可能性均为0.2,则n=。4、对某单位1000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:任职年限5年以下5年至10年10年以上人数300500200试利用上述资料设计一个抽样比为1/10的抽样方法。5、在下列问题中,各采用什么抽样方法抽取样本较为合适?(1)8台电视机中抽取2台进行质检;(2)某礼堂有32排座位,每排40个座位(座位号为1到40),一次报告会坐满了听众,会后为听取意见留下了座位号为18的所有32名听众进行座谈;(3)某学院有四个不同环境的生化实验室、分别养有18、24、54、48只小白鼠供实验用,某项实验需抽取24只小白鼠。6、我校高一年级某班有50名同学,某次单元测试后老师要了解学生对这部分知识的掌握情况,从50份试卷中抽取10份进行详细分析,已知这次考试中60分以下10人,60分到80分25人,80分以上15人,现分别用下列方法得到样本:(1)50份试卷中随意抽出10份作为样本;(2)按照学生学号(假设是按学生入学成绩编制的),用掷骰子的方法在前5名学生中任选一名,用i表示该名学生的学号。将学号中为(i+5k)(k=1、2、3,···)的学生抽出作为样本;(3)分别从60分以下试卷中抽2份,60分到80分中抽5份,80分以上抽3份,把这10份试卷组成样本;这里运用了三种抽样方法,分别是(1)———;(2)———;(3)——7、在下列问题中,各采用的抽样方法抽取样本的代表性如何?如果不够好的话,你有什么改进的建议?(1)某校高二年级有260名学生,学校需要20名学生进行心理测验.有20名志愿者主动参加;(2)考察我校门对面马路上的车流量,每隔7天记录一次;(3)某校有在校高中生1000人,高一,高二、高三学生人数之比是4:3:3,今要调查学生的身高情况,需抽取100人作为样本,则从高一,高二、高三学生中分别抽取40人、30人、30人组成样本。小结•分层抽样的定义•分层抽样的步骤•步骤1:•步骤2:•步骤3:•步骤4:分层求比定数抽样1、用随机数表进行抽样有以下几个步骤,这些步骤的先后顺序应为①将总体中的个体编号②获取样本号码③选定开始的数字④确定读数的方向A.①②③④B.①③④②C.③②①④D.④③①②2、要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法,确定所选取的5枚导弹的编号可能是()A、5、10、15、20、25B、3、13、23、33、43C、1、2、3、4、5D、2、4、8、16、22课堂练习3、某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n的样本;已知从女学生中抽取的人数为80人,则n=_____________【能力提高】1.(2004年全国高考天津卷)某工厂生产A、B、C三种不同型号的产品,产品数量之比为2:3:5,现用分层抽样方法抽取一个容量为n的样本,样本中A型产品有16种,那么此样本容量n=_______.802、某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本;如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为___.分析:总体容量N=36(人)当样本容量为n时,系统抽样间隔为36/n∈N,所以n是36的约数;分层抽样的抽样比为n/36,求得工程师、技术员、技工的人数分别为n/6,n/3,n/2,所以n应是6的倍数,当样本容量为n+1时,总体中先剔除1人还有时35人,系统抽样间隔为35/(n+1)∈N,所以n只能是6.6所以n=6或12或18.课堂小结1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。