2.1随机抽样2.1.1简单随机抽样第四高中数学备课组2014年3月第二章统计初步假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?引例:显然,你只能从中抽取一定数量的饼干作为检验的样本。(为什么?)那么,应当怎样获取样本呢?注意以下几点:(1)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;(4)它是一种等可能性抽样。一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样。简单随机抽样简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。如果用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概率等于Nn抽签法与随机数法是简单随机抽样的两种常用方法。=p思考?下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。1、抽签法(抓阄法)一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。抽签法的步骤:1、把总体中的N个个体编号;2、把号码写在号签上,将号签放在一个容器中搅拌均匀;3、每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?思考?抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平2、用随机数法定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。怎样利用随机数表产生样本呢?下面通过例子来说明,第一步,先将800袋牛奶编号,可以编为000,001,…,799。假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。1622779439495443548217379323788442175331572455068877047447676301637859169555671998105071753321123429786456078252420744385760863244094727965449174609628735209643842634916421763350258392120676128673580744395238791551001342996602795490528477270802734328第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。上述问题中抽取样本的方法用随机数表法来进行!随机数表法的步骤:(1)将总体的个体编号。(2)在随机数表中选择开始数字。(3)读数获取样本号码。练一练:总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.011、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是()A.总体是240B、个体是每一个学生C、样本是40名学生D、样本容量是402、为了了解加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()A、总体B、个体是每一个学生C、总体的一个样本D、样本容量3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是。练习二.系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。系统抽样有以下特征:(1)当总体容量N较大时,采用系统抽样。(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号。Nn思考?(1)下列抽样中不是系统抽样的是()A、从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样B工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈点拨:(2)c不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。系统抽样的一般步骤:(1)采用随机抽样的方法将总体中的N个个编号。(2)将整体按编号进行分段,确定分段间隔k(k∈N,L≤k).(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。【说明】从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。【例题精析】例3、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。[分析]按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号。解:按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生。采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293。例4、从记编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是A.5,10,15,20,25B、3,13,23,33,43C.1,2,3,4,5D、2,4,6,16,32[分析]用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求,故选B。练习:1、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为()A.99B.99,5C.100D.100,52、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体被剔除的可能性()和入样的可能性为()A.3/831/8B.3/83,10/83C.3/801/8D.3/80,10/833、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是抽样方法。抽签法2.简单随机抽样的方法:随机数表法注:随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素.小结一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。1.简单随机抽样的概念3、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:(1)采用随机的方法将总体中个体编号;(2)将整体编号进行分段,确定分段间隔k(k∈N);(3)在第一段内采用简单随机抽样的方法确定起始个体编号L;(4)按照事先预定的规则抽取样本。4、在确定分段间隔k时应注意:分段间隔k为整数,当不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。探究:某地区有高中生2400人,初中生10900人,小学生11000人.当地教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?样本容量与总体个数的比例为1:100,则高中应抽取人数为2400*1/100=24人,初中应抽取人数为10900*1/100=109人,小学应抽取人数为11000*1/100=110人.三.分层抽样上述抽样方法从学生人数这个角度来看,获得的样本结构与这一地区全体中小学生的结构是基本相同的.不仅保证了抽样的公平性,而且抽取的样本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样.一般地,若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本,这种抽样的方法是一种分层抽样.高中生8人,初中生36人,小学生37人.练习:某地区有高中生2400人,初中生10900人,小学生11000人.若用分层抽样从该地区抽取81名学生调查身体发育状况,那么高中生、初中生和小学生应分别抽取多少人?练习:某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本.思考1:该项调查应采用哪种抽样方法进行?思考3:在各血型具体如何抽样?思考2:按比例,各血型分别抽取多少人?将总体分成均衡几部分,按规则关联抽取将总体分成几层,按比例分层抽取.用简单随机抽样抽取起始号码总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成.从总体中逐个不放回抽取用简单随机抽样或系统抽样对各层抽样.简单随机抽样:系统抽样:分层抽样: