第8讲随机抽样1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.1.简单随机抽样抽签法(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:________和随机数法.2.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号________,依次进行下去,直到获取整个样本.l+2k(1)编号:先将总体的N个个体编号;(2)分段:确定分段间隔k,对编号进行分段,当Nn(n是样本容量)是整数时,取k=Nn;3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.1.在简单随机抽样中,某一个个体被抽到的可能性是()CA.与第几次抽样有关,第一次抽到的可能性最大B.与第几次抽样有关,第一次抽到的可能性最小C.与第几次抽样无关,每一次抽到的可能性相等D.与第几次抽样无关,与抽取几个样本有关2.为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为()AA.3,2B.2,3C.2,30D.30,23.(2013年广东揭阳一模)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高三年级抽取的学生人数为()A.15人B.20人C.25人D.30人B4.问题:①三种不同的容器中分别装有同一型号的零件400个、200个、150个,现在要从这750个零件中抽取一个容量为50的样本;②从20名学生中选出3名参加座谈会.方法:Ⅰ.随机抽样法;Ⅱ.系统抽样法;Ⅲ.分层抽样法.其中问题与方法能配对的是()CA.①Ⅰ,②ⅡC.①Ⅱ,②ⅠB.①Ⅲ,②ⅠD.①Ⅲ,②Ⅱ考点1简单随机抽样例1:(1)(2014年四川,由人教版必修3P100-1改编)在“世界读书日”前夕,为了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()A.总体C.样本的容量B.个体D.从总体中抽取的一个样本解析:为了解5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.样本容量为200,每个居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.答案:A(2)(2014年湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2p3C.p1=p3p2B.p2=p3p1D.p1=p2=p3解析:根据随机抽样的原理可得简单随机抽样、分层抽样、系统抽样都必须满足每个个体被抽到的概率相等,即p1=p2=p3.故选D.答案:D【规律方法】抽样方法主要有简单随机抽样、系统抽样、分层抽样,不论是哪种抽样方法,在整个抽样过程中,每个个体被抽到的概率是相等的.本题考查分层抽样,多年来,全国各地对抽样方法的考查一直是以分层抽样为最主要的考查对象,但是2013年江西卷考到了随机数表(见互动探究1),应该引起我们的警觉.【互动探究】1.(2013年江西)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816320465720802923449356314820007024369362348699728693801987481A.08C.02B.07D.01解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件的依次为:02,14,07,01,故第5个数为01.答案:D考点2系统抽样例2:(1)(2014年广东)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50C.25B.40D.20解析:由题意知,分段间隔为100040=25.故选C.答案:C(2)将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003,这600名学生分住在三个营区.从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区.三个营区被抽中的人数依次为(A.26,16,8C.25,16,9)B.25,17,8D.24,17,912,故抽取的号码构成以3为首项,公差为12的等差数列.在第Ⅰ营区001~300号恰好有25组,故抽取25人,在第Ⅱ营区301~495号有195人,共有16组多3人,因为抽取的第一个数是3,所以Ⅱ营区共抽取17人,剩余50-25-17=8(人)需从第Ⅲ营区抽取.解析:根据系统抽样的特点可知抽取的号码间隔为60050=答案:B【规律方法】当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个个体得到所需要的样本,这种抽样方式叫做系统抽样.系统抽样也叫等距抽样.=【互动探究】2.从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000人再按系统抽样的方法进行,则每人入选的概率()A.不全相等B.均不相等C.都相等,且为251002D.都相等,且为140解析:注意随机抽样,每个个体被抽到的概率都一样.此题中,每人入选的概率为502520041002.故选C.C考点3分层抽样例3:(1)(2014年广东)已知某地区中小学学生人数和近视情况分别如图981①②,为了解该地区中小学学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()①②图981A.200,20B.100,20C.200,10D.100,10解析:由题意,样本容量为(3500+4500+2000)×2%=200,其中高中生人数为2000×2%=40,高中生的近视人数为40×50%=20.故选A.答案:A(2)(2014年重庆)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250解析:n=(3500+1500)×703500=100.故选A.答案:A【规律方法】当总体由差异明显的几个部分组成,按某种特征抽样时,将总体中的各个个体分成互不交叉的层,然后按照一定的比例,从各层中独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫做分层抽样.在三种基本抽样中,分层抽样在高考中考查得最多,主要考查比例的运算.【互动探究】3.(2014年上海)某校高一、高二、高三分别有学生1600名、1200名、800名,为了解该校高中学生的牙齿健康状况,按各年级的学生人数进行分层抽样,若高三抽取20名学生,则高一、高二共抽取的学生人数为________.7020800=解析:设高一、高二抽取的人数分别为x,y,则x+y,x+y=70.1600+1200甲高中乙高中丙高中女生153xy男生9790z●难点突破●⊙抽样方式与概率的结合例题:(2015年广东惠州三模)惠州市某县区甲、乙、丙三所高中的高三文科学生共有800人,各学校男、女生人数如下表:已知在三所高中的所有高三文科学生中随机抽取1人,抽到乙高中女生的概率为0.2.(1)求表中x的值;(2)惠州市第三次调研考试后,该县区决定从三所高中的所有高三文科学生中利用随机数表法抽取100人进行成绩统计分析,先将800人按001,002,…,800进行编号.如果从第8行第7列的数开始向右读,请你依次写出最先抽取的3个人的编号;(下面摘取了随机数表中第7行至第9行)844263011326175353163321315724550688770474476721763350268392591692753862982150717512867358074439134278641607825207443815032442997931(3)已知y≥145,z≥145,求丙高中高三文科学生中的女生比男生人数多的概率.解:(1)由x800=0.2,得x=160,即表中x的值为160.(2)依题意,最先检测的3个人的编号依次为165,538,629.(3)设“丙高中高三文科学生中的女生比男生人数多”的事件为A,其中女生、男生数记为(y,z).由(1)知,x=160,则y+z=300,且y≥145,z≥145,y,z∈N,∴满足条件的(y,z)有(145,155),(146,154),(147,153),(148,152),(149,151),(150,150),(151,149),(152,148),(153,147),(154,146),(155,145),共11组,且每组出现的可能性相同.其中事件A包含的基本事件(y,z),即满足yz的有(151,149),(152,148),(153,147),(154,146),(155,145),共5组,∴丙高中高三文科学生中的女生比男生人数多的概率P(A)=511.