第8讲随机抽样考纲要求考点分布考情风向标1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法2012年新课标卷考查互斥事件和古典概型;2013年新课标卷Ⅰ考查分层抽样1.本节复习时,应准确理解三种抽样方法的定义,搞清它们之间的联系与区别,灵活选择恰当的抽样方法抽取样本.2.新课标卷高考近几年常将抽样方法与频率分布直方图、概率等相结合进行综合考查,因此,要加强这方面的训练1.简单随机抽样抽签法(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:________和随机数法.2.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)编号:先将总体的N个个体编号;(3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号________,依次进行下去,直到获取整个样本.l+2k(2)分段:确定分段间隔k,对编号进行分段,当Nn(n是样本容量)是整数时,取k=Nn;3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.)C1.在简单随机抽样中,某一个个体被抽到的可能性是(A.与第几次抽样有关,第一次抽到的可能性最大B.与第几次抽样有关,第一次抽到的可能性最小C.与第几次抽样无关,每一次抽到的可能性相等D.与第几次抽样无关,与抽取几个样本有关2.为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为()AA.3,2B.2,3C.2,30D.30,23.(2013年广东揭阳一模)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高三年级抽取的学生人数为()BA.15人B.20人C.25人D.30人4.(2013年新课标Ⅰ)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()CA.简单随机抽样C.按学段分层抽样B.按性别分层抽样D.系统抽样解析:由差异明显的几部分构成时,一般采用分层抽样,显然根据学段分层抽样比较科学.考点1简单随机抽样例1:(1)(2014年四川,由人教版必修3P1001改编)在“世界读书日”前夕,为了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是(A.总体C.样本的容量)B.个体D.从总体中抽取的一个样本解析:为了解5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.样本容量为200,每个居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.答案:A(2)(2014年湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()解析:根据随机抽样的原理可得简单随机抽样、分层抽样、系统抽样都必须满足每个个体被抽到的概率相等,即p1=p2=p3.故选D.答案:DA.p1=p2p3B.p2=p3p1C.p1=p3p2D.p1=p2=p3【规律方法】抽样方法主要有简单随机抽样、系统抽样、分层抽样,不论是哪种抽样方法,在整个抽样过程中,每个个体被抽到的概率是相等的.本题考查分层抽样,多年来,全国各地对抽样方法的考查一直是以分层抽样为最主要的考查对象,但是2013年江西卷考到了随机数表(见互动探究1),应该引起我们的警觉.【互动探究】1.(2013年江西)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()D78163204A.086572080292344935B.07631407024369820036234869C.029728019869387481D.01解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件的依次为:02,14,07,01,故第5个数为01.考点2系统抽样例2:(1)(2014年广东)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20解析:由题意知,分段间隔为100040=25.故选C.答案:C系统抽样的性质可知人数为20×=4(人).(2)(2015年湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图9-8-1,若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是__________.图9-8-1解析:由茎叶图可知,在区间[139,151]的人数为20,再由735答案:4720-480240(3)(2013年陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14解析:由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为=2020=12(人).答案:B【规律方法】当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个个体得到所需要的样本,这种抽样方式叫做系统抽样.系统抽样也叫等距抽样.【互动探究】2.从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000人再按系统抽样的方法进行,则每人入选的概率()A.不全相等B.均不相等C.都相等,且为251002D.都相等,且为140解析:注意随机抽样,每个个体被抽到的概率都一样.此题中,每人入选的概率为502004=251002.故选C.C考点3分层抽样例3:(1)(2014年广东)已知某地区中小学生人数和近视情况分别如图9-8-2(1)和图9-8-2(2).为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样)(2)本容量和抽取的高中生近视人数分别为((1)图9-8-2A.200,20C.200,10B.100,20D.100,10解析:该地区中小学生总人数为3500+2000+4500=10000,则样本容量为10000×2%=200,其中抽取的高中生近视人数为2000×2%×50%=20.故选A.答案:A(2)(2014年重庆)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100C.200B.150D.250解析:n=(3500+1500)×703500=100.故选A.答案:A【规律方法】当总体由差异明显的几个部分组成,按某种特征抽样时,将总体中的各个个体分成互不交叉的层,然后按照一定的比例,从各层中独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫做分层抽样.在三种基本抽样中,分层抽样在高考中考查得最多,主要考查比例的运算.【互动探究】3.(2014年上海)某校高一、高二、高三分别有学生1600名、1200名、800名,为了解该校高中学生的牙齿健康状况,按各年级的学生人数进行分层抽样,若高三抽取20名学生,则高一、高二共抽取的学生人数为____.7020800=解析:设高一、高二抽取的人数分别为x,y,则x+y,x+y=70.1600+1200性别甲高中乙高中丙高中女生153xy男生9790z难点突破⊙抽样方式与概率的结合例题:(2015年广东惠州三模)惠州市某县区甲、乙、丙三所高中的高三文科学生共有800人,各学校男、女生人数如下表:已知在三所高中的所有高三文科学生中随机抽取1人,抽到乙高中女生的概率为0.2.844217533157245506887704744767217633502683926301531659169275386298215071751286735807443913263321134278641607825207443815032442997931(1)求表中x的值;(2)惠州市第三次调研考试后,该县区决定从三所高中的所有高三文科学生中利用随机数表法抽取100人进行成绩统计分析,先将800人按001,002,…,800进行编号.如果从第8行第7列的数开始向右读,请你依次写出最先抽取的3个人的编号;(下面摘取了随机数表中第7行至第9行)(3)已知y≥145,z≥145,求丙高中高三文科学生中的女生比男生人数多的概率.解:(1)由x800=0.2,得x=160,即表中x的值为160.(2)依题意,最先检测的3个人的编号依次为165,538,629.(3)设“丙高中高三文科学生中的女生比男生人数多”的事件为A,其中女生、男生数记为(y,z).由(1)知,x=160,则y+z=300,且y≥145,z≥145,y,z∈N,=.∴满足条件的(y,z)有(145,155),(146,154),(147,153),(148,152),(149,151),(150,150),(151,149),(152,148),(153,147),(154,146),(155,145),共11组,且每组出现的可能性相同.其中事件A包含的基本事件(y,z),即满足yz的有(151,149),(152,148),(153,147),(154,146),(155,145),共5组.∴丙高中高三文科学生中的女生比男生人数多的概率P(A)5111.根据总体的情况采取适当的抽样方式,无论采用哪种抽样方式,必须保证在整个过程中每个个体被抽到的机会相等.其中简单随机抽样是最基本的抽样方法,是其他两种方法的基础,系统抽样和分层抽样在高考中考的是比较多的.2.应用分层抽样应遵循下列三点:(1)分层,将相似的个体归为一类,即为一层,分层要求每层的各个个体互不交叉,即不重不漏.(2)分层保证每个个体等可能被抽取,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.(3)若各层应抽取的个体数不都是整数,则应当调整样本容量,先剔除“多余”的个体.