随机抽样1.理解随机抽样的必要性和重要性.2.会利用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样的方法.[理要点]一、简单随机抽样1.简单随机抽样的概念设一个总体含有N个个体,从中逐个地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会,就把这种抽样方法叫做简单随机抽样.不放回都相等2.最常用的简单随机抽样方法有两种——法和法.抽签随机数二、系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体.(2)确定,对编号进行,当Nn是整数时,取k=Nn.(3)在第1段用确定第一个个体编号l(l≤k).(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号,再加k得到第3个个体编号,依次进行下去,直到获取整个样本.编号分段间隔k分段简单随机抽样l+kl+2k三、分层抽样1.分层抽样的概念在抽样时,将总体,然后,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.当总体是由组成时,往往选用分层抽样的方法.3.分层抽样时,每个个体被抽到的机会是的.分成互不交叉的层按照一定的比例差异明显的几个部分均等[究疑点]三种抽样方法的共同点及联系是什么?提示:类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的机会均等从总体中逐个抽取总体中的个体数较少系统抽样将总体均匀分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成[题组自测]1.关于简单随机抽样的特点,有以下几种说法,其中不.正确的是()A.要求总体的个数有限B.从总体中逐个抽取C.它是一种不放回抽样D.每个个体被抽到的机会不一样,与先后有关答案:D解析:简单随机抽样除具有A、B、C的三个特点外,还是等可能抽样,即各个个体被抽到的机会相等,与先后顺序无关.2.下面的抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验答案:D解析:A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;C不是简单随机抽样,因为总体的个体有明显的层次;D是简单随机抽样.3.上海某大学为服务于2010上海世博会,从报名的24名大三的学生中选6人组成志愿小组,请用抽签法和随机数法设计抽样方案.解:抽签法第一步:将24名志愿者编号,编号为1,2,3,…,24;第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数法第一步:将24名学生编号,编号为01,02,03,…,24;第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在01~24中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:找出号码与记录的数相同的学生组成志愿小组.若把本题中“24名学生”改为“1000名学生”仍选取6人应该如何抽样?解:因为总体数较大,若选用抽签法制号签太麻烦,故应选用随机数法.第一步:先将1000名学生编号,可以编为0001,0002,…,1000.第二步:在随机数表中任选一个数,例如选出第2行第5列的数2.第三步:从选定的数开始向右读,依次可得0736,0751,……直到抽取6人满为止,就得到一个容量为6的样本.[归纳领悟]简单随机抽样须满足的条件与特点:1.抽取的个体数有限;2.逐个抽取;3.是不放回抽取;4.是等可能抽取;5.抽签法适于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.[题组自测]1.一个班级有5个小组,每一个小组有10名学生,随机编号为1~10号,为了了解他们的学习情况,要求抽取每组的2号学生留下来进行问卷调查,这里运用的方法是()A.分层抽样法B.抽签法C.随机数法D.系统抽样法解析:由系统抽样方法的特点可知选D.答案:D2.从2007名学生中选取50名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下的2000人再按系统抽样的方法抽取,则每人入选的概率()A.不全相等B.均不相等C.都相等,且为502007D.都相等,且为140解析:从N个个体中抽取M个个体则每个个体被抽到的概率都等于MN.答案:C3.(2010·湖北高考)将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为()A.26,16,8B.25,17,8C.26,16,9D.24,17,9解析:依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).令3+12(k-1)≤300得k≤1034,因此第Ⅰ营区被抽中的人数是25;令3003+12(k-1)≤495得1034k≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知.答案:B4.某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.解:按照1∶5的比例,应该抽取的样本容量为2955=59,我们把295名同学分成59组,每组5人.第1组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,第59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第1组5名学生中抽出一名学生,不妨设编号为l(1≤l≤5),那么抽取的学生编号为l+5k(k=0,1,2,…,58),得到59个个体作为样本,如当l=3时的样本编号为3,8,13,…,288,293.[归纳领悟]系统抽样的特点:1.适用于元素个数很多且均衡的总体.2.各个个体被抽到的机会均等.3.总体分组后,在起始部分抽样时采用的是简单随机抽样.4.如果总体容量N能被样本容量n整除,则抽样间隔为k=Nn,如果总体容量N不能被样本容量n整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.注意:系统抽样的四个步骤可简记为:编号—分段—确定起始的个体号—抽取样本.[题组自测]1.某市有高中生30000人,其中女生4000人.为调查学生的学习情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中女生的数量为()A.30B.25C.20D.15解析:设样本中女生的数量为x,则15030000=x4000,∴x=20.答案:C2.某学校在校学生2000人,为了迎接“2010年广州亚运会”,学校举行了“迎亚运”跑步和登山比赛,每人都参加且每人只参加其中一项比赛,各年级参加比赛的人数情况如下表:高一年级高二年级高三年级跑步人数abc登山人数xyz其中a∶b∶c=2∶5∶3,全校参加登山的人数占总人数的14.为了了解学生对本次活动的满意程度,按分层抽样的方式从中抽取一个200人的样本进行调查,则高三年级参加跑步的学生中应抽取()A.15人B.30人C.40人D.45人解析:由题意,全校参加跑步的人数占总人数的34,高三年级参加跑步的总人数为34×2000×310=450,由分层抽样的特征,得高三年级参加跑步的学生中应抽取110×450=45(人).答案:D3.(2010·上海高考)某社区对居民进行上海世博会知晓情况的分层抽样调查.已知该社区的青年人、中年人和老年人分别有800人、1600人、1400人.若在老年人中的抽样人数是70,则在中年人中的抽样人数应该是________.解析:设在中年人中的抽样人数为x,则701400=x1600,∴x=80.答案:804.某大型超市销售的乳类商品有四种:纯奶,酸奶、婴幼儿奶粉、成人奶粉,且纯奶、酸奶、婴幼儿奶粉、成人奶粉分别有30种、10种、35种、25种不同的品牌.现采用分层抽样的方法从中抽取一个容量为n的样本进行三聚氰胺安全检测,若抽取的婴幼儿奶粉的品牌数是7种,则n=________.解析:由题可知,四种商品的总数为30+10+35+25=100,而在35种婴幼儿奶粉的品牌中抽取了7种,所以抽取的概率为735=15,所以需要抽取的样本容量为100×15=20,所以样本容量n为20.答案:20[归纳领悟]进行分层抽样时应注意以下几点:1.分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;2.为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同;3.在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样;4.抽样比=样本容量个体容量=各层样本容量各层个体数量.一、把脉考情从近两年的高考试题来看,分层抽样是高考的热点,题型多为选择、填空题,属容易题,命题多以贴近现实生活的材料为背景;同时随机抽样与概率问题相结合也是考查的重点.对于系统抽样,复习时也要引起重视.二、考题诊断1.(2010·四川高考)一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,6解析:抽样比为40800=120,因此,从各层依次抽取的人数为160×120=8,320×120=16,200×120=10,120×120=6.答案:D2.(2010·重庆高考)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为()A.7B.15C.25D.35解析:设样本容量为n,则依题意有350750×n=7,n=15.答案:B3.(2010·北京高考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.解析:因为直方图中的各个矩形的面积之和为1,所以有10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由直方图可知三个区域内的学生总数为100×10×(0.030+0.020+0.010)=60人.其中身高在[140,150]内的学生人数为10人,所以从身高在[140,150]范围内抽取的学生人数为1860×10=3人.答案:0.03034.(2010·安徽高考)某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.解析:所抽取的990户普通家庭中有50户拥有3套或3套以上住房,所抽取的100户高收入家庭中有70户拥有3套或3