12016届高三文科数学第一轮复习系列统计(1)随机抽样和用样本估计总体(1)主要内容:1、简单随机抽样2、分层抽样3、系统抽样一、简单随机抽样:(1)抽取方式:逐个不放回抽取;(2)每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数法.[提醒]简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.1.下列抽取样本的方式是简单随机抽样的有()①从无限多个个体中抽取50个个体作为样本;②箱子里有100支铅笔,今从中选取10支进行检验.在抽样操作时,从中任意拿出一支检测后再放回箱子里;③从50个个体中一次性抽取5个个体作为样本.A.0个B.1个C.2个D.3个解析:选A①不满足样本的总体数较少的特点;②不满足不放回抽取的特点;③不满足逐个抽取的特点.2.某公司在甲、乙、丙、丁四个地区分别有150,120,180,150个销售点.公司为了调查产品销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有20个大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是()A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法解析:选B一般甲、乙、丙、丁四个地区会存在差异,采用分层抽样法较好.在丙地区中抽取的样本个数较少,易采用简单随机抽样法.3.(2013·江西高考)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()78166572080263140702436997280198232049234493582003623486969387481A.08B.07C.02D.01解析:选D从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的数字为08,02,14,07,01,…,故选出的第5个个体的编号为01.二、系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn;(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.[提醒]系统抽样中,易忽视抽取的样本数也就是分段的段数,当Nn不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列.1、(2014·广东高考)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20解析:由100040=25,可得分段的间隔为25.故选C.答案:C解决系统抽样问题的两个关键步骤(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.2、已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.5678920313(1)若第1组抽出的号码为2,则所有被抽出职工的号码为_________________________;(2)分别统计这5名职工的体重(单位:千克),获得体重数据的茎叶图如图所示,则该样本的方差为________.解析:(1)由题意知被抽出职工的号码为2,10,18,26,34.(2)由茎叶图知5名职工体重的平均数x=59+62+70+73+815=69,则该样本的方差s2=15×[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.答案:(1)2,10,18,26,34(2)62三、分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.[提醒]分层抽样中,易忽视每层抽取的个体的比例是相同的,即样本容量n总体个数N.1.(2014·广东高考)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,10B.200,10C.100,20D.200,20解析:选D易知(3500+4500+2000)×2%=200,即样本容量;抽取的高中生人数为2000×2%=40,由于其近视率为50%,所以近视的人数为40×50%=20.2.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:4学历35岁以下35~50岁50岁以上本科803020研究生x20y(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为539,求x,y的值.解:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,设抽取学历为本科的人数为m,∴3050=m5,解得m=3.抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3.从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2).∴从中任取2人,至少有1人学历为研究生的概率为710.(2)由题意,得10N=539,解得N=78.∴35~50岁中被抽取的人数为78-48-10=20,∴4880+x=2050=1020+y,解得x=40,y=5.即x,y的值分别为40,5.[类题通法]进行分层抽样的相关计算时,常利用以下关系式巧解:(1)样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.课后练习:一、选择题1.(2014·湖南高考)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1、p2、5p3,则()A.p1=p2p3B.p2=p3p1C.p1=p3p2D.p1=p2=p3解析:选D根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样方法,每个个体被抽到的概率都是nN,故p1=p2=p3,故选D.2.某学校有男、女学生各500名.为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()A.抽签法B.随机数法C.系统抽样法D.分层抽样法解析:选D从全体学生中抽取100名应用分层抽样法,按男、女学生所占的比例抽取.故选D.3.(2015·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=()A.54B.90C.45D.126解析:选B依题意得33+5+7×n=18,解得n=90,即样本容量为90.4.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中取的数是39,则在第1小组1~16中随机抽到的数是()A.5B.7C.11D.13解析:选B间隔数k=80050=16,即每16人抽取一个人.由于39=2×16+7,所以第1小组中抽取的数为7.5.某班级有男生20人,女生30人,从中抽取10人作为样本,恰好抽到了4个男生、6个女生,则下列命题正确的是()A.该抽样可能是简单随机抽样B.该抽样一定不是系统抽样C.该抽样中女生被抽到的概率大于男生被抽到的概率D.该抽样中女生被抽到的概率小于男生被抽到的概率解析:选A本题看似是一道分层抽样的题,实际上每种抽样方法都可能出现这个结果,故B不正确.根据抽样的等概率性知C,D不正确.6.福利彩票“双色球”中红色球的号码由编号为01,02,…,33的33个个体组成,某6彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为()49544354821737932378873520964384263491645724550688770474476721763350258392120676A.23B.09C.02D.17解析:选C从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.二、填空题7.(2014·天津高考)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.解析:设应从一年级本科生中抽取x名学生,则x300=44+5+5+6,解得x=60.答案:608.(2014·湖北高考)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.解析:分层抽样中各层的抽样比相同.样本中甲设备生产的有50件,则乙设备生产的有30件.在4800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品的总数为1800件.答案:18009.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为________.解析:总体容量为6+12+18=36.当样本容量为n时,由题意可知,系统抽样的抽样距为36n,分层抽样的抽样比是n36,则采用分层抽样法抽取的乒乓球运动员人数为6×n36=n6,篮球运动员人数为12×n36=n3,足球运动员人数为18×n36=n2,可知n应是6的倍数,36的约数,故n=6,12,18.当样本容量为n+1时,剔除1个个体,此时总体容量为35,系统抽样的7抽样距为35n+1,因为35n+1必须是整数,所以n只能取6,即样本容量n为6.答案:610.(2015·北京海淀区期末)某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为________;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1020小时、980小时、1030小时,估计这个企业所生产的该产品的平均使用寿命为________小时.解析:第一分厂应抽取的件数为100×50%=50;该产品的平均使用寿命为102