第1讲抽样方法、总体分布的估计1.(2019·南通调研测试)某中学共有学生2800人,其中高一年级970人,高二年级930人,高三年级900人,现采用分层抽样的方法,抽取280人进行体育达标检测,则抽取高二年级学生人数为________.解析:设高二年级抽取n人,则n930=2802800,故n=93人.答案:932.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=________.解析:由已知条件,抽样比为13780=160,从而35600+780+n=160,解得n=720.答案:7203.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是________.解析:由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.答案:46,45,564.(2019·江苏省高考命题研究专家原创卷(一))某电商联盟在“双11”狂欢节促销活动中,对11月11日9时到14时的销售额进行统计,得到如图所示的频率分布直方图.已知13时到14时的销售额为4.5万元,则10时到13时的销售额为________万元.解析:设10时到13时的销售额为x万元,由题图可知13时到14时的销售额与10时到13时的销售额的比值为0.100.15+0.40+0.25=18,又13时到14时的销售额为4.5万元,所以4.5x=18,解得x=36,所以10时到13时的销售额为36万元.答案:365.(2019·无锡模拟)若一组样本数据8,x,10,11,9的平均数为10,则该组样本数据的方差为________.解析:因为平均数=8+x+10+11+95=10,所以x=12,从而方差为s2=15(4+4+0+1+1)=2.答案:26.(2019·江苏省高考命题研究专家原创卷(八))某科技公司受过高等教育的人数与没有受过高等教育的人数之比为7∶3,现用分层抽样的方法从该公司的所有员工中抽取一个容量为20的样本,若受过高等教育的甲员工被抽到的概率为120,则该科技公司受过高等教育的员工人数为________.解析:由题意可知,抽取的样本中有20×77+3=14人受过高等教育.故该科技公司受过高等教育的员工人数为14÷120=280.答案:2807.(2019·镇江模拟改编)某市共有400所学校,现要用系统抽样的方法抽取20所学校作为样本,调查学生课外阅读的情况.把这400所学校编上1~400的号码,再从1~20中随机抽取一个号码,如果此时抽得的号码是6,则在编号为21到40的学校中,应抽取的学校的编号为________.解析:根据系统抽样的条件,可知抽取的号码为第一组的号码加上组距的整数倍,所以为号20+6=26号.答案:268.(2019·江苏省名校高三入学摸底卷)已知一组数据1,2,3,4,5m的方差为2,那么相对应的另一组数据2,4,6,8,10m的方差为________.解析:1,2,3,4,5m的平均数x—=2+m,方差s2=(-m-1)2+m2+(1-m)2+(-m+2)2+(4m-2)25=2,而2,4,6,8,10m的平均数x—1=4+2m,方差s21=4×(-m-1)2+m2+(1-m)2+(-m+2)2+(4m-2)25=4×2=8.答案:89.(2019·宿迁调研)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为________.解析:由题图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4.所以s2=17×[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.答案:36710.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{an},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.解析:因为小长方形的面积由小到大构成等比数列{an},且a2=2a1,所以样本的频率构成一个等比数列,且公比为2,所以a1+2a1+4a1+8a1=15a1=1,所以a1=115,所以小长方形面积最大的一组的频数为300×8a1=160.答案:16011.一次数学模拟考试,共12道选择题,每题5分,共计60分,每道题有四个可供选择的答案,仅有一个是正确的.学生小张只能确定其中10道题的正确答案,其余2道题完全靠猜测回答.小张所在班级共有40人,此次考试选择题得分情况统计表如下:得分(分)4045505560百分率15%10%25%40%10%现采用分层抽样的方法从此班抽取20人的试卷进行选择题质量分析.(1)应抽取多少张选择题得60分的试卷?(2)若小张选择题得60分,求他的试卷被抽到的概率.解:(1)得60分的人数为40×10%=4.设抽取x张选择题得60分的试卷,则4020=4x,则x=2,故应抽取2张选择题得60分的试卷.(2)设小张的试卷为a1,另三名得60分的同学的试卷为a2,a3,a4,所有抽取60分试卷的方法为(a1,a2),(a1,a3),(a1,a4),(a2,a3),(a2,a4),(a3,a4)共6种,其中小张的试卷被抽到的抽法共有3种,故小张的试卷被抽到的概率为P=36=12.12.甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算两组数据的平均数;(2)分别计算两组数据的方差;(3)根据计算结果,估计一下两名战士的射击水平谁更好一些.解:(1)x—甲=110(8+6+7+8+6+5+9+10+4+7)=7,x—乙=110(6+7+7+8+6+7+8+7+9+5)=7.(2)由方差公式s2=1n[(x1-x—)2+(x2-x—)2+…+(xn-x—)2]可求得s2甲=3.0,s2乙=1.2.(3)由x甲=x乙,说明甲、乙两战士的平均水平相当;又因为s2甲s2乙,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定.1.(2019·徐州模拟)某工厂在12月份共生产了3600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为________.解析:因为a,b,c成等差数列,所以2b=a+c,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占总数的三分之一,即为1200双皮靴.答案:12002.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为________;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1020小时、980小时、1030小时,估计这个企业所生产的该产品的平均使用寿命为________小时.解析:第一分厂应抽取的件数为100×50%=50;该产品的平均使用寿命为1020×0.5+980×0.2+1030×0.3=1015.答案:5010153.某公司300名员工2016年年薪情况的频率分布直方图如图所示,由图可知,员工中年薪在1.4~1.6万元的共有________人.解析:由频率分布直方图知年薪低于1.4万元或者高于1.6万元的频率为(0.2+0.8+0.8+1.0+1.0)×0.2=0.76,因此,年薪在1.4到1.6万元间的频率为1-0.76=0.24,所以300名员工中年薪在1.4到1.6万元间的员工人数为300×0.24=72(人).答案:724.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是________.解析:因为甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得:s2=148[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],而更正前有75=148[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],化简整理得s2=50.答案:70,505.某学校为准备参加市运动会,对本校甲、乙两个田径队中30名跳高运动员进行了测试,并采用茎叶图表示本次测试30人的跳高成绩(单位:cm),跳高成绩在175cm以上(包括175cm)定义为“合格”,跳高成绩在175cm以下(不包括175cm)定义为“不合格”.(1)如果用分层抽样的方法从甲、乙两队所有的运动员中共抽取5人,则5人中“合格”与“不合格”的人数各为多少?(2)若从甲队178cm(包括178cm)以上的6人中抽取2人,则至少有一人在186cm以上(包括186cm)的概率为多少?解:(1)根据茎叶图可知,30人中有12人“合格”,有18人“不合格”.用分层抽样的方法,则5人中“合格”与“不合格”的人数分别为2人、3人.(2)甲队178cm(包括178cm)以上的6人中抽取2人的基本事件为(178,181),(178,182),(178,184),(178,186),(178,191),(181,182),(181,184),(181,186),(181,191),(182,184),(182,186),(182,191),(184,186),(184,191),(186,191),共15个.其中都不在186cm以上的基本事件为(178,181),(178,182),(178,184),(181,182),(181,184),(182,184),共6个.所以都不在186cm以上的概率P=615=25,由对立事件的概率公式得,至少有一人在186cm以上(包括186cm)的概率为1-P=1-25=35.6.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解:(1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.730.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.480.5,所以2≤x2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居