-1-章末复习提升课抽样方法一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量(单位:辆)如下表:轿车A轿车B轿车C舒适型100150z标准型300450600按类用分层随机抽样的方法在这个月生产的轿车中抽取50辆,其中A类轿车有10辆.(1)求z的值;(2)用分层随机抽样的方法从C类轿车中抽取一个容量为5的样本,求舒适型、标准型的轿车应分别抽取多少辆?【解】(1)设该厂本月生产轿车n辆,由题意得50n=10100+300,所以n=2000,则z=2000-100-300-150-450-600=400.(2)设所抽取的样本中有m辆舒适型轿车,因为用分层随机抽样的方法从C类轿车中抽取一个容量为5的样本,所以由(1)知4001000=m5,解得m=2,所以在C类轿车中抽取2辆舒适型-2-轿车,3辆标准型轿车.与分层随机抽样有关问题的常见类型及解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.1.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层随机抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为______.解析:高三年级学生人数为430-160-180=90,设高三年级抽取x人,由分层随机抽样可得32180=x90,解得x=16.答案:162.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层随机抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本量为______.解析:因为分层随机抽样的抽样比应相等,所以420960=14样本量,样本量=960×14420=32.答案:32频率分布直方图的应用下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数201165(1)列出样本的频率分布表(频率保留两位小数);(2)画出频率分布直方图;(3)估计身高低于134cm的人数占总人数的百分比.【解】(1)列出样本频率分布表:-3-分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计1201.00(2)画出频率分布直方图,如图所示.(3)因为样本中身高低于134cm的人数的频率为5+8+10120=23120≈0.19.所以估计身高低于134cm的人数约占总人数的19%.与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出了频率分布表和频率分布直方图,如图所示:分组频数频率[10,15)100.25[15,20)24n-4-[20,25)mp[25,30]20.05合计M1(1)求表中M,p及图中a的值;(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数.解:(1)由分组[10,15)的频数是10,频率是0.25,知10M=0.25,解得M=40.因为频数之和为40,所以10+24+m+2=40,得m=4,p=mM=440=0.10.因为a是对应分组[15,20)的频率与组距的商,所以a=2440×5=0.12.(2)因为该校高三学生有240人,分组[10,15)的频率是0.25,所以估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为240×0.25=60.众数、中位数、平均数、方差与标准差的应用某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,数据如下(单位:分):甲9582888193798478乙8375808090859295(1)请你计算这两组数据的平均数、中位数;(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合适?请说明理由.【解】(1)x-甲=18(95+82+88+81+93+79+84+78)=85(分),x-乙=18(83+75+80+80+90+85+92+95)=85(分).-5-甲、乙两组数据的中位数分别为83分、84分.(2)由(1)知x-甲=x-乙=85分,所以s2甲=18[(95-85)2+(82-85)2+…+(78-85)2]=35.5,s2乙=18[(83-85)2+(75-85)2+…+(95-85)2]=41.①从平均数看,甲、乙均为85分,平均水平相同;②从中位数看,乙的中位数大于甲,乙的成绩好于甲;③从方差来看,因为x-甲=x-乙,s2甲<s2乙,所以甲的成绩较稳定;④从数据特点看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成绩好些;⑤从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力.综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取得好成绩.用样本的数字特征估计总体的数字特征应注意的问题(1)众数、中位数、平均数的含义及求法.(2)方差、标准差的计算.(3)中位数用来描述分类变量的中心位置,众数体现了数据的最大集中点,平均数反映样本数据的总体水平.(4)标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小.为了比较甲、乙两地某月14时的气温情况,随机抽取了该月中的5天,将这5天中14时的气温数据(单位:℃)列表如下:甲2628312931乙2830293132以下结论正确的是()①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.A.①③B.①④C.②③D.②④-6-解析:选B.法一:因为x-甲=26+28+29+31+315=29,x-乙=28+29+30+31+325=30,所以x-甲x-乙,又s2甲=9+1+0+4+45=185,s2乙=4+1+0+1+45=2,所以s甲s乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.1.(2019·河北省沧州市期末考试)某学校高一、高二年级共有1800人,现按照分层随机抽样的方法,抽取90人作为样本进行某项调查.若样本中高一年级学生有42人,则该校高一年级学生共有()A.420人B.480人C.840人D.960人解析:选C.由题意需要从1800人中抽取90人,所以抽样比为901800=120.又样本中高一年级学生有42人,所以该校高一年级学生共有42×20=840(人).故选C.2.(2019·陕西省西安市长安区第一中学期末考试)如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[5,10]内的频数为()A.50B.40C.30D.20解析:选D.第一个小矩形的面积为0.04×5=0.2,所以样本落在[5,10]内的频数为0.2×100=20.故选D.3.甲、乙两个城市某年4月中旬,每天的最高气温统计图如图所示,这9天里,气温比较稳定的是________.-7-解析:从折线统计图中可以很清楚地看到乙城市的气温变化较大,而甲城市的气温相对来说较稳定,变化基本不大.答案:甲城市4.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)解析:假设这组数据按从小到大的顺序排列为x1,x2,x3,x4,则x1+x2+x3+x44=2,x2+x32=2,所以x1+x4=4,x2+x3=4,又s=14[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2]=12(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=122[(x1-2)2+(x2-2)2]=1,所以(x1-2)2+(x2-2)2=2.同理可求得(x3-2)2+(x4-2)2=2.由x1,x2,x3,x4均为正整数,且(x1,x2),(x3,x4)均为圆(x-2)2+(y-2)2=2上的点,分析知x1,x2,x3,x4应为1,1,3,3.答案:1,1,3,3[A基础达标]1.某防疫站对学生进行身体健康调查,欲采用分层随机抽样的方法抽取样本.某中学共有学生2000名,从中抽取了一个容量为200的样本,其中男生103名,则该中学共有女生为()A.1030名B.97名C.950名D.970名解析:选D.由题意,知该中学共有女生2000×200-103200=970(名),故选D.2有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5)4[19.5,23.5)9-8-[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12[35.5,39.5)7[39.5,43.5]3则总体中大于或等于31.5的数据所占的比例为()A.211B.13C.12D.23解析:选B.由题意知,样本量为66,而落在[31.5,43.5]内的样本个数为12+7+3=22,故总体中大于或等于31.5的数据约占2266=13.3.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是()A.85,85,85B.87,85,86C.87,85,85D.87,85,90解析:选C.因为得85分的人数最多,为4人,所以众数为85,中位数为85,平均数为110(100+95+90×2+85×4+80+75)=87.4.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为()A.6万元B.8万元C.10万元D.12万元解析:选C.设11时至12时的销售额为x万元,由于频率分布直方图中各小组的组距相同,故各小矩形的高度之比等于频率之比,也等于销售额之比,所以9时至10时的销售额与11时至12时的销售额的比为0.100.40=14,所以有2.5x=14,解得x=10,故选C.5.某学校举行的运动会上,七位评委为某位体操选手打出的分数为79,84,84,86,84,87,93,则去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.84,4.84B.84,1.6C.85,1.6D.85,4-9-解析:选C.最高分是93分,最低分是79分,所剩数据的平均数为x-=80+4×3+6+75=85,方差为s2=15×[(84-85)2×3+(86-85)2+(87-85)2]=1.6,故选C.