数学第十一章统计与统计案例第2讲用样本估计总体01基础知识自主回顾02核心考点深度剖析04高效演练分层突破03方法素养助学培优一、知识梳理1.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中__________与__________的差);②决定__________与__________;③将数据__________;④列_____________;⑤画________________.最大值最小值组距组数分组频率分布表频率分布直方图(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的__________,就得到频率分布折线图;②总体密度曲线:随着样本容量的增加,作图时__________增加,__________减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.中点所分组数组距2.样本的数字特征(1)众数:一组数据中____________的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于__________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把________________称为a1,a2,…,an这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为x-,则这组数据的标准差和方差分别是s=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2],s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2].出现次数最多最中间a1+a2+…+ann常用结论1.会用三个关系频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.巧用四个有关的结论(1)若x1,x2,…,xn的平均数为x-,那么mx1+a,mx2+a,…,mxn+a的平均数为mx-+a;(2)数据x1,x2,…,xn与数据x′1=x1+a,x′2=x2+a,…,x′n=xn+a的方差相等,即数据经过平移后方差不变;(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2;(4)s2=1n∑ni=1(xi-x-)2=1n∑ni=1x2i-x-2,即各数平方的平均数减去平均数的平方.二、习题改编1.(必修3P77例2改编)已知一组数据6,7,8,8,9,10,则该组数据的方差是__________.答案:532.(必修3P65探究改编)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第__________组.解析:由题图可得,前四组的频率为(0.0375+0.0625+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第4组.答案:4一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)一组数据的方差越大,说明这组数据的波动越大.()(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()√√×√√二、易错纠偏常见误区(1)频率分布直方图与茎叶图的识图不清;(2)对方差、平均数的统计意义的认识有误.1.甲、乙两人8次测评成绩的茎叶图如图,由茎叶图知甲的成绩的平均数与乙的成绩的中位数分别是__________、__________.解析:由茎叶图可得甲的成绩的平均数为10+11+14+21+23+23+32+348=21.将乙的成绩按从小到大的顺序排列,中间的两个成绩分别是22,23,所以乙的成绩的中位数为22+232=22.5.答案:2122.52.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是__________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:503.(2019·高考全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为__________.解析:经停该站高铁列车所有车次的平均正点率的估计值为10×0.97+20×0.98+10×0.9910+20+10=0.98.答案:0.98样本的数字特征(典例迁移)(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为()A.92,2.8B.92,2C.93,2D.93,2.8(2)(2020·盐城模拟)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为__________.【解析】(1)由题意得所剩数据:90,90,93,94,93.所以平均数x-=90+90+93+94+935=92.方差s2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8.(2)由s2=1ni=1n(xi-x-)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为22.【答案】(1)A(2)22【迁移探究】(变条件)本例(2)增加条件“x1,x2,x3,x4,x5的平均数为2”,求数据2x1+3,2x2+3,2x3+3,2x4+3,2x5+3的平均数和方差.解:数据2x1+3,2x2+3,2x3+3,2x4+3,2x5+3的平均数为2×2+3=7,方差为22×2=8.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s2=1n[(x21+x22+…+x2n)-nx-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原数据平方的平均数减去平均数的平方.1.(2020·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地.这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是()A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数解析:选B.平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选B.2.(2020·甘肃、青海、宁夏联考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下:身高(100,110](110,120](120,130](130,140](140,150]频数535302010由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)()A.119.3B.119.7C.123.3D.126.7解析:选C.由题意知身高在(100,110],(110,120],(120,130]内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x,则(x-120)×0.310=0.1,解得x≈123.3.故选C.3.一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的23倍,则该数据的方差为__________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x,5,10,则2+x2=3,解得x=4,所以这组数据的平均数为x-=16×(1+2+2+4+5+10)=4,方差为s2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.答案:9茎叶图(师生共研)(2020·成都市第二次诊断性检测)为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场比赛的得分,制成如图所示的茎叶图.有下列结论:①甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数;②甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数;③从最近五场比赛的得分看,乙比甲更稳定;④从最近五场比赛的得分看,甲比乙更稳定.其中所有正确结论的编号为()A.①③B.①④C.②③D.②④【解析】对于①,甲得分的中位数为29,乙得分的中位数为30,错误;对于②,甲得分的平均数为15×(25+28+29+31+32)=29,乙得分的平均数为15×(28+29+30+31+32)=30,正确;对于③,甲得分的方差为15×[(25-29)2+(28-29)2+(29-29)2+(31-29)2+(32-29)2]=15(16+1+0+4+9)=6.乙得分的方差为15×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=15×(4+1+0+1+4)=2,所以乙比甲更稳定,③正确,④错误.所以正确结论的编号为②③.【答案】C茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.1.(2020·新疆第一次毕业诊断及模拟测试)某中学高三文科班从甲、乙两个班各选出7名学生参加文史知识竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的平均分是85,乙班学生成绩的中位数是83,则x+y的值为()A.8B.7C.9D.168解析:选A.因为甲班学生成绩的平均分是85,所以79+78+80+80+x+85+92+96=85×7,即x=5.因为乙班学生成绩的中位数是83,所以若y≤1,则中位数为81,不成立.若y1,则中位数为80+y=83,解得y=3.所以x+y=5+3=8,故选A.2.某省为了抽选运动员参加“国际马拉松比赛”,将35名运动员的一次马拉松比赛成绩(单位:分钟)制成茎叶图,如图所示.若将运动员按成绩由好到差编号,再用系统抽样的方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为()A.6B.5C.4D.3解析:选C.对35名运动员进行编号:00,01,02,…,34,分成七组:00~04,05~09,10~14,15~19,20~24,25~29,30~34,用系统抽样的方法抽7人,则第三组到第六组中占4人,即抽取的成绩在区间[139,151]上的运动员的人数为4,故选C.频率分布直方图(多维探究)角度一求样本的频率、频数(2020·福建五校第二次联考)某服装店对过去100天其实体店和网店的