-1-5.1.4用样本估计总体考点学习目标核心素养用样本的数字特征估计总体的数字特征理解用样本的数字特征估计总体的数字特征的方法,会分析实际问题数学抽象、数学运算用样本分布估计总体分布能够利用频率分布直方图、茎叶图等解决统计问题逻辑推理、数学运算问题导学预习教材P77-P83的内容,思考以下问题:1.如何用样本平均数估计总体平均数?2.样本方差、标准差公式是什么?它们的区别与联系是什么?3.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?4.如何用频率分布直方图估计平均数、中位数、众数?5.同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?1.简单随机抽样的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.2.分层抽样的数字特征我们以分两层抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,xm,平均数为x-,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为y-,方差为t2.则x-=1mi=1mxi,s2=1mi=1m(xi-x-)2,y-=1ni=1nyi,t2=1ni=1n(yi-y-)2.如果记样本均值为a-,样本方差为b2,则可以算出a-=1m+n(i=1mxi+i=1nyi)=mx-+ny-m+n,-2-b2=m[s2+(x--a-)2]+n[t2+(y--a-)2]m+n=1m+n[(ms2+nt2)+mnm+n(x--y-)2].判断正误(正确的打“√”,错误的打“×”)(1)样本的平均数描述了样本数据的平均水平.()(2)方差越大、数据越集中在平均数左右.()(3)中位数是样本数据中最中间位置的数据.()答案:(1)√(2)×(3)×下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上边的中点得到的解析:选A.频率分布直方图中每个小矩形的高=频率组距.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分解析:选A.由茎叶图可以看出甲的成绩都集中在30~50分,且高分较多.而乙的成绩只有一个高分52分,其他成绩比较低,故甲运动员的成绩好于乙运动员的成绩.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.解析:60×(0.015+0.025)×10=24.答案:24-3-用样本的数字特征估计总体的数字特征甲、乙两机床同时加工直径为100cm的零件,为检验质量,从中抽取6件测量数据为:甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定.【解】(1)x-甲=16(99+100+98+100+100+103)=100,x-乙=16(99+100+102+99+100+100)=100,s2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知x-甲=x-乙,比较它们的方差,因为s2甲>s2乙,故乙机床加工零件的质量更稳定.(1)在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.(2)关于统计的有关性质及规律:①若x1,x2,…,xn的平均数为x-,那么mx1+a,mx2+a,…,mxn+a的平均数是mx-+a;②数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等;③若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.1.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:甲127138130137135131乙133129138134128136求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.-4-解:设甲、乙两人成绩的平均数分别为x-甲,x-乙,则x-甲=130+16(-3+8+0+7+5+1)=133,x-乙=130+16(3-1+8+4-2+6)=133,s2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473,s2乙=16[02+(-4)2+52+12+(-5)2+32]=383.因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.2.在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?解:把样本中男生的身高记为x1,x2,…,x23,其平均数记为x-,方差记为s2x;把样本中女生的身高记为y1,y2,…,y27,其平均数记为y-,方差记为s2y,把样本的平均数记为a-,方差记为s2.则a-=23×170.6+27×160.623+27=165.2,s2=23×[s2x+(x--a-)2]+27×[s2y+(y--a-)2]23+27=23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]50=51.4862.即样本的方差为51.4862.因此估计高一年级全体学生身高的方差为51.4862.频率分布直方图与数字特征的综合应用已知一组数据:125121123125127129125128130129126124125127126122124125126128(1)填写下面的频率分布表:分组频数累计频数频率-5-[120.5,122.5)[122.5,124.5)[124.5,126.5)[126.5,128.5)[128.5,130.5]合计(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.【解】(1)频率分布表如下:分组频数累计频数频率[120.5,122.5)20.1[122.5,124.5)30.15[124.5,126.5)80.4[126.5,128.5)40.2[128.5,130.5]30.15合计201(2)(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×58=125.75,事实上,中位数为125.5.使用“组中值”求平均数:x-=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上,平均数的精确值为x-=125.75.(1)利用频率分布直方图求数字特征:①众数是最高的矩形的底边的中点;②中位数左右两侧直方图的面积相等;③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.(2)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.-6-某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩.解:(1)由题图可知众数为65,又因为第一个小矩形的面积为0.3,所以设中位数为60+x,则0.3+x×0.04=0.5,得x=5,所以中位数为60+5=65.(2)依题意,平均成绩为:55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,所以高一参赛学生的平均成绩约为67.1.甲乙两名学生六次数学测验成绩(百分制)如图所示.①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学高;③甲同学的平均分比乙同学低;④甲同学成绩的方差小于乙同学成绩的方差.上面说法正确的是()A.③④B.①②④C.②④D.①③解析:选A.甲的中位数为81,乙的中位数为87.5,故①错,排除B、D;甲的平均分x-=16(76+72+80+82+86+90)=81,乙的平均分x-′=16(69+78+87+88+92+96)=85,故-7-②错,③对,排除C,故选A.2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20B.30C.40D.50解析:选B.样本数据落在[15,20]内的频数为:100×[1-5×(0.04+0.10)]=30.3.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是________.解析:设污损的叶对应的成绩为x,由茎叶图可得,89×5=83+83+87+x+90+99,所以x=3.故污损的数字是3.答案:34.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:(1)填写下表:平均数方差中位数命中9环及以上甲71.21乙5.43(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.解:(1)乙的打靶环数依次为2,4,6,8,7,7,8,9,9,10.所以x-乙=110(2+4+6+8-8-+7+7+8+9+9+10)=7;乙的打靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的打靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:平均数方差中位数命中9环及以上甲71.271乙75.47.53(2)①甲、乙的平均数相同,均为7,但s2甲<s2乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙打靶成绩比甲好.③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的打靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.[A基础达标]1.已知数据x1,x2,x3,…,xn是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入xn+1,则这n+1个数据中,下列说法正确的是()A.年收入平均数大大增大,中位数一定变大,方差可能不变B.年收入平均数大大增大,中位数可能不变,方差变大C.年收入平均数大大增大,中位数可能不变,方差也不变D.年收入平均数可能不变,中位数可能不变,方差可能不变解析:选B.插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大.2.在某次高中