第二章统计2.2用样本估计总体2.2.2用样本的数字特征估计总体的数字特征学习目标核心素养1.会求样本的平均数、标准差、方差.(重点)2.理解用样本的数字特征估计总体的数字特征的方法.(重点)3.会应用相关知识解决实际统计问题.(难点)1.通过样本数字特征的学习,体现了数据分析的核心素养.2.借助用样本的数字特征解决实际问题,提升数学运算的数学核心素养.自主探新知预习1.样本的众数、中位数、平均数(1)众数:在数据中,出现最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数.(2)中位数:将数据按大小依次排列,把处在位置的一个数据(或两个数据的平均数)叫这组数据的中位数.(3)平均数:指样本数据的算术平均数,即x=.最中间1n(x1+x2+…+xn)样本次数样本思考:一组数据的平均数、众数、中位数有可能相等吗?[提示]有.2.样本的方差与标准差(1)数据的离散程度可以用极差、方差或标准差来描述.样本方差描述了一组数据围绕_______波动的大小.一般地,设样本的元素为x1,x2,…,xn,样本的平均数为x,定义s2=.平均数[x1-x2+x2-x2+…+xn-x2]n(2)为了得到以___________的单位表示的波动幅度,通常要求出样本方差的算术平方根,即样本标准差s=.样本数据x1-x2+x2-x2+…+xn-x2n思考:方差与标准差的大小与样本数据有什么关系?[提示]标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.1.下列各数字特征中,能反映一组数据离散程度的是()A.众数B.平均数C.标准差D.中位数C[方差与标准差反映一组数据的离散程度.]2.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值约为()A.4.55B.4.5C.12.5D.1.64A[x=4×3+3×2+5×4+6×23+2+4+2≈4.55.]3.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是()A.众数B.平均数C.中位数D.标准差D[对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.]4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________;(2)命中环数的标准差为________.(1)7(2)2[(1)x=7+8+7+9+5+4+9+10+7+410=7.(2)s2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.]合作提素养探究平均数、众数、中位数的求法【例1】甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图所示,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲的日加工零件的平均数为________;乙的日加工零件的众数与中位数分别为________和________.[思路探究]由茎叶图分别提取出甲、乙10天中每天加工零件的个数,然后求平均数,众数与中位数.2424与3023[甲每天加工零件的个数分别为:18,19,20,20,21,22,23,31,31,35,所求平均数为x甲=110×(18+19+20+20+21+22+23+31+31+35)=24.乙每天加工零件的个数分别为:11,17,19,21,22,24,24,30,30,32,故众数为24与30.中位数为12×(22+24)=23.]1.求平均数时要注意数据的个数,不要重计或漏计.2.求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数.3.若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.1.对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:①这组数据的众数是3;②这组数据的众数与中位数的数值不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为()A1B.2C.3D.4A[在这一组数据中,3出现次数最多,有6次,故众数是3;将数据按从小到大顺序排列后,最中间的数据是3,故中位数是3;平均数x=2×2+3×6+6×2+1011=4,故只有①正确.]方差和标准差的计算及应用【例2】甲、乙两机床同时加工直径为100cm的零件,为检验质量,从中抽取6件测量数据为:甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定.[思路探究][解](1)x甲=16×[99+100+98+100+100+103]=100,x乙=16×[99+100+102+99+100+100]=100,s2甲=16×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s2乙=16×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知x甲=x乙,比较它们的方差,∵s2甲>s2乙,故乙机床加工零件的质量更稳定.1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.2.关于统计的有关性质及规律:(1)若x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,…,mxn+a的平均数是mx+a;(2)数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等;(3)若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.2.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:甲127138130137135131乙133129138134128136求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.[解]设甲、乙两人成绩的平均数分别为x甲,x乙,则x甲=130+16(-3+8+0+7+5+1)=133,x乙=130+16(3-1+8+4-2+6)=133,s2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473,s2乙=16[02+(-4)2+52+12+(-5)2+32]=383.因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.样本的数字特征的意义及综合应用[探究问题]1.平均数、中位数、众数中,哪一个量与样本的每一个数据都有关,它的缺点是什么?[提示]平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但它的缺点是受数据中极端值的影响较大.2.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?[提示]为了避免平均值受数据中个别极端值的影响,增大它在估计总体时的可靠性.3.我们知道,当把样本数据制成频率分布直方图后,失去了原始数据,那么是不是不能根据频率分布直方图求平均数、众数与中位数呢?[提示]不是.可以用频率分布直方图估计样本数据的平均数、众数和中位数.【例3】(1)据了解,某公司的33名职工月工资(单位:元)如下:职务董事长副董事长董事总经理经理管理员职员人数11215320工资110001000090008000650055004000该公司职工月工资的平均数与中位数分别为________,在这两个统计量中,________更能反映这个公司员工的工资水平;(2)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.则这次数学测试的众数与中位数分别为________.[思路探究](1)求出中位数与平均数,再根据其反映的数字特征进行判断.(2)由数字特征在直方图中的求法求解.(1)5333,4000中位数(2)75,73.3[(1)把工资数据由小到大排列,得到中位数为4000元.平均数x=11000+10000+9000×2+8000+6500×5+5500×3+4000×2033≈5333元.由数字知,中位数更能反映该公司员工的工资水平,平均数受少数人工资额的影响较大,不能反映这个公司员工的工资水平.(2)由直方图知众数为70+802=75.设中位数为x,由前三个矩形面积之和为0.4,第四个矩形面积为0.3,因此中位数位于第四个矩形内,有0.1=0.03(x-70),所以x≈73.3.]1.(变结论)本例(2)条件不变,求这次数学测试的平均数.[解]x=45×0.05+55×0.15+65×0.20+75×0.30+85×0.25+95×0.05=72.2.(变条件)本例(2)改为为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图所示,则(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________.(3)这20名工人中一天生产该产品数量的平均数为________.(1)13(2)62.5(3)64[(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13.(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.(3)0.20×50+0.40×60+0.25×70+0.10×80+0.05×90=64.]1.因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.2.利用频率分布直方图估计数字特征:(1)众数是最高的矩形的底边的中点.(2)中位数左右两侧直方图的面积相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标.提醒:利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.1.本节课的重点是会求样本的众数、中位数、平均数、标准差、方差,难点是理解用样本的数字特征来估计总体数字特征的方法.2.本节课要掌握以下几类问题:(1)当平均数大于中位数时,说明数据中存在较大的极端值;反之,说明数据中存在较小的极端值.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(3)利用频率分布直方图求出的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.3.本节课的易错点有两个:(1)计算标准差或方差时易将公式记错而致误.当堂固双基达标1.思考辨析(1)样本的平均数描述了样本数据的平均水平.()(2)方差越大、数据越集中在平均数左右.()(3)中位数是样本数据中最中间位置的数据.()[答案](1)√(2)×(3)×2.如图所示是2017年某高一学生下学期政治考试成绩的茎叶图(茎表示成绩的十位数字),则该生政治考试成绩的平均数和众数依次为()A.85,84B.84,85C.86,84D.84,86C[由题意可知,平均数x=79+79+84+84+86+84+87+90+90+9710=86,众数为84.]3.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参