2.2.1用样本的数字特征估计总体的数字特征温故知新2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.1、众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.3、平均数:一般地,如果n个数,那么,叫做这n个数的平均数。12,,...,nxxx121(...)nxxxxn例1:对于数据3,3,2,3,6,3,10,3,6,3,2,说出众数,中位数和平均数在上一节抽样调查的100位居民的月均用水量的数据中,我们来求一下这一组样本数据的众数、中位数和平均数3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2在上一节抽样调查的100位居民的月均用水量的数据中,我们来求一下这一组样本数据的众数=2.3(t)中位数=2.0(t)平均数=2.0(t)那么,观察这组数据的频率分布直方图,能否得出这组数据的众数、中位数和平均数?众数、中位数和平均数频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。如何在频率分布直方图中估计众数可将众数看作直方图中面积最大长方形的“中心”频率分布直方图00.10.20.30.40.50.6月均用水量/t0.52.521.5143.534.5频率组距2.25如何利用频率分布直方图求众数:00.10.20.30.40.50.60.511.522.533.544.5月均用水量/t频率/组距S1S2S3S4S5S6S7S8S9如何利用频率分布直方图求中位数:S1=0.040.5S1+S2=0.04+0.08=0.120.5S1+S2+S3=0.04+0.08+0.15=0.270.5S1+S2+S3+S4=0.04+0.08+0.15+0.22=0.490.52.020.5x解:设中位数为2+x,则一小部分的频率为0.5x,所以:0.49+0.5x=0.5解得:x=0.02所以中位数为2.020.040.080.150.22x是长度0.5是宽度平均数的估值=频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02(t).如何利用频率分布直方图求平均数:00.10.20.30.40.50.60.511.522.533.544.5月均用水量/t频率/组距S1S2S3S4S5S6S7S8S90.50.040.080.150.220.250.140.060.040.02众数:最高矩形的中点的横坐标;中位数:在频率分布直方图中,中位数的左右两边的直方图的面积相等,都为0.5;平均数:每个小矩形的面积乘以中点的横坐标之和知识小结(平均数:每个频率乘以中点的横坐标之和)注:利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.例:某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)高一参赛学生的成绩的众数、中位数.(2)高一参赛学生的平均成绩.例题讲解又∵第一个小矩形的面积为0.3,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67.x解:(1)由图可知众数为65,应聘者小范这个公司员工收入到底怎样?赵经理我这里报酬不错,月平均工资是3000元,你在这里好好干!第二天,小范哼着小歌上班了.我的工资是1500元,在公司算中等收入我们好几个人工资都是1200元技术员D技术员C深入理解小范在公司工作了一周后平均工资确实是每月3000元,你看看公司的工资报表.经理,你忽悠了我,我已问过其他技术员,没有一个技术员的工资超过3000元.员工总工程师工程师技术员A技术员B技术员C技术员D技术员E技术员F见习技术员G工资90007000280027001500120012001200400下表是该公司月工资报表:(1)请观察表中的数据,计算该公司员工的月平均工资是多少?经理是否忽悠了小范?(2)技术员C与技术员D是否忽悠了小范?他们又是用的数据中的那些量呢?我的工资是1500元,在公司算中等收入我们好几个人工资都是1200元技术员D技术员C(2)技术员C与技术员D是否忽悠了小范?他们又是用的数据中的那些量呢?众数中位数名称优点缺点众数中位数平均数知识小结不受少数几个极端值的影响对极端值不敏感反映出更多的关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变体现了样本数据的最大集中点只能表达样本数据很少的一部分信息,无法客观反映总体特征在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你如何对这次射击作出评价?【探究新知】77xx乙甲,两人射击的平均成绩是一样的,那么两个人的水平就没有什么差异吗?作出两人成绩的频率分布条形图,可以看出还是有差异的环数频率0.40.30.20.145678910O(甲)环数频率0.40.30.20.145678910O(乙)甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定.因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图表时提到过的极差.甲的环数极差=10-4=6,乙的环数极差=9-5=4.甲:78795491074乙:9578768677极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用S表示.12.nxxxxxxSn由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.所谓“平均距离”,其含义可作如下理解:3、标准差与方差【探究新知】假设样本数据x1,x2,…,xn的平均数为,则标准差的计算公式是:x222121[()()()nsxxxxxxn(1)标准差:(2)方差2222121[()()()nsxxxxxxn用来描述样本数据的离散程度.例2、甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm),试根据这组数据估计哪一种水稻品种的产量比较稳定.2品种第一年第二年第三年第四年第五年甲9.89.910.11010.2乙9.410.310.89.79.8解:10)2.10101.109.98.951(甲x02.05])102.10()1010()101.10()109.9()108.9[(222222甲s10)8.97.98.103.104.951(乙x24.05])108.9()107.9()108.10()103.10()104.9[(222222乙s较稳定。,所以甲水稻的产量比小于因为乙甲xx标准差的取值范围是标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围;[0,)S=0,标准差为0的样本数据都相等.12,,,nxxxx2s12,,,nxbxbxbxb2s12,,,naxaxaxax22as12,,,naxbaxbaxbaxb22as如果数据的平均数为方差为(1)新数据的平均数为,方差仍为.(2)新数据的平均数为,方差为.(3)新数据的平均数为,方差为.则方差的运算性质:(2)若样本1+X1,1+X2,1+X3,…,1+Xn的平均数是10,方差为2,则对于样本2+X1,2+X2,……2+Xn,下列结论正确的是()A.平均数为10,方差为2B.平均数为11,方差为3C.平均数为11,方差为2D.平均数为12,方差为4C(1)某学生在一次考试中,语文、数学、英语三门学科的平均成绩是80分,物理、化学两门学科的平均成绩为85分,则该学生这五门学科的平均成绩是_____分.82练习(3)数据x1,x2,…,x8平均数为6,标准差为2,则数据2x1-6,2x2-6,…,2x8-6的平均数为_____,方差为_____.616【知识归纳】1、众数、中位数、平均数2、用频率分布直方图估计众数、中位数、平均数(1)众数:最高的矩形的底边的中点的横坐标.(2)中位数:左右两侧直方图的面积相等.(3)平均数:每个小矩形的面积乘以小矩形底边中点的横坐标之和.3、标准差、方差