2.2.2用样本的数字特征估计总体的数字特征(二)方差、标准差二、用样本的标准差估计总体的标准差数据的离散程度可以用极差、方差或标准差来描述。为了表示样本数据的波动幅度,通常要求出样本方差或者它的算术平方根(标准差).(1)方差:设在一组数据,x1,x2,…,xn中,各数据与它们的平均数x的差的平方分别是22212(),(),,()nxxxxxx2222121[()()()]nsxxxxxxn来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大。那么我们用它们的平均数,即(2)标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量。222121[()()()]nsxxxxxxn计算标准差的算法:S2算出每个样本数据与样本平均数的差(i=1,2,……,n);ixxS1算出样本数据的平均数x;S3算出(i=1,2,…,n);2()ixxS4算出(i=1,2,…,n)这n个数的平均数,即为样本方差s2;2()ixxS5算出方差的算术平方根,即为样本标准差s。例1.计算数据5,7,7,8,10,11的标准差.解:S1x=———————=85+7+7+8+10+116数据xiS1xS2xi-xS3(xi-x)258-3978-1178-1188001082411839例题分析S4s2=———————=4;9+1+1+0+4+96S5.24s所以这组数据的标准差是2.例2.从某灯泡厂生产的一批灯泡中随机地抽取10只进行寿命测试,得数据如下(单位:h):1458,1395,1562,1614,1351,1490,1478,1382,1536,1496使用函数型计算器或计算机的Excel软件求样本的平均数x和样本的标准差。例题分析解:按键MODE2(进入统计计算状态)将计算器存储器设置成初始状态SHIFTScl=1458139515621614135114901478138215361496DTDTDTDTDTDTDTDTDTDT继续按下表按键按键显示结果1476.278.7309342SHIFTSHIFTxσn==x解3:打开Excel工作表,在一列输入数据,如将10个数据输入A1到A10单元格中.(1)利用求和∑计算它们的和;(2)用函数AVERAGE(A1:A10)求它们的平均数;(3)用函数VARPA(A1:A10)求它们的方差;(4)用开方函数Sqrt(方差)计算它们的标准差.例题分析例3.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1)解:190(13214023)908x.所以这组数据的方差为5.5,标准差为2.3.例4.从甲、乙两名学生中选拔一人成绩射击比赛,对他们的射击水平进行测试,两人在相同的条件下各射击10次,命中环数如下﹕甲﹕7,8,6,8,6,5,8,10,7,4;乙﹕9,5,7,8,7,6,8,6,7,7.(1)计算甲、乙两人射击命中环数的平均数和标准差;(2)比较两人的成绩,然后决定选择哪一人参赛.例题分析解:(1)计算得x甲=7,x乙=7;s甲=1.73,s乙=1.10.(2)由(1)知,甲、乙两人平均成绩相等,但s乙s甲,这表明乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选乙参赛。(3)标准差和频率直方图的关系从标准差的定义可知,如果样本各数据都相等,则标准差得0,这表明数据没有波动幅度,数据没有离散性;若个体的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也很大,数据的离散程度很高,因此标准差描述了数据对平均数的离散程度。AB样本数据3333311355平均数33标准差01.79频率分布直方图数据没有离散度数据离散程度很高1.00.80.60.40.212345123451.00.80.60.40.2再看钢管内径尺寸的例子,它的样本平均数是25.401,样本标准差是0.056,在直方图中用虚线标出平均数所在的位置,并画出距平均数两侧各一倍标准差和两倍标准差的区间。可以看到大约有70%的钢管内径尺寸落在距平均数两侧各一倍标准差的区间内,即(x-s,x+s)大约有95%的钢管内径尺寸落在距平均数两侧各两倍标准差的区间内,即(x-2s,x+2s)。ss2s2sx例题分析例5画出下列四组样本数据的条形图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;O频率1.00.80.60.40.212345678(1)50xs==O频率1.00.80.60.40.212345678(2)50.82xs==(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.频率1.00.80.60.40.212345678O(3)频率1.00.80.60.40.212345678O(4)51.49xs==52.83xs==的平均数为,12,,,naxaxaxax(2)新数据方差为.22as,方差仍为.12,,,nxbxbxbxb2s(1)新数据的平均数为,方差为.12,,,naxbaxbaxbaxb22as的平均数为(3)新数据12,,,nxxxx2s如果数据的平均数为,方差为,则(4)方差的运算性质:练习:(3)若k1,k2,…,k8的方差为3,则2(k1-3),2(k2-3),…,2(k8-3)的方差为____________3,,3,34,,,)1(2121的方差为,那么的方差为若nnxxxxxx____42,,,)2(21后的方差为这组数据均乘以,那么的方差为若nxxx432120D.0xxC.xxxx.B0A.x0x,x,x.6.______3X5231.5.D.C.B.A.4n21n21n21总体方差一定是)(,则表示的方差为,若样本是,则这个样本的标准差数是,若它的平均,,,,已知一个样本以上都不对标准差方差极差)(范围大小的指标是一组数据变化在数据统计中,能反映A2B(7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为________9.5,0.016五、回顾小结:1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数。用样本方差、标准差估计总体方差、标准差。样本容量越大,估计就越精确。2.方差、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.拓展1.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2(公顷)),试根据这组数据估计哪一种水稻品种的产量比较稳定。品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.240.02,所以,由这组数据可以认为甲种水稻的产量比较稳定。拓展2甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):甲:25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.4425.4025.4225.3525.4125.39乙:25.4025.4325.4425.4825.4825.4725.4925.4926.3625.3425.3325.4325.4325.3225.4725.3125.3225.3225.3225.48从生产零件内径的尺寸看,谁生产的零件质量较高?25.401x»甲25.406x»乙0.037s»甲0.068s»乙甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.说明:1.生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.2.问题中25.40mm是内径的标准值,而不是总体的平均数.拓展3.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换。已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差。天数151~180181~210211~240241~270271~300301~330331~360361~390灯泡数1111820251672解:各组中值分别为165,195,225,285,315,345,375,由此算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天)这些组中值的方差为[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]÷100=2128.60(天2).故所求的标准差约(天)466.2128答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.