第3章平均数、标准差与变异系数

py213147
2 ℃
2019-02-15

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第三章平均数、标准差与变异系数第一节平均数下一张主页退出上一张平均数是统计学中最常用的统计量，用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有：算术平均数（arithmeticmean）中位数（median）众数（mode）几何平均数（geometricmean）调和平均数（harmonicmean）一、算术平均数算术平均数是指资料中各观测值的总和除以观测值个数所得的商，简称平均数或均数，记为。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。(一)直接法主要用于样本含量n≤30以下、未经分组资料平均数的计算。下一张主页退出上一张设某一资料包含n个观测值：x1、x2、…、xn，则样本平均数可通过下式计算：（3-1）其中，Σ为总和符号；表示从第一个观测值x1累加到第n个观测值xn。当在意义上已明确时，可简写为Σx，（3-1）式可改写为：nxnxxxxniin121niix1nxx下一张主页退出上一张【例3.1】某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490（kg），求其平均数。由于Σx=500+520+535+560+58+600+480+510+505+49=5285，n=10下一张主页退出上一张得：即10头种公牛平均体重为528.5kg。（二）加权法对于样本含量n≥30以上且已分组的资料，可以在次数分布表的基础上采用加权法计算平均数，计算公式为：（3-2）.5(kg)528105285nxx∑ffxfxffffxfxfxfxkiikiiikkk11212211式中：—第i组的组中值；—第i组的次数；k—分组数第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量，因此将fi称为是xi的“权”，加权法也由此而得名。【例3.2】将100头长白母猪的仔猪一月窝重（单位：kg）资料整理成次数分布表如下，求其加权数平均数。ixif下一张主页退出上一张表3—1100头长白母猪仔猪一月窝重次数分布表下一张主页退出上一张利用（3—2）式得：即这100头长白母猪仔猪一月龄平均窝重为45.2kg。计算若干个来自同一总体的样本平均数的平均数时，如果样本含量不等，也应采用加权法计算。)(2.451004520kgffxx下一张主页退出上一张【例3.3】某牛群有黑白花奶牛1500头，其平均体重为750kg，而另一牛群有黑白花奶牛1200头，平均体重为725kg，如果将这两个牛群混合在一起，其混合后平均体重为多少？此例两个牛群所包含的牛的头数不等，要计算两个牛群混合后的平均体重，应以两个牛群牛的头数为权，求两个牛群平均体重的加权平均数，即下一张主页退出上一张即两个牛群混合后平均体重为738.89kg。（三）平均数的基本性质1、样本各观测值与平均数之差的和为零，即离均差之和等于零。或简写成)(89.738270012007251500750kgffxx0)(1xxnii0)(xx下一张主页退出上一张2、样本各观测值与平均数之差的平方和为最小，即离均差平方和为最小。(xi-)2(xi-a)2（常数a≠）或简写为：对于总体而言，通常用μ表示总体平均数，有限总体的平均数为：（3-3）ni1xni12)(xx2)(xNxNii1下一张主页退出上一张x式中，N表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时，则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数（）作为总体平均数（μ）的估计量，并已证明样本平均数是总体平均数μ的无偏估计量。x下一张主页退出上一张二、中位数将资料内所有观测值从小到大依次排列，位于中间的那个观测值，称为中位数，记为Md。当观测值的个数是偶数时，则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时，中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。（一）未分组资料中位数的计算方法对于未分组资料，先将各观测值由小到大依次排列。下一张主页退出上一张1、当观测值个数n为奇数时，(n+1)/2位置的观测值，即x(n+1)/2为中位数：Md=2、当观测值个数为偶数时，n/2和（n/2+1）位置的两个观测值之和的1/2为中位数，即：（3-4）2/)1(nx2)12/(2/nndxxM下一张主页退出上一张【例3.4】观察得9只西农莎能奶山羊的妊娠天数为144、145、147、149、150、151、153、156、157，求其中位数。此例n=9，为奇数，则：Md==150（天）即西农莎能奶山羊妊娠天数的中位数为150天。52/)19(2/)1(xxxn下一张主页退出上一张【例3.5】某犬场发生犬瘟热，观察得10只仔犬发现症状到死亡分别为7、8、8、9、11、12、12、13、14、14天，求其中位数。此例n=10，为偶数，则：(天)即10只仔犬从发现症状到死亡天数的中位数为11.5天。（二）已分组资料中位数的计算方法5.11212112265)12/(2/xxxxMnnd下一张主页退出上一张若资料已分组，编制成次数分布表，则可利用次数分布表来计算中位数，其计算公式为：（3—5）式中：L—中位数所在组的下限；i—组距；f—中位数所在组的次数；n—总次数；c—小于中数所在组的累加次数。)2(cnfiLMd下一张主页退出上一张【例3.6】某奶牛场68头健康母牛从分娩到第一次发情间隔时间整理成次数分布表如表3—2所示，求中位数。表3—268头母牛从分娩到第一次发情间隔时间次数分布表下一张主页退出上一张由表3-2可见：i=15，n=68，因而中位数只能在累加头数为36所对应的“57-71”这一组，于是可确定L=57，f=20，c=16，代入公式（3-5）得：(天)即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。5.70)16268(201557)2(cnfiLMd下一张主页退出上一张三、几何平均数n个观测值相乘之积开n次方所得的方根，称为几何平均数，记为G。它主要应用于畜牧业、水产业的生产动态分析，畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长率，抗体的滴度，药物的效价，畜禽疾病的潜伏期等，用几何平均数比用算术平均数更能代表其平均水平。其计算公式如下：(3-6)nnnnxxxxxxxxG1)(321321下一张主页退出上一张为了计算方便，可将各观测值取对数后相加除以n，得lgG，再求lgG的反对数，即得G值，即(3-7)【例3.7】某波尔山羊群1997-2000年各年度的存栏数见表3-3，试求其年平均增长率。)]lglg(lg1[lg211nxxxnG下一张主页退出上一张表3-3某波尔山羊群各年度存栏数与增长率下一张主页退出上一张利用（3-7）式求年平均增长率G==lg-1[（-0.368-0.398–0.602）]=lg-1（-0.456）=0.3501即年平均增长率为0.3501或35.01%。)]lglg(lg1[lg211nxxxn下一张主页退出上一张四、众数资料中出现次数最多的那个观测值或次数最多一组的组中值，称为众数，记为M0。如表2-3所列的50枚受精种蛋出雏天数次数分布中，以22出现的次数最多，则该资料的众数为22天。又如【例3.6】所列出的次数分布表中，57-71这一组次数最多，其组中值为64天，则该资料的众数为64天。下一张主页退出上一张五、调和平均数资料中各观测值倒数的算术平均数的倒数，称为调和平均数，记为H，即（3-8）调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。xnxxxnnH1111111)(121下一张主页退出上一张【例3.8】某保种牛群不同世代牛群保种的规模分别为：0世代200头，1世代220头，2世代210头；3世代190头，4世代210头，试求其平均规模。利用（3-9）式求平均规模：(头)即保种群平均规模为208.33头。33.2080048.01)024.0(1)(1512101190121012201200151H对于同一资料：算术平均数几何平均数调和平均数上述五种平均数，最常用的是算术平均数。第二节标准差一、标准差的意义用平均数作为样本的代表，其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的，还需引入一个表示资料中观测值变异程度大小的统计量。下一张主页退出上一张全距（极差）是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值，并不能准确表达资料中各观测值的变异程度，比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时，可以利用全距这个统计量。下一张主页退出上一张为了准确地表示样本内各个观测值的变异程度，人们首先会考虑到以平均数为标准，求出各个观测值与平均数的离差，（），称为离均差。虽然离均差能表示一个观测值偏离平均数的性质和程度，但因为离均差有正、有负，离均差之和为零，即（）=0，因而不能用离均差之和Σ（）来表示资料中所有观测值的总偏离程度。xx下一张主页退出上一张xxxx为了解决离均差有正、有负，离均差之和为零的问题，可先求离均差的绝对值并将各离均差绝对值之和除以观测值个数n求得平均绝对离差，即Σ||/n。虽然平均绝对离差可以表示资料中各观测值的变异程度，但由于平均绝对离差包含绝对值符号，使用很不方便，在统计学中未被采用。xx我们还可以采用将离均差平方的办法来解决离均差有正、有负，离均差之和为零的问题。先将各个离均差平方，即()2，再求离均差平方和，即，简称平方和，记为SS；由于离差平方和常随样本大小而改变，为了消除样本大小的影响，用平方和除以样本大小，即，求出离均差平方和的平均数；xx2)(xx下一张主页退出上一张nxx/)(2为了使所得的统计量是相应总体参数的无偏估计量，统计学证明，在求离均差平方和的平均数时，分母不用样本含量n，而用自由度n-1，于是，我们采用统计量表示资料的变异程度。统计量称为均方（meansquare缩写为MS）,又称样本方差，记为S2，即S2=（3-9）1/)(2nxx1/)(2nxx下一张主页退出上一张1/)(2nxx相应的总体参数叫总体方差，记为σ2。对于有限总体而言，σ2的计算公式为：（3-10）Nxx/)(22由于样本方差带有原观测单位的平方单位，在仅表示一个资料中各观测值的变异程度而不作其它分析时，常需要与平均数配合使用，这时应将平方单位还原，即应求出样本方差的平方根。统计学上把样本方差S2的平方根叫做样本标准差，记为S，即：（3-11）1)(2nxxS下一张主页退出上一张由于所以（3-11）式可改写为：（3-12）)2()(222xxxxxx222xnxxx222)()(2nxnnxxnxx22)(12)(2nxSnx下一张主页退出上一张相应的总体参数叫总体标准差，记为σ。对于有限总体而言，σ的计算公式为：（3-13）在统计学中，常用样本标准差S估计总体标准差σ。Nx/)(2下一张主页退出上一张二、标准差的计算方法（一）直接法对于未分组或小样本资料，可直接利用（3-11）或（3-12）式来计算标准差。【例3.9】计算10只辽宁绒山羊产绒量：450，450，500，500，500，550，550，550，600，600，650（g）的标准差。此例n=10，经计算得：Σx=5400，Σx2=2955000，代入（3—12）式得：(g)即10只辽宁绒山羊产绒量的标准差为65.828g。828.6511010/540029550001/)(222nnxxS下一张主页退出上一张（二）加权法对于已制