第二章统计量、参数估计与区间估计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章统计量、参数估计与区间估计分析测试都采取抽样检验,通过样本测试对总体的某个或某些特征进行估计与作出推断。统计推断:参数估计、假设检验参数估计:随机变量分布函数已知,须通过样本值估计分布的参数假设检验:假设随机变量分布具有某种函数分布形式,根据样本值通过检验分布参数来推断其假设是否正确。已知随机变量分布函数为正态分布,而表示其分布特性的参数有μ、σ2,为总体的参数。确定了μ、σ2,就可以预测和估计任何测量值落在某一区间的概率,了解总体分布的基本特征。参数的点估计实际分析测试中,对样本进行的是有限次的测定,只能得到样本的平均值和样本方差s2,那么,能否用样本平均值和样本方差s2来分别估计总体均值μ和总体方差σ2,如果理论上证明是可行的,就可将求总体均值μ和总体方差σ2简化为求样本的平均值和样本方差s2。xxx所以,参数估计是根据样本数据估计总体参数的值,如估计总体均值、总体方差,称为参数的点估计。估计值不正好等于待估参数,而只是其近似值。参数的区间估计它包括参数存在的区间,同时也给出此区间包含待估参数真值的概率,常以置信区间的形式给出。第一节加和号和期望值的运算一、加和号的运算1.2.3.,或4.xxxxmnnnmnmii...1xxxxnnii2222112...niiniixx1212nniixxxx2112212)...()(xxxxni5.6.(a为常数)7.8.(当样本一定,为常数)即nnyxyxyxyxii...2211xaxaiinaaxnxxinx1xxxxiiinnn1)1(xixnx9.10.(即一组随机样本值对于样本平均值的偏差的加和等于零。)naxaxii)(0)(xnxxxiixnxnnxii1二、期望值及其运算1.定义对于一个测量值来说,其期望值就是总体的平均值(在无系统误差时)。期望值就是理想值-真值。即我们并不期望在一次给定的试验中,会取它的期望值,然而在大量的试验中,我们可合理地预料,的平均值将在的期望值的附近。2.表示符号:<>,对于方差σ2()表示3.运算规则(1)a为常数,<>=;xxxaa(2)若是随机变量的随机样本值<>=<>=μ=总体均值=(3)(4)(5)xixixxni122222)(1)()()()(iiiixnxxxxx><>><<<ax>=<a><x>=a<x>=μa<xi>=<xi>=μn(6)证明:(7)若和是两个互相独立的随机变量,如:即对于相互独立的随机变量,各变量之和(或差)的期望值,都等于各变量的期望值之和(或差)。))())222222xaxxaaxaxax(σ>><<>><<((σ)(σσxaxa222)()(σσxaxa222)(xy><><><yxyx>><<><yxxy(8)(9)平均值的方差,等于各别测量值的方差的)()()()(2222xnxxxiiσσσσ)1)(.1)(1)(1)()(222222222xnxnnxnxnnxxii(σσσσσσn1(10)证明:由于随机变量相对于它们的平均值的偏差的加和等于零。所以:)()2))))((2)())()))()(22222222><><><<(>><<(>><<(>><><><><<(>]><><<[(>><><<(>>]<<[σyyxxyyxxyyxxyyxxyyxxyxyxyxyxyx0)(>><<xx)0)(1)((μ>μ<xinx)()()(222yxyxσσσ)()()(222yxyxσσσ(11)证明:∵∴上式∴若则222)())(><(><σxaxax>><><><<>><<>><=<>><><><><<>]><><<[>><><<(><)()(2)()())((2)()()(())(2222222xaxxxaxxxaxxxaxxxaxxaxxxax0)(>><<xx2222)()))(><(σ>><<(>><<xaxxaxx0a222)(><><xxx整理得:∵∴又∵由上式得:∴22222)()nnxxxxxii><><(σ2(μ)xiSnnSxxi22()(μ)σSxnxi22)()μ(σ222)(1)xnxxnii(σ222)(1)xxiinxnS(σ222)(><><xxx由上可见。S是由平均值计算出来的。但通常并不是有限小数,绝大多数都按数字修约规则获得的近似值,于是各偏差也都是近似值,其平方再加和,会把舍入误差累积起来,使S、s2、s受影响。为了消除上述弊病,同时为了计算机编程方便起见,可由样本值按上式直接求出方差和S、s2、s。第二节统计量一、统计量1.定义将样本值经过加工运算得到的样本函数值,称为统计量。它可以把关于总体的有用信息更明确更集中地反映出来,如、R、s2、s、S等,这些数值都是由随机变量的随机样本值得到的。所以,统计量也是随机变量。2.作用利用统计量可以对被测物理量的数值作出统计意义的推断xxi选定一个概率(置信概率),并在真值统计量的两边,各定出一个界限(置信限),由此画出的区间——置信区间,然后才能断然说,这个区间包含真值在内的概率是多少,这叫做区间估计而被推断出物理量真值的某个统计量叫做参数的点估计。例如,样本平均值作为总体均值μ的估计值,记做。x二、一些统计量的计算1.平均值简化计算法----编码变换(大的变小,小数变整数)(1)(2)(3)(表示一个数)注意:当测定精密度好,可多保留一位;当离散度大时,位数与测量值相同或少一位。xnxi1aaxxiiixnx1axx2.差方和(离差平方和)方差标准差2)(xSxi12nSs1nSsS的计算方法:(1)由样本值直接求:利用简化计算法与的关系:22)(1xxiinSS)(axbxiiS各样本值同减去一个数a,其差方和不变令则∴axxiiaxxSxxaxaxxxSiii222)()()()(SxnxSii22)(1各样本值同乘以一个数b,其差方和增大b2倍令∴iibxxxbxSbxxbxbbxxxSiii22222)()()(2bSS例2-1用K2Cr2O7法测定某赤铁矿中铁的含量,数据如下:66.64,66.56,66.65,66.62,66.63计算方法的精密度。解:编码公式:%1001%100xnSxsRSD=ix2ixxi100)60.66(iixx66.6466.5666.6566.6266.634-4523101616254970∴(2)先计算平均值,再由,求S。005.0501002==S%053.0%10062.664005.0%1001xnSRSDx2)(xSxi62.661051060.6610560.6622ixx50105170)(1222iixnxS习题某标准水样中氯化物含量为110mg/L,银含量法测定5次的结果分别为112,115,114,113,115mg/L。(1)计算平均值的绝对误差和相对误差;(2)计算样本的差方和、方差、标准偏差和相对标准偏差。第三节参数的点估计一、参数的点估计点估计:用样本的统计量作为总体参数的估计值,叫做总体参数的点估计。表示测定值集中趋势的参数:均值、中位值等,表示测定值离散特性:算术平均偏差、极差、方差和标准差。^μx^μ~x22ss二、参数μ的点估计值1.算术平均值(指各测量值的方差都相等的等精度的测量)(1)平均值是总体均值μ的无偏估计量,这是因为参数μ的估计量的期望值等于被估参数,即无偏估计量是说由测定值计算的估计值离被估参数μ很近,由不同样本得到的估计值在被估参数μ附近波动。xx=μμ><><><nxnxnxii111xμ><xx(2)是出现概率最大的值p23在正态总体中,随机抽出容量为的样本,独立进行测定,得到个测定值测定值出现的概率是指随机变量出现在区间的概率(即具有各种大小偏差的样本值出现的概率)。eFaixi2(2121)σπσnxixxi△nnxxx,,21iFx假设最佳值为,则为各次测量值所对应的误差由于各次测量值独立进行,所以在次测定中,总概率F为:exxxaaannxxxFFFFn][(222212)()()212121)()()()(naaxi),(),(),(21axaxaxn而在一组测量中,最佳值或最可信赖值乃是当总概率P最大时所求出的那个值。由指数关系可知,当F最大时,则为最小,亦即在一组测量值中各偏差的平方和最小,而S为极小值的条件:222221)())()(axaxaxaxin+(当S最小,∴∴∴算术平均值0dadS022daSd0)(2)(2)(2)(221aaaadadSxxxxinndaSd222222200)(0)(2naxaxaxiiixnai1由此可得结论(最小二乘法原理):在一组等精度测量中,为其最佳值或最可信赖值;各测量值与的偏差的平方和为最小由正态分布图形也可看出,由于正态分布概率密度函数曲线对μ对称,各测定值对真值μ的偏差有正有负,正负偏差出现的机会相同。当对测定数据进行算术平均后,一部分正负误差相互抵消,因此,用来估计μ偏差会更小。xxx(3)在一组测量值中,测定值对算术平均值的偏差之和为零由上可见,算术平均值充分利用了样本测定所提供的全部信息,在等精度的测定中,是出现概率最大,偏差平方和最小的值,因而是最可信赖的。算术平均值是μ的无偏估计量,用它来估计μ是最有效的。0)(1xnxnxnxxxinii)1(xnnnxi2.加权平均值设有m组精度分别为S1、S2、…Sm的不等精度的平均值(不同的人、不同的室、或一个人用不同的方法测定同一试样)被测定量μ的最佳值或最佳估计值是样本测定值的加权平均值:(表示)式中权数与测定值的方差成反比。wxwxwxiiiwxiixwsix121swiimxxx、、21wx权重:表示某个精度测定值在样本平均值中所占的地位、比例或贡献,即表示测量值可信赖程度的数值。可见,测量值的可信赖程度与标准差有关,标准差愈小其可信赖程度愈大,因而其权愈大。正态分布的条件下,给于较大权数的测定值必定是最可信赖值,即误差最小,概率最大的测定值。21swiiwi加权平均值的特性:(1)不等精度测定中,是总体均值μ的无偏估计量wxwxwwxwxiiiiiw><><><(2)在不等精度测量中,是出现概率最大的值(3)对于精密度S相同,但测量次数不同的几组测量值,各组测量值平均值的精密度不同,所以(权数=测定次数)nxnxiiiwwx在等精度的测定条件下,各测定值的权相同,则加权平均值等于算术平均值,这是不等精度测定的一种特殊情况,即无论是等精度还是不等精度的测量,都可用加权平均值表示测定结果。xxnxxwxiiiiw1例2-2某一实验室三个分析人员分别用光谱法、原子吸收法和化学法测定耐火材料中的CaO,测定结果分别为(%):1.65,1.67,1.70,标准差分别为0.043,0.024,0.020,问该实验室应如何报分析结果?例2-2某一实验室三个分析人员分别用光谱法、原子吸收法和化学法测

1 / 90
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功