残差与误差的区别误差与残差,这两个概念在某程度上具有很大的相似性,都是衡量不确定性的指标,可是两者又存在区别。误差与测量有关,误差大小可以衡量测量的准确性,误差越大则表示测量越不准确。误差分为两类:系统误差与随机误差。其中,系统误差与测量方案有关,通过改进测量方案可以避免系统误差。随机误差与观测者,测量工具,被观测物体的性质有关,只能尽量减小,却不能避免。残差――与预测有关,残差大小可以衡量预测的准确性。残差越大表示预测越不准确。残差与数据本身的分布特性,回归方程的选择有关。随机误差项Ut反映除自变量外其他各种微小因素对因变量的影响。它是Yt与未知的总体回归线之间的纵向距离,是不可直接观测的。残差et是Yt与按照回归方程计算的Yt的差额,它是Yt与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算et的具体数值。利用残差可以对随机误差项的方差进行估计。随机误差是方程假设的,而残差是原值与拟合值的差。实践中人们经常用残差去估计这个随机误差项。意义不一样哈,残差一般只的是在计算近似值过程中某一步与真实值得差值,而误差指的的是最终近似值与真实值得差值残差就是回归所得的估计值与真值(实际值)之间的误差;修正的Rsquare就是剔出了数据量影响后的R23.4.3测量不确定度评定方法参考公式及其详解参考:发布的“测量不确定度表示指南”是测量数据处理和测量结果不确定度表达的规范,由于在评定不确定度之前,要求测得值为最佳值,故必须作系统误差的修正和粗大误差(异常值)的剔除。最终评定出来的测量不确定度是测量结果中无法修正的部分。测量不确定度评定总的过程如图3-3所示的流程。具体的方法还要有各个环节的计算。图3-3测量不确定度评定流程图1、标准不确定度的A类评定此法是通过对等精度多次重复测量所得数据进行统计分析评定的,正如前面介绍的随机误差的处理过程,标准不确定度u(xi)=s(xi),是用单次测量结果的标准不确定度算出:(3-20)其单次测量结果的标准不确定度可用贝塞尔法求得,即:=(3-21)其实,单次测量结果的标准不确定度还有如下求法:①最大残差法:=,系数如表3-2所示。表3-2最大残差法系数n234567891015201.771.020.830.740.680.640.610.590.570.510.48②极差法:居于服从正态分布的测量数据,其中,最大值与最小值之差称为极差。=,系数如表3-3所示。表3-3极差法系数n234567891015201.131.692.062.332.532.702.852.973.083.473.742、标准不确定度的B类评定B类评定是一种非统计方法,当不能用统计方法获得标准不确定度,或已有现成的相关数据时采用,此时,测量结果的标准不确定度是通过其他途径获得,如信息、资料。来源有以下几方面,如:此前已做测量分析;仪器制造厂的说明书;校准或其它报告提供的数据;手册提供的参考数据等。具体计算标准不确定度方法如下:u(xj)=——已知的展伸不确定度,或是已知的测量值按某一概率的分布区间的半值——包含因子,它的选取与分布有关;正态分布时则与所取的置信概率有关。①当得知不确定度U(xj)为估计标准差的2或3倍时,kj则为2或3;②若得知不确定度U(xj)以及对应的置信水准,则可视其为服从正态分布。若置信水准为0.68、0.95、0.99或0.997时,kj则对应为1,1.96,2.58,3;③若得知U(xj)是xj变化范围的半区间,即Xj在[xj-U(xj),xj+U(xj)]内,且知道其分布规律,kj由表3-4选取:表3-4集中非正态分布的置信因子分布三角分布梯形分布均匀分布反正弦分布3、求合成标准不确定度测量结果y的标准不确定度(y)或u(y)为合成标准不确定,它是测量中各个不确定度分量共同影响下的结果,故取决于xi标准不确定度u(xi),可按不确定度传播律合成。计算方法与前面介绍的随机误差的合成方法相同。4、求展伸不确定度展伸不确定度是为使不确定度置信水准(包函概率)更高而提出的,需将标准不确定度uc(y)乘以包含因子k以得到展伸不确定度:U=kuc(y)。展伸不确定度计算见图3-4所示流程有两种处理方法,一种是自由度不明或无,当“无”处理。另一种是知道自由度,按“有”处理,此时包含因子k与自由度有关。图3-4展伸不确定度计算5、测量不确定度报告上述根据测量原理,使用测量装置进行测量,求得测量结果以及测量结果的展伸不确定度,最后是给出测量结果报告,同时应有测量不确定度报告。测量不确定度报告用展伸不确定度表示,其形式如下。(1)有自由度v时表达为:测量结果的展伸不确定度U=XXX并加如下附注:U由合成标准不确定度uc=XXX求得,其基于自由度v=XXX,置信水准p=XXX的t分布临界值所得包含因子k=XXX。(2)自由度v无法获得时表达为:测量结果的展伸不确定度U=XXX并加如下附注:U由合成标准不确定度uc=XXX和包含因子k=XXX而得。6、应用举例[例3-1]等精度测量某一尺寸15次,各次的测得值如下(单位为mm):30.742,30.743,30.740,30.741,30.755,30.739,30.740,30.739,30.741,30.742,30.743,30.739,30.740,30.743,30.743。求测量结果平均值的标准偏差。若测得值已包含所有的误差因素,给出测量结果及不确定度报告。解:1)求算术平均值:=461.130/15=30.7422)求残差vi=xi-得(单位μm):0,+1,―2,―1,+13,―3,―2,―3,―1,0,+1,―3,―2,+1,+1。3)求残差标准偏差估计值S==3.9mm4)按3σ准则判别粗大误差,剔除不可靠数据:|+13|>3σ(等于3S=11.7),30.755应剔除。5)剩余14个数字再进行同样处理:求得平均值:430.375/14=30.741求得残差(单位mm):+1,+2,―1,0,―2,―1,―2,0,+1,+2,―2,―1,+2,+2。求残差标准偏差估计值(单位mm)S==1.6,3σ=3S=4.8,再无发现粗大误差。6)求测量结果平均值的标准偏差(单位mm):===0.47)测量结果:(属于A类、按贝塞尔法评定)测得值为:30.741mm测量结果的展伸不确定度U=0.0009mm(U由合成标准不确定度uc=0.0004求得,基于自由度v=13,置信水准p=0.95的t分布临界值所得包含因子k=2.16。)内部可靠性内部可靠性可用最小可探测偏差(MDB)描述,MDB代表了最小可能的观测误差,仍然可以通过统计经验(数据探测)检测到其概率等于检验。大的MDB表明观测值或坐标的检核无效。因此MDB越大,可靠性越低。如果不对观测值进行检验就不能计算MDB值,观测值标记为'自由观测值'。当建立一个大地网时对于测量员最通常的活动是进行多余观测。这样对观测值的丢失可以进行一些补偿。更为重要的是可以改善网的质量。这项特殊的测量任务的价值在于不再只有一种解决方法使得网的条件比较满意(e.g.三角形内角和为200gon)。因此需要一个方案来改正观测值使得他们符合条件。观测值需改正的量叫做观测值的残差。最小二乘平差通过使观测值的残差的平方和最小方法使观测值纳入模型。这些残差即为最小二乘平差改正数。任何最小二乘平差模型包含两个同等重要的部分:数学模型和统计模型。数学模型是建立观测值和未知数之间的联系。统计模型描述了观测值误差期望值的分配。标准偏差:下面的六列内容包含如下的信息:观测值类型、测站名称(也许是GPS参考站、TPS基准站或水准路线起点)目标点名称(或许是GPS流动站、TPS目标或水准路线终点),对于地面测量来说,接着是绝对标准差(Sdabs),相对标准差(Sdrel)以及由绝对标准差和相对标准差、对中误差和仪器高误差所计算出的整体标准差(Sdtot)。⑴绝对标准差(Sdabs)⑵相对标准差(Sdrel)⑶整体标准差(Sdtot)W-检验:只有一个观测值中有超限误差而其它观测值均正确.和这种假设相关联的一维检验为W-检验。在网中用W-检验对每个观测值进行检验的过程称之为数据探测。临界值Wcrit取决于显著水平a0的选取F-检验通常称为整体模型检验,因为它从总体上对模型进行了检验。F值由如下表达式给出:F=s2/2其中s2=为后验方差因子,取决于计算的残差和多余观测;2=为先验方差因子。RINEX代表接收机独立交换格式,并且已成为GPS数据的标准ssssddd#.yytssss:4个字符表示测站说明nddd:第一个记录的年日#:日中的文件序列号yy:年t:文件类型:O=观测文件N=导航文件关于该格式的完整说明可在网上看到: