第八章静态测量数据处理第一节试验数据结果的表达静态数据是测定值不随时间变化的数据,常用以下三种方式来表达.数字:用误差分析理论图形:绘制曲线公式:找出经验公式y=f(x)实验数据结果关于数字表达,上一章已详细讲解过,以下介绍图形法和公式法。8.1.1试验数据结果的表达图形表达图形表达比较直观,一目了然,是常用的表达方法.坐标的选择与分度8.1.2试验数据结果的图形表达坐标直角极坐标均匀分度非均匀分度对数坐标三角函数坐标...①坐标在直角坐标系中绘制测量数据的图形时,应以横坐标为自变量,纵坐标为对应的函数量。②分度坐标纸的大小与分度的选择应与测量数据的精度相适应。分度过粗时,影响原始数据的有效数字,绘图精度将低于试验中参数测量的精度;分度过细时会高于原始数据的精度。③起点选择无论自变量还是应变量坐标的标度值不一定从零开始,以实验数据的图形占满整个图形为宜。直线应尽可能与坐标轴成450角。横坐标与纵坐标的实际长度应基本相等。④坐标轴应注明分度值的有效数字和名称、单位。数据描点与曲线描绘①描点根据实验的测量结果(不是测定值),在直角坐标上标出实验点,实验点的标示可用各种形式,如点、圆、矩形、叉等,但其大小应与其误差相对应。若考虑测量误差可用空心圆,矩形,正方形等标点,其中心是最可信赖值,边长代表误差,见图8-1.P145.)]2)(2[(yx②曲线描绘曲线应光滑匀整,所有数据要靠近曲线,大体上随机分布在曲线两侧,落在误差带范围中,但不必都在曲线上。在数据急剧变化的地方数据点应选密一些。③平滑处理分组平滑将实验数据分成2~4个数据为一组的若干组,分别求出各组的几何中心坐标根据这些点描绘曲线。),(),......,,(),,(2211mmyxyxyx残差图法利用残差分析法修正曲线,画出最佳曲线。最佳曲线的原则是测量数据和所画直线的残差和以及残差平方和最小。0iv通过不断修正所绘直线最后得到最佳曲线,修正过程如下:1.在坐标图上标注出实验数据。2.根据实验数据点作一条直线,并求出直线方程y=ax+b3.求出各点所对应的残差:vi=yi-(axi+b)4.求残差直线方程v=a'x+b'5.根据修正值定义,修正直线,得修正后直线方程y=a1x+b1,式中a1=a+a'b1=b+b'经验公式法测量数据不仅可用图形表示出数据之间的关系,而且可用与图形对应的一个公式(解析式)来表示所有的测量数据,当然这个公式不可能完全准确地表达全部数据。因此,常把与曲线对应的公式称为经验公式,在回归分析中则称之为回归方程。8.2试验数据的插值法kx1插值多项式模型已知函数y=f(x)在n个点上的值f(),求一个次数低于n的插值多项式kxkx1()()nkkLxfx(k=1,2,…n)表示插值多项式的最紧凑的方式是拉格朗日(Lagrange)形式111112111121101nnninkkkikkkiiknkknikikikkkkkkknikkixxLxlxyyLagrangexxxxxxxxxxxxxxlxxxxxxxxxxxxxiklxik称为插值多项式其中:=而:拉格朗日插值法求多项式模型为:211211221221111221222313112312132123n21,0;0,1Lagrangen3()()()()()()yxxxxxyxyyylxylxxxxxlxlxlxlxyxxxxxxxxxxxyxyyyxxxxxxxx当=,可以得到的表达式如下:显然,此时:插值多项式即为线性插值当=,可以得到的表达式如下:()()()23132112233()()()Lagrangexxxxxxylxylxylx此时:插值多项式为典型的抛物线插值多项式,它是常用公式之一(4-3)(4-4)Lagrange插值多项式的优点在于不要求数据点是等间隔的,其缺点是数据点数不宜过大,通常不超过7个,否则计算工作量大且误差大,计算不稳定。例15)(,1)(,8)(,4,2,1321321xfxfxfxxx求二次插值多项式。1122332()(2)(4)(1)(4)(1)(2)815(12)(14)(21)(24)(41)(42)31621Lxylxylxylxxxxxxxxx解:按拉格朗日方法,有:8.2.1一元线性回归两个变量之间是线性关系,则称为一元线性回归一、回归方程的确定例:某车辆在水平直线路面上行驶,行驶距离与时间t的关系如表8-1序号12345678距离S(m)700900116011901270149016202130时间t(min)3.84.24.74.84.95.45.66.7第二节回归分析与曲线拟合定义:根据最小二乘原理确定经验公式的数理统计学方法称为回归分析目的:在于找出一条最能代表所有观测资料的函数(回归估计式)回归分析要解决的问题:1、确定函数类型2、确定函数中的参数3、对函数的精度作评估回归分析一元回归多元回归线性回归非线形回归将表8-1中的数据画在坐标纸上,如图8-5所示,从图中看出这些点近似于一条直线,可用一条直线来代表它们的关系,设:式中:x—距离s;a,b—线性回归系数.bxay(8-5)的值)值;(按回归方式算出公式中算出的—ty确定系数a,b的原则是对应同一自变量,实测数据与回归数据之差的平方和最小。将a,b作为变量,求其值。niiiyyyQ12min)((8-6)niiiybxayQ12][0aQy令0bQy解方程,求出a,b的数值.根据表8-1的数据,利用上式求出a,b回归方程为:xy00195.047.2(8-14)xbyaxxxyllbniixnx11niiyny1121)(niixxxxl))((1yyxxliniixy21)(niiyyyyl二、回归方程的精度及显著性检验判断直线的可靠性显著性检验---自变量和因变量之间的关系与实际是否相符方差分析---求解/预报因变量的值的精度如何总的离差平方和①方差分析n个测量值(y1,y2,…,yn)之间的差异---变差iiZyyQ2_)(第i个测量值测量值的平均值回归直线精度---残差标准误差①自变量x取值不同造成因变量y的变化②实验误差等因素的影响iiiiiZyyyyQ2^2_^)()(估计值U回归平方和Qy残差平方和QyQ剩余平方和Q的自由度(QZ的自由度)---n-1U(U的自由度)---1Q(QY的自由度)---n-2测量点数---n:②显著性检验表示:U和QY的相对大小U大QY小(比值大)---y与x的线性关系密切显著性---F(统计量)QUQUF//F分布偶然误差的分布形式---Fa(1,n-2)F大于Fa(1,n-2)的概率为aF分布表显著水平:a=0.01、a=0.05、a=0.1FF0.01(1,n-2)高度显著F0.05(1,n-2)=F=F0.01(1,n-2)显著(0.05水平上)F=F0.1(1,n-2)不显著变差来源平方和自由度方差F值显著性回归U=blxy1残差QY=lyy-blxyn-2总计QZ=lyyn-122nQy)2/(1/nQUF例:表8-1的显著性分析变差来源平方和自由度方差F值显著性回归U=5.571557高度显著残差QY=0.0660.01总计QZ=5.637③相关分析法yyxxxyZlllQUr回归平方和与总离差平方和的比值反映了回归的效果,定义相关系数r表示两变量的线性关系密切程度10rr越接近1两者线性关系越密切,r=1,两变量有确定的线性关系以铜电阻~温度关系为例,测得的一组数据如表所示。已知Rt和t的函数关系为Rt=a+bt,试用最小二乘法求出a、b。次数K12345678电阻Rt10.3510.5110.6410.7610.9411.0811.2211.36温度t5.010.015.020.025.030.035.040.0)()(C解:50.220.1808111kiitkt86.1086.868111kititRkR2107.105.22028857.086.10028857.010503.30xbyallbxxxy如果把数据代入计算r的公式中就可得到r的值为0.999。说明它们的线性关系良好。8754.03.301050yyxyxxlll二、多元回归模型1.基本概念假定因变量y与K个字变量x1,x2……xk之间的回归关系可用线性函数来近似反映,多元线性总体回归模型的一半形式为:uxxxykk....22110是k+1个总体回归参数,y是可观测的被解释变量,μ是不可测的随机误差ky......10,,2211021)/Exxxxy,(Y的条件数学期望为:---------多元线性总体回归方程特别对只有两个自变量的线性总体方程:kkxxxxy....)/E22110(假设给出了n次观察值,得到的估计值iiˆkkxxxyˆ....ˆˆˆˆ22110则称如下估计方程:-----------样本(经验)回归方程2.几点说明:(1)总体回归方程参数的解释:二元为例02x是在x1=0,x2=0时y的拟合值,虽然x1,x2都为0是一个有意义的情况,但在多数情况下都没有什么意义,但为了得到y的预测值,总是需要截距项。给定x1与x2的变化,可以预测y的变化,特别当x2的变化为0时即,有2211)/(xxxyE11)/Exxy(22110/Exxxy)(01的解释:在其他条件不变下的影响,x1每增加一个单位,y平均增加(或减少)个单位,这正是多元回归分析如此有用的原因所在。类似地,01x参数解释:12在x2不变的条件下,x1每增加一个单位,y平均增加(或减少)个单位1在x1不变的条件下,x2每增加一个单位,y平均增加(或减少)个单位211/)/Exxy(122/)/Exxy(也叫做偏回归参数。随机误差项主要包括下列因素的影响:在解释变量中被忽略的因素的影响;变量观测值的观测误差的影响;模型关系的设定误差的影响;其他随机因素的影响;(2)随机误差向uUXYuuuXXXXXXXXXyyynkknkknnnUBXY2121021222211121121111简化为其中最小二乘估计对于随机抽取的n组观测值如果参数估计值已经得到,则kjniXYjii,2,1,0,,,2,1),,(KikiiiiXXXYˆˆˆˆˆ22110回归残差平方和iiKiKiiiXXYQ21102ˆˆˆ根据最小二乘原理,参数估计值应该是下列方程组的解于是得到关于待估参数估计值的正规方程0ˆ0ˆ0ˆ0ˆ210QQQQkkiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)ˆˆˆˆ()ˆˆˆˆ()ˆˆˆˆ()ˆˆˆˆ(221102222110112211022110正规方程组的