1嘉应学院数学学院实验报告课程名称:应用回归分析实验名称:加权线性回归及异方差自相关的处理实验地点:田师420指导老师:邓春亮实验时间:2014.11.20提交时间:2014.11.23班级:1208姓名:李红座号:13号一、实验目的和要求目的:理解加权最小二乘回归的思想;理解数据异方差及自相关的产生的原因及处理方法要求:掌握加权最小二乘回归的方法;掌握异方差及自相关的处理方法二、实验环境、内容和方法实验环境硬件:Windows8中文版64-bit软件:SPSS19.0内容:课后习题4.13、4.14方法:利用SPSS软件进行加权最小二乘回归及处理异方差自相关三、实验过程描述4.13(1)由下面的表格可以得到,y与x之间的普通最小二乘回归方程为y=-1.435+0.176x2(2)以残差e为纵坐标,以et-i为横坐标画散点图如下,由残差散点图看出大部分点落在第一三象限,表明随机扰动项存在正的序列相关,说明自相关现象是存在的。下面再用DW检验法检验自相关性。由表格中DW=0.663,而n=20,k=2,显著性水平为a=0.05,查表知dl=1.20,3du=1.41,那么由DW=0.663<1.2,可知残差存在正的自相关,自相关系数p=1-0.5DW=1-0.5*0.663=0.6685,说明误差项存在高度自相关。(3)用迭代法消除自相关,令ytt=y-0.6685*yt,令xtt=x-0,6685*xt,然后对ytt和xtt作普通最小二乘回归,计算结果如下图从上面表格中看出ytt=-0.3+0.173*xtt,DW=1.36,查DW表,n=19,k=2,显著性水平为0.05,得到dl=1.18,du=1.41,因为dl=1.18<DW<du=1.41所以自相关性落入了不确定区域,那么要进行二次迭代,用同样的方法,p=1-0.5*DW=0.68,进行二次迭代,结果如下,此时DW=2.157,显著性水平为0.05,n=18,k=2,查表的dl=1.16,du=1.39,那么du=1.39<DW<4-du=2.61,说明此时的因变量ytttt与自变量xtttt的残差不存在自相关现象。但是在检验都通过的情况下,由于一步迭代的2r值和F值均大于两步迭代之后的值,且根据取模型简约的原则,最终选择一步迭代的结果,即:ytt=-3+0.173*xtt,代入原来的x,y变量得到最终的得到原来的回归方程为y=0.173*x-0.11565*xt+0.6685*yt-3(2)用一阶差分法来处理数据,并建立回归方程,清除上面的数据之后,计算差分fy=y-yt,fx=x-xt,然后用fy对fx作过原点的最小二乘回归,结果如下4从上图看出,fy与fx之间的回归方程为fy=0.169fx,一阶差分的残差的DW=1.462,根据显著性水平为0.05,n=19,k=2,查DW表可以得到dl=1.18,du=1.4,因为DW>du,所以落入了无自相关区域,所以可以认为一阶差分法已经消除了自相关。将fy=y-yt,fx=x-xt代入fy=0.169fx中,得到原始变量的方程为y=0.169*x-0.169*xt+yt(5)比较以上个方法所建回归方程的优良性。根据以上分析可以发现,普通最小二乘法的随机误差项标准差为0.09744,大于迭代的随机误差项标准差0.07296,所以使用迭代法的效果要优于普通最小二乘法的效果。而且,由于本题的自相关系数6685.0,不接近于1,所以不适于使用差分法消除系列自相关。另外,因为迭代法得出的F值及2r都大于差分法得到的相应值,故差分法的效果低于迭代法的效果。综上可知,本题使用迭代法消除序列自相关是最合适的。习题4.14(1)用普通最小二乘法建立y与x1,x2的回归方程,用残差图和DW检验诊断序列的自相关性。如图,得出y与x1和x2之间的回归方程是y=-574.036+191.086x1+0.911x2下面用残差图来检验自相关性。以残差et为纵坐标,以et1为横坐标。5从上面的残差图可以看出,残差的点大部分分布在第一三象限,说明随机扰动项存在正的序列关系。从表格中看出DW=0.745,显著性水平为0.05,n=52,k=3查表可以得Ld=1.46,Ud=1.63,由于0.7451.46,可知,DW值落入正相关区域,即残差序列存在一阶正的自相关。由DW可以计算出p=1-0.5*DW=1-0.5*0.745=0.3275(2)用迭代法消除自相关,在转换--创建时间序列--里面,创建因变量y的滞后变量用yt表示,创建x1的滞后变量,用x1t表示,x2的滞后变量,用x2t表示,下面令yy=yt-0.3275*ytxx1=x1-0,3275*x1txx2=x2-0.3275*x2t在转换--计算变量里面分别求出以上的yyxx1xx2变量,并保存。然后作因变量yy对自变量xx1和xx2的回归方程,结果如下6从上面表格中可以看出,迭代法之后的因变量与自变量之间的回归方程为yy=-350.615+205.651*xx1+1.639*xx2,(3)用差分法消除自相关先计算差分1tttyyy,)1(111tttxxx,)1(222tttxxx,然后用ty对tx做过原点的最小二乘回归,结果如下:模型汇总c,d模型RR方b调整R方标准估计的误差Durbin-Watson1.715a.511.491280.989952.040a.预测变量:x2t_,x1t_b.对于通过原点的回归(无截距模型),R方可测量(由回归解释的)原点附近的因变量中的可变性比例。对于包含截距的模型,不能将此与R方相比较。c.因变量:yt_d.通过原点的线性回归Anovac,d模型平方和df均方FSig.1回归4036879.69622018439.84825.564.000a残差3868812.3764978955.355总计7905692.072b51a.预测变量:x2t_,x1t_b.因为通过原点的回归的常量为零,所以对于该常量此总平方和是不正确的。c.因变量:yt_d.通过原点的线性回归系数a,b7模型非标准化系数标准系数tSig.B标准误差试用版1x1t_210.11743.692.5444.809.000x2t_1.397.577.2742.421.019a.因变量:yt_b.通过原点的线性回归由模型汇总表可以看到,DW值为2.0421.63,即DW落入了无自相关区域,可知残差序列`te不存在自相关,一阶差分法成功消除了序列自相关。同时得到回归方程为:tttxxy21397.1117.210,并将1tttyyy,)1(111tttxxx,)1(222tttxxx代入,还原原始变量的方程为:)(397.1)(177.210)1(22)1(111ttttttxxxxyy(4)比较以上个方法所建回归方程的优良性。由以上的分析可以发现,迭代法和差分法的DW值都落入随机误差项无自相关区域,一阶差分法消除自相关最彻底。但因为6275.0,并不接近于1,故使用差分法得到的方差较大,拟合效果不理想。迭代法得到的随机误差项标准差为257.86,小于差分法得到的随机误差项标准差280.99和普通最小二乘法得到的随机误差项标准差329.69,因此,迭代法的拟合效果是最好的。综上可知,本题使用一侧迭代法消除序列自相关是最合适的四、心得体会检验自相关的方法有:图示检验法DW检验法消除自相关的方法有:迭代法差分法