自相关案例分析一、研究目的2003年中国农村人口占59.47%,而消费总量却只占41.4%,农村居民的收入和消费是一个值得研究的问题。消费模型是研究居民消费行为的常用工具。通过中国农村居民消费模型的分析可判断农村居民的边际消费倾向,这是宏观经济分析的重要参数。同时,农村居民消费模型也能用于农村居民消费水平的预测。二、模型设定正如第二章所讲述的,影响居民消费的因素很多,但由于受各种条件的限制,通常只引入居民收入一个变量做解释变量,即消费模型设定为tttuXY21(6.43)式中,Yt为农村居民人均消费支出,Xt为农村人均居民纯收入,ut为随机误差项。表6.3是从《中国统计年鉴》收集的中国农村居民1985-2003年的收入与消费数据。表6.31985-2003年农村居民人均收入和消费单位:元年份全年人均纯收入(现价)全年人均消费性支出(现价)消费价格指数(1985=100)人均实际纯收入(1985可比价)人均实际消费性支出(1985可比价)198519861987198819891990199119921993199419951996199719981999397.60423.80462.60544.90601.50686.30708.60784.00921.601221.001577.701923.102090.102162.002214.30317.42357.00398.30476.70535.40584.63619.80659.80769.701016.811310.361572.101617.151590.331577.42100.0106.1112.7132.4157.9165.1168.9176.8201.0248.0291.4314.4322.3319.1314.3397.60399.43410.47411.56380.94415.69419.54443.44458.51492.34541.42611.67648.50677.53704.52317.40336.48353.42360.05339.08354.11366.96373.19382.94410.00449.69500.03501.77498.28501.7520002001200220032253.402366.402475.602622.241670.001741.001834.001943.30314.0316.5315.2320.2717.64747.68785.41818.86531.85550.08581.85606.81注:资料来源于《中国统计年鉴》1986-2004。为了消除价格变动因素对农村居民收入和消费支出的影响,不宜直接采用现价人均纯收入和现价人均消费支出的数据,而需要用经消费价格指数进行调整后的1985年可比价格计的人均纯收入和人均消费支出的数据作回归分析。根据表6.3中调整后的1985年可比价格计的人均纯收入和人均消费支出的数据,使用普通最小二乘法估计消费模型得ttXY0.59987528.106ˆ(6.44)Se=(12.2238)(0.0214)t=(8.7332)(28.3067)R2=0.9788,F=786.0548,df=17,DW=0.7706该回归方程可决系数较高,回归系数均显著。对样本量为19、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.18,dU=1.40,模型中DWdL,显然消费模型中有自相关。这一点残差图中也可从看出,点击EViews方程输出窗口的按钮Resids可得到残差图,如图6.6所示。图6.6残差图图6.6残差图中,残差的变动有系统模式,连续为正和连续为负,表明残差项存在一阶正自相关,模型中t统计量和F统计量的结论不可信,需采取补救措施。三、自相关问题的处理为解决自相关问题,选用科克伦—奥克特迭代法。由模型(6.44)可得残差序列et,在EViews中,每次回归的残差存放在resid序列中,为了对残差进行回归分析,需生成命名为e的残差序列。在主菜单选择Quick/GenerateSeries或点击工作文件窗口工具栏中的Procs/GenerateSeries,在弹出的对话框中输入e=resid,点击OK得到残差序列et。使用et进行滞后一期的自回归,在EViews命今栏中输入lsee(-1)可得回归方程et=0.4960et-1(6.45)由式(6.45)可知ˆ=0.4960,对原模型进行广义差分,得到广义差分方程tttttuXXYY)4960.0()4960.01(4960.01211(6.46)对式(6.46)的广义差分方程进行回归,在EViews命令栏中输入lsY-0.4960*Y(-1)cX-0.4960*X(-1),回车后可得方程输出结果如表6.4。表6.4广义差分方程输出结果DependentVariable:Y-0.496014*Y(-1)Method:LeastSquaresDate:03/26/05Time:12:32Sample(adjusted):19862003Includedobservations:18afteradjustingendpointsVariableCoefficientStd.Errort-StatisticProb.C60.444318.9649576.7422870.0000X-0.496014*X(-1)0.5832870.02941019.833250.0000R-squared0.960914Meandependentvar231.9218AdjustedR-squared0.958472S.D.dependentvar49.34525S.E.ofregression10.05584Akaikeinfocriterion7.558623Sumsquaredresid1617.919Schwarzcriterion7.657554Loglikelihood-66.02761F-statistic393.3577Durbin-Watsonstat1.397928Prob(F-statistic)0.000000由表6.4可得回归方程为**5833.04443.60ˆttXY(6.47))9650.8(Se(0.0294)t=(6.7423)(19.8333)R2=0.9609F=393.3577df=16DW=1.3979式中,1*4960.0ˆtttYYY,1*4960.0tttXXX。由于使用了广义差分数据,样本容量减少了1个,为18个。查5%显著水平的DW统计表可知dL=1.16,dU=1.39,模型中DW=1.3979dU,说明广义差分模型中已无自相关,不必再进行迭代。同时可见,可决系数R2、t、F统计量也均达到理想水平。对比模型(6.44)和(6.47),很明显普通最小二乘法低估了回归系数2ˆ的标准误差。[原模型中Se(2ˆ)=0.0214,广义差分模型中为Se(2ˆ)=0.0294。经广义差分后样本容量会减少1个,为了保证样本数不减少,可以使用普莱斯—温斯腾变换补充第一个观测值,方法是21*11XX和21*11YY。在本例中即为210.49601X和210.49601Y。由于要补充因差分而损失的第一个观测值,所以在EViews中就不能采用前述方法直接在命令栏输入Y和X的广义差分函数表达式,而是要生成X和Y的差分序列X*和Y*。在主菜单选择Quick/GenerateSeries或点击工作文件窗口工具栏中的Procs/GenerateSeries,在弹出的对话框中输入Y*=Y-0.4960*Y(-1),点击OK得到广义差分序列Y*,同样的方法得到广义差分序列X*。此时的X*和Y*都缺少第一个观测值,需计算后补充进去,计算得*1X=345.236,*1Y=275.598,双击工作文件窗口的X*打开序列显示窗口,点击Edit+/-按钮,将*1X=345.236补充到1985年对应的栏目中,得到X*的19个观测值的序列。同样的方法可得到Y*的19个观测值序列。在命令栏中输入LsY*cX*得到普莱斯—温斯腾变换的广义差分模型为**5833.04443.60ttXY(6.48))1298.9(Se(0.0297)t=(6.5178)(19.8079)R2=0.9585F=392.3519df=19DW=1.3459对比模型(6.47)和(6.48)可发现,两者的参数估计值和各检验统计量的差别很微小,说明在本例中使用普莱斯—温斯腾变换与直接使用科克伦—奥克特两步法的估计结果无显著差异,这是因为本例中的样本还不算太小。如果实际应用中样本较小,则两者的差异会较大。通常对于小样本,应采用普莱斯—温斯腾变换补充第一个观测值。由差分方程(6.46)有9292.1194960.014443.60ˆ1(6.49)由此,我们得到最终的中国农村居民消费模型为Yt=119.9292+0.5833Xt(6.50)由(6.50)的中国农村居民消费模型可知,中国农村居民的边际消费倾向为0.5833,即中国农民每增加收入1元,将增加消费支出0.5833元。