内容回顾•什么情况下模型中可能存在异方差?•异方差对估计结果有何影响?•如何判断一个模型中是否存在异方差?•如何消除异方差?第八章自相关在经济计量研究中,自相关是一种常见现象,它是指随机扰动项序列相邻之间存在相关关系,即各期随机扰动项不是随机独立的。自相关主要表现在时间序列中。在经典线性回归模型基本假定中,我们假设随机扰动项序列的各项之间不相关,如果这一假定不满足,则称之为自相关。jiuiuEuiuCovjj0)(),(第一节自相关的来源和形式第二节自相关的后果第三节自相关的检验第四节自相关的修正方法第五节广义最小二乘法一、自相关的来源•经济惯性(滞后效应)•模型设定偏误:应含而未含变量•随机扰动项序列本身的自相关•数据处理造成自相关——如平滑处理•自相关也可能出现在横截面数据中,但主要出现在时间序列数据中。第一节自相关的来源和形式二、一阶自相关线性回归模型Yt=bo+b1Xt+ut若ut的取值只与它的前一期取值有关,即ut=f(ut-1)则称为一阶自回归经典经济计量学对自相关的分析仅限于一阶自回归形式:ut=ut-1+εt为自相关系数||10为正自相关0为负自相关三、高阶自相关线性回归模型Yt=bo+b1Xt+ut若ut的取值不仅与它的前一期取值有关,而且与前n前取值都有关,即ut=f(ut-1,ut-2,ut-3…)则称ut具有n阶自回归形式。例如,ut=f(ut-1,ut-2)时,误差项存在二阶自回归。第二节自相关的后果1、参数的估计值仍然是线性无偏的2、参数的估计值不具有最小方差性,因而是无效的,不再具有最优性质3、参数显著性t检验失效低估了2,也低估了bi的方差和标准差夸大了T值,使t检验失去意义4、降低预测精度^第三节自相关的检验1、图示法2、杜宾—瓦森检验(Durbin-Watson)一、图示法1、按时间顺序绘制残差et的图形2、绘制残差et,et-1的图形1、时间顺序图—将残差对时间描点•如a图所示,扰动项为锯齿型,et随时间变化频繁地改变符号,表明存在负自相关。•如b图所示,扰动项为循环型,et随时间变化不频繁地改变符号,而是几个正之后跟着几个负的,几个负之后跟着几个正的,表明存在正自相关。etetab2、绘制残差et,et-1的图形如a图所示,散点在I,III象限,表明存在正自相关。如b图所示,散点在II,IV象限,表明存在负自相关。etet-1abetet-1变量Iet变量IIet-1e2e1e3e2e4e3....enen-1.....................二、杜宾—瓦森检验DW检验是检验自相关的最著名、最常用的方法。1、适用条件2、检验步骤–(1)提出假设–(2)构造统计量–(3)检验判断1、适用条件(1)回归模型中含有截距项;(2)解释变量与随机扰动项不相关;(3)随机扰动项是一阶自相关;(4)回归模型解释变量中不包含滞后因变量;(5)样本容量比较大。2、检验步骤(1)提出假设H0:=0,即不存在一阶自相关;H1:0,即存在一阶自相关。(2)构造统计量DW(3)检验判断对给定样本大小和给定解释变量个数找出临界值dL和dU,按图中的决策准则得出结论。构造D-W统计量•定义为样本的一阶自相关系数,作为的估计量。则有,•因为-11,所以,0d4nttenttetenttenttenttentteted12212212212222)1(2112teteted21ˆteteteρ)ˆ1(2dnttenttentte1222122对大样本,DW检验的判断准则依据显著水平、变量个数(k)和样本大小(n)一般要求样本容量至少为15。正自相关无自相关负自相关0dLdU4-dU4-dL2不能检出不能检出4一、广义差分法第四节自相关的修正方法线性回归模型Yt=bo+b1Xt+ut若随机项ut存在一阶自相关ut=ut-1+εt式中若随机项ut满足基本假定:E(εt)=0εt为白噪声Var(εt)=s2Cov(εt,εt+s)=0Yt=bo+b1Xt+ut(1)如果自相关系数为已知,将上式滞后一期Yt-1=bo+b1Xt-1+ut-1两边乘以Yt-1=bo+b1Xt-1+ut-1(2)(1)式减(2)式,变成广义差分模型YtYt-1=bo(1)+b1(XtXt-1)+Vt(3)作广义差分变换Yt*=YtYt-1Xt*=XtXt-1Yt*=bo*+b1Xt*+εt对广义差分模型应用OLS法估计,求得参数估计量的方法称为广义差分法当=1时,可得一阶差分模型YtYt-1=b1(XtXt-1)+Vt(4)作一阶差分变换Yt=YtYt-1Xt=XtXt-1为不损失自由度,Yt和Xt的首项作如下变换一阶差分模型可写成Yt=b1Xt+Vt12112111XρρXYY当=1时,可得移动平均模型(5)作变换移动平均模型可写成Yt*=b0+b1Xt*+VttVtXtXbobtYtY221112*2*11tXtXtXtYtYtY二、科克兰内—奥克特法广义差分法要求已知,但实际上只能用的估计值来代替。科克兰内—奥克特法又称迭代法,步骤是:1、用OLS估计模型Yt=bo+b1Xt2、计算残差etet=YtYt=Yt(bo+b1Xt)3、将et代入,得残差的一阶自回归方程et=et-1+Vt用OLS方法求的初次估计值1。^^^^^^^^4、利用1对原模型进行广义差分变换作第一次迭代2111ˆttteeeρ1111111ˆˆˆ)1()1()1()1()1()1(tttttttttttotρVXρXXYρYYVXbbY式中:5、计算的第二次估计值2112ˆˆˆˆteteteρ^6、利用2对原模型进行广义差分变换作第二次迭代^1212121ˆˆˆ)2()2()2()2()2()2(tρttVtXρtXtXtYρtYtYtVtXbobtY式中:7、反复迭代,直到收敛,实际上人们只迭代两次,称为二步迭代法。Eviews中有专门命令AR(1)一阶自回归LSYCXAR(1)在回归结果中,可以直接读到的迭代收敛值。三、杜宾两步法这种方法是先估计再作差分变换,然后用OLS法来估计参数。步骤是:1、将模型(3)的差分形式写为Yt=bo(1)+Yt-1+b1Xtb1Xt-1+VtYt=ao+Yt-1+a1Xt+a2Xt-1+Vt式中:ao=bo(1)a1=b1a2=b1用OLS法来求得的估计值。^^2、用对原模型进行差分变换得:Yt*=YtYt-1Xt*=XtXt-1得Yt*=ao+b1Xt*+Vt用OLS法来求得参数估计值ao和b1bo=ao/(1)此外求得估计值还有其它方法:^^^^^^2222)1()1()21(ˆ:21ˆ)1(2knkdnρdρρd在小样本下1、当模型存在自相关和异方差时,OLS参数估计值的优良性质将不存在。2、通过模型转换(GLS法)消除自相关和异方差给定线性回归模型Y=XB+U(6)同方差及无自相关假定不成立E(u)=0第五节广义最小二乘法Ω222122212121212212221212121...)cov()cov(............)cov(...)cov()cov(...)cov(.....................)'(nnnnnnnnuuuunuuuuuuuuuuuuunuuuuuuuuuuEuuE如果=I(I为单位矩阵),表明(1)各随机项的方差相同且等于2;(2)各随机项无自相关;IuuE221...00............0...100...01)'(如果I,有两种可能1、矩阵的主对角线元素不全为1,即{}ii1因此随机项方差不全相同,i222、随机项存在自相关矩阵的非主对角线元素不全为0,即{}ij0ij因此随机项协方差不等于0,即cov(ui,uj)0广义最小二乘法的基本思路是对模型进行适当的变换。变换后的新模型满足线性回归基本假定,即=I,然后应用OLS法,对模型进行估计,主要步骤如下:1、寻找适当的变换距阵P因为是n阶对称正定矩阵,根据线性代数知识,存在nn阶非奇异矩阵P,使下式成立。PP’=I可得-1=P’P2、模型变换用矩阵P左乘公式(6)PY=PXB+PU令Y*=PYX*=PXU*=PU得Y*=X*B+U*新的随机项的方差—协方差距阵E(U*U*’)=E[PU(PU)’]=E(PUU’P’)=PE(UU’)P’=P2P’=2PP’=2I变换后的新模型满足同方差和无自相关假定参数估计向量B=(X*’X*)-1X*’Y*=[(PX)’PX](PX)’PY=(X’P’PX)-1X’P’PY=(X’-1X)-1X’-1YB称为广义最小二乘估计量~~1、当=I时,B=(X’X)-1X’Y,广义最小二乘估计量就是普通最小二乘估计量。2、当模型存在异方差时:nPΩΩnn1...00............0...100...011...00............0...100...01...00............0...00...02122221122221~P满足关系式PP’=I用距阵P左乘原模型PY=PXB+PU这实际上是对模型作变换,设异方差形式为i2=Xi2nnnnXuXuXuuuuXXXPU......1...00............0...100...0122112121B=(X’-1X)-1X’-1Y这是广义最小二乘估计~3、当模型存在一阶自相关时:1...00............0...10...011...00............0...10...1111..................1...12212121ρρPρρρΩρρρρρρΩnnnnP满足关系式PP’=I用距阵P左乘原模型PY=PXB+PU第四节案例分析案例1:中国城市居民家庭人均实际生活费收入与恩格尔系数案例2:中国商品进口模型案例1年份ECY年份ECY年份ECY197857.5343.4198753.5641.81199648.81035.69197957.2387.01198851.4626.71199746.61071.06198056.9436.12198954.4627.74199844.71132.88198156.7438.18199054.2680.28199942.11238.3198258.7459.81199153.8729.38200039.41317.63198359.2482.82199253799.78200138.21429.57198458542.92199350.3876.01200237.71621.3198553.3550.81199450950.53200337.11767.14198652.4626.71199550.1996.89200437.71903.211.建立模型DependentVariable:LOG(CE)Method:LeastSquaresDate:05/11/08Ti