第8章模型中的特殊解释变量8.1随机解释变量(一般性了解)8.2工具变量8.3滞后变量(一般性了解)8.4虚拟变量(重点)(其中分段线性回归不讲)8.5时间变量8.1随机解释变量(第2版教材第203页)(第3版教材第174页)假定条件⑵规定解释变量是非随机的且与随机误差项相互独立,即E(X'u)=0.(1)如果模型中的解释变量是随机的,但具有平稳性且与误差项相互独立,模型其他假定条件都成立,β的OLS估计量βˆ仍具有无偏性,E(βˆ)=β。(2)如果模型中的解释变量X是随机的,与误差项u不独立,也不相关,模型其他假定条件都成立,β的OLS估计量具有一致性。ββ=∞→ˆlimpT(3)如果模型中的解释变量X是随机的,且与误差项u相关,Cov(X'u)≠0,模型其他假定条件都成立,β的OLS估计量不具有无偏性,也不具有一致性。(第2版教材第207页)(第3版教材第177页)8.2工具变量法工具变量法是解决随机解释变量X与误差项u相关时,β的OLS估计量不具有一致性的方法。假定有变量Z与X高度相关,但与误差项u不相关,则用Z替换X,估计回归参数β,这种估计方法称作工具变量法,Z称作工具变量。β的工具变量法估计量具有一致性。ββ=∞→IVTˆlimp例8.1用昀终消费C1对国内生产总值Y回归。假定Y与误差项u相关,但资本总额K与误差项u不相关,用K作Y的工具变量。工具变量法的EViews操作:打开模型估计对话窗,选TSLS估计法。在方程设定区填入C1CY在工具变量列写区填入CK,点击确定键。8.2工具变量法(第2版教材第208页)(第3版教材第178页)8.3滞后变量(一般性了解)滞后的原因。如:消费行为的滞后,央行上调银行存款准备金率,投资、项目研发周期长,一项政策的执行有滞后。(1)分布滞后模型(权数法、阿尔蒙多项式法不讲)Yt=α+β0Xt+β1Xt-1+…+βkXt-k+ut可以用OLS法估计参数,但不具有有效性。容易引起多重共线性。昀大滞后阶数由AIC、SC准则决定。(2)自回归模型(柯依克变换不讲)Yt=α+β0Xt+γ1Yt-1+…+γmYt-m+ut可以用OLS法估计参数,为有偏、一致估计量。昀大滞后阶数由AIC、SC准则决定。(3)自回归分布滞后模型Yt=α+β0Xt+β1Xt-1+…+βkXt-k+γ1Yt-1+…+γmYt-m+ut如消费模型:Yt=α+β0Xt+β1Xt-1+γ1Yt-1+ut(第2版教材第218页)(第3版教材第187页)8.4虚拟变量(重点掌握)在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量(dummyvariable),用D表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法和定量变量相同。(第2版教材第219页)(第3版教材第188页)注意:(1)当定性变量含有m个类别时,模型不能引入m个虚拟变量。昀多只能引入m-1个虚拟变量,否则当模型中存在截距项时就会产生完全多重共线性,无法估计回归参数。比如,对于季节数据引入4个虚拟变量,数据如下表,8.4虚拟变量txtD1D2D3D41995.1x110001995.2x201001995.3x300101995.4x400011996.1x510001996.2x601001996.3x700101996.4x800011997.1x91000则必然会有,截距项对应的单位向量等于(D1+D2+D3+D4)。这意味着虚拟变量之间存在完全多重共线性。(2)把虚拟变量取值为0所对应的类别称作基础类别。(3)当定性变量含有m个类别时,不能把虚拟变量的值设成如下形式。这种赋值法在一般情形下与虚拟变量赋值是完全不同的两回事。(4)回归模型可以只用虚拟变量作解释变量,也可以用定量变量和虚拟变量一起做解释变量。⎪⎪⎩⎪⎪⎨⎧−=个类别第个类别第个类别第mmD,1,2,11,08.4虚拟变量(第2版教材第219页)(第3版教材第188页)(第2版教材第220页)(第3版教材第189页)8.4虚拟变量1.用虚拟变量测量截距变动设有模型,yt=β0+β1xt+β2D+ut,其中yt,xt为定量变量;D为定性变量。当D=0或1时,上述模型可表达为,⎩⎨⎧=+++=++=1)(012010DuxDuxytttttβββββ02040600204060XYD=1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。D=1D=0β0β0+β2例8.3随机调查美国旧金山地区20个家庭的储蓄情况,拟建立年储蓄额Yi(千美元)对年收入Xi(千美元)的回归模型。通过对样本点的分析发现,居于上部的6个点(用小圆圈表示)都是代表自己有房子的家庭;居于下部的14个点(用小三角表示)都是租房住的家庭。而这两类家庭所对应的观测点各自都表现出明显的线性关系。于是给模型加入一个定性变量“住房状况”,用D表示。定义如下:8.4虚拟变量⎩⎨⎧=,(租房户),(有房户)01D012310203040Xy(第2版教材第220页)(第3版教材第189页)例8.3建立回归模型Yi=β0+β1Xi+β2Di+ut得估计结果如下,=-0.3204+0.0675Xt+0.8273Di(-5.2)(16.9)(11.0)R2=0.99,DW=2.27由于回归系数0.8273显著地不为零,说明对住房状况不同的两类家庭来说,回归函数截距项确实明显不同。当模型不引入虚拟变量“住房状况”时,得回归方程如下,=-0.5667+0.0963Xi(-3.5)(11.6)R2=0.88,DW=1.85比较回归方程,前者的确定系数为0.99,后者的确定系数仅为0.88。说明该回归模型中引入虚拟变量非常必要。iYˆiYˆ8.4虚拟变量(第2版教材第221页)(第3版教材第190页)8.4虚拟变量“季节”是在研究经济问题中常常遇到的定性因素。比如,酒,肉的销量在冬季要超过其它季节,而饮料的销量又以夏季为昀大。当建立这类问题的计量模型时,就要考虑把“季节”因素引入模型。由于一年有四个季节,所以这是一个含有四个类别的定性变量。应该向模型引入三个虚拟变量。例8.4市场用煤销售量模型。由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下:⎩⎨⎧=,(其他季度),(第四季度)011D⎩⎨⎧=,(其他季度),(第三季度)012D⎩⎨⎧=,(其他季度),(第二季度)013D(第2版教材第222页)(第3版教材第191页)(第2版第224页)(第3版第192页)以时间t为解释变量(1982年1季度取t=1)的煤销售量(Yi)模型估计结果如下:=2431.20+49.00t+1388.09D1+201.84D2+85.00D3(26.04)(10.81)(13.43)(1.96)(0.83)R2=0.95,DW=1.2,F=100.4,T=28,t0.05(28-5)=2.07由于D2,D3的系数没有显著性,说明第二、三季度可以归并入基础类别第一季度。于是只考虑加入一个虚拟变量D1,把季节因素分为第四季度和第一、二、三季度两类。从上式中剔除虚拟变量D2,D3,得煤销售量(Yi)模型如下:=2515.86+49.73t+1290.91D1(32.03(10.63)(14.79)R2=0.94,DW=1.4,F=184.9,T=28,t0.05(25)=2.06这里第一、二、三季度为基础类别。8.4虚拟变量例8.4iYˆiYˆ(第2版第224页)(第3版第192页)2.测量斜率变动以上介绍了用虚拟变量测量回归函数的截距变化。实际上,也可以用虚拟变量考察回归函数的斜率是否发生变化。方法是在模型中加入定量变量与虚拟变量的乘积项。设模型如下,Yi=β0+β1Xi+β2Di+β3(XiDi)+ui按β2,β3是否为零,回归函数可有如下四种形式。E(Yi)=β0+β1Xi,(当β2=β3=0)E(Yi)=(β0+β2)+(β1+β3)Xi,(当β2≠0,β3≠0)E(Yi)=β0+(β1+β3)Xi,(当β2=0,β3≠0)E(Yi)=(β0+β2)+β1Xi,(当β2≠0,β3=0)截距、斜率同时发生变化的两种情形见图。8.4虚拟变量0204060801000204060XY0102030405060700204060TY3.分段线性回归(不讲)例8.5中国进出口贸易总额序列(1950~1984年)如图。试检验改革开放前后该时间序列的斜率是否发生变化。定义虚拟变量D如下,以时间time为解释变量,进出口贸易总额用trade表示,估计结果如下,=0.2818+0.0746time-35.8809D+1.2559timeD(1.35)(6.2)(-8.4)(9.6)上式说明,改革开放前后相比无论截距和斜率都发生了变化。进出口贸易总额的年平均增长量扩大了近17倍。⎩⎨⎧−−=),(),(198419790197819501D∧trade⎩⎨⎧−=+−−=+=∧)(,)(19841979,13305.15991.3319781950,0,0746.02818.0DtimeDtimetrade8.4虚拟变量(第2版第226页)(第3版第194页)补充案例:香港季节GDP数据(千亿港元)的拟合(file:dummy6)8.4虚拟变量1.21.62.02.42.83.23.690919293949596979899000102GDP1990~1997年香港季度GDP呈线性增长。1997年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,1998~2002年底GDP总量几乎没有增长(见上图)。对这样一种先增长后停滞,且含有季节性周期变化的过程简单地用一条直线去拟合显然是不恰当的。为区别不同季节,和不同时期,定义季节虚拟变量D2、D3、D4和区别不同时期的虚拟变量DT如下,⎩⎨⎧=,(其他季度)季度)(第,0212D⎩⎨⎧=,(其他季度)季度)(第,0313D⎩⎨⎧=,(其他季度)季度)(第,0414D⎩⎨⎧=2002m4~998m11141997~119900,,mmDT得估计结果如下:=1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4+1.8338DT-0.0654DT×t(50.8)(64.6)(3.7)(9.9)(11.0)(19.9)(-28.0)R2=0.99,DW=0.9,s.e.=0.05,F=1198.4,T=52,t0.05(52-7)=2.01对于1990:1~1997:4=1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4对于1998:1~2002:4=2.9911+0.0014t+0.0775D2+0.2098D3+0.2349D48.4虚拟变量例3:香港季节GDP数据(千亿港元)的拟合(file:dummy6)∧tGDP∧tGDP∧tGDP如果不采用虚拟变量拟合效果将很差。=1.6952+0.0377t(20.6)(13.9)R2=0.80,DW=0.3,T=52,t0.05(52-2)=2.01∧tGDP8.4虚拟变量补充案例:香港季节GDP数据的拟合8.5时间变量以时间变量t作解释变量。估计与检验方法与定量解释变量Xt相同。Yt=α+γt+β0Xt+utYt=α+γt+ut如时间变量t在生产函数模型中代表技术进步。Lnyt=β0+γt+β1Lnxt1+β2Lnxt2+ut第8章结束.