第十章时间序列数据的基本回归分析10.1时间序列数据的性质•我们应该怎样认识时间序列数据的随机性?•回答:很明显,经济时间序列满足作为随机变量结果所要求的直观条件,这些变量的结果都无法事先预料到。(例如,我们今天不知道道琼斯工业指数在下一个交易日收盘时会是多少,我们也不知道加拿大下一年的年产出增长会是多少。)•规范地,一个标有时间脚标的随机变量序列被称为一个随机过程(stochasticprocess)或时间序列过程(timeseriesprocess)。10.2时间序列回归模型的例子•1、静态模型•我们将有两个变量(例如y和z)的时间序列数据标注相同的时期,将这样的y和z联系起来即为一个静态模型(staticmodel):•“静态模型”的名称来源于我们正在模型化y和z的同期关系的事实。•在一个静态回归模型中也可以有几个解释变量。2、有限分布滞后模型在有限分布滞后模型(finitedistributedlagmodel,FDL)中,我们容许一个或多个变量对y的影响有一定时滞。ntuzyttt,,2,1,10•考察一个二阶FDL:(1)当z发生一个暂时性的提高时,则表示z在t时期提高一个单位所引起y的即期变化。通常被称作冲击倾向(impactpropensity)或冲击乘数(impactmultiplier)。(注意:分别表示这一暂时变化发生后,下一时期、两个时期、…j个时期后y的变化—如图10.1)(2)当z从t期开始永久性提高,一期后y提高了,两期后y提高了。这表明,z的当期和滞后系数之和,等于z的永久性提高导致y的长期变化,它被称为长期倾向(long-runpropensity,LRP)或长期乘数(long-runmultiplier)。tttttuzzzy22110000j,,,2110210210一个q阶有限分布滞后模型可写成:静态模型是上式的一种特例,当都为0即可。冲击倾向总是同期z的系数。长期倾向便是所有变量的系数之和。tqtqtttuzzzy1100q,,,210jtzqLRP1010.3经典假设下OLS的有限样本性质假定TS.1(线性于参数)假定TS.2(无完全共线性):在样本中,没有任何自变量是恒定不变的,或者是其他自变量的一个完全线性组合。假定TS.3(零条件均值):假定TS.4(同方差性):该假定意味着,不能依赖于X(只要和X相互独立就足够了—满足TS.3即可),且在所有时期都保持不变。假定TS.5(无序列相关):【提问:我们为什么不假定不同横截面观测的误差是无关的呢?答:前述有随机抽样的假定,则以样本中所有解释变量为条件,不同观测的误差是独立的。因此,就我们当前目的而言,序列相关只是时间序列和回归中的一个潜在问题。】假定TS.6(正态性):误差独立于X,且具有独立同分布ntXuEt,,2,1,0)(ntuVarXuVartt,,2,1,)()(2stXuuCorrst,0),()(XuVarttutu),0(2Normal定理10.1(OLS的无偏性)在假定TS.1、TS.2和TS.3下,以X为条件,OLS估计量是无偏的,并因此下式也无条件地成立:定理10.2(OLS的样本方差)在时间序列高斯-马尔可夫假定TS.1-TS.5下,以X为条件,的条件方差为:其中,是的总平方和,为由对所有其他自变量回归得到的kjEjj,1,0,)ˆ(jˆkjRSSTXVarjjj,,1,)]1([)ˆ(22jSSTtjx2jRjx2R定理10.3(的无偏估计)在假定TS.1-TS.5下,估计量是的一个无偏估计量,其中df=n-k-1定理10.4(高斯-马尔可夫定理)在假定TS.1-TS.5下,以X为条件,OLS估计量是最优线性无偏估计量。定理10.5(正态抽样分布)在时间序列的CLM假定TS.1-TS.6下,以X为条件,OLS估计量遵循正态分布。而且,在虚拟假设下,每个t统计量服从t分布,F统计量服从F分布,通常构造的置信区间也是确当的。2dfSSR/ˆ22例10.1静态菲利普斯曲线研究失业和通货膨胀之间是否存在替代关系。H0:H1:文件:PHILLIPS.RAW命令:reginfunem结果:上述方程并没有表明unem和inf之间存在替代关系(因为)分析中可能存在的问题:(1)CLM假定不成立(12章);(2)静态菲利普斯曲线不是最佳模型(附加预期的菲利普斯曲线)01010ˆ1例10.2通货膨胀和赤字对利率的影响1948-2003年数据。i3:三月期国债利率;inf:据消费者价格指数得出的年通货膨胀率def:联邦赤字占GDP的百分比文件:INTDEF.RAW命令:regi3infdef结果:Inf与def对于i3的影响在统计上十分显著,即通货膨胀上升或赤字相对规模的扩大都会提高短期利率。(但前提是CLM假定成立)10.4函数形式、虚拟变量和指数在应用研究中经常出现具有恒定百分比效应的时间序列回归(自然对数形式)将对数函数形式用于分布滞后模型:方程中的冲击倾向也被称为短期弹性(short-runelasticity):它度量了GDP增长1%时货币供给的即期百分比变化;长期倾向有时也被称为长期弹性(long-runelasticity):它度量了GDP持久地增长1%,4个月后货币供给的百分比变化。4100二值或虚拟自变量在时间序列应用中也相当有用。既然观测单位是时间,所以虚拟变量代表某特定事件在每个时期是否发生。在事件研究(eventstudy)中,二值变量是关键成分。事件研究的目标是为了确定某个特定的事件是否会影响到某项结果。讨论指数(indexnumber)的概念:(1)基期、基值;(2)标准的经济产出都是用真实价值表示的;例10.3波多黎各的就业和最低工资研究美国的最低工资对波多黎各就业的影响。prepopt:波多黎各第t年的就业率(就业人口占总人口的比例);usgnpt:美国的真实国民生产总值(以10亿美元计)mincov:度量最低工资相对于平均最低工资的重要性。mincov=(avgmin/avgwage)*avgcov,其中,avgmin是平均最低工资,avgwage是总体平均工资,avgcov是平均工资覆盖率。文件:PRMINWGE.RAW命令:reglprepoplmincovlusgnp结果:prepop对mincov的估计弹性是-0.154,而根据t=-2.37,它在统计上是显著的。因此,更高的最低工资降低了就业率,这与古典经济学的预言一样。例10.4个人税收豁免对生育率的影响总生育率(gfr)是每个1000个育龄妇女生育孩子的个数。对1913-1984年这段时间,方程pe:个人税收减免的实际美元金额;ww2:在1941-1945年间为1(第二次世界大战);pill:从避孕药开始用于控制生育的1963年后一直为1文件:FERTIL3.RAW命令:sumpereggfrpeww2pill结果:考虑生育率对pe变化的反应滞后,估计一个包含两期滞后的分布滞后模型命令:reggfrpeww2pillpe_1pe_2在这个回归中,我们只有70次观测,这是因为pe滞后两次减少了2次观测。pe变量的系数估计得很不准确,每一个变量都不是个别显著的。事实上,pet,pet-1和pet-2明显相关,这种多重共线性使得估计每个滞后的影响非常困难。1、pet,pet-1和pet-2是联合显著的,F统计量的p值为0.012。命令:testpepe_1pe_2因此,pe的确对gfr有影响,但我们并没有足够好的估计值判断这种影响是即期的,还是存在一期或者两期的滞后(或都有一些)。2、实际上,pet-1和pet-2不是联合显著的,因而我们使用静态模型还算合理。命令:testpe_1pe_2式(10.19)中估计的(命令:display_b[pe]+_b[pe_1]+_b[pe_2])LRP=0.073-0.0058+0.034=0.101但我们从式(10.19)中无法得到这个估计值的标准误。为得到LRP估计值标准误的技巧:令表示LRP,并将代入模型便得到21002100221100ttttpepepegfr22112100)(ttttpepepegfr)()(221100tttttpepepepepe基于上式,可通过将gfrt对pet,(pet-1-pe),(pet-2-pet),ww2t和pillt进行回归而得到及其标准差。命令:gendif1=pe_1-pegendif2=pe_2-pereggfrpedif1dif2ww2pill说明在较小的显著性水平上异于0。本例说明:即使都不是个别显著的,但LRP非常显著。_cons95.87053.28195729.210.00089.31403102.427pill-31.304993.981559-7.860.000-39.25907-23.35091ww2-22.126510.73197-2.060.043-43.56608-.6869196dif2.0338268.12625740.270.790-.2184013.286055dif1-.0057796.1556629-0.040.970-.316752.3051929pe.1007191.02980273.380.001.0411814.1602568gfrCoef.Std.Err.tP|t|[95%Conf.Interval]Total25992.432969376.701926RootMSE=14.27AdjR-squared=0.4594Residual13032.644364203.635067R-squared=0.4986Model12959.788652591.95772ProbF=0.0000F(5,64)=12.73SourceSSdfMSNumberofobs=700ˆ0ˆjˆ例10.5反倾销调查和化学产品进口在美国开展反倾销调查,而后制定反倾销生产条例的过程中,一些有意思的问题:(1)在反倾销调查前的一段时期进口量异常吗?(2)反倾销调查后进口有明显的变化吗?(3)有利于美国产业的决策执行后,进口究竟减少了多少?定义的3个虚拟变量:befile6:在开始调查前的六个月为1;affile6:表示开始调查后的六个月;afdec6:代表调查结束并确认构成倾销行为后的六个月;因变量chnimp:从中国进口的数量(取对数形式);解释变量包括:(1)化工产量指标chempi;(2)石油产量gas;(3)汇率指标rtwex;(均使用对数形式)文件:BARIUM.RAW命令:reglchnimplchempilgaslrtwexbefile6affile6afdec6结果:计算出准确的百分比变化(决策执行后,进口减少的比率)命令:display100*(exp(_b[afdec6])-1)例10.6选举结果和经济形势费尔利用1916-1992年(每4年一次)的数据得到的20次观测,解释了两党选举中民主党候选人获得选票的比例。估计费尔模型的一个简化形式:其中:demvote:两党选举中民主党候选人获得选票的比例;partyWH:虚拟变量,民主党在白宫执政时取值为1,共和党执政时取值为-1;incum:民主党在任总统参加竞选时定义为1,共和党在任总统参加竞选时定义为-1,其他情况为0;gnews:现任政府执政的前15个季度中,人均真实产出增长率超过2.9%的季度数;inf:本届政府前15个季度的年均通货膨胀率。gnewspa