时间序列分析方法讲义第11章向量自回归1第十一章向量自回归前一章我们讨论了向量随机过程的基本性质。本章我们将深入分析向量自回归模型,这种模型更适合于估计和预测。由于Sims(1980)年在经济中的出色运用,向量自回归模型在分析经济系统的动态性上得到了广泛的应用。§11.1无限制向量自回归模型的极大似然估计和假设检验按照时间序列模型极大似然估计方法,我们首先分析向量自回归模型的条件似然估计。11.1.1向量自回归模型的条件似然函数假设ty表示一个包含时间t时n个变量的1n的向量。假设ty的动态过程可以由下面的p阶高斯向量自回归过程:ttt1t1εyΦyΦyΦcyppt22,)(~Ω0,εtN假设我们已经在)(pT个时间间隔中观测到这些n个变量的观测值。如同标量过程时的情形,最简单的方法是将前p个样本(表示为021,,,yyypp)做为条件,然后利用后面的T个样本(表示为Tyyy,,,21)形成参数估计。我们的目的是构造下面的条件似然函数:);(θy,y,y|y,,y,y1p1011TTY,Y,Y|Y,,Y,Y1p1011TTf这里参数向量为)(Ω,Φ,,Φ,Φc,θp21,我们在上述函数中相对于参数θ进行极大化。一般情形下,向量自回归模型是在条件似然函数基础上,而不是在无条件似然函数基础上进行估计的。为了简单起见,我们将上述“条件似然函数”称为“似然函数”,相应的“条件极大似然估计”称为“极大似然估计”。向量自回归与标量自回归过程的似然函数的计算方法是类似的。基于时刻1t以前观测值,时刻t的ty值等于常数向量:ptpttyΦyΦyΦc2211,加上一个多元正态分布的随机向量)(~Ω0,εtN,因此条件分布为:),(~|22ΩyΦyΦyΦcy,,yytt1t11ppptttN我们可以将上述条件分布表示成为更为紧凑的形式。假设向量tx是常数向量和ty滞后值向量构成的综合向量:),1(1pttty,,yx这是一个维数为]1)1[(np的列向量。假设Π表示下述)]1([npn维矩阵:],,,,[21pΦΦΦcΠ这时条件均值可以表示为txΠ,Π的第j行包含VAR模型第j个方程中的参数。使用这样的符号,我们可以把条件分布表示成为紧凑形式:),(~|ΩxΠy,,yy1tptttN因此第t个观测值的条件分布可以表示成为:)]())(2/1exp{(||)2();,|(12/112/21|11ttttnptttpttfxΠyΩxΠyΩθy,y,yy1Y,,Y,Y这是基于条件),,,{110pyyy的观测值从1到t的联合概率分布为:时间序列分析方法讲义第11章向量自回归2);();();(121110121110112121θy,y,y|yθy,y,y|y,,y,yθy,y,y|y,,y,y1p1p1011p1011Y,Y,Y|YY,Y,Y|Y,,Y,YY,Y,Y|Y,,Y,Yptttpttptttttttttfff连续叠代利用上述公式,可以获得全部样本11,,,yyyTT基于),,,{110pyyy的联合条件分布是单独条件密度函数的乘积:TtptttpTTtttTTff112111011);();(21θy,y,y|yθy,y,y|y,,y,y1p1p1011Y,Y,Y|YY,Y,Y|Y,,Y,Y因此,样本对数似然函数为:TtttttTtptttTTnfLttt1111121)()(21||log2)2log(2);(log)(21xΠyΩxΠyΩθy,y,y|yθ1pY,Y,Y|Y11.1.2Π的极大似然估计我们首先考虑Π的极大似然估计,它包含常数向量c和自回归系数jΦ。我们的结论是它可以利用下述公式给出:111)]1([ˆTtttTtttnpnxxxyΠ这可以当作ty基于常数和tx母体线性投影的样本估计,Πˆ的第j行是:111)]1(1[ˆTtttTttjtnpyjxxx这正是tjy基于常数和tx进行线性回归的普通最小二乘估计(OLS)的估计系数向量。因此,VAR模型第j个方程系数的极大似然估计可以从tjy基于常数项和该系统所有变量的p阶滞后变量进行线性回归得到的OLS估计获得。为了验证上述结论,我们将似然函数中的最后一项表示成为:111111()()ˆˆˆˆ()()ˆˆˆˆ[()][()]TtttttTtttttttttTtttttyΠxΩyΠxyΠxΠxΠxΩyΠxΠxΠxεΠΠxΩεΠΠx这里的1n向量tεˆ的第j个元素是从tjy基于常数和tx进行线性回归得到的观测值t的样本残差:tttxΠyεˆˆ进一步将上式化简为:TtttTtttTtttTttttt11111111)ˆ()ˆ()ˆ(ˆ2ˆˆ])ˆ(ˆ[])ˆ(ˆ[xΠΠΩΠΠxxΠΠΩεεΩεxΠΠεΩxΠΠε时间序列分析方法讲义第11章向量自回归3考虑上式的中间项,由于这是一个标量,利用“迹算子”进行计算数值不改变:TtttTtttTtttTttt11111111ˆ)ˆ(traceˆ)ˆ(trace)ˆ(ˆtrace)ˆ(ˆεxΠΠΩεxΠΠΩxΠΠΩεxΠΠΩε注意到在线性回归中,普通最小二乘估计下的样本残差与解释变量是正交的,即对所有的j有:0εxTtjtt1ˆ因此也有:0εxTttt1ˆ这样就有:TtttTtttTttttt111111)ˆ()ˆ(ˆˆ)()(xΠΠΩΠΠxεΩεxΠyΩxΠy因为Ω是正定矩阵,它的逆矩阵1Ω也是正定矩阵。因此,定义一个1n维向量:ttxΠΠx)ˆ(*则上式最后一项可以表示成为:TtttTttt1*1*11][][)ˆ()ˆ(xΩxxΠΠΩΠΠx因此,上式达到最小值时要求:0x*t,即:ΠΠˆ,这意味着OLS回归估计为向量自回归系数提供了极大似然估计。11.1.3Ω的极大似然估计我们可以利用矩阵导数的一些公式来获得Ω的极大似然估计。在Π的极大似然估计Πˆ处,条件似然函数为:TtttTTnL111ˆˆ21||log2)2log(2)ˆ,(εΩεΩΠΩ我们的目的是选择对称正定矩阵使得上述函数达到最大。类似的矩阵导数运算得到:TtttT1ˆˆ1ˆεεΩ上述矩阵的第i行和第j列元素的估计为:TtjtitijεεT1ˆˆ1ˆ这里残差tiεˆ是VAR模型中第i个变量基于常数和所有变量的p阶滞后进行回归普通最小二乘估计得到的残差。11.1.4向量自回归模型的似然比检验LikelihoodRatiosTests为了实施似然比检验,我们需要计算极大似然函数的具体数值,为此,我们考虑:TtttTTnL111ˆˆˆ21|ˆ|log2)2log(2)ˆ,ˆ(εΩεΩΠΩ上式中的最后一项是:时间序列分析方法讲义第11章向量自回归42trace21)ˆ(ˆtrace21ˆˆˆtrace21ˆˆˆtrace21ˆˆˆ211111111nTTTnTtttTtttTtttIΩΩεεΩεΩεεΩε代入到似然函数中,得到:2|ˆ|log2)2log(2)ˆ,ˆ(1TnTTnLΩΠΩ这使得似然比检验比较容易进行。假设我们希望检验的原假设是一组变量是由具有0p阶滞后变量的高斯VAR模型产生,而备选假设是滞后变量阶数为01pp。为了在原假设下估计系统,我们对系统中的每一个变量基于常数和所有其他变量及其0p阶滞后变量进行最小二乘回归,设TtttppT1000])(ˆ[)(ˆ)/1(ˆεεΩ是从这些回归中得到的残差的方差-协方差矩阵。因此在原假设0H下对数似然估计的极大值是:2|ˆ|log2)2log(2100TnTTnLΩ类似,该模型系统可以利用最小二乘估计对包括所有变量1p阶滞后变量进行线性估计,得到备选假设下对数似然函数的最大值是:2|ˆ|log2)2log(2111TnTTnLΩ这里TtttppT1111])(ˆ[)(ˆ)/1(ˆεεΩ是从第二组变量集合中获得的方差-协方差矩阵。则似然比对数的二倍可以表示为:112210100110ˆˆˆˆ2()2log||2log||{log||log||}~[()]22TTLLTnppΩΩΩΩ在原假设下,似然比统计量具有2分布的渐近分布,自由度是附加在原假设0H上约束的数目,系统中每个方程在原假设0H上的约束条件是每个变量减少了)(01pp个滞后变量,因此一个方程中的参数零约束是)(01ppn,因此整个VAR模型系统的约束条件数目)(012ppn,因此上述似然比统计量在原假设成立时的渐近分布是)]([0122ppn。例如,假设在滞后3阶和4阶的情形下估计一个二元VAR模型,这时的参数阶数为:2n,30p,41p,假设原始样本中每个变量包含50个观测值,表示为4623,y,,yy,观测值1至46用于估计滞后3阶和4阶指定时的系统参数,因此这时46T。假设)(ˆ0pit表示t时ity基于常数、ty1的3阶滞后和ty2的3阶滞后进行回归的残差,假设计算得到:0.2)](ˆ[11201TttpεT,5.2)](ˆ[11202TttpεT,0.1)](ˆ)][(ˆ[110201TtttpεpεT则有:5.20.10.10.2ˆ0Ω计算这个矩阵的对数行列式值为:386.14log|ˆ|log0Ω。类似地,假设将变量的滞后4阶变量加入到回归方程中来,则可以得到残差的协方差矩阵为:2.29.09.08.1ˆ1Ω这个矩阵的对数行列式值为:147.1|ˆ|log1Ω。则有:时间序列分析方法讲义第11章向量自回归599.10)147.1386.1(46)(201LL检验统计量的自由度为4)34(22,由于49.9)4(99.10205.0,因此拒绝原假设,认为模型的动态性没有被VAR(3)描述,这时采用VAR(4)更为合适。Sims(1980)提出了一种修正的似然比检验,该检验考虑了小样本带来的偏差。他建议的统计量为:220110ˆˆ(){log||log||}~[()]TknppΩΩ,11pnk这里的k是每个方程中需要估计的参数个数。这个修正后的统计量保持原来的渐近分布,但是降低了小样本情形下拒绝原假设的可能性。对上面的例子而言,检验统计量为:84.8)147.1386.1)(946(此时我们将得到相反的检验结果,这时原假设是被接受的。§11.2二元Granger因果关系检验BivariateGrangerCausalityTests一个能够利用VAR模型处理的关键问题是如何描述一些变量预测其他变量时的有用程度。下面我们主要分析由Granger(1969)提出的,由Sims(1972)推广的预测两个变量之间关系的方法。11.2.1二元Granger因果关系的定义DefinitionofBivariateGrangerCausality我们在这里分析的主要问题是一个标量随机变量y对于预测另外一个标