1第七章带有线性约束的多元线性回归模型及其假设检验在本章中,继续讨论第五章的模型,但新的模型中,参数β满足J个线性约束集,Rβ=q,矩阵R有和β相一致的K列和总共J个约束的J行,且R是行满秩的,我们考虑不是过度约束的情况,因此,J<K。带有线性约束的参数的假设检验,我们可以用两种方法来处理。第一个方法,我们按照无约束条件求出一组参数估计后,然后我们对求出的这组参数是否满足假设所暗示的约束,进行检验,我们在本章的第一节中讨论。第二个方法是我们把参数所满足的线性约束和模型一起考虑,求出参数的最小二乘解,尔后再作检验,后者就是参数带有约束的最小二乘估计方法,我们在本章的第二节中讨论。第一节线性约束的检验从线性回归模型开始,Xy(1)我们考虑具有如下形式的一组线性约束,JKJKJJKKKKqrrrqrrrqrrr22112222212111212111这些可以用矩阵改写成一个方程qR(2)作为我们的假设条件0H。R中每一行都是一个约束中的系数。矩阵R有和β相一致的K列和总共J个约束的J行,且R是行满秩的。因此,J一定要小于或等于K。R的各行必须是线性无关的,虽然J=K的情况并不违反条件,但其唯一决定了β,这样的约束没有意义,我们不考虑这种情况。给定最小二乘估计量b,我们的兴趣集中于“差异”向量d=Rb-q。d精确等于0是不可能的事件(因为其概率是0),统计问题是d对0的离差是否可归因于抽样误差或它是否是显著的。2由于b是多元正态分布的,且d是b的一个线性函数,所以d也是多元正态分布的,若原假设为真,d的均值为0,方差为RXXRRbVarRqRbVardVar12)(])[(][][(3)对H0的检验我们可以将其基于沃尔德(Wald)准则:ddVardJW12])[()(=)(])([)(112qRbRXXRqRb(4)在假设正确时将服从自由度为J的2分布(为什么?)。直觉上,d越大,即最小二乘满足约束的错误越大,则2统计量越大,所以,一个大的2值将加重对假设的怀疑。MeesKn222)((5)由于σ未知,(4)中的统计量是不可用的,用s2替代σ2,我们可以导出一个F[J,(n-K)]样本统计量,令)/(]/)[(/)(])([)(22112KnsKnJqRbRXXRqRbF(6)分子是(1/J)乘(4)中的W,分母是1/(n-K)乘(5)中的幂等二次型。所以,F是两个除以其自由度的卡方变量的比率。如果它们是独立的,则F的分布是F[J,(n-K)],我们前边发现b是独立于s2分布的,所以条件是满足的。我们也可以直接推导。利用(5)及M是幂等的这一事实,我们可以把F写为)/()]/([])/([/}/)({])([}/)({11KnMMJbRRXXRbRF(7)由于TXXXRbR1)()(F统计量是)/(的两个二次型的比率,由于M)/(和T)/(都服从正态分布且它们的协方差TM为0,所以二次型的向量都是独立的。F的分子和分母都是独立随机向量3的函数,因而它们也是独立的。这就完成了证明。消掉(6)中的两个σ2,剩下的是检验一个线性假设的F统计量,)/(/)(])([)(11KneeJqRbRXXRqRbFJqRbRXXRsqRb)(])([)(112(8)我们将检验统计量JqRbRXXsRqRbKnJF)(}])([{)(],[112和F分布表中的临界值相比较,一个大的F值是反对假设的证据。注意:将wald统计量中的2用2s去替代,相应的就将J维的卡方分布转换为维度为(J,n-K)的F分布。第二节参数带有约束的最小二乘估计一、带有约束的最小二乘函数在许多问题中,要求其中的未知参数β满足某特定的线性约束条件:Rβ=q,这里R是J×K矩阵(J<K),并假定它的秩为J维向量,常常希望求β的估计ˆ,使得2}:{2minˆXYXYqR(9)满足条件(9)的称为β的具有线性约束Rβ=q的最小二乘估计。解ˆ的问题实际上是在约束条件Rβ=q下求nimjjijixYXYf1212的限制极值点问题。这个问题的一个拉格朗日解可写作)(2)()(*qRXyXyS解b*和λ将满足必要条件402)(2**RXbyXS0)(2**qRbS展开可以得到分块矩阵方程qyXbRRXX*0或Wd*=v假定括号中的分块矩阵是非奇异的,约束最小二乘估计量d*=W-1v*bwhere11111111111111)')'(()'()')'(()')'((')'()'()')'((')'()'(RXXRXXRRXXRRXXRRXXXXRRXXRRXXXXW的解。此外,若X′X是非奇异的,则用分块逆公式可以得到b*和λ的显示解)(])([)()')'((')'()')'((')'(')'()')'((')'()(')'()')'((')'(')'()')'((')'(')'()')'((')'(')'(11111111111111111111111111*qRbRXXRRXXbqRXXRRXXRbRXXRRXXyXXXqRXXRRXXeXbXXXRRXXRRXXyXXXqRXXRRXXyXXXRRXXRRXXyXXXb和)(])([11qRbRXXR格林和西克斯(1991)表明b*的协方差矩阵简单地就是2乘以W-1的左上块,在X′X是非奇异的通常情况下,再一次可以得到一个显性公式1111212*)(])([)()(][XXRRXXRRXXXXbVar,5这样,][][*bVarbVar(一个非负定矩阵),Var[b*]的方差比Var[b]小的一个解释是约束条件提供了更多的信息价值。二、对约束的检验的另一个方法令**Xbye,我们来计算新的离差平方和**ee。)()(***bbXebbXXbye则新的离差平方和是eebbXXbbeeee)()(****22~'knee2)(2**~'Jknee因为新的模型中参数的个数为k-J个,J个榆树条件是原模型中的J个参数可以被其他k-J个表示。(此表达式中的中间项含有X′e,它是0)。这说明我们可以将一个约束检验基于拟合的损失。这个损失是,)(])([)(11**qRbRXXRqRbeeee这出现在前边推导的F统计量的分子上,我们得到统计量的另一个可选形式。可选形式是)/(/)(],[**KneeJeeeeKnJF最后,以SST=2)(yy除F的分子和分母,我们得到第三种形式,)/()1(/)(],[22*2KnRJRRKnJF由于两个模型的拟合之差直接体现在检验统计量中,这个形式具有一些直观吸引力。[实例]对数变换生产函数所有科布—道格拉斯模型的一般化是如下的对数变换模型,62lnln2ln2lnlnlnln62524321KLKLKLY(10)无约束回归的结果在表1中给出。表1无约束回归的结果回归标准误差0.17994残差平方和0.67993R平方0.95486调整R平方0.94411变量系数标准误差t值常数项0.9442162.9110.324LnL3.613631.5482.334LnK-1.893111.016-1.863L2ln21-0.964060.7074-1.363K2ln210.085290.29260.291lnL×lnK0.312390.43890.71系数估计量的估计协方差矩阵常数项lnLlnKLn2L/2Ln2K/2lnL×lnK常数项8.472LnL-2.3882.397LnK-0.3313-1.2311.033L2ln21-0.08760-0.66580.52310.5004K2ln210.23320.034770.026370.14670.08562lnL×lnK0.36350.1831-0.2255-0.2880-0.11600.1927考虑了约束条件0654的模型就可以得到科布一道格拉斯模型:KLYlnlnln321(11)这是一个条件约束下的无条件的多元线性回归模型。就可以用一般线性回归的方法求解模型。假如我们通过有约束条件下的无条件的多元线性回归模型得到:85163.0**ee,而且n-K=21,则科布—道格拉斯模型假设的F统计量是768.121/67993.03/)67993.085163.0(]21,3[F查自F分布表的5%临界值是3.07,所以我们不能拒绝科布—道格拉斯模型是适当的这一假设。7考虑了约束条件0654和条件132的模型就是满足规模效应的科布—道格拉斯生产函数。这个模型可以推导如下:)ln(lnlnlnln)1(lnlnlnln21221321KLLYKLKLY(12)假如我们通过有约束条件下的无条件的多元线性回归模型得到:89172.0**ee,而且n-K=21,则科布—道格拉斯模型假设的F统计量是635.121/67993.04/)67993.089172.0(]21,4[F查自F分布表的5%临界值是2.85,所以我们不能拒绝科布—道格拉斯模型是规模效应的生产函数的这一假设。第三节结构变化与邹至庄检验(StructureChangeandChou-Test)一、问题提出我们经常碰到这样的问题。某项政策的出台及实施,其效果如何?不同地区或不同时期内,我们分别可以得到这两个地区或时期的观测值,我们的问题是:这两个地区或时期的情况是否不同,经济结构有无差异。这类问题,被华人经济学家邹至庄用构造的F检验解决了(1960年)。这样的F检验的统计量,就称为邹至庄检验(Chou-Test)。二、问题的模型表述设1122(),()ZYZY分别表示这两个时期的观测值,允许两个时期中系数不同的无约束回归是11112222YZYZ,我们可以将其改写成一个回归方程1111222200YZYZ……(1)即YZ模型,其中Y=12YY,Z=1200ZZ,β=12,ε=12。上述问题就转换成检验012112::HH的问题。8我们可以用两种方式来处理问题一)用约束条件12,来检验。12是更一般约束条件Rβ=q的一个特殊形式,其中R=(I,-I)和q=0。这个直接可以从基于Wald统计量的带约束条件的F检验得到。(请自己推导)。例题:用约束条件下,F检验推导出邹至庄检验的表达式:解:在约束条件Rβ=q下,F检验211()[()]()(,)RbqSRZZRRbqFJnkJ。而邹至庄检验时约束条件Rβ=q的一种特殊形式,即R=(I,-I),而q=0,也即等同于条件12。(有2k个参数,并且是有k个约束)。故21112'121111212'1222'1'111211221()[()]()(,2)()0()[(,)]()0()()[()()](=RbqSRZZRRbqFknnkkIZZbbSIIbbIZZkbbSZZZZbb