2019第七章--带有线性约束的多元线性回归模型及其假设检验(金融计量-浙大-蒋岳祥)

silkroad86
8 ℃
2020-05-26

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第七章带有线性约束的多元线性回归模型及其假设检验在本章中，继续讨论第五章的模型，但新的模型中，参数β满足J个线性约束集，Rβ=q，矩阵R有和β相一致的K列和总共J个约束的J行，且R是行满秩的，我们考虑不是过度约束的情况，因此，J＜K。带有线性约束的参数的假设检验，我们可以用两种方法来处理。第一个方法，我们按照无约束条件求出一组参数估计后，然后我们对求出的这组参数是否满足假设所暗示的约束，进行检验，我们在本章的第一节中讨论。第二个方法是我们把参数所满足的线性约束和模型一起考虑，求出参数的最小二乘解，尔后再作检验，后者就是参数带有约束的最小二乘估计方法，我们在本章的第二节中讨论。第一节线性约束的检验从线性回归模型开始，Xy（1）我们考虑具有如下形式的一组线性约束，JKJKJJKKKKqrrrqrrrqrrr22112222212111212111这些可以用矩阵改写成一个方程qR（2）作为我们的假设条件0H。R中每一行都是一个约束中的系数。矩阵R有和β相一致的K列和总共J个约束的J行，且R是行满秩的。因此，J一定要小于或等于K。R的各行必须是线性无关的，虽然J=K的情况并不违反条件，但其唯一决定了β，这样的约束没有意义，我们不考虑这种情况。给定最小二乘估计量b，我们的兴趣集中于“差异”向量d=Rb－q。d精确等于0是不可能的事件（因为其概率是0），统计问题是d对0的离差是否可归因于抽样误差或它是否是显著的。由于b是多元正态分布的，且d是b的一个线性函数，所以d也是多元正态分布的，若原假设为真，d的均值为0，方差为RXXRRbVarRqRbVardVar12)(])[(][][（3）对H0的检验我们可以将其基于沃尔德（Wald）准则：ddVardJW12])[()(=)(])([)(112qRbRXXRqRb（4）在假设正确时将服从自由度为J的2分布(为什么?)。直觉上，d越大，即最小二乘满足约束的错误越大，则2统计量越大，所以，一个大的2值将加重对假设的怀疑。MeesKn222)(（5）由于σ未知，（4）中的统计量是不可用的，用s2替代σ2，我们可以导出一个F[J，（n－K）]样本统计量，令)/(]/)[(/)(])([)(22112KnsKnJqRbRXXRqRbF（6）分子是（1/J）乘（4）中的W，分母是1/（n－K）乘（5）中的幂等二次型。所以，F是两个除以其自由度的卡方变量的比率。如果它们是独立的，则F的分布是F[J，（n－K）]，我们前边发现b是独立于s2分布的，所以条件是满足的。我们也可以直接推导。利用（5）及M是幂等的这一事实，我们可以把F写为)/()]/([])/([/}/)({])([}/)({11KnMMJbRRXXRbRF（7）由于TXXXRbR1)()(F统计量是)/(的两个二次型的比率，由于M)/(和T)/(都服从正态分布且它们的协方差TM为0，所以二次型的向量都是独立的。F的分子和分母都是独立随机向量的函数，因而它们也是独立的。这就完成了证明。消掉（6）中的两个σ2，剩下的是检验一个线性假设的F统计量，)/(/)(])([)(11KneeJqRbRXXRqRbFJqRbRXXRsqRb)(])([)(112（8）我们将检验统计量JqRbRXXsRqRbKnJF)(}])([{)(],[112和F分布表中的临界值相比较，一个大的F值是反对假设的证据。注意：将wald统计量中的2用2s去替代，相应的就将J维的卡方分布转换为维度为（J,n-K）的F分布。第二节参数带有约束的最小二乘估计一、带有约束的最小二乘函数在许多问题中，要求其中的未知参数β满足某特定的线性约束条件：Rβ=q，这里R是J×K矩阵（J＜K），并假定它的秩为J维向量，常常希望求β的估计ˆ，使得2}:{2minˆXYXYqR（9）满足条件（9）的称为β的具有线性约束Rβ=q的最小二乘估计。解ˆ的问题实际上是在约束条件Rβ=q下求nimjjijixYXYf1212的限制极值点问题。这个问题的一个拉格朗日解可写作)(2)()(*qRXyXyS解b*和λ将满足必要条件02)(2**RXbyXS0)(2**qRbS展开可以得到分块矩阵方程qyXbRRXX*0或Wd*=v假定括号中的分块矩阵是非奇异的，约束最小二乘估计量d*=W-1v*bwhere11111111111111)')'(()'()')'(()')'((')'()'()')'((')'()'(RXXRXXRRXXRRXXRRXXXXRRXXRRXXXXW的解。此外，若X′X是非奇异的，则用分块逆公式可以得到b*和λ的显示解)(])([)()')'((')'()')'((')'(')'()')'((')'()(')'()')'((')'(')'()')'((')'(')'()')'((')'(')'(11111111111111111111111111*qRbRXXRRXXbqRXXRRXXRbRXXRRXXyXXXqRXXRRXXeXbXXXRRXXRRXXyXXXqRXXRRXXyXXXRRXXRRXXyXXXb和)(])([11qRbRXXR格林和西克斯（1991）表明b*的协方差矩阵简单地就是2乘以W-1的左上块，在X′X是非奇异的通常情况下，再一次可以得到一个显性公式1111212*)(])([)()(][XXRRXXRRXXXXbVar，这样，][][*bVarbVar（一个非负定矩阵），Var[b*]的方差比Var[b]小的一个解释是约束条件提供了更多的信息价值。二、对约束的检验的另一个方法令**Xbye，我们来计算新的离差平方和**ee。)()(***bbXebbXXbye则新的离差平方和是eebbXXbbeeee)()(****22~'knee2)(2**~'Jknee因为新的模型中参数的个数为k-J个，J个榆树条件是原模型中的J个参数可以被其他k-J个表示。（此表达式中的中间项含有X′e，它是0）。这说明我们可以将一个约束检验基于拟合的损失。这个损失是，)(])([)(11**qRbRXXRqRbeeee这出现在前边推导的F统计量的分子上，我们得到统计量的另一个可选形式。可选形式是)/(/)(],[**KneeJeeeeKnJF最后，以SST=2)(yy除F的分子和分母，我们得到第三种形式，)/()1(/)(],[22*2KnRJRRKnJF由于两个模型的拟合之差直接体现在检验统计量中，这个形式具有一些直观吸引力。[实例]对数变换生产函数所有科布—道格拉斯模型的一般化是如下的对数变换模型，2lnln2ln2lnlnlnln62524321KLKLKLY（10）无约束回归的结果在表1中给出。表1无约束回归的结果回归标准误差0.17994残差平方和0.67993R平方0.95486调整R平方0.94411变量系数标准误差t值常数项0.9442162.9110.324LnL3.613631.5482.334LnK－1.893111.016－1.863L2ln21－0.964060.7074－1.363K2ln210.085290.29260.291lnL×lnK0.312390.43890.71系数估计量的估计协方差矩阵常数项lnLlnKLn2L/2Ln2K/2lnL×lnK常数项8.472LnL－2.3882.397LnK－0.3313－1.2311.033L2ln21－0.08760－0.66580.52310.5004K2ln210.23320.034770.026370.14670.08562lnL×lnK0.36350.1831－0.2255－0.2880－0.11600.1927考虑了约束条件0654的模型就可以得到科布一道格拉斯模型：KLYlnlnln321（11）这是一个条件约束下的无条件的多元线性回归模型。就可以用一般线性回归的方法求解模型。假如我们通过有约束条件下的无条件的多元线性回归模型得到：85163.0**ee，而且n－K=21，则科布—道格拉斯模型假设的F统计量是768.121/67993.03/)67993.085163.0(]21,3[F查自F分布表的5%临界值是3.07，所以我们不能拒绝科布—道格拉斯模型是适当的这一假设。考虑了约束条件0654和条件132的模型就是满足规模效应的科布—道格拉斯生产函数。这个模型可以推导如下：）ln(lnlnlnln)1(lnlnlnln21221321KLLYKLKLY（12）假如我们通过有约束条件下的无条件的多元线性回归模型得到：89172.0**ee，而且n－K=21，则科布—道格拉斯模型假设的F统计量是635.121/67993.04/)67993.089172.0(]21,4[F查自F分布表的5%临界值是2.85，所以我们不能拒绝科布—道格拉斯模型是规模效应的生产函数的这一假设。第三节结构变化与邹至庄检验(StructureChangeandChou-Test)一、问题提出我们经常碰到这样的问题。某项政策的出台及实施，其效果如何？不同地区或不同时期内，我们分别可以得到这两个地区或时期的观测值，我们的问题是：这两个地区或时期的情况是否不同，经济结构有无差异。这类问题，被华人经济学家邹至庄用构造的F检验解决了（1960年）。这样的F检验的统计量，就称为邹至庄检验（Chou-Test）。二、问题的模型表述设1122(),()ZYZY分别表示这两个时期的观测值，允许两个时期中系数不同的无约束回归是11112222YZYZ，我们可以将其改写成一个回归方程1111222200YZYZ……（1）即YZ模型，其中Y=12YY，Z=1200ZZ，β=12，ε=12。上述问题就转换成检验012112::HH的问题。我们可以用两种方式来处理问题一）用约束条件12，来检验。12是更一般约束条件Rβ=q的一个特殊形式，其中R=(I,-I)和q=0。这个直接可以从基于Wald统计量的带约束条件的F检验得到。（请自己推导）。例题：用约束条件下，F检验推导出邹至庄检验的表达式：解：在约束条件Rβ=q下，F检验211()[()]()(,)RbqSRZZRRbqFJnkJ。而邹至庄检验时约束条件Rβ=q的一种特殊形式，即R=(I,-I)，而q=0，也即等同于条件12。（有2k个参数，并且是有k个约束）。故21112'121111212'1222'1'111211221()[()]()(,2)()0()[(,)]()0()()[()()](=RbqSRZZRRbqFknnkkIZZbbSIIbbIZZkbbSZZZZbb2)k服从