第十二章自相关

iasombra贩爱机
0 ℃
2019-12-20

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1第12章自相关本章放松古典线性回归模型的另一假设——总体回归函数的扰动项ui无序列相关或自相关。主要解决以下问题答案：(1)自相关有什么性质？(2)自相关的理论与实际结果是什么？(3)如何诊断自相关？(4)如何采取措施加以补救？本章对自相关的讨论在许多方面与上一章的异方差问题相类似。12.1自相关的性质自相关问题通常是与时间序列数据有关。在古典线性回归模型中假定在扰动项ui中不存在自相关：cov(ui,uj)=0i≠j更直观,推理因为cov(ui,uj)=E{[ui-E(ui)][uj-E(uj)]}=E(uiuj)-E(ui)E(uj)=0所以E(uiuj)=0i≠j即两个不同误差项ui和uj的乘积的期望为零。简单地说，任一观察值的扰动项不受其他任何观察值的扰动项的影响。例如，在讨论产出对劳动和资本投入回归的季度时间序列数据时，如果某一季度工人罢工影响了产出，但没有这一影响没有持续到下一个季度，即如果本季度产出降低，但并不意味着下一季度产出也下降。但是如果存在这种影响，便产生了自相关问题:E(uiuj)≠0i≠j图12-1a到d表明有可能存在自相关。2为什么会产生自相关呢？312.1.1惯性大多数经济时间序列的一个显著特征就是惯性或者说是迟缓性。时间序列数据，例如国民生产总值、就业、货币供给、价格指数等等，都呈现循环波动性。当经济恢复开始时，由萧条的底部开始，大多数的经济序列向上移动。在向上移动的过程中，序列某一时点的值会大于其前期值。直到某些事件发生(例如税收的增加或者利率的提高)才使序列数据移动减慢下来。因此，在涉及时间系列数据的回归方程中，连续的观察值之间很可能是相关的。12.1.2模型设定误差有时发生自相关是因为回归模型没有正确设定。或是由于本应包括在模型中的重要变量未包括进模型中，或是模型选择了错误函数形式，例如本应该使用对数线性模型但却用了线性变量模型。一个简单的检验方法是将略去的变量包括到模型中，判定残差是否自相关。12.1.3数据加工在实证分析中，有时原始数据需经过加工。如，在季度数据的回归中，通常将3个月的数据简单加总并除以3。这样平均的结果，消除了月度数据的波动性，但这种“平滑”过程本身就可能导致扰动项的自相关。需指出：虽然大多数经济时间序列都因在一个时期内或者上升或者下降而表现出正的自相关，但是不会表现为一上一下的恒常运动。412.2自相关的后果(1)最小二乘估计量仍然是线性的和无偏的。(2)但不是有效的。即通常所用的普通最小二乘估计量（OLS）并不是最优线性无偏估计量(BLUE)。(3)误差项的方差，22ˆ..eidf(残差平方和/自由度)，是真实2的有偏估计量，在有些情形下，它很可能是低估了真实的2。(4)因此，OLS估计量的方差是有偏的。有时候，用来计算方差和OLS估计量的标准差的公式会严重低估真实的方差和标准差（例如，在一元古典线性回归模型中，var(b1)222ˆiiXnx；var(b2)=22ˆix），从而导致2ˆ/kkibBtx变大。这会使某个估计量显著不为零，但是事实却并非如此。因此，t检验和F检验一般来说是不可靠的。(5)通常计算的R2不能测度真实R2。可见，自相关产生的后果与异方差产生的后果很相似。12.3自相关的诊断由于无法得到真实的ui，我们不知道误差项的2的真实值，而且如果它们是自相关的，也不知道其产生机制，我们仅仅有它们的替代物et。因此，与异方差一样，我们不得不根据从标准OLS法中得到的et来推测自相关存在与否。例子给出了1968年到1982年期间美国个人可支配收入（Y），及进口支出（X）的数据。从标准OLS法中得到给出了残差et512.3.1图形法通过对OLS残差e的直观检验判断误差项u中是否存在自相关。6上图表明：残差e并不是随机分布，它们呈现一种明显的变动行为：正，负，再正。如果将t时间的残差et与滞后一期的残差et-1绘图，则会发现存在着正的自相关：大多数残差都分布在第一象限和第三象限。12.3.2杜宾－瓦尔森d（D-W检验）检验由杜宾和瓦尔森提出的，定义为：21221()ntttntteede它是逐次残差差的平方和对残差平方和的比值。d统计量分子的容量为(n－1)，因为在求逐次差时失去一个观察值。杜宾－瓦尔森d检验的条件：(1)变量X是非随机变量，即在重复取样中是固定的。(2)扰动项ut的产生机制是马尔可夫一阶自回归或者一阶自回归[AR(1)]：ut=u（t-1）+vt－1≤≤1这表明在t时期内的扰动项或者说误差项依赖于它的第(t－1)期的值以及一个纯粹的随机项(vt)。依赖过去值的程度由测度，称为自相关系数，介于－1和1之间。一阶是指因为只涉及ut和它的上一期值。(3)。该检验对自回归模型不适用：Yt=B1+B2Xt+B3Y(t－1)+ut在回归方程中，不能把应变量的滞后值作为解释变量（4）大容量样本。7统计量d值的计算：2222111122222211(2)2nnnnttttttttttttnntttteeeeeeeedee对大容量样本有2221221nnntttttteee2111222221122222(1)nnnttttttttnntttteeeeedee因为112222121ˆnnttttttnntttteeeeee证明ˆ是的估计量：tt-1tt1(,)()()coveevarevare（为相关系数）tt-12tE(ee)tt-121..t(ee)nedf因为对大容量样本有1..1ndfnk，k是解释变量的个数。8因此tt-112221,1ˆ..ntttnttt(ee)eeneedf所以由于－1≤≤1，因此0≤d≤4，d可能出现：根据以上讨论可以得出：如果计算的d值接近于零，则表明存在着正的自相关，如果接近于4，则表明存在着负的自相关。d值越接近于2，则说明越倾向于无自相关。上述结论很宽泛，能否有更准确的临界点？杜宾－瓦尔森根据样本容量n，解释变量的个数，显著性水平，给出了下限dL和上限dU（课本P272－275）。d值位于这些界限之外，可以断定是否存在正的或负的序列相关。9D-W检验的步骤：(1)进行OLS回归并获得残差et。(2)计算d值。(3)给定样本容量、解释变量的个数以及相应的显著性水平，从D-W表中查到临界的dL和dU。(4)按照表中给出的数据进行判定。D-W检验缺陷是：（1）只适用一阶自回归（2）只适用大容量样本（3）如果计算得到的d值落入非决策区域或者说是盲区。12.4补救措施12.4.1已知：广义差分法以一元回归模型为例：Yt=B1+B2Xt+ut（1）假设误差项服从一阶自回归AR(1)过程：ut=u（t－1）+vt－1≤≤1，v满足OLS假定。思路是对模型作变换，使得变换后模型的误差项是序列独立的，再用OLS法进行估计，得到最优线性无偏估计量。将回归方程中的变量滞后一期：Y（t－1）=B1+B2X（t－1）+u（t－1）两边同时乘以Y（t－1）=B1+B2X（t－1）+u（t－1）（2）利用方程ut=u（t-1）+v，在将（1）（2）两式相减：(Yt-Y（t－1）)=B1(1-)+B2(Xt-X（t－1）)+vt方程可以写成：Yt*=B1*+B2*Xt*+vt其中，Yt*=(Yt－Y（t－1）)Xt*=(Xt－X（t－1）)B1*=B1(1－)对变换后的模型使用OLS法，获得的估计量具有BLUE性质，得到的估计量称为广义最小二乘估计量(GLS)。Y对X的回归，是以差分形式，即通过将变量的当期值减去前期值的一个比例()得到的。1012.4.2未知从杜宾－瓦尔森d统计量中估计d=2(1－ˆ)，可得ˆ12d该方法很容易使用，但只有当样本容量很大时才能得到较理想的值。从OLS残差et中估计一阶自回归：ut=u（t-1）+vtu无法直接观察得到，用相对应的样本误差e代替：et=ˆe（t－1）+vt其中ˆ是的估计量，尽管对小样本而言,ˆ是真实的有偏估计量,但是随着样容量的增加,这个偏差会逐渐消失。12.4.3科克兰内—奥可特方法（Cochrance-Orcutt反复迭代法）可以进行一系列反复迭代，以寻找一个更好的的估计值ˆ，或者一直到消除序列相关为止。第一步：从OLS残差et来估计的第二次估计值1ˆ（见12.4.2）第二步：利用1ˆ进行广义差分法（12.4.1）对下式进行OLS估计(Yt-1ˆY（t－1）)=B1(1-1ˆ)+B2(Xt-1ˆX（t－1）)+vt检验残项vt是否存在自相关。如无自相关，则计算结束；如存在自相关，则继续计算的第二次估计值2ˆ第三步：利用2ˆ进行广义差分法，即进行第二次迭代(Yt-2ˆY（t－1）)=B1(1-2ˆ)+B2(Xt-2ˆX（t－1）)+vt经过多次迭代，一直到消除序列相关。实际处理中，一般只需要进行两次迭代，即可以消除自相关，得到精确的ˆ。（实验中，可在命令栏中直接键入：YCXAR(1)，点击回车键即可）