第四章多重共线性一、判断题1、多重共线性是一种随机误差现象。(F)2、多重共线性是总体的特征。(F)3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t值会趋于变大。(F)4、尽管有不完全的多重共线性,OLS估计量仍然是最优线性无偏估计量。(T)5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(T)6、变量的两两高度相关并不表示高度多重共线性。(F)7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。(T)8、在多元回归中,根据通常的t检验,每个参数都是统计上不显著的,你就不会得到一个高的2R值。(F)9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。(F)10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。(T)11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。(T)12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。(F)13、多重共线性的存在会降低OLS估计的方差。(F)14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。(T)15、解释变量和随机误差项相关,是产生多重共线性的原因。(F)16、对于模型inini110iuXXY,n1i,,;如果132XXX,模型必然存在解释变量的多重共线性问题。(T)17、多重共线性问题是随机扰动项违背古典假定引起的。(F)18、存在多重共线性时,模型参数无法估计。(F)二、单项选择题1、在线性回归模型中,若解释变量1X和2X的观测值成比例,既有12iiXkX,其中k为非零常数,则表明模型中存在(B)A、异方差B、多重共线性C、序列相关D、随机解释变量2、在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型中存在(C)A、异方差性B、序列相关C、多重共线性D、拟合优度低3、对于模型ii22i110iuXXY,与0r12相比,当50r12.时,估计量1ˆ的方差1ˆvar将是原来的(B)A、1倍B、1.33倍C、1.96倍D、2倍4、如果方差膨胀因子VIF=10,则认为什么问题是严重的(C)A、异方差问题B、序列相关问题C、多重共线性问题D、解释变量与随机项的相关性5、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF(C)。A、大于1B、小于1C、大于10D、小于106、模型中引入实际上与解释变量有关的变量,会导致参数的OLS估计量方差(A)A、增大B、减小C、有偏D、非有效7、存在严重的多重共线性时,参数估计的标准差(A)。A、变大B、变小C、无穷大D、无法估计8、完全多重共线性时,下列判断不正确的是(D)。A、参数无法估计B、只能估计参数的线性组合C、模型的拟合程度不能判断D、可以计算模型的拟合程度9、模型中引入一个无关的解释变量(C)A、对模型参数估计量的性质不产生任何影响B、导致普通最小二乘估计量有偏C、导致普通最小二乘估计量精度下降D、导致普通最小二乘估计量有偏,同时精度下降三、多项选择题1、关于多重共线性的影响,下面哪些正确:(ABCD)A、增大回归系数的标准差B、难以区分单个自变量的影响C、t检验倾向于不显著D、回归参数估计值不稳定2、下列哪些回归分析中很可能出现多重共线性问题(ACE)。A、资本投入与劳动投入两个变量同时作为生产函数的解释变量B、消费作被解释变量,收入作解释变量的消费函数C、本期收入和前期收入同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型3、当模型中解释变量间存在高度的多重共线性时(ACD)。A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关4、下述统计量可以用来检验多重共线性的严重性(ACD)。A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数5、多重共线性产生的原因主要有(ABCDE)。A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确6、多重共线性的解决方法主要有(ABCDE)。A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量7、关于多重共线性,判断错误的有(ABC)。A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应用的意义D、存在严重的多重共线性的模型不能用于结构分析8、模型存在完全多重共线性时,下列判断正确的是(AB)。A、参数无法估计B、只能估计参数的线性组合C、模型的可决系数为0D、模型的可决系数为19、下列判断正确的有(ABC)。A、在严重多重共线性下,OLS估计量仍是最佳线性无偏估计量。B、多重共线性问题的实质是样本现象,因此可以通过增加样本信息得到改善。C、虽然多重共线性下很难精确区分各个解释变量的单独影响,但可据此模型进行预测。D、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。10、检测多重共线性的方法有(AC)。A、简单相关系数检测法B、样本分段比较法C、方差膨胀因子检测法D、可决系数增量贡献法E、工具变量法四、简答题1、什么是多重共线性?产生多重共线性的原因是什么?答:多重共线性是指解释变量之间存在完全或近似的线性关系。产生多重共线性主要有下述原因:(1)经济变量之间具有共同变化趋势(2)模型中包含滞后变量(3)利用截面数据建立模型(4)样本数据的自身原因,例如抽样仅限于总体中解释变量取值的一个有限范围。2、什么是完全多重共线性?什么是不完全多重共线性?答:完全多重共线:对于解释变量k32XXX1,,,,,如果存在不全为0的数k21,,,,使得n21i0XXXkiki33i221,,,则称解释变量k32XXX1,,,,之间存在着完全的多重共线性。不完全多重共线性:对于解释变量k32XXX1,,,,,如果存在不全为0的数k21,,,,使得n21i0vXXXikiki33i221,,,式中,iv为随机变量,则称解释变量k32XXX1,,,,之间存在着不完全的多重共线性。3、完全多重共线性对OLS估计量的影响有哪些?答:(1)参数的估计值不确定,不能独立分辨各个解释变量对被解释变量的影响。(2)参数估计值的方差无穷大。4、不完全多重共线性对OLS估计量的影响有哪些?答:(1)回归的参数估计值很不稳定,普通最小二乘估计不精确。(2)参数估计值的方差与协方差增大。(3)对参数区间估计时,置信区间趋于变大。(4)严重多重共线性时,假设检验容易作出错误的判断,t检验可能倾向于不显著,甚至可能回归系数的正负号得不到合理的经济解释。5、从哪些症状中可以判断可能存在多重共线性?答:(1)模型总体性检验F值和R2值都很高,但各回归系数估计量的方差很大,t值很低,系数不能通过显著性检验。(2)回归系数值难以置信或符号错误。(3)参数估计值对删除或增加少量观测值,以及删除一个不显著的解释变量非常敏感。6、什么是方差膨胀因子检验法?答:所谓方差膨胀因子是存在多重共线性时回归系数估计量的方差与无多重共线性时回归系数估计量的方差对比而得出的比值系数。若1VIFj时,认为原模型不存在“多重共线性问题”;若1VIFj时,则认为原模型存在“多重共线性问题”;若10VIFj时,则模型的“多重共线性问题”的程度是很严重的,而且是非常有害的。五、计算题1、考虑下表中的数据Y-10-8-6-4-20246810X11234567891011X213579111315171921假设你做Y对X1和X2的多元回归,你能估计模型的参数吗?为什么?答:不能。因为X1和X2存在完全的多重共线性,即X2=2X1-1,或X1=0.5(X2+1)。2、下表给出了以美元计算的每周消费支出(Y),每周收入(X1)和财富(X2)的假想数据。Y1X2X7080810651001009901201273951401425110160163311518018761202002252140220220115524024351502602686(1)作Y对X1和X2的OLS回归。(2)直观地判断这一回归方程中是否存在多重共线性?为什么?(3)分别作Y对X1和X2的回归,这些回归结果表明了什么?(4)作X2对X1的回归。这一回归结果表明了什么?答:(1)21X0350X872033724Y...ˆT(3.875)(2.773)(-1.160)R2=0.9682(2)可能存在多重共线性。因为财富的系数解释是随着财富的增加,消费支出的金额在减少,这与经济理论不相符。而且,财富的系数不显著。因此可能是由于多重共线性引起的。(3)1X509045524Y..ˆT(3.813)(14.243)R2=0.9622X048045226Y..ˆT(3.132)(10.575)R2=0.9332回归结果表明两个解释变量对消费支出的影响都是显著的,并且解释能力较强。(4)12X373103643X..ˆT(-0.046)(25.253)R2=0.988回归结果表明每周的收入与财富是高度线性相关的,二者同时作为解释变量会产生严重的多重共线性。3、某地区供水部门利用最近15年的用水年度数据得出如下估计模型:rain1231price8717pcy0050pop3630house30509326water......t=(-1.7)(0.9)(1.4)(-0.6)(-1.2)(-0.8)938F930R2.,.其中,water-用水总量(百万立方米),house-住户总数(千户),pop-总人口(千人),pcy-人均收入(元),price-价格(元/100立方米),rain-降水量(毫米)。(1)根据经济理论和直觉,请估计回归系数的符号的正负(不包括常量),为什么?观察符号与你的直觉相符吗?(2)在5%的显著性水平下,请进行变量的t检验和方程的F检验。t检验与F检验结果有相矛盾的现象吗?答:(1)在其他变量不变的情况下,一层是的人口越多或房屋数量越多,则对用水的需求越高。所以可期望house和pop的符号为正;收入较高的个人可能用水较多,因此pcy的预期符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期price的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望rain的系数符号为负。从估计的模型看,除了pcy之外,所有符号都与预期相符。(2)t统计量检验单个变量的显著性,F统计值检验变量是否是联合显著的。这里t检验的自由度为15-5-1=9,在5%的显著性水平的临界值为2.262。可见,所有参数估计值的t值的绝对值都小于该值,所以即使在5%的水平下这些变量也是不显著的。这里,F统计量的分子自由度为5,分母自由度为9。5%显著性水平下,F分布的临界值为3.45。可见,计算的F值大于该临界值,表明回归系数是联合显著的。t检验与F检验结果的矛盾性可能是由于多重共线性造成的。house、pop、pcy是高度相关的,这将使它们的t值降低且表现为不显著。Price和rain不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能很好地被度量。可以预期水价与年降雨量在各年中一般没有