计量经济学—理论·方法·EViews应用郭存芝杜延军李春吉编著第六章异方差性◆学习目的通过本章的学习,你可以知道什么是异方差性,异方差性是如何形成的,异方差性导致什么样的后果,怎样检验和处理具有异方差性的模型。◆基本要求1)掌握异方差性的概念、异方差性的后果和几种常见的检验方法。2)了解加权最小二乘法原理,并能运用加权最小二乘法估计线性回归模型。3)了解异方差稳健推断原理。◆异方差性及其产生原因◆异方差性的影响◆异方差性的检验◆异方差性的的修正第六章异方差性第一节异方差性及其产生原因—、异方差性的含义对于多元线性回归模型011221,2,,iiikkiiYXXXin(6-1)同方差性假设为2(),1,2,...,iVarin如果出现2(),1,2,...,iiVarin即对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性(Heteroskedasticity)。二、异方差的类型2()iifX常数i同方差性假定是指回归模型中不可观察的随机误差项条件的方差是一个常数,因此每个的条件方差不随X的变化而变化,即有以解释变量X为i2()iifX不再是常数,2i在异方差的情况下,总体中的随机误差项的方差通常它随解释变量值的变化而变化,即i2()iifX根据2i与解释变量X的关系,异方差一般可归结为三种类型(如图):(1)单调递增型:2i随X的增大而增大;(2)单调递减型:(3)复杂型:随X的增大而减小;2i随X的变化呈复杂形式。2i三、异方差产生的原因例6-1居民储蓄模型在截面资料下研究居民家庭的储蓄行为,假定储蓄行为模型为01iiiSYiSiY其中,为第i个家庭的储蓄额,为第i个家庭的可支配收入。析:iiiY在该模型中,假定的方差为常数往往不符合实际情况。对于高收入的方差往往随的这属于递增型异方差。家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一特定的目的而储蓄),差异较小。因此增加而增加,三、异方差产生的原因例6-2干中学模型人们在学习的过程中,其行为误差随时间而减少。在这种情况下,会减小。i2i的方差可以预料例如,考虑一次打字测验,在给定的一段时间里,打字出错个数与用于打字练习的小时数有关系。随着打字练习小时数增加,不仅平均打错字个数下降,而且打错字个数的方差也下降,这属于递减型的异方差。资料收集技术的改进可能会使2i减小。例如,相较于没有先进设备的银行,那些拥有先进数据处理设备的银行,在他们对帐户的每月或每季财务报告中,会出现更少的差错。三、异方差产生的原因例6-3股票价格和消费者价格智利澳大利亚奥地利加拿大比利时丹麦芬兰印度爱尔兰以色列意大利日本墨西哥荷兰新西兰瑞典英国美国法国德国0510152025300510152025序号价格变化率股票价格变化率消费者价格(%)考虑如下20个国家在第二次世界大战后直至1969年间的股票价格(Y)和消费者价格(X)的百分比变化的散点图。图中,对智利的观测值Y和X远大于对其他国家的观测值,故可视为一个异常值,在这种情况下,同方差性的假定就难以维持了。三、异方差产生的原因例6-4假性异方差两个变量有真实关系:201iiiYX其中i满足线性回归模型的假定,即满足零均值和不变方差的假定。01iiiYX如果我们误以为Y和X之间的关系为:并认为()0iE,那么2220011()()[()()]iiiiiVarEEXX记20011()()()iiifXXX,则2222()()(())()iiiiiVarEEfXfX()iVariX因此是的函数,即我们建立的模型具有异方差。第二节异方差性的影响1.参数估计量非有效计量经济学模型一旦出现异方差,如果仍然用普通最小二乘法估计模型参数,会产生一系列不良后果。2.OLS估计的随机干扰项的方差不再是无偏的3.基于OLS估计的各种统计检验非有效4.模型的预测失效1.参数估计量非有效根据前面有关OLS参数估计量的无偏性和有效性的证明过程,可以看到,当计量经济学模型出现异方差时,其普通最小二乘法参数估计量仍然具有无偏性和一致性,因为同方差假设在证明无偏性和一致性时并没有起作用。但在异方差情况下OLS估计量不再具有有效性,因为在有效性证明中利用了2()EI而且在大样本情况下,OLS估计量也不具有渐进有效性。为详细说明异方差使OLS参数估计量的无效性,我们考虑一元回归模型:(6-2)01iiiYX该模型参数的OLS估计量可以写为对于该模型,我们假定除同方差假设外,其他的高斯马尔科夫假设都成立。如果模型随机误差项包含异方差,那么有2(|)iiiVarX这一异方差取决于iX的值。12ˆiiixyx2211221ˆ()()niiiniixVarx(6-3)212ˆ()iVarx(6-4)显然(6-3)式与(6-4)式不同,只有在22i时两者才是相同的。在上述给定的异方差情况下,1ˆ的方差为容易证明而同方差假设下,1ˆ的OLS估计方差为2.OLS估计的随机干扰项的方差不再是无偏的异方差时OLS估计的随机误差项的方差不再是真实随机干扰项方差的无偏估计,正是因为这一点才使得OLS估计的参数不再是有效的,这可从(6-3)式中直接看出来。2211221ˆ()()niiiniixVarx(6-3)3.基于OLS估计的各种统计检验非有效1)t统计量不再服从t分布;3)F统计量也不再服从F分布;4)LM统计量也不再有渐近2分布。总而言之,在异方差情况下,我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的,OLS估计量不再是最佳线性无偏估计量(即不具有BLUE性质)。4.模型的预测失效所以,如果仍然使用OLS估计量,将导致预测区间偏大或偏小,预测功能失效。当模型出现异方差时,一方面,由于上述后果,使得OLS估计不再具有良好的统计性质;另一方面,由于在被解释变量预测值的置信区间中也包含有参数估计量的标准差,第三节异方差性检验用什么来表示随机干扰项的方差???问题:一般的处理方法是首先采用普通最小二乘法估计模型,以求得随机干扰项的估计量,用ˆie表示。这样我们有22ˆ()()ˆˆ()iiiiiOLSVarEeeYY即用2ˆie来表示随机干扰项的方差。对于解释变量引起的异方差,我们可以用如下几种方法来检验异方差。一、图示检验法二、帕克(Park)检验与戈里瑟(Gleiser)检验三、G-Q(Goldfeld-Quandt)检验四、F检验五、拉格朗日乘子检验六、怀特检验一、图示检验法~ei2~ei2XX同方差递增异方差~ei2~ei2XX递减异方差复杂型异方差图6-2不同异方差类型(图示检验法只能进行大概的判断)二、帕克(Park)检验与戈里瑟(Gleiser)检验基本思想:2ˆieˆ||iejX以或为被解释变量,以原模型的某一个解释变量为解释变量,建立如下回归方程:2ˆ()ijiiefX或ˆ()ijiiefX选择关于变量Xj的不同函数形式,对方程进行估计并进行显著性检验。如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。三、G-Q(Goldfeld-Quandt)检验基础范围基本思想——F检验——样本容量较大、异方差递增或递减的情况——按某一个解释变量对样本排序,再将排序后的样本一分为二,对子样本①和子样本②分别作OLS回归,然后利用两个子样本的残差平方和之比构造F统计量进行异方差检验。步骤(1)将n组样本观察值按某一被认为可能引起异方差的解释变量的观察值大小排序。2212ˆˆ,iiee()12nck(3)对每个子样分别进行OLS回归,并计算各自的残差平方和。分别用表示较小的与较大的残差平方和(自由度均为)。(2)将序列中间的c个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为()2nc,这样做主要是为了突出小方差样本和大方差样本之间的差异。步骤(4)在同方差性假定下,构造如下满足F分布的统计量:2221ˆ/(1)2~(1,1)22ˆ/(1)2iincekncncFFkkncek12(,)Fvv12(,)FFvv(5)给定显著性水平,确定临界值。若则拒绝同方差性假设,表明原模型随机干扰项存在异方差性。当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。,注意:1)G-Q检验结果有时要依赖于省略的样本个数c的大小。根据蒙特卡洛试验结果和实际经验,Judge等人建议若n为30左右,c取4;若n为60左右,c取10。2)G-Q检验需要按照某一被认为有可能引起异方差的解释变量观察值的大小排序,因此,可能需要对各个解释变量进行轮流试验,而且它只适合检验单调递增或递减型异方差。四、F检验考虑我们常用的多元线性回归模型0112212iiikkiiYXXXin,,,假定该模型满足高斯马尔科夫假设,特别地我们假设12(|,,,)0kEXXXOLS估计依然是无偏、一致估计同方查差假设意味着等价于只需检验是否与一个或多个解释变量相关,可估计如下方程然后检验该方程的总体显著性,统计量为2012:(|,,,)kHVARXXX220:()HE2201122ˆiiikkiieXXXv222ˆ2ˆ/(1)/(1)eeRkFRnk五、拉格朗日乘子检验222ˆ~keLMnR(6-11)用于检验异方差的LM统计量可以通过下式得到步骤(1)用OLS估计模型,得到OLS回归残差平方2ˆie序列。(2)对(6-9)进行回归,记下回归得到的拟合优度。22ˆeR(4)如果BP检验的P值很小,那就应该采取一些纠正的措施,一个可能的措施就是用异方差稳健标准差和前面讨论过的检验统计量。(3)计算LM统计量相应的P值(查2分布表得到的概率),如果P值足够小,即小于给定的显著性水平的话,那么我们就拒绝同方差的零假设。六、怀特检验2ˆie与多个解释变量可能存在非线性关系范围:下面以两个解释变量的回归模型为例来说明怀特检验的基本思想与步骤。例:对于二元回归模型0112212iiiiYXXin,,,(6-12)先做OLS回归,再做如下辅助回归222011223142512ˆiiiiiiiieXXXXXXv相应的LM统计量为22ˆeLMnR可在大样本情况下进行检验,也可用F统计量进行检验当辅助回归中的解释变量较多时,可去掉交叉项或用被解释变量的预测估计值做解释变量2例6-5一个异方差检验的说明性例子给定如下农村居民人均消费函数回归模型:(6-14)01122lnlnlniiiiYbbXbXm相关数据如表6-1。1X2XY表示农村家庭人均消费支出,表示从事农业经营的收入,表示其他收入。地区人均消费支出Y农业经营收入X1其他收入X2地区人均消费支出Y农业经营收入X1其他收入X2北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南3552.12050.91429.81221.61554.61786.31661.71604.54753.22374.73479.21412.42503.1172019051375.6579.11314.6928.8609.81492.81254.31634.61684.1652.51177.6985.81013.110531027.812931083.84446.42633.11674.81346.2480.51303.6547.6596.25218.42607.23596.61006.92327.71203.81511.61014.1湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆2703.