第四章经典单方程计量经济学模型:放宽基本假定的模型§4.1异方差性§4.2序列相关性§4.3多重共线性§4.4随机解释变量问题•基本假定违背主要包括:(1)随机误差项序列存在异方差性;(2)随机误差项序列存在序列相关性;(3)解释变量之间存在多重共线性;(4)解释变量是随机变量且与随机误差项相关的随机解释变量问题;(5)模型设定有偏误;(6)解释变量的方差不随样本容量的增而收敛。•计量经济检验:对模型基本假定的检验•本章主要学习:前4类§4.1异方差性一、异方差的概念二、异方差的类型三、实际经济问题中的异方差性四、异方差性的后果五、异方差性的检验六、异方差的修正七、案例对于模型ikikiiiiXXXY2210如果出现Varii()2即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。一、异方差的概念二、异方差的类型同方差:i2=常数f(Xi)异方差:i2=f(Xi)异方差一般可归结为三种类型:(1)单调递增型:i2随X的增大而增大(2)单调递减型:i2随X的增大而减小(3)复杂型:i2与X的变化呈复杂形式三、实际经济问题中的异方差性例4.1.1:截面资料下研究居民家庭的储蓄行为:Yi=0+1Xi+iYi:第i个家庭的储蓄额Xi:第i个家庭的可支配收入。高收入家庭:储蓄的差异较大低收入家庭:储蓄则更有规律性,差异较小i的方差呈现单调递增型变化例4.1.2,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:Ci=0+1Yi+I将居民按照收入等距离分成n组,取组平均数为样本观测值。•一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。•所以样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起异方差性。例4.1.3,以某一行业的企业为样本建立企业生产函数模型:Yi=Ai1Ki2Li3ei被解释变量:产出量Y解释变量:资本K、劳动L、技术A,那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。四、异方差性的后果计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1.参数估计量非有效OLS估计量仍然具有无偏性,但不具有有效性因为在有效性证明中利用了E(’)=2I而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。2.变量的显著性检验失去意义变量的显著性检验中,构造了t统计量其他检验也是如此。3.模型的预测失效一方面,由于上述后果,使得模型不具有良好的统计性质;所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。五、异方差性的检验•检验思路:由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。•问题在于用什么来表示随机误差项的方差一般的处理方法:首先采用OLS法估计模型,以求得随机误差项的估计量(注意,该估计量是不严格的),我们称之为“近似估计量”,用~ei表示。于是有VarEeiii()()~22~()eyyiiils0几种异方差的检验方法:1.图示法(1)用X-Y的散点图进行判断看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)(2)X-~ei2的散点图进行判断看是否形成一斜率为零的直线~ei2~ei2XX同方差递增异方差~ei2~ei2XX递减异方差复杂型异方差2.帕克(Park)检验与戈里瑟(Gleiser)检验基本思想:偿试建立方程:ijiiXfe)(~2或ijiiXfe)(|~|选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。如:帕克检验常用的函数形式:ieXXfjiji2)(或ijiiXelnln)~ln(22若在统计上是显著的,表明存在异方差性。3.戈德菲尔德-匡特(Goldfeld-Quandt)检验G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。G-Q检验的思想:先将样本一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。G-Q检验的步骤:①将n对样本观察值(Xi,Yi)按观察值Xi的大小排队;②将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2;③对每个子样分别进行OLS回归,并计算各自的残差平方和;④在同方差性假定下,构造如下满足F分布的统计量)12,12(~)12(~)12(~2122kcnkcnFkcnekcneFii⑤给定显著性水平,确定临界值F(v1,v2),若FF(v1,v2),则拒绝同方差性假设,表明存在异方差。当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。4.怀特(White)检验怀特检验不需要排序,且适合任何形式的异方差。怀特检验的基本思想与步骤(以二元为例):iiiiXXY22110然后做如下辅助回归iiiiiiiiXXXXXXe215224213221102~可以证明,在同方差假设下:(*)R2为(*)的可决系数,h为(*)式解释变量的个数,表示渐近服从某分布。注意:辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。六、异方差的修正模型检验出存在异方差性,可用加权最小二乘法(WeightedLeastSquares,WLS)进行估计。•加权最小二乘法的基本思想:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。21102)]ˆˆˆ([kkiiiiXXYWeW•例如,如果对一多元模型,经检验知:222)()()(jiiiiXfEVar在采用OLS方法时:对较小的残差平方ei2赋予较大的权数;对较大的残差平方ei2赋予较小的权数。新模型中,存在222)()(1))(1())(1(ijiijiijiEXfXfEXfVar即满足同方差性,可用OLS法估计。ijiijijiijiXXfXXfXfYXf22110)(1)(1)(1)(1ijikijikXfXXf)(1)(1•一般情况下:对于模型Y=X+存在:Wμμμμ2)()(0)(ECovEW即存在异方差性。W是一对称正定矩阵,存在一可逆矩阵D使得W=DD’用D-1左乘Y=X+两边,得到一个新的模型:μDXβDYD111***μβXY该模型具有同方差性。因为1211211111)()()(DDDDDΩDDμμDDμμDμμ**EEEI2**1***)(ˆYXXXβYWXXWXYDDXXDDX11111111)()(这就是原模型Y=X+的加权最小二乘估计量,是无偏、有效的估计量。这里权矩阵为D-1,它来自于原模型残差项的方差-协方差矩阵2W。•如何得到2W?从前面的推导过程看,它来自于原模型残差项的方差—协方差矩阵。因此仍对原模型进行OLS估计,得到随机误差项的近似估计量ěi,以此构成权矩阵的估计量,即2212~~ˆneeW这时可直接以|}~|/1,|,~|/1|,~|/1{211neeediagD作为权矩阵。•注意:在实际操作中人们通常采用如下的经验方法:不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。七、案例——中国农村居民人均消费函数例4.1.4中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括:(1)从事农业经营的收入;(2)包括从事其他产业的经营性收入(3)工资性收入;(4)财产收入;(4)转移支付收入。考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响:22110lnlnlnXXY表4.1.1中国2001年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)地区人均消费支出Y从事农业经营的收入1X其他收入2X地区人均消费支出Y从事农业经营的收入1X其他收入2X北京3552.1579.14446.4湖北2703.361242.92526.9天津2050.91314.62633.1湖南1550.621068.8875.6河北1429.8928.81674.8广东1357.431386.7839.8山西1221.6609.81346.2广西1475.16883.21088.0内蒙古1554.61492.8480.5海南1497.52919.31067.7辽宁1786.31254.31303.6重庆1098.39764.0647.8吉林1661.71634.6547.6四川1336.25889.4644.3黑龙江1604.51684.1596.2贵州1123.71589.6814.4上海4753.2652.55218.4云南1331.03614.8876.0江苏2374.71177.62607.2西藏1127.37621.6887.0浙江3479.2985.83596.6陕西1330.45803.8753.5安徽1412.41013.11006.9甘肃1388.79859.6963.4福建2503.11053.02327.7青海1350.231300.1410.3江西1720.01027.81203.8宁夏2703.361242.92526.9山东1905.01293.01511.6新疆1550.621068.8875.6河南1375.61083.81014.1普通最小二乘法的估计结果:21ln5084.0ln3166.0655.1ˆlnXXY(1.87)(3.02)(10.04)2R=0.78312R=0.7676DW=1.89F=50.53RSS=0.8232异方差检验进一步的统计检验(1)G-Q检验将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:子样本1:21ln119.0ln343.0061.4ˆlnXXY(3.18)(4.13)(0.94)R2=0.7068,RSS1=0.0648子样本2:21ln776.0ln138.0791.0ˆlnXXY(0.43)(0.73)(6.53)R2=0.8339,RSS2=0.2729计算F统计量:F=RSS2/RSS1=0.2792/0.0648=4.31查表给定=5%,查得临界值F0.05(9,9)=2.97判断FF0.05(9,9)否定两组子样方差相同的假设,从而该总体随机项存在递增