1第4章违背基本假设的情况思考与练习参考答案4.1试举例说明产生异方差的原因。答:例4.1:截面资料下研究居民家庭的储蓄行为Yi=0+1Xi+εi其中:Yi表示第i个家庭的储蓄额,Xi表示第i个家庭的可支配收入。由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。例4.2:以某一行业的企业为样本建立企业生产函数模型Yi=Ai1Ki2Li3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。4.2异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。4.3简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差2的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。由OLS求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。加权最小二乘法的方法:4.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。答:运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回归的类似。多元线性回归加权最小二乘法是在平方和中加入一个适当的权数iw,以调整各项在平方和中的作用,加权最小二乘的离差平方和为:niippiiipwxxywQ1211010)(),,,((2)加权最小二乘估计就是寻找参数p,,,10的估计值pˆ,,ˆ,ˆ10使式(2)的离差平方和wQ达极小。所得加权最小二乘经验回归方程记做220111ˆˆˆ()()NNwiiiiiiiiQwyywyx22__1_2__02222()()ˆ()ˆ1111,iiNwiiiwiwi1Ni=11表示=或3ppˆˆˆˆ110(3)多元回归模型加权最小二乘法的方法:首先找到权数iw,理论上最优的权数iw为误差项方差2i的倒数,即21iiw(4)误差项方差大的项接受小的权数,以降低其在式(2)平方和中的作用;误差项方差小的项接受大的权数,以提高其在平方和中的作用。由(2)式求出的加权最小二乘估计pˆ,,ˆ,ˆ10就是参数p,,,10的最小方差线性无偏估计。一个需要解决的问题是误差项的方差2i是未知的,因此无法真正按照式(4)选取权数。在实际问题中误差项方差2i通常与自变量的水平有关(如误差项方差2i随着自变量的增大而增大),可以利用这种关系确定权数。例如2i与第j个自变量取值的平方成比例时,即2i=k2ijx时,这时取权数为21ijixw(5)更一般的情况是误差项方差2i与某个自变量jx(与|ei|的等级相关系数最大的自变量)取值的幂函数mijx成比例,即2i=kmijx,其中m是待定的未知参数。此时权数为mijixw1(6)这时确定权数iw的问题转化为确定幂参数m的问题,可以借助SPSS软件解决。4.5(4.5)式一元加权最小二乘回归系数估计公式。证明:由得:220111ˆˆˆ()()NNwiiiiiiiiQwyywyx0100ˆˆQQ4ˆˆ)())((ˆ4.6验证(4.8)式多元加权最小二乘回归系数估计公式。证明:对于多元线性回归模型,y=Xβ+ε(1)2()0,cov(,)EεεεW,即存在异方差。设1,00nwwWDDD,用1D左乘(1)式两边,得到一个新的的模型:111Dy=DXβ+Dε,即y=Xβ+ε。因为22()()()EEE1-11-11-1εεDεεDDεεDDWDI,故新的模型具有同方差性,故可以用广义最小二乘法估计该模型,得111ˆ()()()1111wβXXXyXDDXXDDyXWXXWy原式得证。4.7有同学认为当数据存在异方差时,加权最小二乘回归方程与普通最小二乘回归方程之间必然有很大的差异,异方差越严重,两者之间的差异就越大。你是否同意这位同学的观点?说明原因。答:不同意。当回归模型存在异方差时,加权最小二乘估计(WLS)只是普通最小二乘估计(OLS)的改进,这种改进可能是细微的,不能理解为WLS一定会得到与OLS截然不同的方程来,或者大幅度的改进。实际上可以构造这样的数据,回归模型存在很强的异方差,但WLS与OLS的结果一样。加权最小二乘法不会消除异方差,只是消除异方差的不良影响,从而对模型进行一点改进。4.8对例4.3的数据,用公式iwiiwewe'计算出加权变换残差'iwe,绘制5加权变换残差图,根据绘制出的图形说明加权最小二乘估计的效果。解:用公式iwiiwewe'计算出加权变换残差'iwe,分别绘制加权最小二乘估计后的残差图和加权变换残差图(见下图)。6根据绘制出的两个图形可以发现加权最小二乘估计没有消除异方差,只是对原OLS的残差有所改善,而经过加权变换后的残差不存在异方差。4.9参见参考文献[2],表4.12(P138)是用电高峰每小时用电量y与每月总用电量x的数据。(1)用普通最小二乘法建立y与x的回归方程,并画出残差散点图。解:SPSS输出结果如下:Coefficientsa-.831.442-1.882.065.004.000.83911.030.000(Constant)xModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:ya.由上表可得回归方程为:ˆ0.8310.004yx残差图为:40003000200010000x4.000002.000000.00000-2.00000-4.00000普通残差(2)诊断该问题是否存在异方差;解:a由残差散点图可以明显看出存在异方差,误差的方差随着x的增加而增大。7b用SPSS做等级相关系数的检验,结果如下表所示:Correlations1.000.318*..0215353.318*1.000.021.5353CorrelationCoefficientSig.(2-tailed)NCorrelationCoefficientSig.(2-tailed)NxabseiSpearman'srhoxabseiCorrelationissignificantatthe0.05level(2-tailed).*.得到等级相关系数0.318sr,P值=0.021,认为残差绝对值ie与自变量ix显著相关,存在异方差。(3)如果存在异方差,用幂指数型的权函数建立加权最小二乘回归方程;解:SPSS输出结果如图:8由上述表可得,在1.5m时对数似然函数达到最大,则幂指数的最优取值为1.5m。加权后的回归方程为:ˆ0.6830.004wyx。计算加权后的残差,并对残差绝对值和自变量做等级相关系数分析,结果如下表所示:0.321sr,P值为0.0190.05,即加权最小二乘法没有消除异方差,只是消除异方差的不良影响,从而对模型进行一点改进。(4)用方差稳定变换yy'消除异方差。解:对应变量做方差稳定变换(yy')后,用最小二乘法做回归,SPSS结果如下表:Coefficientsa,b-.683.298-2.296.026.004.000.8129.930.000(Constant)xModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:ya.WeightedLeastSquaresRegression-WeightedbyWeightforyfromWLS,MOD_2x**-1.500b.Correlations1.000.321*..0195353.321*1.000.019.5353CorrelationCoefficientSig.(2-tailed)NCorrelationCoefficientSig.(2-tailed)NxabseiwSpearman'srhoxabseiwCorrelationissignificantatthe0.05level(2-tailed).*.Coefficientsa.582.1304.481.000.001.000.8059.699.000(Constant)xModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:sqrtya.9则回归方程为:ˆ0.5822+0.0009529yx。保存预测值ˆiy,计算出残差的绝对值后,计算等级相关系数,见下表:Correlations1.000.160..2545353.1601.000.254.5353CorrelationCoefficientSig.(2-tailed)NCorrelationCoefficientSig.(2-tailed)NxeeiiSpearman'srhoxeeii其中0.160sr,P值=0.2540.05,说明异方差已经消除。4.10试举一可能产生随机误差项序列相关的经济例子。答:例如,居民总消费函数模型:Ct=0+1Yt+εtt=1,2,…,n由于居民收入对消费影响有滞后性,而且今年消费水平受上年消费水平影响,则可能出现序列相关性。另外由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。4.11序列相关性带来的严重后果是什么?答:直接用普通最小二乘法估计随机误差项存在序列相关性的线性回归模型未知参数时,会产生下列一些问题:1.参数估计量仍然是无偏的,但不具有有效性,因为有自相关性时参数估计值的方差大于无自相关性时的方差。2.均方误差MSE可能严重低估误差项的方差3.变量的显著性检验失去意义:在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,当参数方差严重低估时,容易导致t值和F值偏大,即可能导致得出回归参数统计检验和回归方程检验显著,但实际并不显著的严重错误结论。4.当存在序列相关时,仍然是的无偏估计,但在任一特定的样本中,可能严重歪曲的真实情况,即最小二乘法对抽样波动变得非常敏感105.模型的预测和结构分析失效。4.12总结DW检验的优缺点。答:优点:1.应用广泛,一般的计算机软件都可以计算出DW值;2.适用于小样本;3.可用于检验随机扰动项具有一阶自回归形式的序列