管理研究方法(7)--计量经济学方法(二)主要参考书目教材:[美]古扎拉蒂(DamodarN.Gujarati)著:《计量经济学》(BasicEconometrics),第四版,中译本,林少宫译,中国人民大学出版社,2006。新版本:古扎拉蒂(DamodarN.Gujarati)著:《计量经济学》(BasicEconometrics),第五版,中译本,费剑平译,中国人民大学出版社,2012。其他参考书目:1.易丹辉主编,《数据分析与EViews应用》,中国人民大学出版社,2008年10月。2.马庆国:《管理统计--数据获取、统计原理、SPSS工具与应用研究》,科学出版社,2006。主要内容计量经济学专题(1)--多重共线性与异方差性问题计量经济学专题(2)--自相关、自回归及分布滞后计量经济学专题(3)--虚拟变量回归问题计量经济学专题(4)--联系方程组方法计量经济学专题(5)--面板数据模型及其估计因子分析、主成份分析、聚类分析一、多重共线性与异方差性问题放宽古典模型的假设--多重共线性(multi-collinearity)问题--异方差性(heteroscedasticity)问题1.多重共线性问题多重共线性的例子例1:消费—收入的例子例2:农民消费与农业产值多重共线性的程度--pp313多重共线性的原因:--pp313--数据采集方法和范围--模型或总体受到约束--模型设定--过度决定的模型(样本信息过于集中)--cont’多重共线性的实质--样本(间)的回归现象λ1x1+λ2x2+…+λkxk=0其中:λ1,λ2,…,λk为一组不同时为零的数多重共线性的后果--理论后果和实际后果:p316-321☆标准误差将随着变量间的共线程度的增大而增大☆由于标准误差较大,会使有关的总体参数的置信区间更大。☆如果存在高度共线性,则样本数据可能与各种不同的假设相容,因此接受错误假设(犯第二类错误)的概率增大了。--cont’☆在不完全的多重共线性下,回归系数的估计是可能的,但其估计量及其标准差非常敏感。例子pp321,323☆如果是高度多重共线的,可能得出较高的R2值,但几乎没有一个估计的回归系数在统计上是显著的。多重共线性的检测(发现):pp325-328☆经验判断:a.估计的回归系数无法解释;b.R2值很高或者pα,但几乎所有偏回归系数的t-检验在统计上是不显著的;--cont’c.偏回归系数的估计值大小及符号与常识不符;d.专业知识上可以肯定对因变量的影响因素,但在多元回归中却不能纳入方程;e.去掉一两个变量或样本观测值,方程的回归系数值发生剧烈变动,非常不稳定。☆可以考察解释变量间的判定系数R2,如果只有两个自变量,考察他们之间的简单相关系数即可判断。如果r较大,则一般是共线的。☆如果R2值较高而偏相关系数较低,则可能存在多重共线性;其中的一个或多个变量可能是多余的。--cont’☆可将模型中的每一个变量xi对其它的变量进行回归,求出相应的可决系数Ri2。如果某个Ri2较高,则表明该变量与其它变量是高度相关的。只要不导致严重的设定偏倚,可将其从模型中剔除。☆逐步回归法:将Y分别与Xi进行回归:--有用的变量:R2大,t-检验显著--多余的变量:R2变化不大,其他系数无影响--可能重要的变量:R2变化大,其他系数及符号均发生变化☆检测共线性的统计指标:pp327-328--本征值(eigenvalues)与病态指数(conditionindex)经验规则:k在100—1000之间,就算有中等强度的多重共线性;kCI最小本征值最大本征值--cont’如果k大于1000,就算有严重的多重共线性.或者:CI在10-30之间,就算有中等强度的多重共线性;如果CI大于30,就算有严重的多重共线性!--容许度(tolerrance)与方差膨胀因子(varianceinflatingfactor)经验规则:VIFj值越大,变量xj共线性可能性越大。如果一个变量的VIFj值超过10,则该变量是高度共线的。用容许度来检测多重共线性:如果Xj与其他回归元无关,则TOLj=1;如果Xj与其他回归元完全相关,则TOLj=0。jjjjjVIFx)R(x2222211var)(jjjVIF)R(TOL112如何避免多重共线性问题–补救措施★利用额外的或先验的信息★合并截面数据和时间序列数据(并用)★剔除(某个高度共线的)变量和设定偏倚★变换数据★增加样本观测值或补充新的数据★主成分分析★差分模型或增长率模型★岭回归方法--例题(略)2.异方差性(heteroscedasticity)问题的提出--不满足统计假设中的随机扰动项同方差同方差(homo-scedasticity):E(ui2)=σ2异方差(heter-scedasticity):E(ui2)=σi2--实际经济问题的同方差假定不合理(尤其时间序列数据,要格外当心!)异方差的来源--干中学,边错边改(error-learning)--行为方式或偏好发生改变--数据采集技术的改进,使误差可能减小--异常值(离群值,outliers)的出现--模型设定错误广义最小二乘法(GLS)基本思想先将原始变量转换成满足经典模型假设的转换变量,然后再对它们使用OLS程序。即GLS是对满足标准最小二乘假定的转换变量的OLS。如此得到的估计量称为GLS。GLS估计量是BLUEpp354-355OLS与GLS的区别pp355--cont’异方差性的后果--在其他条件满足时,有异方差时,用OLS估计式得到的系数估计仍是无偏的、一致的,但不再是有效的。(方差不是最小)p352-353,--由于此时Var(βhat)不具有最小方差,导致过低估计βhat的t-值。--β的置信区间不必要地增大,从而使显著性检验的功效变小。P356--如果忽视异方差性而一味使用惯用的检验程序,则无论得出何结论或做出何判断,都可能产生严重误导。p357--cont’异方差性的检验(或发现)--pp358–369--图解法--{ei}与{Yi}或{Xi}的散点图(Scatplot)--Park检验ln(σi2)=ln(σ2)+βln(Xi)+νi=α+βln(Xi)+νi估计时,用{ei2}作为σi2的替代变量,看β是否显著?--Glejser检验--{ei}与{Xi}之间的各种可能关系?--Spearman等级相关检验:di为两变量的等级差步骤:pp362例题:pp36322212)1(61ssisrnrtnndr--cont’--戈德菲尔德-匡特检验步骤:pp364例题:pp365-366--布劳殊-培干-戈弗德检验步骤:pp367例题:pp368--怀特(White)的一般异方差性检验步骤:pp369例题:pp369-370--cont’异方差性的补救在理论上,克服异方差性还没有很好的办法。--出现异方差时的一般对策是从经济理论上考虑更合理的解释变量和函数形式。--当σi2为已知时:加权最小二乘法(WLS)pp371--进行数据变换尤其是对数变换通常是较有效的办法关于异方差性模式的可能假定–数据变换的形式pp373-376--双变量总体方差是否相同的F-检验一个总结性例题pp377二、计量经济学专题(2)自相关(Autocorrelation)自回归(Auto-Regression)分布滞后(Distributed-lag)模型1.自相关(Autocorrelation)问题问题的提出:自相关是指按时间顺序或空间顺序排列的观察值之间的相关现象,又称序列相关。Cov(Ui,Uj)=E(Ui,Uj)≠0自相关的来源:pp395-398在经济时间序列中,序列相关现象之所以经常存在,是因为模型常把一些不重要的或无法观测到的因素都包括在随机误差中,而这些因素往往具有时间趋势,从而在随机误差项Ut中体现了在时间先后上的某种相关性。--惯性:时间序列数据的回归中,连续观测值可能是相互依存的。--省略了不该省的解释变量--设定偏误(错误的数学表达式或函数形式)--数据的编造(对原始数据的处理或变换不当)--cont’--蛛网现象:Qt=f(Pt-1)+Ut--滞后效应:Ct=β1+β2Yt+β3Ct-I+Ut自相关出现时的OLS估计:☆一阶自回归模型:AR(1)Ut=ρUt-1+εt,εt~N(0,σ2)☆一阶移动平均模型:MA(1)Ut=νt+λνt-1☆ARMA(1,1)Ut=ρUt-1+νt+λνt-1--cont’☆在自相关情况下,用OLS估计式得到的系数估计仍是无偏的、一致的,但不再是有效的。(方差不是最小的)自相关出现时的后果:☆OLS估计式是无偏的,但无偏性是在重复抽样中体现出来的,在任一特定的样本中,OLS估计式对于样本波动非常敏感。☆估计的方差可能增大:☆剩余的方差E(∑ei2)可能低估扰动项ut的方差σ2;OLS估计式的方差和标准差也可能低于真实的方差和标准差。☆使检验失效,如t–检验(t-值放大),拒绝H0例子:pp403-407)()(1*1olsVarVar--cont’自相关的检验a.图示法:用ei代替ui,若ui之间存在自相关(序列相关),比通过{ei}反映出来。因此,可用{ei}来考察ui的序列相关性质。--看et与et-1之间的散点图:--看et与t之间的散点图:--看et的数值的变化(如季节变化):b.Durbin–Watson检验(DW—值)适用于检验是否存在一阶线性自回归:Ut=ρUt-1+vt,vt~N(0,σ2),称为白噪声序列一阶马尔可夫过程AR(1)--cont’4101204011)1(2)(121112121DWDWDWDWeeeeeeDWnttntttnttnttt,由于这里,--cont’结论:du≤DW≤4-du→无序列相关(无自相关)0DW≤dL→正相关4–dL≤DW≤4→负相关DL≤DW≤Du→不确定4-du≤DW≤4-dL→不确定图示:p413查表du和dL,与估计或计算的DW-值比较!c.游程检验:pp410-411•补救办法(存在序列相关时的估计方法)如果是遗漏解释变量而造成的,加入之。确定正确的模型形式,或变量变换如果是真实的序列相关:Ut=ρUt-1+vta.ρ已知时,做广义差分变换;b.ρ未知时,--由于:)进行估计。看作已知(然后再把在小样本时:2222)21(21),1(2knkdnDWDW--cont’--科克伦-奥克特(Cochrane-Orcutt)迭代法step1:step2:广义差分变换step3:广义差分变换→参数估计直到ρ的估计量没有显著差异为止!或无序列相关!'**1211),(),(OLSttnttnttttOLSttYXeeeeYX--Durbin两段法tttttttttOLStttttttttttVXYVXXYYYVYXXYVUUUXY**1*0*1101111110110)()1()()1(带入广义差分变换中将前的系数做广义差分变换:--自回归条件异方差模型(ARCH)模型及含义检验例子处理--GLS,--GARCH2.自回归与分布滞后模型问题的提出--分布滞后模型:不仅包含解释变量的本期值,还包括解释变量的滞后值。如:Yt=α+β0Xt+β1Xt-1+β2Xt-2+Ut--自回归模型:不仅包含解释变量的本期值,还包括被解释变量的滞后值。如:Yt=β0+β1Xt+β2Yt-1+Ut经济研究中分布滞后的作用或意义有限滞后分布模型:无限滞后分布模型:tjjtjttnjjtjtUXYUXY00--cont’--短期乘数:β0--延迟乘数(过渡乘数):β1,β2,…βk--长