计量经济学复习范围一、回归模型的比较1.根据模型估计结果观察分析(1)回归系数的符号和值的大小是否符合经济理论要求(2)改变模型形式之后是否使判定系数的值明显提高(3)各个解释变量t检验的显著性2.根据残差分布观察分析在方程窗口点击View\Actual,Fitted,Residual\Tabe(或Graph)(1)残差分布表中,各期残差是否大都落在ˆ的虚线框内。(2)残差分布是否具有某种规律性,即是否存在着系统误差。(3)近期残差的分布情况二、判断新的解释变量引入模型是否合适(遗漏变量检验)1、基本原理如果模型逐次增加一个变量,由于增加一个新的变量,ESS相对于RSS的增加,称为这个变量的“增量贡献”或“边际贡献”。不引入:0H(即引入的变量不显著))'','(~)''/(/'kkFknRSSkESSESSFnewoldnew或)'','(~/)1(/)(''2'22kkFknRkRRFNEWOLDNEW其中,'k为新引进解释变量的个数,''k为引进解释变量后的模型中参数个数。判别增量贡献的准则:如果增加一个变量使2R变大,即使RSS不显著地减少,这个变量从边际贡献来看,是值得增加的。若FF或者对应的P值充分小,拒绝则认为引入新的解释变量合适;否则,接受则认为引入新的解释变量不合适。三、伪回归的消除如果解释变量和被解释变量均虽随时间而呈同趋势变动,如果不包含时间趋势变量而仅仅是将Y对X回归,则结果可能仅仅反映这两个变量的同趋势特征而没有反映它们之间的真实关系,这种回归也称为伪回归。模型的结构稳定性检CHOW检验法1、基本原理模型结构稳定性,是指模型在样本期的不同时期(子样本),其参数不发生改变。若模型参数样随样本期(子样本)的不同而发生改变,则称模型不具有结构稳定性。另外,还可以引入虚拟变量四、模型的拟合优度检验“拟合优度”,即所估计的模型对样本数据的近似程度,常用判定系数反映。ikikiiiXbXbXbbY22110ni,,2,11、总误差平方和的分解2)(yyi22)ˆ(iieyy总误差(TSS)=回归误差(ESS)+剩余误差(RSS)自由度)1()1(knkn2.判定系数2R22222)(1)()ˆ(yyeyyyyRiiii221102ˆˆˆ1ynyyxbyxbybyiikikiiii0≤2R≤1,R2的值越接近于1,则表明模型对样本数据的拟合优度越高。经济意义:在被解释变量的变动中,由模型中解释变量变动所引起的比例,即y变动的%1002R是由模型中解释变量变动所引起。3.判定系数与相关系数的区别和联系区别:(1)判定系数反映变量间不对称的因果关系(2)相关系数反映变量间对称的线性相关关系联系:TSSRSSTSSESSR1一元线性判定系数相关系数222yyxxyyxxRr11r多元线性4.比较解释变量个数不同模型优劣时,利用如下三个指标⑴调整的判定系数2R)1(111)1()1(122RknnnTSSknRSSR2R越大,模型拟合优度越高。⑵SC(SchwarzCriterion,施瓦兹准则)SC=nnkneiln1)ln(2⑶AIC(AkaikeInformationCriterion,赤池信息准则)AIC=nknei)1(2)ln(2SC和AIC越小,表明模型的拟合优度越高。方程的显著性检验——RF,检验法方程的显著性检验,就是检验模型对总体的近似程度。最常用的检验方法是F检验或者R检验。1.F检验ikikiiixbxbxbby22110ni,,2,10:210kbbbH1//)ˆ(22knekyyFii~)1,(knkF给定的显著水平,可由F分布表查得临界值F,进行判断:若F>F,拒绝0H,方程的线性关系显著;若F≤F,接受0H,方程的线性关系不显著,回归方程无效、重建。222ˆ1yyyyRR10R检验通不过的原因可能在于:⑴所选取的解释变量不是影响被解释变量变动的主要因素,或者说影响y变动的主要因素除方程中包含的因素外还有其它不可忽略的因素;⑵解释变量与被解释变量之间无相关关系;⑶解释变量与被解释变量之间不存在线性相关关系;⑷样本容量n小。2.R检验⑴R2与F的关系22221111//)ˆ(RRkknTSSRSSTSSESSkknknekyyFii可见,F为R2的单调递增函数⑵相关系数由于kFknkFR)1(2则kFknkFR)1(在一元线性回归中,R称为简单相关系数,且│R│≤1,即-1≤R≤1在多元线性回归中,,R称为复相关系数,且0≤R≤1。给定显著性水平和自由度1kn,即可查表找到R判断:︱R︱R,方程线性关系显著。︱R︱≤R,方程线性关系不显著,回归方程无效,重建方程。F检验与R检验结果一致,实际应用可选择其一。解释变量的显著性检验-t检验法对于模型ikikiiiXbXbXbbY2211.0在),0(.~2Ni之下,检验解释变量jx对y是否有显著影响,建立假设0:0jbH,0:1jbH)1(~)ˆ(0ˆkntbsebtjjj当jt>2t,或所对应的伴随概率p<时,拒绝0H,即认为jX对Y有重要线性影响;当jt≤2t,或所对应的伴随概率p≥时,接受0H,即认为jX对Y无重要影响,应考虑将其从模型中剔除,重新建立模型。解释变量显著性检验通不过的原因可能在于:⑴jx与y不存在线性相关关系;⑵jx与y不存在任何关系;⑶ix与jx(i≠j)存在线性相关关系。五、最小二乘原理所选择的回归模型应该使所有观察值的残差平方和达到最小,即22)ˆ(iiiyye=最小多重共线性产生的原因对于模型yi=b0+b1x1i+b2x2i+…+bkxki+εi,若解释变量之间存在较强的线性相关关系,即存在一组不全为零的常数λ1,λ2,…λk,使得:λ1x1i+λ2x2i+…+λkxki+νi=0则称模型存在着多重共线性如果νi=0,则称存在完全的多重共线性。六、多重共线性的检验(一)简单相关系数检验法计算解释变量两两之间的相关系数。一般而言,如果每两个解释变量的简单相关系数比较高,则可认为存在着较严重的多重共线性。【命令方式】COR解释变量名【菜单方式】将所有解释变量设置成一个数组,并在数组窗口中点击View\Correlations。(二)方差膨胀因子法方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。一般当VIF10时(此时Ri20.9),认为模型存在较严重的多重共线性。另一个与VIF等价的指标是“容许度”(Tolerance),当0≤TOL≤1;当xi与其它解释变量高度相关时,TOL→0。因此,一般当TOL0.1时,认为模型存在较严重的多重共线性(三)直观判断法1.当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线性。2.从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。3.有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。4.解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。(四)逐步回归检测法将变量逐个的引入模型,每引入一个解释变量后,都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。(五)特征值检验若模型存在完全多重共线性,rank(X)k+1,而当模型存在严重的多重共线性时,(六)Theil效应系数检验法式中R2为样本方程判定系数;Rj2为不含Xj的样本方程判定系数,RT2为Theil效应系数。判断:RT2=0,无多重共线性;RT2接近于1,样本回归方程的解释变量与被忽略的之间存在严重的多重共线性。补救办法:(一)剔除变量法直接剔除次要或可替代的变量,或者把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。需注意产生新的问题:①模型的经济意义不合理;②是否使模型产生异方差性或自相关性;③若剔除不当,可能会产生模型设定误差,造成参数估计严重有偏(二)增大样本容量如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。(三)变换模型形式将线性方程变换为差分方程、双对数模型、半对数模型等。注意:差分会丢失一些信息,差分模型的误差项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。(四)利用非样本先验信息通过经济理论分析能够得到某些参数之间的关系,可以将这种关系作为约束条件。(五)横截面数据与时序数据并用首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参数的估计。注意:这里包含着假设,即参数的横截面估计和从纯粹时间序列分析中得到的估计是一样的。(六)变量变换1.引入差分指标、相对指标2.将名义数据转换为实际数据0||'XX0||'XXkjJTRRRR222223.将小类指标合并成大类指标4.改变变量的统计指标(七)逐步回归法⑴利用相关系数从所有解释变量中选取相关性最强的变量建立一元回归模型;⑵在一元回归模型中分别引入第二个变量,共建立k-1个二元回归模型(设共有k个解释变量),从这些模型中再选取一个较优的模型。选择时要求:模型中每个解释变量影响显著,参数符号正确,值有所提高。⑶在选取的二元回归模型中以同样方式引入第三个变量;如此下去,直至无法引入新的变量时为止。(八)主成分回归法1.将原始数据进行标准化处理2.计算样本相关矩阵R3.计算相关矩阵R的特征值及单位特征向量⑴计算特征值⑵计算特征值贡献率和累积贡献率七、异方差性产生的主要原因⑴模型中遗漏了随时间变化影响逐渐增大的因素。(即测量误差变化)⑵模型函数形式设定误差。⑶随机因素的影响。(即截面数据中总体各单位的差异)异方差导致的后果1.最小二乘估计不再是有效估计(即估计方差不再是最小)2.无法正确估计系数的标准误差;3.t检验的可靠性降低;4.增大模型的预测误差。检验方法【案例】教材P142。一、图示检验法1.相关图分析键入命令:ScatXY2.残差分布图分析注意观察之前需要先将数据关于解释变量排序,命令格式为:SORTXLSYCX戈德菲尔德-匡特(Goldfeld-Quandt)检验适用条件:样本容量较大,异方差性呈递增或递减的情况,且检验结果与C相关。样本1样本2C个数据xy怀特(White)检验White检验的具体步骤为:(1)估计回归模型,并计算e2i;(2)估计辅助回归模型;(3)计算辅助回归模型的R2;可以证明,在同方差的假设下,有:nR2~χ2(q)q:辅助回归模型中的自变量个数(此时q=5)。(4)给定α,若nR2χ2α(q),存在异方差性;反之,不存在。①建立回归模型:LSYCX②检验异方差性:在方程窗口中依次点击View\ResidualTest\WhiteHeteroskedastcity一般是直接观察p值的大小,若p值较小,认为模型存在异方差性。帕克(Park)检验和戈里瑟(Gleiser)检验异方差性的解决方法基本思想:变异方差为同方差,或尽量缓解方差变异的程度。一、模型变换法例如,对于模型yi=a+bxi+εi(1)如果σi2=D(εi)=λxi2(λ0,且为常数)加权最小二乘法(WLS)加权