第一节异方差性的概念●异方差性的实质同方差的含义同方差性:对所有的有:因为方差是度量被解释变量Y的观测值围绕回归线的分散程度,因此同方差性指的是所有观测值的分散程度相同。异方差的含义设模型为如果对于模型中随机误差项ui有:则称具有异方差性。进一步,把异方差看成是由于某个解释变量的变化而引起的,则●异方差产生的原因(一)模型中省略了某些重要的解释变量假设正确的计量模型是:假如略去,而采用当被略去的与有呈同方向或反方向变化的趋势时,随的有规律变化会体现在式的中。(二)模型的设定误差模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。(三)数据的测量误差样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。(四)截面数据中总体各单位的差异通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。第二节异方差性的后果●对参数估计统计特性的影响(一)参数估计的无偏性仍然成立参数估计的无偏性仅依赖于基本假定中的零均值假定(即)。所以异方差的存在对无偏性的成立没有影响。(二)参数估计的方差不再是最小的同方差假定是OLS估计方差最小的前提条件,所以随机误差项是异方差时,将不能再保证最小二乘估计的方差最小。●对参数显著性检验的影响由于异方差的影响,使得无法正确估计参数的标准误差,导致参数估计的t统计量的值不(1,2,...,)iin2Var()=iuσ12233...1,2,...,iiikkiiYXXXuin2Var(),1,2,3,...,iiuin12233E()...iiikkiYXXX22Var()()iiiufX12233iiiiYXXu*122iiiYXu3iX(5.5)*iu2iX2iX3iX*iu能正确确定,所以,如果仍用t统计量进行参数的显著性检验将失去意义。●对预测的影响尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对Y的预测也将不是有效的。第三节异方差性的检验常用检验方法:●图示检验法(一)相关图形分析方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量与随机误差项有相同的方差,所以利用分析与的相关图形,可以初略地看到的离散程度与之间是否有相关关系。如果随着的增加,的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。(二)残差图形分析设一元线性回归模型为:运用OLS法估计,得样本回归模型为:由上两式得残差:绘制出对的散点图◆如果不随而变化,则表明不存在异方差;◆如果随而变化,则表明存在异方差。●Goldfeld-Quanadt检验作用:检验递增性(或递减性)异方差。基本思想:将样本分为两部分,然后分别对两个样本进行回归,并计算两个子样的残差平方和所构成的比,以此为统计量来判断是否存在异方差。(一)检验的前提条件1、要求检验使用的为大样本容量。2、除了同方差假定不成立外,其它假定均满足(二)检验的具体做法1.排序将解释变量的取值按从小到大排序。2.数据分组将排列在中间的约1/4的观察值删除掉,记为,再将剩余的分为两个部分,每部分观察值的个数为。3.提出假设4.构造F统计量分别对上述两个部分的观察值求回归模型,由此得到的两个部分的残差平方为和。为前一部分样本回归产生的残差平方和,iXc(-)/2nc21ie22ie21ie12iiiYββXu12ˆˆˆiiY=β+βXˆ-iiieYY2ieiuiuiXiX222220112H:,=1,2,...,;H:inσ=σinσσ...σ为后一部分样本回归产生的残差平方和。它们的自由度均为,为参数的个数。(三)检验的特点●要求大样本●异方差的表现既可为递增型,也可为递减型●检验结果与选择数据删除的个数的大小有关●只能判断异方差是否存在,在多个解释变量的情下,对哪一个变量引起异方差的判断存在局限。●White检验(一)基本思想:不需要关于异方差的任何先验信息,只需要在大样本的情况下,将OLS估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。(二)检验的特点要求变量的取值为大样本不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差。[(-)/2]-nckk22ie(四)检验的特点●变量的样本值为大样本●数据是时间序列数据●只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。五、Glejser检验(一)检验的基本思想由OLS法得到残差,取得绝对值,然后将对某个解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。(二)检验的特点不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。该检验要求变量的观测值为大样本。第四节异方差性的补救措施异方差性是指模型中随机误差项的方差不是常量,而且它的变化与解释变量的变动有关。2.产生异方差性的主要原因有:模型中略去的变量随解释变量的变化而呈规律性的变化、变量的设定问题、截面数据的使用,利用平均数作为样本数据等。3.存在异方差性时对模型的OLS估计仍然具有无偏性,但最小方差性不成立,从而导致参数的显著性检验失效和预测的精度降低。4.检验异方差性的方法有多种,常用的有图形法、Goldfeld-Qunandt检验、White检验、ARCH检验以及Glejser检验,运用这些检验方法时要注意它们的假设条件。5.异方差性的主要方法是加权最小二乘法,也可以用变量变换法和对数变换法。变量变换法与加权最小二乘法实际是等价的。第一节什么是多重共线性当时,表明在数据矩阵X中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。()RankkX二、产生多重共线性的背景多重共线性产生的经济背景主要有几种情形:1.经济变量之间具有共同变化趋势。2.模型中包含滞后变量。3.利用截面数据建立模型也可能出现多重共线性。4.样本数据自身的原因。第二节多重共线性产生的后果2.对参数区间估计时,置信区间趋于变大3.假设检验容易作出错误的判断4.可能造成可决系数较高,但对各个参数单独的t检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。第三节多重共线性的检验一、简单相关系数检验法含义:简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。判断规则:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,例如大于0.8,则可认为存在着较严重的多重共线性。注意:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。经验表明,方差膨胀因子≥10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计三、直观判断法1.当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线性。2.从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。3.有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。4.解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。四、逐步回归法逐步回归的基本思想将变量逐个的引入模型,每引入一个解释变量后,都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。第四节多重共线性的补救措施一、修正多重共线性的经验方法1.剔除变量法把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。注意:若剔除了重要变量,可能引起模型的设定误差。2.增大样本容量如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。问题:增加样本数据在实际计量分析中常面临许多困难。3.变换模型形式一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计差分方程。问题:差分会丢失一些信息,差分模型的误差项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。4.利用非样本先验信息通过经济理论分析能够得到某些参数之间的关系,可以将这种关系作为约束条件,将此约束条件和样本信息结合起来进行约束最小二乘估计。5.横截面数据与时序数据并用首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参数的估计。注意:这里包含着假设,即参数的横截面估计和从纯粹时间序列分析中得到的估计是一样的。6.变量变换变量变换的主要方法:(1)计算相对指标(2)将名义数据转换为实际数据(3)将小类指标合并成大类指标变量数据的变换有时可得到较好的结果,但无法保证一定可以得到很好的结果。二、逐步回归法(1)用被解释变量对每一个所考虑的解释变量做简单回归。(2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按对被解释变量贡献大小的顺序逐个引入其余的解释变量。若新变量的引入改进了R2和F检验,且回归参数的t检验在统计上也是显著的,则在模型中保留该变量。若新变量的引入未能改进R2和F检验,且对其他回归参数估计值的t检验也未带来什么影响,则认为该变量是多余变量。若新变量的引入未能改进R2和F检验,且显著地影响了其他回归参数估计值的数值或符号,同时本身的回归参数也通不过t检验,说明出现了严重的多重共线性。小结1.多重共线性是指各个解释变量之间有准确或近似准确的线性关系。2.多重共线性的后果:如果各个解释变量之间有完全的共线性,则它们的回归系数是不确定的,并且它们的方差会无穷大。如果共线性是高度的但不完全的,回归系数可估计,但有较大的标准误差。回归系数不能准确地估计。3.诊断共线性的经验方法:(1)表现为可决系数异常高而回归系数的t检验不显著。(2)变量之间的零阶或简单相关系数。多个解释变量时,较低的零阶相关也可能出现多重共线性,需要检查偏相关系数。(4)如果高而偏相关系数低,则多重共线性是可能的。(5)用解释变量间辅助回归的可决系数判断。4.降低多重共线性的经验方法:(1)利用外部或先验信息;(2)横截面与时间序列数据并用;(3)剔除高度共线性的变量(如逐步回归);(4)数据转换;(5)获取补充数据或新数据;(6)选择有偏估计量(如岭回归)。经验方法的效果取决于数据的性质和共线性的严重程度。第十章、时间序列计量经济模型第一节时间序列基本概念一、伪回归问题传统计量经济学模型的假定条件:序列的平稳性、正态性。所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。20世纪70年代,Grange、Newbold研究发现,造成“伪回归”的根本原因在于时序序列变量的非平稳性二、随机过程有些随机现象,要认识它必须研究其发展变化过程,随机现象的动态变化过程就是随机过程。