第六章线性模型结构转变本章内容我们在进行经济研究时,计量经济所隐含的基本前提是经济结构是稳定的,但通常在一长期的研究过程中,体系内的参数会因经济情况的改变而造成结构的改变,以致在转变前后会有不同的估计结果,使得预测发生误差。本章主要讨论这一问题,包括虚拟变量的使用、模型稳定性检验两方面,而内生确定结构转变点或区制的方法在以后介绍。一、虚拟变量需要说明的是,研究结构转变是虚拟变量的一个重要用途,但一般而言,虚拟变量主要是衡量一些属性因素的影响。例如,职业对个人收入的影响、战争与和平对发展经济的影响、繁荣与萧条对就业的影响、文化程度对工资的影响、自然灾害对农业生产的影响、季节对销售量的影响等。由于这些属性因素无法定量化,从而只能借助虚拟变量来解决。(一)虚拟变量的定义由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量(DummyVariable)(或称二项变量binaryvariables),用D表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。例如:1男0女含有虚拟变量的模型称为虚拟变量模型。D=二项变量是将函数的离散移动引入到回归模型中的合适手段。一些简单的模型可以表示为下述包含一个虚拟变量的回归模型:iiiidyβx政策分析中一个值得关注的问题是,处理效果的度量可以反映代表性经济个体是否采取某种决策的结果。例如虚拟变量可以表示经济个体是否参加某种培训对其后工资的影响。(二)虚拟变量的形式截距变化(加法方式)斜率变化(乘法方式)截距、斜率同时变(1)一个虚拟变量1男性0女性Y=b0+b1X+b2D+u男性:Y=(b0+b2)+b1X+u女性:Y=b0+b1X+u1、加法方式(截距变化)D=XYb0b2增加的一个截距可认为是虚拟变量带来的影响。女性男性D=1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若b2显著不为零,说明截距不同;若b2为零,说明这种分类无显著性差异。关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。定性变量中取值为0所对应的类别称作基础类别(basecategory)。而其余虚拟变量效应是相对基础类别而言。(2)几个分类指标当具有几个分类时,就需要一组二元变量,在宏观经济数据中进行季节修正就是一个典型的例子。我们可以将消费函数表示为:ttttttDDDxC33221121这里tx是可支配收入。注意到四个季度的虚拟变量,只有三个被引入到模型当中。如果第4个季度的季节变量也引入到模型中的话,那么这四个虚拟变量的和总为1,将产生完全的共线性。这就是著名的虚拟变量陷阱(dummyvariabletrap)。因此,为了避免虚拟变量陷阱的出现,我们省略了第四个虚拟变量。若定性变量含有m个类别,应引入m-1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummyvariabletrap)。(3)几个分组指标考虑不同州际(美国的不同州)中教育支出与收入之间的关系,假设我们考虑50n个州和10T年的样本,一个可以允许预期支出随着时间和州际不同改变的回归模型是:titiititxy其中,491ii,tiiFλδ表示不同州之间的差异,Fit是州变量。而91ti,tttDφθ表示不同年度之间的差异,Dit是年度变量。注意:与以前一样,在每组哑变量中去掉一个以避免出现虚拟变量陷阱。例子如果我们选取6个航空公司1970—1984年数据为样本,建立成本方程:51ii,ti,ti141ti,tti,t5i,t4i,t23i,t21i,tεFδDθLoadfactorβP(fuel)βQlnβlnQββlnC其中,i,tQ表示载客里程,i,tP(fuel)表示原油价格,i,tLoadfactor表示载客率,Fit是公司变量,Dit是年度变量。然后我们可以根据样本数据对以上模型进行估计,根据参数的显著性判断公司效应和时间效应。但对于公司效应和时间效应的检验可以根据前面介绍过的检验方法进行。模型参数个数F自由度全模型24---原假设:没有公司效应1965.94*[5,66]原假设:没有时间效应102.61*[14,66]原假设:无效应522.19*[19,66](4)门限效应和类别变量ThresholdEffectsandCategoricalVariables所谓的门限效应,是指当指标超过某个值(被称为门限值)时,效果就发生改变。也即变量落在某个区域内所导致的效果。例如,我们感兴趣的回归方程可以表示为:educationofeffectageimcome21教育的数据可以由“最高教育程度”(例如高中,大学,硕士和博士等表示)表示。一种方式是使教育虚拟变量E为0,依次为1,2和3等。这时回归方程为:Eageimcome221缺陷是认为不同教育程度对收入的影响是一致的(由3表示)。这是对模型的不合理限制。因此,一个更为合理的模型是采取三个或者四个虚拟变量(每个对应一种教育程度),将模型表示为:PMBageimcomePMB21对给定年龄条件下,收入与教育程度之间的对应关系为:高中:ageHSageincomeE21],|[学士:BageBageincomeE21],|[,最后一项表示学士学位的门限效果硕士:MageMageincomeE21],|[,最后一项表示硕士学位的门限效果博士:PagePageincomeE21],|[,最后一项表示博士学位的门限效果因此,上述不同教育程度对收入影响的区别就可以计算出来,而且十分有趣和重要。另外一种描述教育程度的虚拟变量表示方法是,假设拥有那个学位,那个学位的虚拟变量就是1,而不管是否是最高学位,这样一来,回归方程可以表示为:高中:ageHSageincomeE21],|[学士:BageBageincomeE21],|[硕士:MBageMageincomeE21],|[博士:PMBagePageincomeE21],|[这里的参数具有不同的含义,表示增加一种学位对收入带来的边际影响。1男性0女性Y=b0+b1X+b11DX+u男性:Y=b0+(b1+b11)X+u女性:Y=b0+b1X+u2、乘法方式(斜率变化)D=XYb0斜率发生了变化,可认为是虚拟变量带来的影响。女性男性1男性0女性Y=b0+b01D+b1X+b11DX男性:Y=(b0+b01)+(b1+b11)X女性:Y=b0+b1X3、加法乘法并用(双结构转变)D=XYb0b01截距和斜率均发生变化女性男性检验以上模型的b11是否显著,即可判断斜率是否发生变化。几个例子(见word文档)例1:市场用煤销售量模型(虚拟变量应用举例1)例2:用虚拟变量区别不同历史时期(虚拟变量应用举例2)例3:香港季节GDP数据的拟合(虚拟变量应用举例3)4、仿射回归(SplineRegression)彷射回归(splineregression)或分段回归有时需要将整个样本按照样本顺序分成几个子样本组,以便考虑这些子样本组中的回归模型的具体形式。被称为彷射函数的限制性回归经常用于处理这样的效果。例如,考虑年龄对收入影响的分段回归可以表示为:22,2218,18,]|[221100ageifageageandageifageageifageageincomeE这里年龄的门限值18和22被称为节点(knots)。假设:18,111taged,22,122taged则可以将三个方程结合起来表示为:ageddageddageincome2222111121在这个模型中,三个分段内的回归斜率分别为2,12,212。为了保证分段函数是连续的,我们要求分段在节点处相交,则有:11211121)()(tt221221121211)()()()(tt上述方程构成了参数的约束条件,可以得到:)()(22211121tagedtagedageincome上述限制性回归模型的参数可以通过下述多元回归模型得到:agex1,18,018,182ageageagex,22,022,223ageageagex我们可以在这个模型中检验回归直线斜率相等的联合假设为:021仿射回归incomeage1822二、模型稳定性检验已知,虚拟变量可用来检验模型是否有结构转变,从而可判断模型是否稳定。接下来,我们将介绍几种更常用的检验方法。chow(邹至庄)突变点检验Chow预测检验CUSUM检验CUSUM平方检验1、chow突变点检验(1)F检验统计量构造F—统计量的一种最为重要的应用是检验结构性转变(structuralchange)。如果可以将样本分为两个不同阶段,则可以利用不同参数描述不同区间内的方程。假设前一个阶段y和X的数据表示为1y和1X,后一个阶段的数据表示为2y和2X,则对应的两个模型为:1111XY(某一时点以前的样本n1)2222XY(某一时点以后的样本n2)不同阶段具有不同参数的无限制模型可以表示为:21212121εεββX00Xyy上述模型的最小二乘估计可以表示为:212211122111bbyXyXXX00XXyXX)X(b这个最小二乘估计与分别进行最小二乘估计是一致的,因此总残差平方和将是两个分别估计的残差平方和相等:2211eeeeee限制性系数向量可以通过两种方法获得。第一种方法:参数限制21是线性约束qRβ,这里][II,R,0q。这时以前给出的参数约束检验可以应用;第二种方法:比较简单的算法是,将限制性条件直接应用到模型中,则有:212121εεβXXyy这时限制性参数估计可以通过上述限制性回归直接得到。这个限制性回归的残差平方和为ee,它构成了检验的统计量。即构造统计量2K)n)/(neeee()]/Keeee(ee[2K)ne/(nee)/Keee(2K]nnF[K,21221122112121(2)检验步骤总结:原假设是:检验步骤:第一步:分别用两个样本n1和n2对模型进行回归,得到残差平方和SSR1和SSR2;第二步:将两个样本合二为一,用n(n1+n2)对模型进行回归,得到残差平方和SSRR;第三步:构造F统计量;第四步:检验,如果F大于临界值,则拒绝原假设,即认为发生结构突变。21ββ(3)对数似然比LR检验统计量对具有约束条件和没有约束条件下的极大对数似然值进行比较。LR检验统计量渐近服从分布,自由度等于分割点个数乘以参数个数k。2在进行chow突变点检验时,将样本分为两份,要保证两组样本的个数都大于待估参数的个数,即n1k,n2k。但如果n2k时,该怎么办呢?第二组样本不足以估计模型,此时应该用chow预测检验。其原理如下:2、chow预测检验Chow预测检验的基本思想是:先用较长的数据(n1个观测值)估计回归模型;再用估计出来的模型预测剩余的n2个数据点。如果实际值和预测值差异较大,说明模型可能不稳定。其检验统计量构造如下:设两个样本区间的真实模型结构如下:1111XY(某一时点以前的样本)2122122122222X)(XXXY(某一时点以后的样本)其中,)(X122