计量经济学第五章经典单方程计量经济学模型:专门问题§5.1虚拟变量模型§5.2滞后变量模型§5.1虚拟变量模型◆虚拟变量的基本含义◆虚拟变量的引入方法◆虚拟变量的设置原则城乡居民储蓄存款变化规律?改革开放以来,随着经济的发展中国城乡居民的收入快速增长,同时城乡居民的储蓄存款也迅速增长。经济学界的一种观点认为,20世纪90年代以后由于经济体制、住房、医疗、养老等社会保障体制的变化,使居民的储蓄行为发生了明显改变。12314266850.5088254.00tttttttYY=+GNIGNID+GNIDu11199601996ttDt年以后年及以前21200002000ttDt年以后年及以前其中:为什么要引入虚拟变量?虚拟变量(dummyvariables):这种不可直接度量的因素,根据其属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D。经济中的变量可直接度量:商品需求量、价格、收入等不可直接度量:性别、职业对收入的影响;季节、政策等虚拟变量的基本含义虚拟变量模型:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。虚拟变量模型例如,反映性别的虚拟变量可取为:1,男性D=0,女性一个以性别为虚拟变量考察个体收入与食品支出关系的模型:iiiiDXY210其中,Y为食品支出;X为税后收入;D=1代表男性,D=0代表女性例:男女个体消费者每年的食品支出(美元)年龄女性食品支出女性税后收入男性食品支出男性税后收入2519831155722301158925-3429872938737573332835-4429933146338213615145-5431562955432913544855-6427062513734293298865221714952253320437虚拟变量模型例:食品支出与税后收入和性别的关系观察值食品支出税后收入性别观察值食品支出税后收入性别119831155707223011589122987293870837573332813299331463093821361511431562955401032913544815270625137011342932988162217149520122533204371虚拟变量模型虚拟变量的引入方法虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。方式:将虚拟变量作为一个单独解释变量加入模型。企业职工薪金模型中性别虚拟变量的引入。1、加法方式(考察截距的变化)虚拟变量的引入iiiiXDXYE10)0,|(iiiiXDXYE120)()1,|(女职工的平均薪金:男职工的平均薪金:假定20,则两个函数有相同的斜率,但有不同的截距。即男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。年薪Y男职工女职工工龄X02虚拟变量的引入例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上,这时需要引入两个虚拟变量:模型可设定如下:iiiDDXY231210虚拟变量的引入011D其他高中012D其他大学及其以上在E(i)=0的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:高中以下:iiiXDDXYE1021)0,0,|(高中:iiiXDDXYE12021)()0,1,|(大学及其以上:iiiXDDXYE13021)()1,0,|(假定32,其几何意义:大学教育保健高中教育支出低于中学教育收入虚拟变量的引入还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。如在上述职工薪金的例中,再引入代表学历的虚拟变量D2:iiiDDXY231210012D本科及以上学历本科以下学历职工薪金的回归模型可设计为:多个虚拟变量的引入011D男性女性•女职工本科以下学历的平均薪金:iiiXDDXYE13021)()1,0,|(•女职工本科以上学历的平均薪金:iiiXDDXYE132021)()1,1,|(iiiXDDXYE1021)0,0,|(iiiXDDXYE12021)()0,1,|(于是,不同性别、不同学历职工的平均薪金分别为:•男职工本科以下学历的平均薪金:•男职工本科以上学历的平均薪金:多个虚拟变量的引入2、乘法方式加法方式引入虚拟变量测量:截距的不同;乘法方式引入虚拟变量测量:斜率的变化;方式:将虚拟变量与原解释变量相乘作为新的解释变量加入到模型中。例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。虚拟变量的引入tttttXDXC21001tD反常年份正常年份消费模型可建立如下:假定E(i)=0,上述模型所表示的函数可化为:正常年份:ttttXDXCE)()1,|(210反常年份:ttttXDXCE10)0,|(虚拟变量的引入虚拟变量的引入案例能源问题:下表是某国1966年~1979年能源需求与相应GDP的数据资料。年份初次能源需求量Y实际GDPX年份初次能源需求量Y实际GDPX196510010019731141501966106108197411715619671151171975121161196812212319761231691969129132197712917419701361411978130177197114114519791341831972143154Y与X的散点图如下:X1965196619671968196919701971197219731974197519761977197819799010011012013014015080100120140160180200Y虚拟变量的引入案例回归结果如下:22ˆ82.4530.2850.3510.301:(5.185)(2.650)ttYXRRt可以看出,模型的拟合度非常不好。考虑1973年石油危机以后,该国能源需求结构的变化,对下面引入虚拟变量的多元回归模型进行OLS估算。0石油冲击前(1965-1972)1石油冲击后(1973-1979)Di=虚拟变量的引入案例123(),tttttYXDXu230,0.其中设β30是因为考虑到石油冲击后,出现了节能性的经济增长。重新回归,得到结果如下:2ˆ17.0950.839-0.199()(4.47)(28.16)(-22.61)0.983ttttYXDXtR结论:石油冲击前的系数为0.839,石油冲击后的系数为0.640.可见石油冲击后,经济增长模式向节能化方向转变。虚拟变量的引入案例当截距与斜率发生变化时,需要同时引入加法与乘法形式的虚拟变量。例5.1.1,考察2007年中国内地农村居民与城镇居民边际消费倾向是否存在差异。表5.1.1中给出了中国内地2007年城镇居民家庭人均可支配收入与人均生活消费支出,以及农村居民家庭人均可支配收入与人均生活消费支出的相关数据。虚拟变量的引入以Y为人均消费,X为人均可支配收入,可令:农村居民:Yi=1+2Xi+1ii=1,2…,n1城镇居民:Yi=1+2Xi+2ii=1,2…,n2则有可能出现下述四种情况中的一种:(1)1=1,2=2,即两个回归相同,称为重合回归;(2)11,但2=2,即两个回归的差异仅在其截距,称为平行回归;(3)1=1,但22,即两个回归的差异仅在其斜率,称为汇合回归;(4)11,且22,即两个回归完全不同,称为相异回归。将n1与n2次观察值合并,并用以估计以下回归:iiiiiiXDDXY)(4310Di为引入的虚拟变量:01iD于是有:可分别表示城镇居民和农村居民消费函数。在统计检验中,如果4=0的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。iiiiXXDYE10),0|(iiiiXXDYE)()(),1|(4130农村居民城镇居民回归结果为:由3与4的t检验可知:这两个参数并非显著地不等于0,也就是说,2007年农村居民与城镇居民的边际消费倾向并无显著差异,有着共同的消费函数:(1.23)(26.61)(-0.62)(0.49)2R=0.9799ˆ450.330.6920271.140.0275iiiiiYXDDXˆ253.390.7059iiYX3、临界指标的虚拟变量的引入截距、斜率同时发生变化,一般多用在经济转折时期。做法:原解释变量减去转折期指标再乘以虚拟变量作为新的解释变量。例如,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。假定t*=1979年为转折期,1979年的国民收入Xt*为临界值,设如下虚拟变量:01tD**tttt虚拟变量的引入回归方程为两时期进口消费品函数分别为:tttttDXXXY)(ˆˆˆˆ*210当tt*=1979年,ttXY10ˆˆˆ当tt*=1979年,titXXY)ˆˆ()ˆˆ(ˆ21*20则进口消费品的回归模型可建立如下:ttttttDXXXY)(*210虚拟变量的引入课本图5.1.3虚拟变量的设置原则虚拟变量的设置原则虚拟变量的个数需按以下原则确定:每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果该变量有m个属性,只在模型中引入m-1个虚拟变量。例:已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可:011tD其他春季012tD其他夏季013tD其他秋季则冷饮销售量的模型为:在上述模型中,若再引入第四个虚拟变量ttttktkttDDDXXY332211110014tD其他冬季则冷饮销售模型变量为:tttttktkttDDDDXXY44332211110其矩阵形式为:μαβD)(X,Y虚拟变量的设置原则如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷阱”,应避免。000110010110001010010010100011)(616515414313212111kkkkkkXXXXXXXXXXXXDX,k10β4321α虚拟变量的设置原则uxbbyiii101.某商品需求函数为,其中y为需求量,x为价格。为了考虑“地区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为()。A.2B.4C.5D.62.假定月收入水平在1000元以内时,居民边际消费倾向维持在某一水平,当月收入水平达到或超过1000,边际消费倾向将明显下降,则描述消费(C)依入(I)变动的线性关系宜采用()。元元1000110000,210IIDDuIbIbaCtttt元元1000110000,210IIDDuIbbaCttt元1000,)(**10