第9章非平稳时间序列•在很多情况下,公共管理者通过制定政策来改变人们的行为模式。•例如,2012年,江苏省政府印发《江苏省新能源汽车推广应用指导意见》,对在省内发展和推广新能源汽车作出了全面说明。《意见》规定“2014年底前,南京、苏州、南通等新能源汽车应用试点城市要确保分别推广应用新能源汽车1000辆以上”。•这个文件是否提高了新能源汽车的推广速度?•1998年中国房改刚刚开始时,任务的核心是“建立和完善以经济适用住房为主的住房供应体系”。2003年8月12日,由建设部起草的“关于促进房地产市场持续健康发展的通知”出台。在这份文件里,经济适用房由“住房供应主体”被改为“具有保障性质的政策性商品住房”。经济适用房性质的改变,引发了全国持续近10年的房价上涨狂潮。实际上,政府从2004年就开始对房地产价格进行调控。2004年颁布的《关于深入开展土地市场治理,整顿严格土地管理的紧急通知》,要求二套房首付比例不得低于40%。以后的10年中,陆续出台各种政策遏制房地产价格暴涨,2012年3月,国务院批转的国家发展改革委《关于2012年深化经济体制改革重点工作的意见》明确要适时扩大房产税试点范围,形成向存量房征税的基本政策。•这些政策的实施效果,也可以通过本章介绍的断续时间序列分析(interruptedtimeseriesanalysis)的分析技术进行评估。9.1.1短期影响•1974年,由于阿拉伯石油禁运,美国通过了55mph的速度限制。尽管该限制的目的是为了省油,但新速度带来了一个额外的好处,即降低了交通事故死亡人数。•分析人员萨维奇把阿肯色州交通事故死亡人数的数据列在表9—1中。年份死亡人数(Y)时间(X1)计划(X2)19684121O19694372O19704283O19714534O19724495O19734636O1974384711975395811976414911977406lO112212ˆ4098.985.11.679.827.940.93yxYXXsbsbSR9.1.2长期影响•明湖市正在考虑强化社会保障计划,以降低市政府的保险费支出。市长决定聘用一个风险经理来监督保险运营,看是否能够节约一些费用。受聘的风险经理李先生知道保险费用大幅度下降是不现实的。他所希望的是实现保险费用长期增长率的下降。•图9—3显示了这种影响。年份保险费用(Y)时间(X1)计划(X2)19914237001O19925169002O19935932003O19946843004O19957512005O19968143006119978672007219989413008319999958009420001056700lO512212ˆ34857881381213291800286965100.99yxYXXsbsbSR9.1.3同时考虑短期效应和长期效应•在很多情况下,人们对公共政策如何影响个人与产出的理论认识并不充分。•例如,尽管人们作了很多努力来理解一个国家的经济运行机制,各种税收和支出政策的影响仍然没有被完全理解。如果说宏观经济学的这些研究领域由于理论上的不确定性而不够完整,那么公共管理者涉及的大多数研究领域亦如此。结果,管理者可能并不知道他是否应预期一项计划的变动会产生短期效应或长期效应。或许,计划管理者应预期一项计划既产生长期效应,也产生短期效应。一个案例•西滨市警察局长多次听到来自停车场收费员的反映,说人们非法停车却不购买停车月票。局长觉得应当解决这个问题。他决定专门抽调一批警察来处理那些非法停车的司机。局长认为新的方案将对停车月票的售出数量产生瞬时影响,而且随着这批警察对工作的熟悉,新的小组还会产生长期影响。•新方法实施后,局长等了8个星期让计划产生影响。然后他收集了新计划实施以前和实施以后的停车月票的数据,数据见表9—3。星期(1X)停车月票(Y)(万张)短期(2X)长期(0X)146OO239OO339OO452OO555OO648OO751OO854OO96511107112117413127714137415148216158717169318另一个案例•假设我们希望评估对新进入某地区的工业企业免税的政策对该地区生产增长的影响。•我们希望能发现这些政策独立于其他因素之外对生产的影响。特别是在时间序列中,应意识到有两个因素可能会混杂在我们所发现的结果中,趋势(trend)就是这种因素之一。•也许在引进了免税制后,生产的确比以前有了明显的增长,但是这种增长很可能是生产增长长远趋势的一部分。•另外一个因素是周期性,即经济增长模式的循环性。经济增长也许是在一个有规律的循环中波动,繁荣几年后也许会出现几年经济低谷,然后再繁荣。在决定特定政策的影响时,我们必须考虑这种循环模式。•如果政策实施是在经济循环的谷底,也许出现的正面影响事实上并不是政策作用的结果;相反,如果在循环的谷峰,则看起来政策呈现出一种负面效果。虚拟变量对应变量政策后变量年份1X2X3X1965196619671968……19791980198119821983……19950000……O1111……11234……1516171819……31oO00……01234……169.1.4脉冲效应•例如,校团委认为每年三月份的“学雷锋”活动产生的好人好事数量剧增的影响。“学雷锋”活动从3月1日开始,持续到3月底结束。团委书记对这个假设很感兴趣,他从数据库中调取了全校每个月登记的好人好事件数。数据见表9—5。月份好人好事件数趋势(X1)脉冲效应(X2)一月461O二月522O三月10531四月604O五月665O六月686O七月707O八月768O九月799O十月55100十一月8111O十二月8612O12212ˆ45.43.5224.40.192.42.20.99yxYXXsbsbSR9.2.1利用数据来表示计划变动•到目前为止,在本章所用的断续时间序列分析模型中,自变量或者是趋势变量、虚拟变量,或者是某种计数变量。虚拟变量是反映政策或新计划的变动的非常粗略的指标。分析人员通常用更好的测度来反映政策变动。•例如,让我们假定政府想了解医疗救助计划(一个面向低收入人群的保健计划)对婴儿死亡率是否产生了影响。•婴儿死亡率(每1000名活产婴儿中的婴儿死亡数)是因变量;分析覆盖的时期从1951-1988年。•在医疗救助计划实施(1965年)之前,由于营养与医疗水平的普遍改善,婴儿死亡率一直在下降。为了反应改善的一般趋势,引入了一个趋势变量(x1),1950年取1,以后每年递增1。传统的断续时间序列会建立两个新的自变量:一个是短期效应(x2),医疗救助计划实施(1965年)以后取1,实施以前取0;另一个是长期效应,医疗救助计划实施以前取0,实施以后为一个计数变量(x3)。•这种断续时间序列回归的结果如下:•检验医疗救助计划对婴儿死亡率的影响的另一种方法是使用医疗救助总支出(单位为不变价百万元)。这种断续时间序列分析结果如下:9.2.2控制其他变量•断续时间序列分析的一个优点是它允许分析人员对可能影响因变量的其他因素进行控制,方法是把这些因素作为附加的自变量引入分析。•例如,2005年,政府非常关心为医疗改革的效果。政府专门成立了医疗费用监控中心,该中心的任务是降低医疗费用。•他们按照工作目标,提出并实施了新的计划,为了确定这一计划是否影响医疗费用,可以把单位为百万元的医疗费用作为因变量,自变量可以包括两个:一个是趋势变量(x1),每年增加1;另一个是关于医疗费用监控中心计划的短期影响变量(x2)。•这个估计的问题在于它没有考虑由通货膨胀导致的医疗费用的迅速上涨。只要把通货膨胀的测度引入回归方程,断续时间序列分析就可以处理这个问题。•本例中,医疗价格的测度(医疗价格指数,以1997年为100)作为第三个自变量(x3)被引入回归分析。回归结果如下:1232123ˆ520012241178936235672995470.99yxYXXXsbsbsbSR医疗价格较大的正系数表明,如果对年份和医疗费用监控中心计划是否生效这两个变量进行控制,则医疗价格指数每提高1个百分点,医疗救助费用就会提高893600万元(29.9t)。第二个系数是人们最为关心的。这个系数表明,如果对年份和医疗价格指数进行控制,则实施医疗费用监控中心计划导致医疗救助费用降低411700万元(7.25t)。9.3非平稳时间序列的特殊问题•9.3.1滞后效应•9.3.2自相关•9.3.3一个综合问题:多重共线性9.3.1滞后效应•虽然在我们的例子中我们假设政策自其颁布之日起就发生效用,但是这个假设不是在任何情况下都是合理的。•有时候法律在这年颁布,但却在下一年实施。在进行时间序列分析时,你需要考虑如何合理地假设你的政策被实施或被认为显示出显著影响的时间。•如果时间是在年中,那就可以把该年编码为1。如果无法确定时间,你可以试着选取两年或是更多年份作为政策实施年份,看看它们在模型中会产生什么样的影响。•例如,l986年美国大学体育总会(NCAA)提高了对新招募的运动员在教育程度上的要求,但是直到l990年,这项政策才对大学毕业的运动员的比率显示出影响(或在那些优秀运动员居多的学校,直到l991或1992年才显示出影响)。•如果是这样的话,那么对于政策实施后的对应变量,我们就不应把开始实施政策的1986年编码为1,而是应把1990年编码为1,1991年为2等等。对于虚拟变量,也应将1990年前编码为0,1990年及其以后编码为l。在对滞后效应处理时,需要考虑政策效应发生前多长时间是合理的,并据此建立起回归方程。9.3.2自相关•第6章指出,回归分析的假设之一是误差项无关。•相关的误差或自相关通常只是在时间序列分析中才出现。自相关会使事实上并不显著的回归系数变得显著,这种不一致的分析会导致第一类错误,并在零假设成立时否定它。•也就是说,自相关可以导致斜率看起来是显著的,而事实上它们并不显著。•这意味着管理者可能做出一项计划产生了影响的判断,而事实并非如此。•自相关可以用德宾—沃森(D-W检验)检验,大多数回归程序都会输出(D-W)统计量。•对于西滨市停车月票发放数量的回归(表9—3)而言,德宾—沃森统计量等于1.85。如果没有自相关,德宾—沃森统计量接近2.0;如果有完全的正自相关,等于0;如果有完全的负自相关,等于4。•附录给出了德宾—沃森表(D-W检验),可以用来在0.05的显著性水平下检验自相关。•在使用德宾—沃森表时,需要知道自变量的个数(停车月票一例中为3)和个案的个数(16)。•我们查到两个数字,0.857和1.728。较大的数字,1.728,被称为上限,较小的数字被称为下限。•如果德宾—沃森大于1.728,你在0.05的显著性水平下不能认为存在自相关。•如果德宾—沃森小于0.857,你应当在0.05的显著性水平下拒绝没有自相关的原假设。•如果德宾—沃森介于0.857和1.728之间,你不能肯定是否存在自相关•由于D-W检验为1.85,我们可以以相当的把握认为没有自相关。9.3.3一个综合问题:多重共线性•多重共线性(Multi-collinearity)是指线性回归模型中的解释变量之间由于存在相关关系而使模型估计失真或难以估计准确。•一般来说,由于经济数据的限制使得模型设计不当,导致解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。两种情况都会对模型进行最小二乘估计都会产生严重后果。产生原因•㈠经济变量间具有相同方向的变化趋势•㈡经济变量间存在较密切关系•㈢采用滞后变量作为解释变量较易产生多重共线性•㈣数据收集范围过窄,有时会造成变量间存在多重共线性问题。多重共线性的检验•检验多重共线性有不显著系数法、拟合优度法、相关矩阵法、Frisch综合分析法等四种方法。㈠不显著系数法情况1、2R很大,t小情况2、理论性强,检验值弱情况3、新引入变量后,方差增大㈡拟合优度2jR检验对多元