季节调整中国化与NBS-SA软件研发项目研究报告课题负责人:国家统计局马建堂;南开大学张晓峒一、为什么对经济序列进行季节调整(1)带有季节性变化因素的经济变量不能直接用来计算环比增长率在月度或季度的经济序列中常包含有季节性周期。尽管这是真实的观测数据,但是,却不能用这种带有季节性的数据直接计算环比增长率。(2)用季节调整数据才能真正揭示经济变量的环比增长变化用季节调整方法对季度(月度)经济序列进行季节调整,从序列中剔除季节因素、日历效应等因素的影响,使数据处于一个“平等”的水平,这种情形下,计算出的环比增长率才能真正反映经济变量的变化。(3)用季节调整方法从序列中分离出的季节成分含有重要的经济信息用季节调整方法从序列中分离出的季节成分序列含有重要的经济信息。这种变化特征为商业部门和物资供应部门提供了有价值信息。按季节变化规律准备充足的商品和物资供不同月份的消费,对保障供给、满足需求、繁荣经济有重要意义。二、NBS-SA与X-13A-S的季节调整原理(1)时间序列的四种成分一个经济时间序列(以后简称时间序列)通常受多种因素影响,一般地,可以把这些因素分解为趋势成分、循环成分、季节成分和不规则成分。经典的时间序列模型有两种:(1)加法模型:Yt=Tt+Ct+St+It,At=Tt+Ct+It(2)乘法模型:Yt=Tt×Ct×St×It,At=Tt×Ct×It(2)X-13A-S程序的基本流程X-13A-S程序处理过程可以分为“建模”,“季节调整”和“诊断”三个阶段,如图3-1中3个虚线框所示。regARIMA模型(日历效应、移动假日、离群值回归,前向预测,后向预测,预调整)残差序列进入X-11季节调整阶段残差序列进入SEATS季节调整阶段模型诊断(M1M11,Q检验统计量,季节调整序列和不规则分量的谱分析,平移区间、修正历史检验等)对提取的4个信号分量的1阶矩、2阶矩检验。SA序列和不规则分量的谱分析。平移区间、修正历史检验等)建模与模型比较诊断图3-1X-13A-S季节调整过程三阶段第一阶段,即利用RegARIMA方法对原始序列建模阶段。本阶段的功能是首先从原始序列中剔除各种日历效应和假日效应以及离群值的影响并对误差序列建立乘积季节模型,并对该序列进行前向、后向预测。第二阶段是对序列的季节调整阶段,即对上一阶段(RegARIMA建模)输出的序列进行季节调整。其中包括两种调整方法。一种是“X11方法”;一种是“SEATS”方法。第三阶段是对季节调整结果的诊断阶段,即通过一系列统计量的值检验,判断季节调整结果是否符合要求。若用X11方法进行季节调整,对调整结果的诊断包括11个M统计量,2个Q统计量检验,季节调整后序列和不规则成分的谱分析,以及平移区间检验和修正历史检验等。若用SEATS方法进行季节调整,检验则包括4个信号成分的一阶矩和二阶矩检验,季节调整后序列和不规则成分的谱分析,以及平移区间检验和修正历史检验等。下面对三个阶段分别予以介绍。(3)RegARIMA建模原理对时间序列yt写出一个线性回归模型Yt=0+1X1t+2X2t+…+kXkt+ut(3-1)其中yt是待调整时间序列,即前面所说的原始序列。Xit,i=0,1,…,k,是解释变量,其中包括各种离群值变量,日历效应变量,以及假日效应变量等。βi,i=0,1,…,k是回归系数。ut是随机误差序列,应该满足回归模型设定的假定条件。对于季节性经济时间序列来说,回归后得到的残差通常是自相关的。所谓RegARIMA建模方法就是在回归式(3-1)的基础上同时对误差项ut建立季节时间序列模型。表达式如下,p(L)P(Ls)dsDut=q(L)Q(Ls)vt(3-2)其中ut即是来自式(3-1)中的ut。是一阶差分算子,d表示差分次数。s是s期的季节差分算子,D表示季节差分次数。dsDut表示对ut进行一阶差分d次,季节差分D次后为平稳序列。vt是白噪声序列。上式称作(p,d,q)(P,D,Q)s阶季节时间序列模型或乘积季节模型。注意:如果d=D=0(即无需差分),通常将式(3-1)中的ut改用其对均值的离差代替,即用ut-μ代替ut,其中μ=E(ut)。将式(3-1)写成,ut=(Yt–β0-kiitiX1),并代入式(3-2),可以写成,p(L)P(Ls)dsD(Yt–β0-kiitiX1)=q(L)Q(Ls)vt(3-3)RegARIMA模型(3-3)可以理解为(1)在回归模型(3-1)的基础上,令误差项ut服从SARIMA模型(3-2);(2)从yt中减去回归因子的影响后,建立SARIMA模型。把式(3-3)写成,dsD(Yt–β0-kiitiX1)=tsPpsQqvLΑLΦLΓLΘ)()()()((3-4)令wt=tsPpsQqvLΑLΦLΓLΘ)()()()(,wt被假定为平稳序列,并表达为p(L)P(Ls)wt=q(L)Q(Ls)vt。模型(3-4)式的另一种写法是(1-L)d(1-Ls)DYt=(β0+kiitiX1)(1-L)d(1-Ls)D+wt(3-5)上式强调的是RegARIMA模型中的回归变量Xit,i=0,1,…,k,同Yt一样,用ARIMA模型的差分算子(1-L)d(1-Ls)D进行了差分。式(3-1)中的回归因子(解释变量)Xit主要包括各种离群值(outlier)变量与日历相关的影响变量以及假日效应变量等。X-13A-S软件将这些功能集中到了第一阶段RegARIMA模块中。在X-13A-S的X11季节调整程序中,仍保留了在不规则成分中对这些效应的处理功能。但X-13A-S软件说明书建议在第一阶段处理离群值效应、日历效应和假日效应等,对原始序列进行预调整。在X-13A-S程序中,离群值被分为5类,即加性离群值(AO),水平漂移(LS),暂时变化(TC),斜线变动(RP)和季节性离群值SO。分述如下,下面介绍7种可能在季节性经济序列中产生影响的效应,它们都属于日历效应。分述如下。(1)固定季节效应。(2)闰年效应。(3)月份长度效应。(4)季度长度效应。(5)交易日效应。(6)工作日效应。(7)移动假日效应。(4)X11在默认状态下的计算原理以月度序列、加法模型为例,假设序列Yt不含离群值、已经通过前向预测、后向预测对序列进行了扩展,所以序列两端不需要使用修正公式。省略极端值(extremevalue)调整过程。由于在X-11体系的季节调整程序中,对趋势成分和循环成分不再细分,视为一种成分,所以这里按照加法分解模型将Yt分解为趋势-循环(Ct)、季节(St)和不规则(It)三种成分:Yt=Ct+St+It,季节调整序列用At表示,则Yt=At+St。X11季节调整计算过程也分为3个阶段。(1)初始估计At,(2)再次估计At,(3)估计最终Henderson趋势和不规则成分。第1阶段:初始估计At1.使用“中心化12项”移动平均(2×12)估计趋势循环成分Ct。2.估计季节-不规则成分:(S+I))1(t=Yt-)1(tC3.对每个月份应用3×3移动平均估计预备季节成分:)1(ˆtS=M3×3[)1()(tIS]4.估计季节调整后序列A)1(t。A)1(t=(C+I))1(t=Yt-)1(tS这是初次估计的季节调整后序列,所包含的季节性因素已经很少了。接下来X11方法将基于A)1(t序列继续进行移动平均。第2阶段:再次估计At1.用13项Henderson移动平均估计趋势循环成分Ct。C)2(t=H13(A)1(t)2.估计季节-不规则成分。(S+I))2(t=Yt-)2(tC3.对每个月份应用3×5移动平均估计最终季节成分。)2(ˆtS=M3×5[)2()(tIS]4.估计季节调整后序列)2(tA。)2(tA=(C+I))2(t=Yt-)2(tS第3阶段:估计最终Henderson趋势和不规则成分1.估计最终趋势。C)3(t=H2H+1(A)2(t)2.估计最终不规则成分。)3(tI=)2(tA-)3(tC最终得到分解序列的加法模型:Yt=)3(tC+)2(tS+)3(tI三、中国假日效应的处理(1)中国固定假日效应的处理中国每周工作天数体制转换、固定假日、调休、黄金周等实施期间的沿革示意图见图4-1。每周6天工作制(1995年5月以前)每周5天工作制(1995年5月始)元旦法定假日1天,2000年1月始伴以调休(休3天)五一节法定假日1天(2000年5月以前)五一劳动节法定假日3天(2000年5月始)五一节法定假日改回1天(2008年5月始)无五一黄金周(2000年5月以前)五一黄金周,伴以调休(2000:52007:5)取消五一黄金周(2008年5月始取消)国庆节法定假日1天(1999年10月以前)国庆节法定假日3天(1999年10月始)无十一黄金周(1999年10月以前)十一黄金周,伴以调休(1999年10月始)1990:11995:51999:102008:52030:12图4-1中国工作体制转换、固定假日、调休、黄金周等因素变化示意图①关于中国月度交易日效应变量的定义与计算下面以2009年9月为例介绍当出现跨月调休时,中国交易日效应变量的计算过程。第1步:以公元纪年的日历为基础生成新的日历。由于2009年9月涉及到黄金周调休,所以要先调整9月份的日历。“国务院办公厅关于2009年部分节假日安排的通知”(见本研究报告后附录3)规定,将2009年9月27日(星期日)的公休日调至10月7日(星期三),而把10月7日(星期三)调至9月27日按工作日处理。所以,对于2009年9月27日来说,其交易日的性质由周日变成周三。这导致2009年9月的周日减少1天,周三增加1天。对于2009年10月7日来说,其交易日的性质由周三变成了周日,导致2009年10月的周日增加1天,周三减少1天。见图4-2。图4-2按国务院放假通知生成2009年9月和10月份新定义的工作日和休息日(新日历)示意图。第2步:计算中国月度交易日效应变量。以新生成的日历为基础,则在计算2009年9月的交易日效应变量时,周日的天数就由原来的4天变为现在的3天,周三的天数由原来的5天变为现在的6天,而其他交易日的天数不变。若用m12009,9,…,m62009,9,m72009,9分别表示2009年9月份调整后周一、周二、…、周日的天数,则,m12009,9=4m22009,9=5m32009,9=6m42009,9=4m52009,9=4m62009,9=4m72009,9=3则中国交易日效应变量T1t,T2t,…,T6t(分别表示调整后的周一、周二、…、周六效应变量)在2009年9月的取值依次是T12009,9=m12009,9–m72009,9=4-3=1T22009,9=m22009,9–m72009,9=5-3=2T32009,9=m32009,9–m72009,9=6-3=3T42009,9=m42009,9–m72009,9=4-3=1T52009,9=m52009,9–m72009,9=4-3=1T62009,9=m62009,9–m72009,9=4-3=11990年1月至2030年12月中国交易日效应变量T1t,T2t,…,T6t的赋值结果见本研究报告后附录4。②关于中国月度工作日效应变量的定义与计算中国月度工作日效应变量WDt的定义方法是,以公元纪年日历为基础,根据我国固定假日,国务院通知的黄金周调休方案重新计算每月中工作日和休息日的天数。由于1990年1月至1995年4月我国实行的是6天工作制,所以,中国月度工作日效应变量WDt的值按下式计算WDt=(调整后的每月工作日天数)-6(调整后的每月周日天数)由于1995年5月至2030年12月我国实行的是5天工作制,所以,中国月度工作日效应变量WDt的值按下式计算WDt=(调整后的每月工作日天数)-(5/2)(调整后的每月周六、周日天数)仍以2009年9月月份为例,说明具体计算过程。根据公元纪年的日历,2009年9月共有