第六章ARIMAX模型一、ARIMAX模型的概念有时考虑其它序列对一个时间序列的影响,如太阳黑子对某地区降雨量的影响,石油价格对股价的影响。带有输入序列的一般ARIMA模型也称为ARIMAX模型。Box和刁锦寰提出ARIMAX模型。例子1)9.11事件对道琼斯指数的影响2)广告对销售量的效应3)美国月批发物价指数对零售价指数的影响4)1960年前后时间X1、冬季X2、夏季X3对臭氧数据Yt5)固有股减少X1、道琼斯指数X2、石油价格X3对上证指数数学模型设)(itx,ty是时间序列,(i=1,…,k)tjktjkjjtjjjtjjtaBBxBvxBvxBvy)()(0)()(0)2()2(0)1()1(其中,ppqqBBBBBB111)(,1)(称为传递函数模型,)(jtx称为输入因子(干预因子),ty称为输出因子。Xt(1)Xt(2)ta…tyxt(k).注:为减少参数个数,通常考虑简化为:tktkbktbtaBBxBBBxBBByk)()()()()()()()1(111其中iiiipipiiiqiqiiiBBBBBB)()(1)(0)()(1)(0)(,)((i=1,……,k)=称上述模型为ARIMAX模型,又称为带有干预序列的ARIMA模型或动态回归模型。这个模型把相应序列表示为随机波动的过去值和其它序列(称为输入序列)的过去值的结合。响应序列也称为相依序列或输出序列,输入序列也称为独立序列或预测因子序列。二、两个独立滑动平均过程之和tw它是阶数分别为2,1qq的两个独立平均过程之和即tttbBaBw)()(21ttba,均是均值为零的白噪声且相互独立记},max{21qqq可得tw的自相关函数j当qj时为零故tw可表示成q阶的单一滑动平均过程ttuBw)(3tu为零均值白噪声(证明可参考Hamiton《时间序列分析》)三、附加噪声对一般模型的影响考虑ARIMA),,qdp(ttdaBzB)()(设tz本身不可观测,只能观测到tttbzZtb表示有关的附加的噪声,则对tZ有tdttdbBaBZB)()()(若对tb有),0,11qpARMAbt(满足即ttBbB)()(11独立白噪声与tta则有tdttdBBaBBZ)()()()((B)B)(111},max{,111dqpqpQppPttduBzB)()(22),,(QdPARIMA四、带有回归项和时间序列误差的模型ttktttNXXXWk...2121),...,2,1(nttktXX...1为解释变量,而误差tN是一个ARMA(p,q),ttaBNB)()(生成。该式可以写为:)cov(,NVVXW。在传统模型中我们有IV2,的最小二乘估计为WXXX1)(ˆ,并具有性质12)()ˆcov(XX。但在自相关误差的情形下,这种性质不再成立。此时最小二乘估计的协方差阵为112)()()ˆcov(XXVXXXX。因此一般的样本性质和统计推断的方=1法,如关于估计的通常标准差公式,t-统计量及置信区间等就不再有效。例:tttttaBNNxw)1(,1,tN的子协方差为21220,)1(aa。1的最小二乘估计为ntnttttxwx1121/ˆ,它的方差为:)](21[)()(2)()ˆvar(11212021211111202121xrxxxxxxVXXnttnttntttnttntt如果模型中误差tN为不相关的,我们会取01,而这会引起明显的错误推断。当对时间序列数据拟合回归模型时,总是需要考虑误差项存在自相关的可能性的。通常,对于误差tN识别一个恰当模型的可行方法是首先得出最小二乘估计ˆ,然后再得到相应的回归模型的残差ktkttttXXXWNˆ...ˆˆˆ2121这个残差序列可以用通常的时间序列方法来考察,这样可以对误差项建立一个实验性的模型。WXXX1)(ˆ是渐近最优的,由此计算的自相关、偏相关等也是渐近最优的。而一般最优的线性估计,也称为广义最小二乘估计为WVXVXXG11)(ˆ。在实际中,根据噪声项tN确定具体的ARMA模型,可以确定N协方差V的具体形式,并可找到一个下三角阵P,使得22/,aaPPVIVPP。令XPXWPW**,得到广义最小二乘估计为*/*1*/*)(ˆWXXXG。因为tN的时间序列模型中的参数ii,是未知的,所以必须在计算Gˆ和极大似然估计以及模型中的参数ii,之间迭代。(BOXJENKINSp415-420)三、附加噪声的传递函数模型干扰或噪声tN和tX的水平独立,且添加到有关X的影响上,它们可以写成干预序列tttN)()B(YXBBb如果噪声模型可以用ARIMA(p,d,q)过程表示ttaBBN)()(1这里ta是白噪声,则模型最终可以写成:tbaBBXBB)()()()B(Y1ttNtYXtt,...,2,1),,(互协方差和互相关系数一般地,一个双变量随机过程无须是平稳的,但适当进行差分后的过程),(ttyx是平稳的,这里tDttdtYyXx,。)])([()(xktxtxxxxEk)])([()(yktytyyyyEk)])([()(yktxtxyyxEk)])([()(xktytyxxyEk一般)()(kkyxxy,但)()(kkyxxy称之为互协方差,和互相关系数yxxyxykk)()(一般)()(kkxyxy,它关于0k不是对称的。(P470)互协方差和互相关的估计假设对原始的输入输出序列作了d次差分后有n=N-d对数值),(ttyx,那么滞后k互协方差系数的估计值为:,...2,1,0,))((1,...2,1,0,))((1)(11kxxyynkyyxxnkckntkttkntkttxy,...2,1,0,)()(ksskckryxxyxy传递函数模型的识别对预白噪化输入的传递函数模型的识别如果系统的输入是白噪声,则识别过程将很大程度被简化。假设适当差分后的输入过程是平稳的,并且可由ARMA模型来描述,那么可以对tx用通常的识别和估计方法得到一个模型:ttxxxBB)()(1该式把相关的输入序列转化为非常接近不相关的白噪声t。同时我们可以由t的平方和得到2a的估计2as。如果我们对ty使用同样的变换得到:txxtyBB)()(1则原模型可以写为:tttBv)(其中转换后的噪声序列有txxtnBB)()(1将上式两边同时乘以kt并取数学期望,我们得到:2)(kvk于是)()(2kkvk因此,将输入白燥化后,在白燥化输入和经相应变换的输出之间的互相关函数直接与脉冲相应函数成正比。在实际中我们并不知道理论互相关函数)(k,故我们可以用其估计量替代:sskrvk)(ˆ噪声模型的识别假设模型可以写成(如果必要,做适当的差分之后)tttnxBvy)(tdtNn用前面所述方法给出传递函数的初步估计后,噪声序列的估计由下式得到:tttxBvyn)(ˆˆ)(ˆBv还可以用初步识别所确定的试用传递函数模型来替代。于是btttxBByn)(ˆ)(ˆˆ1tnˆ的计算:先通过bttxByB)(ˆ)(ˆ写为sbtsbtrtrttxxyyyˆ...ˆˆˆ...ˆˆˆ111递推计算出bttxBBy)(ˆ)(ˆˆ1,然后由tttyynˆˆ计算噪声序列。噪声的识别还可以利用经过白燥化后的输入和输出的相关函数来进行,即按照下列方法进行。假如输入可以被完全白燥化,tttBv)(txxtnBB)()(1如果t可以找到一个随机模型,那么由上式可以对tn,从而对tN导出模型。记ttBvu)(,便有tttu,同时由于给出了ttnx,独立性的假设,从而ttu,也独立。)()()(kkkuu由此计算得到)(),(kkuu模型识别后可以用条件平方和法进行参数的计算。干预模型ttbtN)B(B)B(WY其中t1t)()(ybBBWB代表干预事件的影响tN是噪声它表示在没有干预影响时序列tY的变化一般可设tN是一个ARIMA(p,d,q)即ttaBNB)()(干预序列分为脉冲式干预序列和持续式干预序。列。脉冲式干预序列:持续式干预序列:t一般有两种通用的形式①10)(TtSTtTt它表示在时刻T之后干预的影响仍保留下去的情形②10)(TtpTtTt它可表示暂时或瞬间干预的影响干预分析模型可表示为)()(BBBWYbtt+taBB)()(持续式干预序列需预白噪声化,即先将干预序列拟合ARIMA模型。预白噪声:用途:①对非脉冲干预因子,有可能计算机不好计算②估计干预因子对应的传递函数的推移算子有关附加异常值与新息异常值模型1.设tZ~ARIMA(p,d,q)ttaBZB)()(若在时刻T附加异常值,则有tTttTttaBBWPZWPY)()()()(称之为附加异常值模型(AOModel)2.新息异常值(IO)模型tY=)()()()(tTtaWPBB[〈〈统计诊断引论〉〉韦博成东南大学出版社]第三节SAS实现计算一、差分输入序列的差分由CROSSCORR=选项来指定,并且如同相应序列的差分那样工作。例如Identify=var=y(1)crosscorr=(x1(1)x2(1))表示对Y作一阶差分,对X1,X2作一阶差分,在随后的ESTIMATE语句中,任何在INPUT=选项中用到X1和X2时,这些名字指差分序列。二、使用输入序列为了使用输入序列的过去值和过去误差,你也可以使用被称为输入序列的其它序列的当前和过去值来对响应序列建模。此时要在identify语句中。的crosscorr=选项中列出输入序列,并在随后的ESTIMATE语句中用INPUT=选项说明它们是如何进入模型的。Procarimadata=a;Identifyvar=salescrosscorr=price;Estimateinput=price;本例使用一个称作price的序列来帮组对sales建模。执行了一个sales关于price的简单线性回归,生成和procreg过程相同的结果。由这些语句所得出的估计模型的数学形式为:tttaXY0模型中可以使用任意多个输入变量,例如:Procarimadata=a;Identifyvar=salescrosscorr=(priceincome);Estimateinput=(priceincome);由这些语句所得出的估计模型的数学形式为:ttttaXXY,20,2,10,1三、延迟和差分输入序列procarimadata=a;identifyvar=sales(1)crosscorr=price(1);estimateinput=(1$price);run;这些语句给出估计模型tttaXBYB10)1()1(其中price的一阶滞后由input=(1$price).说明。四、带ARMA误差的回归可以把输入序列与关于误差的ARMA模型结合起来。建立回归模型,但回归模型的误差(噪声序列)假定是一个时间序列模型。procarimadata=a;identif