(2004年教案)辨识与自适应第五章1第五章时间序列分析与建模简介时间序列建模(Modellingviatimeseries)。时间序列分析与建模是数理统计的重要分支,其主要学术贡献人是Box和Jenkins。本章扼要介绍吴宪民和Pandit的工作,仅要求一般了解当前时间序列分析与建模的一些主要结果。参考书:“时间序列及系统分析与应用(美)吴宪民,机械工业出版社(1988)TP13/66。引言根据对系统观测得出的按照时间顺序排列的数据,通过曲线拟合和参数估计或者谱分析,建立数学模型的理论与方法,理论基础是数理统计。有时域和频域两类建模方法,这里概括介绍时域方法,即基于曲线拟合与参数估计(如最小二乘法)的方法。常用于经济系统建模(如市场预测、经济规划)、气象与水文预报、环境与地震信号处理和天文等学科的信号处理等等。§5—1ARMA模型分析一、模型类把具有相关性的观测数据组成的时间序列{xk}视为以正态同分布白噪声序列{ak}为输入的动态系统的输出。用差分模型ARMA(n,m)为(z-1)xk=(z-1)ak式(5-1-1)(2004年教案)辨识与自适应第五章2其中:(z-1)=1-1z-1-…-nz-n(z-1)=1-1z-1-…-mz-m离散传函式(5-1-2)为与参考书符号一致,以下用B表示时间后移算子即:Bxk=xk-1B即z-1,B2即z-2…(B)=0的根为系统的极点,若全部落在单位园内则系统稳定;(B)=0的根为系统的零点,若全部在单位园内则系统逆稳定。二、关于格林函数和时间序列的稳定性1.格林函数Gi格林函数Gi用以把xt表示成at及at既往值的线性组合。式(5-1-3)GI可以由下式用长除法求得:例1.AR(1):xt-1xt-1=atxBBBaBBaatttjtjj()()()1111112210)()()(111zzzG0jjtjtaGxttaBBx)()((2004年教案)辨识与自适应第五章3即:Gj=1j(显示)例2.ARMA(1,1):xt-1xt-1=at-1atG0=1;Gj=(1-1)1j-1,j1(显示)例3.ARMA(2,1)(1-1B-2B2)xt=(at-1B)at得出:G0=1G1=0G0-1G2=1G1+2G0.....Gj=1Gj-1+2Gj-2(j2)Gj为满足方程(1-1B-2B2)Gj=0的解,称为隐式表达式。该结论可推广到ARMA(n,m)模型。2.格林函数与系统稳定性当j时:Gj有界,则系统稳定;Gj衰减,则系统渐进稳定;Gj发散,则系统不稳定。例:AR(1):Gj=1j当1时,Gj衰减,渐进稳定;当=1时,Gj=1j=1,有界,则系统稳定;当1时,Gj发散,不稳定。(2004年教案)辨识与自适应第五章4例:ARMA(2,1)1和2和为特征方程的根,有1+2=1和12=2当11且21时,ARMA(2,1)渐进稳定;当1=1且21或11且2=1时,ARMA(2,1)稳定;当1=2且或1=2(两根同号)时,不稳定。由此得出ARMA(2,×)的稳定域如下图所示。tttaBBBaBBBx)1)(1(1112112211(2004年教案)辨识与自适应第五章5ARMA(2,m)的稳定域三、逆函数与逆稳定性逆函数Ij表示xt的既往值对当前值的影响,与格林函数Gj表示既往的at值对xt的影响正相反。定义:即:或:at=(1-I1B-I2B2-…)xtat格林函数xtxt逆函数at1jtjtjtaxIx)1(;)(010IxIxIxajjjtjjtjtt0)()(jjjBGBB0)()()(jjjBIBB(2004年教案)辨识与自适应第五章6系统逆稳定的条件是(B)的根1(落在单位园内)。合理的模型不仅要求是稳定的,也要求是逆稳定的,因为如果1,即意味着过时愈久的xt的老数据对xt的现在值影响愈大,这显然是不合理的。5.自协方差函数与偏自相关函数及其截尾性(略)§5—2时间序列建模及其应用一、关于吴宪民andPandit的建模策略简介ARMA(n,m)模型,当n和m设定后,可由非线心、非线性最小二乘法估计参数,并计算出残差平方总和(R.S.S.)。设定不同的n和m值,用F检验比较R.S.S.,确定合理的n、m值。穷举法(最笨的建模策略):高阶模型要做很多次搜索,计算量大。吴宪民—Pandit建模策略目的是减少建模的搜索次数。策略可概括为:10.按照ARMA(2n,2n-1)拟合模型,即当nn+1时,模型增加2阶,理由是过程的基点往往是成对的。20.检查ARMA(2n,2n-1)模型的高阶项参数2n和2n-1的绝对值是否很小,它们的置信区间是否包含零在内?若是,则进一步拟(2004年教案)辨识与自适应第五章7合下降一阶后的模型ARMA(2n-1,2n-2),并用F检验检查。30.探索进一步降低MA的阶次的可能性,即设ARMA(2n-1,m),m2n–1,用F检验确定。补充:关于参数估计误差的置信区间假定参数估计符合正态分布N(0,2)则估计值的置信区间(95%置信度)为:j1.96j参数的估计误差协方差阵为:j的置信区间为:j=1,2,…二、时间序列建模应用举例例1.太阳黑子年均数,由1749-1924年共计176个观测数据。拟合ARMA(2,1)模型,F检验ARMA(4,3)较前者没有明显改善。ARMA(2,1)模型估计结果为:参数估计95%置信区间1=1.42(1.26~1.58)2=-0.72(-0.86~-0.58)1=0.15(-0.07~0.37)n11T22TVar....Cor.CorVar)(P]))(E[()(Var96.1j(2004年教案)辨识与自适应第五章8因为1的值较小,而且置信区间包括零在内,所以进一步实验降为AR(2)模型。估计结果:参数估计95%置信区间1=1.43(1.23~1.45)2=-0.65(-0.76~-0.54)F检验表明ARMA(2,1)模型较之AR(2)模型并没有明显改善,而且2的置信区间不包含零,所以AR(2)模型合适。例2.IBM股票每天值(61.5.1~62.11.2)按照吴宪民—Pandit建模策略,得出ARMA(6,5)模型。例3.航空公司月销售额(49.1~60.12)建模结果-ARMA(13,13)一、趋势项和季节性1.恒定趋势即总的趋势保持在同一水平,均值0。引入算子,定义为:=(1-B),即xt=xt-xt-1可以消除恒定趋势。例如IBM股票模型用xt=(1-1B)at更为合适。有恒定趋势的模型有一个极点的绝对值接近为1。2.线性趋势总趋势按照线性规律增减,即模型有两个极点的绝对值接近为1的情况。用算子2=(1–B)2可以消除线性趋势,例如:2xt=(1-1B)at(2004年教案)辨识与自适应第五章93.多项式趋势有多个极点的绝对值接近于1,引入算子3=(1–B)3例如:3xt=(1-1B-2B2)at4.季节性有的时间序列按照一定的周期波动,例如月平均温度是按照12个月的周期波动的,每小时用电量按照24小时的周期变化…,称为季节性。为消除季节性的影响,引入算子:s=1–Bs例如,航空公司的模型AR(13,13)模型中的参数1~12的数值都很小,而接近于零,用周期为12的模型为合适。由于该时间序列不仅有周期为12的季节性,而且还有恒定趋势,所以用以下模型最合适:12=(1–B)(1–B12)xt=(1-1B)(1-12B12)at