小波时间序列对非平稳信号中突变点的辨识与处理陈帅,岳迎春,徐巍,游振兴,王昌言(中国地质大学信息工程学院,武汉430074)【摘要】在本文中,利用小波时间序列模型找出非平稳信号中突变的位置,通过分析把突变点分为两类。若对两类突变点作适当的插值处理,既可保留原始数据发展趋势的真实性也提高了预测模型的精度。文中把迭代模型的预测值去逼近突变点值和单纯地用Pchip插值、spline插值、linear插值作为内插值进行了对比研究,得出了各自的优缺点。【关键词】小波分析;时间序列分析;突变点;内插值【中图分类号】P208【文献标识码】A【文章编号】1009-2307(2013)05--Wavelettimeseriesmodelstoidentifyandprocesstothemutationpointinnon-stationarysignalChenShuai,YueYingchun,XuWei,YouZhenxing(FacultyofInformationEngineering,ChinaUniversityofGeosciences,Wuhan430074,China)Abstract:Inthispaper,theuseofwavelettimeseriesmodelstoidentifythelocationofthemutationpointinnon-stationarysignalandmutationpointisdividedintotwocategoriesbyanalysis.Twotypesofpointmutationswereprocessedwithappropriateinterpolationapproachnotonlyhasretainedtheauthenticityoftherawdatabutalsotoimprovethepredictionaccuracyofthemodel.Thearticle,bycomparingpredictivevalueoftheiterativemodeltoapproximatethemutationpointvaluewithsimplyusepchip,splineandlinearinterpolationastheinterpolation,comestotheirownadvantagesanddisadvantages.Keywords:Waveletanalysis;timeseriesanalysis;mutationpoint;interpolated1引言在实际数据处理中,往往会碰到一些问题,例如在数据传输,采样及记录过程中发生信息失真或者丢失,或者变形体本身受到各种因素影响发生变态的变形,这些都会使数据在变化趋势中发生突变。检测突变点的方法有很多:在计量经济学中基于马尔科夫链蒙特卡罗模拟的技术下的贝叶斯检验法【1】,在水文时间序列中突变点的检测有Mann-kendall方法、有序聚类分割法、最小方差法和极大似然法、参数假设检验、非参数假设检验,以及基于贝叶斯推断理论的Lee和Heghinian方法【2】,“3σ准则”法【3】,运用人工免疫系统寻找斜坡演化过程中的突变点【4】,在线性半截多项式的前提下对时间序列数据分段检验突变点【13】。最近比较热门的小波分析理论,在突变信号检测方面的应用【5】中也介绍了检测突变点的方法。方法虽多,但是在数据分析中如何正确地处理突变点才是至关重要的。本文将根据工程实例介绍小波时间序列模型对非平稳信号中突变点的处理。2小波时间序列对突变点的辨别与处理在介绍小波时间序列处理非平稳信号之前,简单地介绍小波时间序列的基本概念。小波变换的基本思想是用一族函数去表示或逼近一信号的或函数。连续性小波变换(CWT):设2()()tLR称()t为一个基小波或母小波(MotherWavelet)。1/2,()()abtbtaa(1)其中a0称为尺度因子,bR称为平移因子。对于任意的函数信号2()()ftLR,其小波变换为该函数与小波的函数的内积:1/2,(,)(),()()()fabRtbWabfttaftdta(2)离散型小波变换离散化是将a,b变换,取0jaa,00jbkba(1a,0bR,j、kZ),代入(1)式中得到离散的小波函数。时间序列的基本思想是:对于平稳、正态、零均值的时间序列{tx},若tx的取值不仅与其前n步的各个观测值1tx,2tx,3tx,,tnx有关,而且还与前m步的各个干扰1t,2t,3t,,tn有关。通过观测值和干扰项建立时间序列模型。时间序列模型ARMA(n,m):112211+ttttnttmtmtxxx(3)称ARMA(n,m)为自回归滑动平均模型。特殊地,当1=0时,模型变为AR(n)自回归模型,当1=0时,模型变为MA(m)滑动平均模型。1,2,,m,2a这些未知数都是由观测值估计算出。在实际数据处理中,若数据信号在变化趋势中存在一些突变点。可将这些突变点分为两类:一类是连续变化的突变点,变形体因自身形变发生突变,信号由正常的监测系统传递出来,整个数据序列连续,突变点与其前后数据的相关性大;另一类是离散间断的突变点,因在数据传输,采样及记录过程中发生信息失真或者丢失,或者是监测系统被损坏,信号由监测系统传递出来,整个数据序列间断,突变点与其前后数据的相关性小。这两类突变点也可以称为奇异值。如果能及时地发现这些突变点且判断其形成的原因,在变形监测中具有重要的意义。小波时间序列建立模型的步骤可分为八步:1.突变点检测,小波消噪预处理,2.数据序列等时间间隔处理,3.数据序列的平稳性、正态性、零均值检验,4.自相关性分析与模型识别,5.模型的参数估计,6.模型检验,7.突变点的辨识及处理,8.模型的预测。根据一般理论和实际经验,需要反复试验4、5、6步,才能得出最好的预测模型。在本文中根据BOX的建模方法建立时间序列模型。3实验与分析本文选取了一组含有突变点的地铁路基沉降观测数据序列,通过小波分析可以判断突变点分别位于第27、33、34期。-4-2024-20246255075100125ResidualActualFitted图1特征提取趋势图Figure.1FeatureExtractiontrends对原始数据建立小波时间序列模型,特征趋势提取见图1。模型优化准则数据:AIC=1.704498,SBC=1.788943,SSR=0.433366。从图1可看出模型对突变点前后期数据的发展趋势提取失败。模型拟合时,突变还有继续向后期数据传递的趋势,与实际发展趋势相违。发生这种情况的原因归功于突变点破坏了数据序列之间的相互关系。而时间序列模型正是通过数据之间的相关性建立的,故突变点前后期数据的发展趋势提取失败。为判断突变点的类型,本文采用保留一个突变值,其他突变值用插值和迭代模型的预测值代替的方法,分析各个突变点对建模的影响。针对本文数据的突变值,可以采取spline(三次样条函数插值)、linear(线性内插值)、pchip(分段三次Hermite插值)进行内插计算。在数据序列中均匀挖去15期的观测值,再用上述的三种内插方法填补,再与实际测量值比较,在本实验中pchip插值的均方根最小,内插的效果最好,故选取此方法算出的内插值代替突变点的值。实验一:对第27、34期数据用Pchip插值=1.53、Pchip插值=1.20代替建立模型。特征趋势提取见图2。模型优化准则数据:AIC=1.060372,SBC=1.127902,SSR=0.627558。-4-2024-1012345255075100125ResidualActualFitted图2特征提取趋势图Figure.2Featureextractiontrends结论1:模型对第33期突变值前后数据变化趋势提取失败,突变有向后延续的趋势。对第25期数据之前和第45期之后的数据变化趋势提取成功,说明第33期的突变值与前后期数据相关小。实验二:对第27、33期数据用Pchip插值=1.53、Pchip插值=1.22代替建立模型,特征趋势提取见图3。模型优化准则数据:AIC=1.060372,SBC=1.127902,SSR=0.600316。-3-2-10123-2-1012255075100125ResidualActualFitted图3特征提取趋势图Figure.3Featureextractiontrend结论2:模型对第34期突变值前后数据变化趋势提取失败,突变有向后延续的趋势。对第25期数据之前和第45期之后的数据变化趋势提取成功,说明第34期的突变值与前后期数据相关小。实验三:对第33、34期数据用Pchip插值=1.20代替、Pchip插值=1.22代替建立模型,特征趋势提取见图4。模型优化准则数据:AIC=0.485324,SBC=0.584450,SSR=0.793603。-2-1012-101234255075100125ResidualActualFitted图4特征提取趋势图Figure.4Featureextractiontrend结论3:建立的模型能较好地提取数据序列的整个发展趋势,说明第27期的突变值与其前后期的数据联系紧密,相关性大。实验四:以上都是用Pchip插值取代突变点值建立的模型,下面采用图1中的数据建立的初始模型对突变点预测,然后用预测值取代突变点值,反复迭代直到模型到最优为止。为简约,只列出第33、34期的突变值进行迭代建模。经五次迭代后最优模型的特征提取趋势见图5。模型优化准则数据:AIC=0.48312,SBC=0.57346,SSR=0.0.793608。-2-1012-101234255075100125ResidualActualFitted图5特征提取趋势图Figure.5Featureextractiontrend结论四:由实验得,当模型经五次迭代后,优化准则数据基本无变化,此时截止迭代。通过模型优化准则数据分析(AIC、SBC为模型优化准则数据,越小模型拟合效果越好,SSR反应了拟合值与它们平均值的总偏差,SSR越大,说明拟合效果越好【6】。),用模型迭代的预测值取代突变值比用Pchip插值取代突变值建立的模型更优,而从表2可以看出迭代模型的预测效果和实验三建立模型的预测效果基本相同。表2预测值表Table.2Thepredictedvalue期数原始值图1预测值图2预测值图3预测值图4预测值图5预测值1330.02-0.007048-0.0011230.0032390.0111110.0110591340.03-0.0033420.0027330.0095330.0046830.0046501350.05-0.0040260.0118130.0145350.0155140.0155031360.100.0097910.0319020.0345370.0373290.0373281370.200.0377680.0715170.0754360.0884210.0884131380.280.0825800.1468900.1535090.1817060.1816651390.310.1394900.2041030.2199780.2424120.2423491400.310.1773800.2274860.2427370.2502450.2501991410.260.1846100.2313430.2391990.2393700.2393761420.190.1791400.2052260.2097950.1964250.1965131430.130.1631680.1744480.1713110.1495310.149691均方根0.110.080.070.060.06通过实验分析可得出:①数据中的突变点将