■■物理雙月刊(卅卷三期)2008年六月257物理專文金融時間序列的相位統計分析文/吳明佳本文介紹我們最近引進的一種研究時間序列的方法。該方法係基於時間序列的瞬時相位包含豐富的資訊,藉由統計相位的分佈可以研究該時間序列之性質的概念。我們應用此一方法研究美國道瓊工業平均(DJIA)指數及那斯達克(NASDAQ)指數從1997年到2003年的日內(intraday)資料,以及美元/日圓(USD/JPY)匯率與美元/馬克(USD/DEM)匯率從1986年到1996年的日(daily)資料,發現金融時間序列是一種不同於其他非穩態的(nonstationary)時間序列的類別。兩股市指數的獲利率(return)時間序列的相位關聯分析顯示在2001年9/11攻擊事件之後,兩股市的交易活動的關聯性變強;而兩匯率的相位關聯分析則顯示兩者在1990年之前的關聯比之後強,此一現象可能與東西德統一及日本的泡沫經濟有關。簡介金融市場是一種複雜的動力學系統,其性質可以經由連續的記錄過程來記錄,其特徵可以由所得的時間序列來描述。對於這類動力學系統,大部分基於實驗數據的研究多聚焦於現象上的解釋,因此數據的分析方法在獲得研究結果與結論的過程中扮演重要的角色,不適當的方法可能導致錯誤的結果。然而,實驗數據通常混著雜訊,且一般是非線性的(nonlinear)與非穩態的(nonstationary),過去廣泛使用的處理方法是採取某些過濾器從實驗資料中過濾雜訊。由於這些方法多要求原始的時間序列是穩態及/或線性的,在沒有嚴格的限制條件可用來判定資料中哪些是本質的動力學,哪些是外在因素與雜訊的貢獻的情況下,這些過濾器的有效性是值得懷疑的。因此,如何從處理實驗數據中取出重要的分量是這類研究的重要課題。在本篇文章中,我們將回顧我們最近研究金融時間序列[1,2,3,4]與生理信號[4,5,6,7]所引進的「相位統計」方法。該方法係基於相位包含豐富的資訊,藉由統計相位的分佈可以研究時間序列之性質的概念。為了實現相位統計,我們採用希爾伯特-黃轉換(Hilbert-HuangTransform,HHT)[8]來定義與計算瞬時相位。HHT將實驗的時間序列分解為若干本質模態函數(IntrinsicModeFunctions,IMFs),經由計算這些IMF的瞬時相位,並對其做統計分析,從相位與相位差的分佈中,我們可以得到時間序列的特性與關聯。下文中,我們將簡單地介紹這個方法,並以美國道瓊工業平均(DJIA)指數與那斯達克(NASDAQ)指數(index)的日內(intraday)資料及美元/日圓(USD/JPY)匯率與美元/馬克(USD/DEM)匯率的日(daily)資料分析為例,說明相位統計方法的應用。相位統計方法所謂「相位統計」方法,是對實驗數據的時間序列計算瞬時相位,以獲得瞬時相位的時間序列,然後吳明佳中央大學數據分析方法研究中心助理研究員中央研究院物理研究所合聘助研究員中央大學物理學系兼任助理教授e-mail:mcwu@ncu.edu.tw;mcwu@phys.sinica.edu.tw■■物理雙月刊(卅卷三期)2008年六月258物理專文對其作統計分析。由於對一般的時間序列計算相位可能會遇到無法計算出正確相位的問題[8],在實際計算相位之前通常必須對時間序列做前置處理。上文提到的HHT正是一種可以分解實驗時間序列為IMF,並透過希爾伯特轉換(Hilberttransform)得到正確相位的方法。HHT係由中央研究院黃鍔院士引進,是一種適於分析非線性與非穩態時間序列的方法[8]。該轉換包含兩個部分,第一個部分是經驗模態分解(EmpiricalModeDecomposition,EMD),第二部分是希爾伯特轉換。不同於傳統的濾波器,EMD是一種從實驗數據中擷取物理韻律的有效方法,此一優點使研究人員較容易對時間序列給出物理的解釋。HHT的EMD係基於任何時間序列可以由簡單振盪的本質模態組成的假設,其基本概念是以實驗數據本身的特徵時間尺度來分解數據[8],如此一來,分解便是適應性的(adaptive)。EMD分解的過程是利用篩選(sifting)資料的方式來產生IMF,所得的IMF是一組表現良好的本質模態,其相對於平均值是對稱的,並且具有相同的極值與跨零(zero-crossing)數目。因此,所有的IMF都具有良好的希爾伯特轉換。EMD產生IMF的演算法相當簡單,主要包含兩個步驟[5,8]:步驟一:找出實驗數據()xt中局部的極值,並以立方曲線(cubicsplineline)連接這些局部的極值,其中局部極大值的連線形成上包絡線()Ut,局部極小值的連線形成下包絡線()Lt。兩包絡線包住所有資料點。上下包絡線的平均值1()mt為1()()().2UtLtmt+=(1)將原來的()xt資料減去平均值1()mt,我們可以得到一個分量1()ht,11()()().htxtmt=−(2)如果所得的分量1()ht是對稱的,且所有局部極大值均為正值而所有局部極小值均為負值,則其為IMF。如果1()ht不是一個IMF,則重複上面的步驟直到擷取出來的信號是IMF。在這個過程中,1()ht將被當作是原始資料並重複步驟11111()()().hthtmt=−(3)如果函數11()ht仍不滿足IMF的要求,則重複上述步驟k次直到所得之函數滿足某一可以接受的容差,結果11(1)1()()().kkkhthtmt−=−(4)步驟二:若所得的時間序列是IMF,則將其標示為11()kcht=。接著把原始資料減去第一個IMF,所得之差1r11()()()rtxtct=−(5)係一殘餘值。將殘餘值1()rt當作原始數據,我們可以再一次運用上述步驟一的程序。按照步驟一與步驟二的程序,我們持續找到更多的IMFic直到最後一個。最後的殘餘值是一個常數或是單調的趨勢。如此,我們可以得到1()(),ninixtctr==+∑(6)1()()().iiirtctrt−−=(7)IMF的瞬時相位計算可以藉由對其實施希爾伯特轉換來獲得。對於第r個分量()rct,希爾伯特轉換的程序包括計算()rct的共軛對,即(')1()','rrctytPdtttπ∞−∞=−∫(8)其中P指示柯西主值(Cauchyprincipalvalue)。根據此一定義,兩函數()rct與()ryt構成一複數共軛並定義一解析信號()rzt()()()()(),ritrrrrztctiytAteφ=+≡(9)其中振幅()rAt與瞬時相位()rtφ定義為221/2()[()()],rrrAtctyt=+(10)1()()tan.()rrryttctφ−⎛⎞=⎜⎟⎝⎠(11)■■物理雙月刊(卅卷三期)2008年六月259物理專文因此,我們可以根據方程式(8)與(11)來計算瞬時相位。對於統計相位,我們進一步定義機率密度函數(Probabilitydensityfunction)。我們將機率密度函數P定義為一測量量ρ的歸一化機率分佈,其滿足()1,Pdρρ∞−∞=∫(12)其中測量量ρ可以是相位或稍後定義的相位差。美國道瓊工業平均與那斯達克指數分析我們首先介紹DJIA與NASDAQ指數時間序列的分析[1]。兩股市的數據係取自TradeandQuotation(TAQ)資料庫,使用的日內10分鐘取樣週期的數據包含兩股市指數從1997年8月1日至2003年12月31日,從9:30至15:50共計六個半小時的交易資料,總數包含60,177個資料點。圖一是兩股市的指數走勢圖。19981999200020012002200320040500010000NASDAQYearIndexDJIA圖一:1997年8月1日至2003年12月31日期間道瓊工業平均指數與那斯達克指數的變化。對於金融時間序列,我們可以定義獲利率(return)。由於股市長期的趨勢變化可能很大,一般使用對數形式的獲利率定義,即對於由時間序列()Yt表示的指數,其於時間τ期間的獲利率可定義為()()()lnln,RtYtYtττ=−−(13)其中τ是原始取樣時間單位tΔ(=10分鐘)的複數倍。由於時間尺度τ(以tΔ為單位)是用來取樣獲利率的參數,我們可以對()Rtτ採取不同的τ值以檢視日內取樣頻率的獲利率的特性。因為一天的交易時間有390分鐘,為了有整數個取樣資料點,我們採取10,30,130,390τ=分鐘來取樣獲利率時間序列()Rtτ。我們首先將10分鐘取樣頻率的時間序列()Rtτ當作原始數據,並應用EMD將()Rtτ分解成14個IMF,結果如圖二(a)所示,其中僅顯示前3個IMF。應注意的是,經由EMD分解的IMF的數量與原始時間序列的特性有關。從這些IMF的性質,可以了解分解的物理意義。首先我們比較圖二(a)中的時間序列()Rtτ與IMF1c及2c。根據方程式(6)與(7),從()Rtτ分解出來的每一個IMF都是獨立的,且IMF之間互相正交。IMF1c與2c的主要差異在於其各自的頻率範圍不同:1c是在篩選過程中從()Rtτ分離的第一個分量,其具有14個IMF中最高的頻率範圍。因為時間序列Rτ(t)的細部結構是由最高頻率的分量來描述,因此1c抓住了獲利率時間序列()Rtτ的特徵。-0.0050.0000.005-0.0050.0000.005-0.0050.0000.0050100200300400500-0.0050.0000.00576007800800082008400R(t)c1c2t(10mins)c3Y(t)(a)-1.0-0.50.00.51.00.20.30.40.50.60.70.8Pϕ(π)c1c2c3(b)圖二:(a)DJIA日內指數與其對應之以10分鐘為取樣時間間隔的獲利率時間序列,及前3個IMF;(b)相位的機率密度函數。圖片取自參考資料[1]。■■物理雙月刊(卅卷三期)2008年六月260物理專文接下來,我們根據方程式(8)、(10)與(11)計算IMF的振幅與瞬時相位,並統計其相位分佈,結果如圖二(b)所示。我們發現除了這些時間序列的第一個IMF以外,其他IMF的相位都是隨機分佈的,亦即所有可能的相位(1πφπ−≤≤)都有相同的機率。第一個IMF的振幅的機率密度函數是一般的馬克斯威爾-波茲曼(Maxwell-Boltzmann)分佈,而相位分佈則集中於10.50.5πφπ−≤≤。這種相位分佈聚集化的現象源自於指數時間序列的突變結構,因而時間序列的振盪週期接近取樣週期τ[1]。同樣地,我們對取樣頻率為30,130,與390分鐘的時間序列應用EMD,計算振幅變化與瞬時相位,然後統計其振幅與相位分佈。圖三(a)與三(b)分別顯示這些時間序列的第一個IMF的振幅與相位分佈。振幅的機率密度函數仍是一般的馬克斯威爾-波茲曼分佈,相位分佈也仍有聚集化的現象。這個現象存在於日內資料的所有取樣時間尺度(10分鐘的倍數),甚至存在於日間(interday)的時間週期(日,週,甚正更低的頻率),而與股市的組成無關。0.0000.0050.0100.0150.0200.0250.0300100200300400500600PA110mins30mins130mins390mins(a)-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.00.20.40.60.8Pϕ1(π)10mins30mins130mins390mins(b)圖三:以10,30,130,390分鐘取樣之DJIA指數之獲利率的第一個IMF的(a)振幅機率密度函數與(b)相位機率密度函數。圖片取自參考資料[1]。我們以用相同的方法分析NASDAQ指數時間序列,結果發現除了尺度上有些差異外,NASDAQ指數的獲利率的第一個IMF具有相同的相位分佈。值得注意的是,這表示相位分佈的聚集化現象是股市時間序列的特性。從另一個觀點來看,相位聚集化對應的突變的結構隱含著指數不可預測與隨機的性質,這與規則的訊號或準規則的訊號不同。舉例來說,我們比較股市時間序列、匯率時間序列與典型的呼吸訊號的相位分佈,結果如圖四