1第二讲线性时间序列分析及其应用§1引言一、基本知识1\资产收益率多数金融研究是针对资产收益率而不是资产价格.Campbell,Lo,MacKinlay(1997)给出了两个使用收益率的主要理由:第一,对普通的投资者来说,资产收益率是投资机会的完全的,尺度自由的概括;第二,收益率序列比价格序列更容易处理,因为前者有更好的统计性质.单周期简单收益率:若从第t-1天到第t天持有某种资产,则简单收益率为:11tttPRP多周期简单收益率:若从第t-k天到第t天这k个周期内持有某种资产,则k周期简单收益率为:1112111011111111tttktttktttktttkktjjPRkPPPPPPPRRRR连续复合收益率:资产的简单毛收益率的自然对数称为复合收益率或对数收益率(log-return):11ln1lnlnlnttttttPrRPPP对数收益率比简单收益率有更容易处理的统计性质.2二、时间序列分析方法1.确定型时间序列分析发展水平分析(水平分析、速度分析);趋势变动分析(直线趋势分析、曲线趋势分析);周期波动分析(周期点平均法、三角函数模型法、帕森斯季节性分析);长期趋势加周期波动分析(温特斯线性与季节性指数平滑法、自适应过滤法、分解法)2.随机型时间序列分析一元时序分析、多元时序分析、可控时序分析、不可控时序分析、马尔可夫分析、贝叶斯分析三、时间序列分析与回归分析的关系不少统计文献是分别论述时间序列分析和回归分析这两个问题的。时间序列分析在于测定时间序列中存在的长期趋势、季节性变动、循环波动及不规则变动,并进行统计预测;回归分析则侧重于测定解释变量对被解释变量的影响,侧重于因果关系的分析。这似乎给人一种印象:即时间序列分析与回归分析二者之间互不相干。这里通过一个模型的构造说明时间序列分析与回归分析的差别性与内在统一性。为了测定一个时间序列中存在的长期趋势、季节变动、循环波动及不规则变动,主要构造两种模型1:一种是加法模型,即假设各构成部分对时间序列的影响是相互独立的。这样就可将时间序列Y表示为:ISCTY(1.1)1除此之外,还有一些其它的混合模型。3另外一种是乘法模型,即假设各构成部分对时间序列的影响均按比例而变化,从而可以把时间序列Y表示为:ISCTY(1.2)进行时间序列分析,如果要测定长期趋势(直线或非直线),可以通过移动平动法、时距扩大法2或数学模型法,剔除时间序列中的循环波动C、季节变动S及不规则变动I,使时间序列中的长期趋势呈现出来。例如假设一个时间序列中存在直线趋势tT,模型(1)和(2)可变化为:ISCtISCTY(1.3)或ISCtISCTY)((1.4)通过参数的OLS估计可得到,的估计值ba,,并可得出长期趋势方程为:btaT(1.5)点评:我们无法从模型(3)、(4)或(5)看出导致长期增长的趋势,即自变量t本身不能告诉我们事物为什么会随着时间推移呈现出某种趋势性的变化,这是时间序列分析的不足之处。事实上,由于事物内部蕴含着促成事物表现为长期趋势的一些基本因素,如农产量随时间的推移不断提高原因在于:优良品种的选用、高效化肥的刺激、耕作方式的改变等。真正能够起到对增长解释作用的是上述诸因素,时间变量t在此仅起到桥梁作用。不妨用,,,321XXX分别表示这些影响时间序列的基本因素,则模型(3)或(4)可以改写为:ISCxxISCtY2211(1.6)或ISCxxISCtY)()(2211(1.7)从模型(6)或(7)中可以看出:事实上已把时间序列模型转化为回归模2只适合于时期序列,因为时点序列不具有可加性。4型。不妨再假设(6)、(7)中均含有季节性变动的成份,我们可以引入虚拟变量(dummyvariable),设在其中引入季节性虚拟变量,则模型(6)和(7)可进一步地改写为:ICZZZxxY3322112211或ICZZZxxY)()(3322112211如果令ICU或ICU,则上面两式可写为:UZZZxxY3322112211(1.8)或UZZZxxY)()(3322112211(1.9)点评:通过模型(8)和(9)可以看出时间序列分析和回归分析二者存在着内在的统一性。事实上,我们正是用时间变量t代替了许许多多影响事物长期趋势的基本因素;用含有截距项及设置的虚拟变量反映了一个时间序列中存在的季节性变动;通过干扰因素项U反映了除基本因素和季节性变动影响因素以外的其它因素对时间序列的影响,并且把上述各种影响因素统一在一个回归模型中。时间序列分析和回归分析二者之间的差异也是明显的,这主要表现在:其一,回归分忻中的资料来源既可以是时间序列资料,也可以来自横截面资料;而时间序列分忻中的资料则只能来自时间序列,显然回归分析具有较大的包容性。其二,回归分析需要一组确定性变量和相应的观测值;而一元时间序列分析只需要一组随机变量的观测值。其三,即便回归分析的资料来自时间序列,我们仍然可以就影响时间序列5的诸多因素中,选择其中相关程度高、具有因果关系的影响因素进行分析。以测定解释变量对被解释变量的影响,这也是时间序列分析所不能比拟的。其四,利用时间序列资料可直接进行统计预测;而进行回归预测必须先预测解释变量的变化,然后间接地预测被解释变量的变化,当然自回归预测例外。即一个是在动态条件下进行研究的,一个是在表态条件下进行研究的。其五,模型的一些基本假定也不相同。§2确定型时间序列分析这里简单的介绍一下趋势模型1.常用的趋势模型直线模型,指数曲线,幂函数曲线,对数曲线,多项式曲线,修正指数曲线,双曲线,龚伯兹(Compertz)曲线,逻辑(Logistic)曲线,以及各种曲线的复合形式等。2.产品的生命周期分析趋势模型可以与产品市场生命周期相结合,对产品的未来市场发展前景做出相应的预测。产品市场生命周期的不同阶段具有不同的特点,可概括如下:(1)进入期:产品刚进入市场,消费者对其不熟悉,消费需求增长缓慢且不稳定,产品的普及率不超过5%。(2)成长期:产品已为人们所接受,成长前期,生产者迅速增加,产品的普及率在5%-50%左右;成长后期销量仍迅速增长,不过增长速度趋缓,普及率在50%-80%。(3)成熟期:这一时期产销量依然增长,但增长速度逐渐放慢,需求量逐步接近饱和点,普及率在80%-90%左右。成熟期后期产品开始显露衰退征6兆,产销量出现负增长。(4)衰退期:前期产销量迅速下降,市场上新产品已出现,老产品逐步被淘汰;后期老产品基本退出市场,只是由于保守用户的需求、保障老的设备需要等原因,产销量维持在某一极低的水平。我们可以选择Compertz曲线来描述产品的生命周期,对Compertz曲线:tbtLaY两边同时取对数得:abLYttlnlnln。这里,L为增长上限,当其固定时,模型参数的选取与产品市场生命周期的各个阶段存在着对应关系:参数取值与周期阶段对应关系表参数的取值范围所处的周期阶段1b0lna进入期成长前期10b0lna成长后期成熟前期饱和点进入期成长期后期成熟期前期衰退期tf(t)71b0lna衰退前期成熟后期10b0lna衰退后期【实例1】我国搪瓷面盆市场需求量预测1961年至1981年我国搪瓷面盆销售量数据见表。试用一模型来描述期生命周期变化。搪瓷面盆历年销量单位:万只年份销量年份销量年份销量196119031968480919756137196225201969520519766522196326881970429019777364196419751971393319787319196519571972457619797485196624981973542919807986196730201974542619817470解:法一(三和法)模型取对数转换成修正指数曲线:abLYttlnlnln根据修正指数曲线的三和值参数计算公式,可知212)1(1)(lnnbbSSa(2.1)8nSSSSb1223(2.2))ln11(1ln1abbSnLn(2.3)式中,1S为第一段(1961-1967)时期内tYln的和,1S=54.2835;2S为第二段(1968-1974)时期内tYln的和,2S=59.30387;3S为第三段(1975-1981)时期内tYln的和,3S=62.13237。依据(2.1)、(2.2)和(2.3)式可以计算出参数的值为:a=0.125849;b=0.921304;L=12058.05。法二(NLLS)工程方法所得到的估计结果比较粗糙,但可以将结果作为NLLS估计的初始值,再进行比较精确的估计。详见软件操作。结论:①由于10,0lnba,产品处于成长后期即成熟前期。②可以进行市场潜力的计算和挖掘。③反推衰退的时间。§3随机型时间序列分析3一、基本概念和术语1.随机过程(stochasticprocess)要把时间序列的研究提高到理论高度来认识,必须介绍随机过程。时间序列不是无源之水。它是由相应随机过程产生的。只有从随机过程的高度认识了它的一般规律。对时间序列的研究才会有指导意义。对时间序列的认识才会更深刻。自然界中事物变化的过程可以分成两类。一类是确定型过程,一类是非确定型过程。3这里所介绍只是线性时间序列分析模型。时间序列分析的最大特点是不以经济理论为依据,而是依据变量自身统计变化规律,利用外推机制描述时间序列的变化,认为历史可以重演。9确定型过程即可以用关于时间t的函数描述的过程。例如,真空中的自由落体运动过程,电容器通过电阻的放电过程,行星的运动过程等。非确定型过程即不能用一个(或几个)关于时间t的确定性函数描述的过程。换句话说,对同一事物变化过程独立、重复地进行多次观测而得到的结果是不相同的。例如,对河流水位的测量。其中每一时刻的水位值都是一个随机变量。如果以一年的水位纪录作为实验结果,便得到一个水位关于时间的函数xt。这个水位函数是预先不可确知的。只有通过测量才能得到。而在每年中同一时刻的水位纪录是不相同的。定义1(随机过程):由随机变量组成的一个有序序列称为随机过程,记为TtSstsX,);,((3.1)其中S表示样本空间,代表试验场合;T表示序数集,代表时间变化。对于每一个t,Tt,),(tX是样本空间S中的一个随机变量。对于每一个s,Ss,),(sX是随机过程在序数集T中的一次实现。可以借助图1清晰地表达出它们之间的关系:①当s和t都变动时,得到所有的曲线,这就构成一个随机过程;②当s固定,而t变动时,则得到一条曲线,它就是一个时间序列;③当t固定,而s变动时,所有曲线与直线tT的交点则构成随机变量的取值。{x11,x21,…,xT-11,xT1}{x12,x22,…,xT-12,xT2}样本空间{x1s,x2s,…,xT-1s,xTs}随机过程简记为{xt}或xt。随机过程也常简称为过程。10随机过程一般分为两类:一类是离散型的,一类是连续型的。如果一个随机过程{xt}对任意的tT都是一个连续型随机变量,则称此随机过程为连续型随机过程。如果一个随机过程{xt}对任意的tT都是一个离散型随机变量,则称此随机过程为离散型随机过程。我们只考虑离散型随机过程。连续型严(强)平稳过程随机过程平稳的离散型宽平稳过程非平稳的一阶矩:期望值,即均值,EX二阶矩:方差(Variance)用于描述随机变量相对于其期望(均值)的偏差程度,这种偏差越大,表明随机变量的取值在其均值周围的分布越分散。公式:2VarXEx三阶矩:偏度(skewness)用于衡量随机变量的概率分布