金融时间序列分析第2部分时间序列分析基础51ARMA建模过程

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

金融时间序列分析陆贵斌2012年10月建模过程内容第1部分ARMA建模第2部分ARIMA建模第3部分ARCH建模第4部分协整建模一、ARMA建模建模步骤模型识别参数估计模型检验模型优化序列预测建模步骤平稳非白噪声序列计算样本相关系数模型识别参数估计模型检验模型优化序列预测YN计算样本相关系数样本自相关系数样本偏自相关系数nttkntkttkxxxxxx121)())((ˆDDkkkˆˆˆ模型识别基本原则选择模型拖尾P阶截尾AR(P)q阶截尾拖尾MA(q)拖尾拖尾ARMA(p,q)kkˆk模型定阶的困难因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的或仍会呈现出小值振荡的情况由于平稳时间序列通常都具有短期相关性,随着延迟阶数,与都会衰减至零值附近作小值波动当或在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?kkˆkkˆkˆkkˆkˆkkˆ样本相关系数的近似分布BarlettQuenouillennNk,)1,0(~ˆnnNkk,)1,0(~ˆ模型定阶经验方法95%的置信区间模型定阶的经验方法如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。阶数为d。22ˆPr0.9522ˆPr0.95kkknnnn例2选择合适的模型ARMA拟合1950年——1998年北京市城乡居民定期储蓄比例序列。序列自相关图序列偏自相关图拟合模型识别自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾所以可以考虑拟合模型为AR(1)例2美国科罗拉多州某一加油站连续57天的OVERSHORT序列序列自相关图序列偏自相关图拟合模型识别自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数1阶截尾偏自相关系数显示出典型非截尾的性质。综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为MA(1)例31880-1985全球气表平均温度改变值差分序列序列自相关图序列偏自相关图拟合模型识别自相关系数显示出不截尾的性质偏自相关系数也显示出不截尾的性质综合该序列自相关系数和偏自相关系数的性质,可以尝试使用ARMA(1,1)模型拟合该序列参数估计待估参数个未知参数常用估计方法矩估计极大似然估计最小二乘估计2pq211,,,,,,,pq矩估计原理样本自相关系数估计总体自相关系数样本一阶均值估计总体均值,样本方差估计总体方差111111ˆ(,,,,,)ˆ(,,,,,)pqpqpqpq1ˆniixxn22212212ˆˆˆ1ˆˆ1ˆxqp例4:求AR(2)模型系数的矩估计AR(2)模型Yule-Walker方程矩估计(Yule-Walker方程的解)ttttxxx22112112121112121ˆˆ1ˆ1ˆ212122ˆ1ˆˆˆ例5:求MA(1)模型系数的矩估计MA(1)模型方程矩估计11tttx2201111220111(1)11211ˆ2ˆ411ˆ例6:求ARMA(1,1)模型系数的矩估计ARMA(1,1)模型方程矩估计1111ttttxx11111120111211()(1)1211221221121ˆˆ21,2,242,24ˆ,ˆˆˆccccccc对矩估计的评价优点估计思想简单直观不需要假设总体分布计算量小(低阶模型场合)缺点信息浪费严重只用到了p+q个样本自相关系数信息,其他信息都被忽略估计精度差通常用作极大似然估计和最小二乘估计迭代计算的初始值极大似然估计原理在极大似然准则下,认为样本来自使该样本出现概率最大的总体。使得似然函数(即联合密度函数)达到最大的参数值},,,);~(max{)~,;ˆ,,ˆ,ˆ(21121kkxpxxL似然方程0)~;~(~0)~;~(2xlxl对极大似然估计的评价优点充分应用了每一个观察值所提供的信息,估计精度高优良的统计性质:估计的一致性、渐近正态性和渐近有效性缺点需要假定总体分布最小二乘估计原理使残差平方和达到最小的那组参数值即为最小二乘估计值ntqtqtptpttxxxQQ121111)(min)~(min)ˆ(对最小二乘估计的评价优点最小二乘估计充分应用了每一个观察值所提供的信息,因而它的估计精度高缺点需要假定总体分布模型检验模型的显著性检验整个模型对信息的提取是否充分参数的显著性检验模型结构是否最简模型的显著性检验目的检验模型的有效性(对信息的提取是否充分)检验对象残差序列判定原则一个好的拟合模型:能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列反之:残差序列中还残留着相关信息未被提取,拟合模型不够有效假设条件原假设:残差序列为白噪声序列备择假设:残差序列为非白噪声序列0120,1mHm:mkmHk,:至少存在某个1,01检验统计量LB统计量221ˆ(2)()~()mkkLBnnmnk例检验1950年——1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性残差白噪声序列检验结果延迟阶数LB统计量P值检验结论65.830.3229拟合模型显著有效1210.280.50501811.380.8361参数显著性检验目的检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简假设条件检验统计量mjHHjj10:0:10)(~)~(ˆtmntQamnjjjj例检验1950年——1998年北京市城乡居民定期储蓄比例序列极大似然估计模型的参数是否显著参数检验结果检验参数t统计量P值结论均值46.120.0001显著6.720.0001显著1例:对OVERSHORTS序列的拟合模型进行检验残差白噪声检验参数显著性检验检验参数t统计量P值结论均值-3.750.0004显著10.600.0001显著延迟阶数LB统计量P值结论63.150.6772模型显著有效129.050.61711模型优化问题提出当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列,但这种有效模型并不是唯一的。优化的目的选择相对最优模型例:拟合某一化学序列序列自相关图序列偏自相关图拟合模型一根据自相关系数2阶截尾,拟合MA(2)模型参数估计模型检验模型显著有效三参数均显著ttBByield)31009.032286.01(17301.512拟合模型二根据偏自相关系数1阶截尾,拟合AR(1)模型参数估计模型检验模型显著有效两参数均显著Byieldtt42481.0126169.51问题同一个序列可以构造两个拟合模型,两个模型都显著有效,那么到底该选择哪个模型用于统计推断呢?解决办法确定适当的比较准则,构造适当的统计量,确定相对最优AIC准则最小信息量准则(AnInformationCriterion)指导思想似然函数值越大越好未知参数的个数越少越好AIC统计量)(2)ˆln(2未知参数个数nAICSBC准则AIC准则的缺陷在样本容量趋于无穷大时,由AIC准则选择的模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多SBC统计量))(ln()ˆln(2未知参数nnSBC例用AIC准则和SBC准则评判两个拟合模型的相对优劣结果AR(1)优于MA(2)模型AICSBCMA(2)536.4556543.2011AR(1)535.7896540.2866序列预测线性预测函数预测方差最小原则10titiixCx()ˆ()min()tlxttVarelVarelMA序列分解111111ˆ()()tltltlltltltttxGGGGelxl预测误差预测值)]([),,()(ˆ),,(11leVarxxxVarlxxxxEtttltttlt误差分析估计误差期望方差1111)(tlltlttGGle1022)]([liitGleVar0)]([leEtAR(p)序列的预测预测值预测方差95%置信区间)(ˆ)1(ˆ)(ˆ1plxlxlxtpt22121)1()]([ltGGleVar12221112ˆ()1tlxlzGG例已知某超市月销售额近似服从AR(2)模型(单位:万元/每月)今年第一季度该超市月销售额分别为:101,96,97.2万元请确定该超市第二季度每月销售额的95%的置信区间12100.60.3,~(0,36)tttttxxxN例:预测值计算四月份五月份六月份12.973.06.010)1(ˆ233xxx432.973.0)1(ˆ6.010)2(ˆ333xxx5952.97)1(ˆ3.0)2(ˆ6.010)3(ˆ333xxx例:预测方差的计算GREEN函数方差01102112010.60.360.30.66GGGGGG6416.64)()]3([96.48)()]2([36)]1([222212032212032203GGGeVarGGeVarGeVar例:置信区间公式估计结果))]([96.1)(ˆ,)]([96.1)(ˆ(3333leVarlxleVarlx预测时期95%置信区间四月份(85.36,108.88)五月份(83.72,111.15)六月份(81.84,113.35)例北京市城乡居民定期储蓄比例序列拟合与预测图MA(q)序列的预测预测值预测方差qlqllxqliiltit,,)(ˆqlqlleVarqlt,)1(,)1()]([222122121例已知某地区每年常驻人口数量近似服从MA(3)模型(单位:万):最近3年的常驻人口数量及一步预测数量如下:预测未来5年该地区常住人口的95%置信区间3212.06.08.0100tttttx年份统计人数预测人数200210411020031081002004105109例随机扰动项的计算4109105)1(ˆ8100108)1(ˆ611010

1 / 77
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功