报告题目:AR模型拟合课程名称:应用时间序列分析专业:统计学年级:统计121学号:1207010165学生姓名:陈江余指导教师:胡尧学院:理学院实验时间:2015年5月26日实验报告学生实验室守则一、按教学安排准时到实验室上实验课,不得迟到、早退和旷课。二、进入实验室必须遵守实验室的各项规章制度,保持室内安静、整洁,不准在室内打闹、喧哗、吸烟、吃食物、随地吐痰、乱扔杂物,不准做与实验内容无关的事,非实验用品一律不准带进实验室。三、实验前必须做好预习(或按要求写好预习报告),未做预习者不准参加实验。四、实验必须服从教师的安排和指导,认真按规程操作,未经教师允许不得擅自动用仪器设备,特别是与本实验无关的仪器设备和设施,如擅自动用或违反操作规程造成损坏,应按规定赔偿,严重者给予纪律处分。五、实验中要节约水、电、气及其它消耗材料。六、细心观察、如实记录实验现象和结果,不得抄袭或随意更改原始记录和数据,不得擅离操作岗位和干扰他人实验。七、使用易燃、易爆、腐蚀性、有毒有害物品或接触带电设备进行实验,应特别注意规范操作,注意防护;若发生意外,要保持冷静,并及时向指导教师和管理人员报告,不得自行处理。仪器设备发生故障和损坏,应立即停止实验,并主动向指导教师报告,不得自行拆卸查看和拼装。八、实验完毕,应清理好实验仪器设备并放回原位,清扫好实验现场,经指导教师检查认可并将实验记录交指导教师检查签字后方可离去。九、无故不参加实验者,应写出检查,提出申请并缴纳相应的实验费及材料消耗费,经批准后,方可补做。十、自选实验,应事先预约,拟订出实验方案,经实验室主任同意后,在指导教师或实验技术人员的指导下进行。十一、实验室内一切物品未经允许严禁带出室外,确需带出,必须经过批准并办理手续。目录第一部分:实验(或算法)原理....................................................4第二部分:实验步骤......................................................................41.AR(p)模型的参数估计...................................................42.AR(p)模型参数的最小二乘估计..................................53.AR(p)模型的定阶..........................................................64.拟合模型的检验............................................................6第三部分:算法实例与讲解......................................................6讲解......................................................................................7模型评价..............................................................................7第四部分:优点与限制..................................................................8第五部分:参考文献......................................................................8第一部分:实验(或算法)原理自回归模型(英语:Autoregressivemodel,简称AR模型),是统计上一种处理时间序列的方法,用同一变量例如x的之前各期,亦即x_{1}至x_{t-1}来预测本期x_{t}的表现,并假设它们为一线性关系。因为这是从回归分析中的线性回归发展而来,只是不用x预测y,而是用x预测x(自己);所以叫做自回归。其中:是常数项;被假设为平均数等于0,标准差等于的随机误差值;被假设为对于任何的都不变。文字叙述为:的当期值等于一个或数个落后期的线性组合,加常数项,加随机误差。第二部分:实验步骤如果时间序列}{tX是平稳AR序列,根据此序列的一段有限样本值nxxx,,,21对}{tX的模型进行统计,称为自回归模型拟合自回归模型拟合主要包括:(1)判断自回归模型AR的阶数;(2)估计模型的参数;(3)对拟合模型进行检验。1.AR(p)模型的参数估计目的:为观测数据建立AR(p)模型tptptttXXXX2211(1.1)假定自回归阶数p已知,考虑回归系数Tp),,(1α和零均值白噪声}{t的方差2的估计。数据nxxx,,,21的预处理:如果样本均值不为零,需将它们中心化,即将它们都同时减去其样本均值nttnxnx1/1,再对序列按(1.1)式的拟合方法进行拟合。对于AR(p)模型,自回归系数α由AR(p)序列的自协方差函数prrr,,,10通过Yule-Walker方程ppppppaaarrrrrrrrrrrr2102120111021唯一决定,白噪声方差2由jpjjrr102决定。实际应用中,对于较大的p,为了加快计算速度可采用如下的Levison递推方法pkkjaaaaarrarrararkjkkkkjkjkjkjkjjkjjkkkkkkkk,1ˆˆˆˆ)ˆˆˆ)(ˆˆˆ(ˆ)ˆ1(ˆˆˆ/ˆˆˆˆ,11,1,1,111,0,111,12,21220111020递推最后得到矩估计22,2,1,1ˆˆ,)ˆ,,ˆ,ˆ()ˆ,,ˆ(pTppppTpaaa上式是由求偏相关函数的公式:kkkkkkkkkaaa2121211121111导出。2.AR(p)模型参数的最小二乘估计如果pˆ,ˆ,ˆ21是自回归系数p,,,21的估计,白噪声j的估计计定义为njpxxxxpjpjjjj1),ˆˆˆ(ˆ2211通常njpj1,ˆ为残差。我们把能使npjptptttxxxxs122211}{)(α达到极小值的αˆ称为α的最小二乘估计。相应地,白噪声方差2的最小二乘估计nptptpttTTTTxxxpnpnspn121112)ˆˆ(1))((1)ˆ(1ˆyxxxxyyyα式中pˆ,ˆ,ˆ21为αˆ的p个分量。3.AR(p)模型的定阶偏相关函数的分析方法:一个平稳序列是AR(p)序列当且仅当它的偏相关函数是p步截尾的。如果}ˆ{,kkap步截尾:当pkˆ时,0ˆ,kka;而0ˆˆ,ˆppa,就以pˆ作为p的估计。4.拟合模型的检验现有数据nxxx,,,21,欲判断它们是否符合以下模型2,1,2211pptXXXXtptpttt式中}{t被假定为独立序列,且422,,0tttEEEt与},{tsXs独立。原假设0H:数据nxxx,,,21符合AR(p)。故在0H成立时,下列序列nptXXXXptptttt,,1,2211为独立序列}{t的一段样本值序列。步骤:1.首先,根据公式2,1,0),(ˆ/)(ˆ)(ˆ2,1,0,1)(ˆ01krrkpnrkkkpntkptptk计算出残差的样本自相关函数,2.利用上一章关于独立序列的判别方法,判断np,,1是否为独立序列的样本值3.根据判断结果,如果接受它们为独立序列的样本值,则接受原假设,即接受nxxx,,,21符合AR(p),否则,应当考虑采用新的模型拟合原始数据序列。第三部分:算法实例与讲解下表为某地历年税收数据(单位亿元)。使用AR(p)预测税收收入,为年度税收计划和财政预算提供更加有效、科学的依据。年份1234567税收15.215.918.722.426.928.330.5年份891011121314税收33.840.450.75866.781.283.4讲解因为税收具有一定的稳定性和增长性,且与前几年的税收具有一定的关联性,因此可以采用时间序列方法对税收的增长建立预测模型。下面为使用MATLAB建立模型并求解过程clc,cleara=[15.215.918.722.426.928.330.533.840.450.75866.781.283.4];a=a';a=a(:);a=a';%把原始数据按照时间顺序展开成一个行向量Rt=tiedrank(a)%求原始时间序列的秩n=length(a);t=1:n;Qs=1-6/(n*(n^2-1))*sum((t-Rt).^2)%计算Qs的值t=Qs*sqrt(n-2)/sqrt(1-Qs^2)%计算T统计量的值t_0=tinv(0.975,n-2)%计算上alpha/2分位数e=[1:13];b=diff(a)%求原始时间序列的一阶差分%plot(e,b,'*');m=ar(b,2,'ls')%利用最小二乘法估计模型的参数bhat=predict(m,[b';0],1)%1步预测,样本数据必须为列向量,要预测1个值,b后要加1个任意数,1步预测数据使用到t-1步的数据ahat=[a(1),a+bhat{1}']%求原始数据的预测值,并计算t=15的预测值delta=abs((ahat(1:end-1)-a)./a)%计算原始数据预测的相对误差plot(a,'b');holdonplot(ahat,'r');gridontitle('历史数据-蓝色线;预测数据-红色线')模型评价由于本案例哄第t年税收的值与前若干年的值之间具有较高的相关性,所以采用了AR模型,在其他情况下,也可以采用MA模型或者ARMA模型等其他时间序列方法。另外,还可以考虑投资、生产、分配结构、税收政策等诸多因素对于税收收入的影响,采用多元时间序列分析方法建模关系模型,从而改善税收预测模型,提高预测质量。第四部分:优点与限制自回归方法的优点是所需资料不多,可用自身变量数列来进行预测。但是这种方法受到一定的限制:1.必须具有自相关,自相关系数()是关键。如果自相关系数(R)小于0.5,则不宜采用,否则预测结果极不准确。2.自回归只能适用于预测与自身前期相关的经济现象,即受自身历史因素影响较大的经济现象,如矿的开采量,各种自然资源产量等;对于受社会因素影响较大的经济现象,不宜采用自回归,而应改采可纳入其他变量的向量自回归模型。第五部分:参考文献1司守奎,孙玺菁.数学建模算法与应用[M].国防工业出版社,2013.3。2《运筹学》教材编写组,运筹学(修订版),北京:清华大学出版社,1990。3中国人民出版社王燕《应用时间序列分析》第三版。学号:1207010165日期:2015/5/29