四、模型检验(一)模型的显著性检验(1)检验目的检验模型的有效性(对信息的提取是否充分)(2)检验对象残差序列(3)判定原则一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列。反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效。(4)假设条件0120,1mHm:mkmHk,:至少存在某个1,01221ˆ(2)()~()mkkLBnnmnk原假设:残差序列为白噪声序列备择假设:残差序列为非白噪声序列121ˆˆˆˆnkttktkntt(5)检验统计量:LB统计量例2.5续:检验1950年——1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性。延迟阶数LB统计量P值检验结论65.830.3229拟合模型显著有效1210.280.50501811.380.8361残差白噪声序列检验结果:(二)参数的显著性检验(1)目的:检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简(2)假设条件:(3)检验统计量:mjHHjj10:0:10)(~)~(ˆmntQamnTjjjj21ˆ()nttQ其中拒绝域12()Ttnm例2.5续:检验1950年——1998年北京市城乡居民定期储蓄比例序列极大似然估计模型的参数是否显著。检验参数t统计量P值结论均值46.120.0001显著6.720.0001显著1参数检验结果:例3.8续:对OVERSHORTS序列的拟合模型进行检验。检验参数t统计量P值结论均值-3.750.0004显著10.600.0001显著延迟阶数LB统计量P值结论63.150.6772模型显著有效129.050.61711残差白噪声检验结果:参数显著性检验结果:例3.9续:对1880-1985全球气表平均温度改变值差分序列拟合模型进行检验。检验参数t统计量P值结论16.340.0001显著3.50.0007显著延迟阶数LB统计量P值结论65.280.2595模型显著有效1210.300.424711残差白噪声检验结果:参数显著性检验结果:五、模型优化问题提出:当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的。优化的目的:选择相对最优模型。例3.13:拟合某一化学序列(附录1.8)序列自相关图序列偏自相关图拟合模型一ttBByield)31009.032286.01(17301.512根据自相关系数2阶截尾,拟合MA(2)模型参数估计:模型检验:模型显著有效;三参数均显著。拟合模型二Byieldtt42481.0126169.51根据偏自相关系数1阶截尾,拟合AR(1)模型参数估计:模型检验:模型显著有效;两参数均显著。问题:同一个序列可以构造两个拟合模型,两个模型都显著有效,那么到底该选择哪个模型用于统计推断呢?解决办法:确定适当的比较准则,构造适当的统计量,确定相对最优。AIC准则(AnInformationCriterion)由日本统计学家赤池弘次(Akaike)1973年提出,称为最小信息量准则。如何评价模型对数据的拟合程度?通常似然函数值越大(或估计的残差平方和越小)越好。一般地,增加模型中滞后变量的个数会使估计的残差平方和降低。然而,增加模型中滞后变量的个数,会使需估计的参数增多,响应地减少自由度,参数估计的难度越大,估计的精度越差。甚至,包含了无关紧要的变量还会降低拟合模型的预测效果。所以,一个好的拟合模型应该是拟合精度和未知参数个数的综合最优配置。2ˆln()2AICnTAIC统计量:常用的AIC统计量有2ln()2AICLnTn221ˆTnAICen其中:n------可用的序列观测值的个数T------待估参数的个数221ˆˆntt------残差平方和中心化的ARMA(p,q)模型,1Tpq非中心化的ARMA(p,q)模型,2Tpq惩罚因子为221211(,,,)[ln()ln()]222nnlxxS对数似然函数SBC准则(BIC准则)AIC准则的缺陷:在样本容量趋于无穷大时,由AIC准则选择的模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多。由似然函数可以看出上述三个统计量会选择相同的模型。nSBC统计量:常用的SBC统计量有2ˆln()ln()SBCnTn惩罚因子2ln()ln()SBCLnnTn21ˆTnSBCnn其中:n------可用的序列观测值的个数T------待估参数的个数221ˆˆntt------残差平方和中心化的ARMA(p,q)模型,1Tpq非中心化的ARMA(p,q)模型,2Tpq理论上,AIC和SBC的值越小越好(注意:两者皆可为负)。当模型的拟合优度上升时,AIC和SBC的值会趋于-∞。需注意的是:在比较两个备选模型的AIC(或SBC)时,必须基于相同样本期估计的模型。SBC具有更优的大样本特性,可以证明,SBC准则是最优模型的真实阶数的相合估计(一致估计)。而在小样本下AIC效用优于SBC。一般来说,AIC倾向于选择过多参数的模型,而SBC倾向于选择更为简练模型。在使用AIC(或SBC)准则选择模型时,我们只能得到相对最优模型,而不可能得到绝对最优模型。(因为不可能比较所有模型的AIC值)。例3.13续:用AIC准则和SBC准则评判例3.13中两个拟合模型的相对优劣。模型AICSBCMA(2)7.497.59AR(1)7.437.50结果:AR(1)优于MA(2)六、序列预测(一)线性预测函数0tlitiixDx所谓预测是要利用序列已观测到的样本值对序列未来某个时刻的取值进行估计。预测方法主要有线性最小方差预测和条件期望预测。对于一个平稳可逆的ARMA(p,q)模型来说,其所有历史未知信息都可以用已知历史信息表示出来。即tlx1,,ttxx()ˆ()min()tlxttVarelVarel(二)预测方差最小原则预测误差:以作为的预测值,称为的向前第步线性预测。l0ˆ()titiixlDxtlxˆ()txltxˆ()()ttltelxxl由于是的线性函数,所以该原理也称为线性预测方差最小原理。ˆ()txl1,,ttxx(三)条件期望预测1ˆ()(,,)ttlttxlExxx对于平稳可逆的ARMA(p,q)模型来说,有1(,,)()kttkExxxxkt1(,,)()kttkExxkt1(,,)0()kttExxkt11(,,)(,,)()kttkttkExxxExxkt(四)线性最小方差预测和条件期望预测的关系(1)线性最小方差预测设序列的格林函数为tlx111111tltltlltltltxGGGG0110000ˆ()()titiijtijitittiijixlDxDG1001222001220ˆ()()()(())[()]lttltitliliitiiiltiliiiiliielxxlGGWVarelGGWG111111ˆ()()tltltlltltltttxGGGGelxl预测误差预测值)]([),,()(ˆ),,(11leVarxxxVarlxxxxEtttltttlt当时,预测方差达到最小,此时的预测值为:,0,1,2,liiGWitlx01111ˆ()tttltltxlWWGG(2)条件期望预测由此可见,线性最小方差预测与条件期望预测是一致的。在正态假定下,有1ˆ,,((),[()])tlttttxxxNxlVarel其中:11ˆ()tltltxlGG1111()ttltlltelGG22211(())(1)tlVarelGG1,,tlttxxx的置信水平为的置信区间为1221211ˆ(()(1))tlxlzGG(())0tEelAR(1)序列的预测11tttxx111111ˆ(1)(,,)(),,tttttttttxExxxExxxx211121111121ˆ(2)(,,)(),,(,,)ˆ(1)tttttttttttttxExxxExxxExxxxx一般地有:11ˆˆ()(1)ttltxlxlx预测值满足模型差分方程部分:1ˆˆ()(1)0ˆ(0)ttttxlxlxxAR(2)序列的预测1122ttttxxx11121ˆ(1)(,,)ttttttxExxxxx2112ˆ(2)(,,)ˆ(1)ttttttxExxxxx3112ˆ(3)(,,)ˆˆ(2)(1)ttttttxExxxxx一般地有,预测值满足模型差分方程部分:12ˆˆˆ()(1)(2)0tttxlxlxl例AR(p)序列的预测1ˆˆˆ()(1)()ttptxlxlxlp22121)1()]([ltGGleVar12221112ˆ()1tlxlzGG111221ˆ()(,,)(,,)ttltttltlptlptlttxlExxxExxxxxˆ(),1ˆ(),0tttkxkkxkxk预测值:预测方差:95%置信区间例3.14•已知某超市月销售额近似服从AR(2)模型(单位:万元/每月)•今年第一季度该超市月销售额分别为:101,96,97.2万元•请确定该超市第二季度每月销售额的95%的置信区间12100.60.3,~(0,36)tttttxxxN例3.14解:预测值计算•四月份•五月份•六月份12.973.06.010)1(ˆ233xxx432.973.0)1(ˆ6.010)2(ˆ333xxx5952.97)1(ˆ3.0)2(ˆ6.010)3(ˆ333xxx例3.14解:预测方差的计算01102112010.60.360.30.66GGGGGG6416.64)()]3([96.48)()]2([36)]1([222212032212032203GGGeVarGGeVarGeVarGREEN函数:方差:例3.14解:置信区间))]([96.1)(ˆ,)]([96.1)(ˆ(3333leVarlxleVarlx预测时期95%置信区间四月份(85.36,108.88)五月份(83.72,111.15)六月份(81.84,113.35)公式:估计结果:MA(1)序列的预测11tttx111111ˆ(1)(,,)(),,tttttttttxExxxExx212111ˆ(2)(,,)(),,0ttttttttxExxxExxˆ()0,2txll一般地:例MA(q)序列的预测qlqllxqliiltit,,)(ˆ222112221(1),[()](1),ltqlqVarellq预测值:预测方差:例3.15:已知某地区每年常驻人口数量近似服从MA(3)模型(单位:万)