1.1949—2001年中国人口时间序列数据见表8,由该数据(1)画时间序列图;(2)求中国人口序列的相关图和偏相关图,识别模型形式;(3)估计时间序列模型;(4)样本外预测。表8中国人口时间序列数据(单位:亿人)年份人口yt年份人口yt年份人口yt年份人口yt年份人口yt19495.416719606.620719718.5229198210.159199311.851719505.519619616.585919728.7177198310.2764199411.98519515.6319626.729519738.9211198410.3876199512.112119525.748219636.917219749.0859198510.5851199612.238919535.879619647.049919759.242198610.7507199712.362619546.026619657.253819769.3717198710.93199812.476119556.146519667.454219779.4974198811.1026199912.578619566.282819677.636819789.6259198911.2704200012.674319576.465319687.853419799.7542199011.4333200112.762719586.599419698.067119809.8705199111.582319596.720719708.2992198110.0072199211.7171(1)画时间序列图打开ty的数据窗口得到中国人口序列图求中国人口差分图:中国人口差分图如下:从人口序列图和人口差分序列图可以看出我国人口总水平除在1960年和1961年两年出现回落外,其余年份基本上保持线性增长趋势。52年间平均每年增加人口1412.6923万人,年平均增长率为1.66%。由于总人口数逐年增加,实际上的年人口增长率是逐渐下降的。把52年分为两个时期,即改革开放以前时期(1949—1978年)和改革开放以后时期(1979—2001年),则前一个时期的人口年平均增长率为2%,后一个时期的年平均增长率为1.23%。从人口序列ty的变化特征看,这是一个非平稳序列。(2)求中国人口序列的相关图和偏相关图,识别模型形式打开ty数据窗口,过程如下:Level表示选择对ty画相关图、偏相关图。滞后期为10。结果如下:由相关图衰减缓慢可以知道,中国人口序列ty是非平稳序列。做tdy的相关图和偏相关图如下:由上图可以看出,自相关函数呈指数衰减,偏自相关函数1阶或2阶截尾。所以是一个1阶或2阶自回归过程。(3)时间序列模型估计模型估计命令如下,同时将样本改为1949—2000年,留下2001年的值用于计算预测精度。输出结果如下:从上面的输出结果可以看出,AR(2)的系数没有显著性,因此需要从模型中将其剔除继续估计。得到重新的估计结果如下:对应的模型表达式为:0.1429ttDyu(8.7)10.6171tttuuv(5.4)直接写为:10.14290.6171(0.1429)tttDyDyv输出结果中的0.1429是tDy的均值,表示年平均人口增量是0.1429亿人。整理上述输出结果,得:110.1429(10.6171)0.61710.05470.6171tttttDyDyvDyv0.0547表示线性趋势的增长速度。从输出结果的最后一行可以知道,特征根是1/0.62=1.61,满足平稳性要求。检验模型的误差项:选滞后期为10得到如下输出结果:从对应的概率值可以看出,所有的Q值都小于检验水平为0.05的2分布,所以模型的随机误差项是一个白噪声序列。(4)样本外预测过程如下:预测方法选择静态预测。结果如下:已知2001年中国人口实际数是12.7627亿人,预测值为12.788亿人,误差为0.2%。2.1967—1998年天津市保费收入(ty,万元)和人口(tx,万人)数据见表9。表9天津市保费收入(ty)和人口(tx)数据年份Yt(万元)Xt(万人)年份Yt(万元)Xt(万人)1967259649.7219835357785.281968304655.0419846743795.521969313650.7519858919804.81970315652.7198614223814.971971322663.41198719007828.731972438674.65198823540839.211973706683.31198929264852.351974624692.47199034327866.251975632702.86199139474872.631976591706.5199249624878.971977622712.87199367412885.891978806724.271994100561890.5519791172739.421995123655894.6719802865748.911996171768898.4519814223760.321997243377899.819825112774.921998271654905.09对数的天津保费收入lnty和人口tx的散点图如下图:所以可以建立半对数模型。输出结果如下:相应表达式为:ln11.180.0254ttyx(-20.9)(37.2)20.9788,0.36RDW因为DW=0.36,说明模型误差项存在严重自相关。观察残差序列的自相关结构。过程如下:得到如下结果:由上图可以看出自相关函数拖尾,偏自相关函数2阶截尾,残差序列是一个明显的AR(2)过程。重新进行回归分析,得如下结果:相应表达式是:ˆln11.580.02591.17(1)0.45(2)ttyxARAR(-8.6)(15.3)(6.5)(-2.2)20.993,1.97RDW这种模型称作回归于时间序列组合模型。通过对回归模型残差序列建立时间序列模型提高回归参数估计量的有效性,所以组合模型估计的回归参数0.0259要比OLS估计结果0.0254的品质要好。拟合度也有所提高,并且消除了残差的自相关性。3.做663天的深证成指(SZ)序列:从SZ的序列走势可以看出,SZ序列既不是确定性趋势非平稳序列,也不是随机趋势序列。所以先按随机趋势序列设定检验式。过程如下:打开SZ的数据文件对SZ原序列进行ADF检验,检验式不包括趋势项,包括截距项。得到ADF的检验结果如下:带有截距项的DF检验式的估计结果如下:12.85410.0050ttDSZSZ(1.9)(-1.8)2.0,660DWT从1tSZ的系数的t检验可以看出,SZ序列存在单位根。但是常数项也没有通过t检验,所以从检验式中去掉截距项,继续进行单位根检验。结果如下:则DF检验式的估计结果如下:10.0002ttDSZSZ(0.4)2.0,660DWTDF=0.4,大于临界值。SZ序列是一个随机游走过程,并不含有随机趋势。对tSZ的差分序列tDSZ继续做单位根检验。过程如下:得到的结果如下:所以:211.0017ttDSZDSZ(-25.7)2.0,659DWTADF=-25.7,所以(0)tDSZI是平稳序列,(1)tSZI。4.利用表9.1的数据(1)做出时间序列lnGDP与lnCONS的样本相关图,并通过图形判断该两时间序列的平稳性。(2)对lnGDP与lnCONS序列进行单位检验,以进一步明确它们的平稳性。(3)如果不进行进一步的检验,直接估计以下简单的回归模型,是否认为此回归是虚假回归:01lnlntttCONSGDPu。表9.1中国GDP与消费支出单位:亿元年份CONSGDP年份CONSGDP19781759.1003605.60019909113.20018319.5019792005.4004074.000199110315.9021280.4019802317.1004551.300199212459.8025863.7019812604.1004901.400199315682.4034500.7019822867.9005489.200199420809.8046690.7019833182.5006076.300199526944.5058510.5019843674.5007164.400199632152.3068330.4019854589.0008792.100199734854.6074894.2019865175.00010132.80199836921.1079003.3019875961.20011784.70199939334.4082673.1019887633.10014704.00200042911.9089112.5019898523.50016466.00(1)首先做lnGDP与lnCONS的样本相关图,过程如下:做lnGDP的样本相关图。由于是做lnGDP的水平序列,所以选择level,并包括12期滞后。得到lnGDP的样本相关图如下:从样本的自相关函数图可以看出,函数并没有迅速趋向于零,并在零附近波动,说明lnGDP序列是非平稳的。用同样的方法,做lnCONS序列的自相关函数图如下:从上面的样本自相关函数图可以看出,lnCONS的自相关函数并没有迅速趋于零,并在零附近波动,说明lnCONS序列也是非平稳的。(2)首先对lnGDP进行单位根检验,过程如下:先从模型3进行检验,包括截距项,时间趋势及一阶滞后项的模型。结果如下:从上面的伴随概率值可以知道,在5%的显著性水平下,不拒绝存在单位根的假设,表明lnGDP是非平稳的。对模型2进行检验,即不包括时间趋势的模型,结果如下:从伴随概率值可以看出,在5%的显著性水平下,不拒绝存在单位根的假设,lnGDP是非平稳的。对模型1进行检验,即不包括截距项和时间趋势。结果如下:从伴随概率值可以看出,在5%的显著性水平下,不拒绝存在单位根的检验,lnGDP是非平稳的。综上所述,lnGDP序列是非平稳序列。用同样的方法对lnCONS序列进行检验,可以知道,在5%的显著性水平下,lnCONS序列也是非平稳的。(2)由于时间序列lnGDP和lnCONS是非平稳的,如果没有进行协整性检验,直接对两者做OLS回归,此回归很可能是虚假回归。5.以上题的数据为基础,利用lnGDP和lnCONS的数据。(1)检验lnGDP和lnCONS单整性。(2)尝试建立lnGDP和lnCONS的ARMA模型。单整性的检验仍然通过单位根检验进行。但此时,针对的时间序列不是原序列的水平序列,而是一阶差分、二阶差分或更高阶的差分序列为了寻找适当的模型,经过反复测算,发现lnGDP的一阶差分序列在只带截距项与三阶滞后项时,在5%的显著性水平下可以拒绝存在单位根的假设。过程如下:得到如下输出结果:所以lnGDP序列是一阶单整的。即ln(1)GDPI。用同样的方法对lnCONS进行单整性检验,发现lnCONS的一阶差分序列,只带截距项与三阶滞后项时,在5%的显著性水平下可以拒绝存在单位根的检验。所以lnCONS序列也是一阶单整的。即ln(1)CONSI。由于lnGDP和lnCONS两序列是非平稳的,因此不宜直接建立它们的ARMA模型。但它们的一阶差分序列却是平稳的,因此可对差分序列建立ARMA模型。记1lnlntttXGDPGDP1lnlntttYCONSCONS做tX的自相关函数与偏自相关函数图,过程如下:输出结果如下:从上面可以看出,序列tX在一阶滞后后,自相关函数与偏自相关函数均迅速趋于零,表明它是ARMA(1,1)的平稳序列,因此原序列lnGDP为ARIMA(1,1,1)序列。估计tX序列,过程如下:输出结果如下:即有:0.1449ttXu其中110.40890.6618ttttuu则:11(10.408