1案例分析1:中国人口时间序列模型(file:b2c1)(怎样建立AR模型)4681012145055606570758085909500Y-0.2-0.10.00.10.20.35055606570758085909500DY图2.11中国人口序列(1949-2000)图2.12中国人口一阶差分序列(1950-2000)从人口序列图可以看出我国人口总水平除在1960和1961两年出现回落外,其余年份基本上保持线性增长趋势。51年间平均每年增加人口1451.5万人,年平均增长率为17.5‰。由于总人口数逐年增加,实际上的年人口增长率是逐渐下降的。把51年分为两个时期,即改革开放以前时期(1949—1978)和改革开放以后时期(1979—1996),则前一个时期的人口年平均增长率为20‰,后一个时期的年平均增长率为13.4‰。从人口序列的变化特征看,这是一个非平稳序列。见人口差分序列图。建国初期由于进入和平环境,同时随着国民经济的迅速恢复,人口的年净增数从1950年的1029万人,猛增到1957年的1825万人。由于粮食短缺,三年经济困难时期是建国后我国惟一一次人口净负增长时期(1960,1961),人口净增值不但没有增加,反而减少。随着经济形势的好转,从1962年开始人口年增加值迅速恢复到1500万的水平,随后呈连年递增态势。1970年是我国历史上人口增加最多的一个年份,为2321万人。随着70年代初计划生育政策执行力度的加强,从1971年开始。年人口增加值逐年下降,至1980年基本回落到建国初期水平。1981至1991年人口增加值大幅回升,主要原因是受1962—1966年高出生率的影响(1963年为43.73‰)。这种回升的下一个周期将在2005年前后出现,但强势会有所减弱。从数据看,1992年以后,人口增加值再一次呈逐年下降趋势。由于现在的人口基数大于以往年份,所以尽管年增人口仍在1千万人以上,但人口增长率却是建国以来最低的(1996年为10.5‰)。从Δyt的变化特征看,1960,1961年数据可看作是两个离群值,其它年份数据则表现为平稳特征。但也不是白噪声序列,而是一个含有自相关和(或)移动平均成分的平稳序列。下面通过对人口序列yt和人口差分序列Dyt的相关图,偏相关图分析判别其平稳性以及识别模型形式。图2.13yt的相关图,偏相关图2图2.14Dyt的相关图,偏相关图(虚线到中心线的距离是2(1/51)=0.28)见图2.13和图2.14。人口序列yt是非平稳序列。人口差分序列Dyt是平稳序列。应该用Dyt建立模型。因为Dyt均值非零,结合图2.14拟建立带有漂移项的AR(1)模型。估计结果如下:Dyt=0.1429+0.6171(Dyt-1-0.1429)+vt(8.7)(5.4)R2=0.38,Q(10)=5.2,Q(k-p-q)=Q0.05(10-1-0-1)=15.5模型参数都通过了显著性t检验。注意:(1)根据Wold分解定理,EViews的输出格式表示的是,对序列(Dyt-0.1429)建立AR(1)模型,而不是对Dyt建立AR(1)模型。(2)整理输出结果:Dyt=0.1429(1-0.6171)+0.6171Dyt-1+vt=0.0547+0.6171Dyt-1+vt漂移项=0.0547,特征根是1/0.62=1.61。输出结果中的0.1429是Dyt的均值,不是模型漂移项。以AR(1)过程xt=+xt-1+ut为例,两侧求期望,得均值和漂移项0的关系是E(xt)=11=,或=(1-)3对整理后的输出结果两侧求期望,就会反求出=0.0547/(1-0.6171)=0.1429(3)有没有漂移项对求特征方程和特征根无影响。模型残差的相关图和偏相关图如下,图2.15表2.5中模型(1)残差序列的相关图,偏相关图因为Q(10)=5.220.05(10-1-0)=16.9可以认为模型误差序列为非自相关序列。EViews操作方法:从EViews主菜单中点击Quick键,选择EstimateEquation功能。随即会弹出Equationspecification对话框。输入漂移项非零的AR(1)模型估计命令(C表示漂移项)如下:D(Y)CAR(1)注意:(1)不能把命令中的AR(1)写成D(Y(-1))(写成D(Y(-1))意味着做OLS估计)。(2)写成D(Y)的好处是EViews可以直接对Y、D(Y)进行预测。(3)模型中若含有移动平均项,EViews命令用MA(q)表示。(4)估计的时间序列模型的R2不可能很高。因为变量差分后损失了很多信息。(5)估计的模型是否成立应该从3个方面检查,①模型参数估计量必须通过t检验;②全部的特征根的倒数必须在单位圆以内;③模型的残差序列必须通过Q检验。(6)在模型估计结果窗口通过View/ARMAStructure/Correlogram命令可以观察样本的相关图与理论AR(1)过程相关图的对比图。下面进行预测:Dy2001=0.0547+0.6171Dy2000+v2001=0.0547+0.61710.0957+0=0.1138y2001=y2000+Dy2001=12.6743+0.1138=12.7881EViews给出的预测值是12.78806,结果相同。预测的EViews操作方法:把样本容量调整到1949-2001。打开估计式窗口,在Equation4Specification(方程设定)选择框输入命令,D(Y)CAR(1),保持Method(方法)选择框的缺省状态(LS方法),在Sample(样本)选择框中把样本范围调整至1949-2000。点击OK键,得到估计结果后,点击功能条中的预测(Forecast)键。得对话框及各种选择状态见下图。点击OK键,YF和YFse序列出现在工作文件中。打开YF序列窗口,得2001年预测值12.78806,见前图。已知2001年中国人口实际数是12.7627亿人。预测误差为=7627.127627.127881.12=0.00212.6812.7212.7612.8012.8412.8812.922001YFForecast:YFActual:YForecastsample:20012001Includedobservations:1RootMeanSquaredError0.025358MeanAbsoluteError0.025358MeanAbs.PercentError0.198685图2.17点击forecast键只选取2001年动态或静态的预测结果解法2:把中国人口序列yt看作是含有确定性趋势的平稳序列。前提是中国人口序列yt必须是退势平稳序列。用yt对时间t回归,得yt=5.0152+0.1502t+ut(110)(102)R2=0.995,(1949-2001)用ut检验单位根如下。dut=-0.0940ut-1+0.6681dut-1(-2.5)(6.3)R2=0.45,(1951-2001),DF0.05=-1.965-1.0-0.50.00.51.05055606570758085909500RESID图16ut序列ut是一个平稳序列。所以yt是一个退势平稳序列。有理由建立一个含有固定趋势项的时间序列模型。图17ut的相关图和偏相关图通过观察ut的相关图和偏相关图,判定ut是一个二阶自回归过程。为正,2为负。特征根应该为复根。建立含有固定趋势项的二阶自回归模型YC@trend(1948)AR(1)AR(2)估计结果如下:6写表达式如下:yt=4.9729+0.1508t+ut,(1949,t=1)(34.9)(35.4)其中ut=1.5503ut-1-0.6491ut-2+vt,(1949,t=1)(13.7)(-5.9)或写为yt=4.9729+0.1508t+1.5503ut-1-0.6491ut-2+vt,(1949,t=1)(34.9)(35.4)(13.7)(-5.9)R2=0.995,(1951-2000),Q(10)=4.6,Q(k-p-q)=Q0.05(10-2-0-2)=12.6模型残差序列的相关与偏相关图如下,根据上式预测,2001年中国人口预测数是7y2001=4.9729+0.1508253+1.5503(-0.15179)-0.6491(-0.09728)=12.7942(亿人),(2001年,t=53)也可以把输出结果写为,yt=4.9729+0.1508t+1.5503(yt-1-4.9729-0.1508(t-1))-0.6491(yt-2-4.9729-0.1508(t-2))+vt(34.9)(35.4)(13.7)(-5.9)整理后得yt=0.5293+0.0149t+1.5503yt-1-0.6491yt-2+vt注意:EViews的输出格式表示的是对序列(yt-4.9729-0.1508t)估计AR(2)模型。根据上式预测,2001年中国人口预测数是y2001=0.5293+0.014953+1.5503(12.6743)-0.6491(12.5786)=12.8032(亿人),(2001年,t=53)EViews预测的结果是12.8033。已知2001年中国人口实际数是12.7627亿人。预测误差为=7627.127627.128033.12=0.00312.7012.7512.8012.8512.902001YFForecast:YFActual:YForecastsample:20012001Includedobservations:1RootMeanSquaredError0.040592MeanAbsoluteError0.040592MeanAbs.PercentError0.318051图2.18点击forecast键只选取2001年动态或静态的预测结果案例2日本人口时间序列模型(file:japopu)(怎样建立缺项的AR模型)80.20.40.60.81.01.21.4188019001920194019601980Y-0.03-0.02-0.010.000.010.020.030.04188019001920194019601980DY图1日本人口序列(yt)日本人口差分序列(Dyt)人口数字之所以起于1872年,是因为1872年日本才有了全国人口统计数字。在122年间(1872-1994),日本人口从3480.6万人增至12503.4万人(3.6倍)。日本人口增加的特点是两头慢,中间快。同时在1944-1946年和1972年人口总量出现了激烈波动。1944-1946年的波动是因为战败,1972年的波动是由于美国归还冲绳。由图1中的相关图可以判定日本人口序列yt是一个非平稳序列。由图2可以看出日本人口差分序列Dyt是一个平稳序列。图3是日本人口的二次差分序列DDyt。它也是一个平稳序列。差分序列Dyt的极差是0.059,差分序列DDyt的极差是0.087。可见DDyt是一个过度差分序列。应该用Dyt建立时间序列模型。日本历史上有两次大规模向国外学习的过程。一次是大化改新。大化改新(公元645-649)是一场以圣德太子政治理念为基础的贵族革命。圣德太子(公元574-622)一心加强皇权,决心向中国学习,启蒙日本。他四度向中国派遣使团和留学生。在它的影响下,其死后23年,即公元645年,中大兄皇子发动政变,成功地建立了类似唐朝的中央集权机构。一次是明治维新。明治维新始于1868年。从而开始了全面向西方学习的历史。口号是“富国强兵”(福泽谕吉)。主要措施是(1)加强中央集权,1871年实施“废藩治县”,(2)1872年采取美国三权分立的政治体制,(3)1872年统一货币,实行1日元=1美元的兑换率,(3)1872年开始修铁路、建立现代统计制度,采用阳历等,(4)1873年迁都东京。9图2yt的相关图与偏相关图,Dyt的相关图与偏相关图-0.04-0.020.000.0