用STATA软件学习《时间序列分析》1第三课:ARMA/ARIMA建模及预测核心问题:1,前提:同方差,因此,不用考虑不同时刻变量的离散性;2,建立的是变量分布的均值模型,也就是,随机变量分布的均值所在的位置3,难点在于,时间序列数据建立模型并没有唯一性以quarterly.dta的数据来说明。这个数据是美国的季度GDP数据,数据从1947年一季度开始,到2012年一季度结束。研究对象,GDP,存在通货膨胀问题。所以要用GDP平减指数(GDPDeflator)进行矫正,这里是以2005年的美元作为基准的。所以考察变量是GDP2005,即以2005年的美元作为基准的各季度的GDP真实值。一,一些基本符号:DLF二,建立模型:前期准备:观察时序图相关命令:tsset,tsline/twoway用STATA软件学习《时间序列分析》2从图上可以看出,GDP2005值呈线性的向右上方倾斜,第一种方法:可以用确定性分析理的方法,使用研究变量对时间变量进行回归即:regresslrgdpdate(采用的是最小二乘估计)然后对残差项进行WhiteNoise检验观察此图:特征大值跟大值,小值跟小值,这说明Residual中存在着自相关信息。肯定不是WhiteNoise因此,从这里看出,确定性的方法比较直观,简单,但效果不好,弥补:对残差序列进行回归,建立AR模型,这就是所谓的残差自回归模型。第二种方法BOX-JENKINS方法,也就是通常所说的ARMA(p,d)/ARIMA(p,d,d)建模(采用的是最大似然估计)。四大步骤:1、模型识别Identification:决定p和q2、模型估计Estimation:估计个),(,个)(,qp3、模型检验DiagnosticChecking4、模型优化Parsimony用STATA软件学习《时间序列分析》31,模型识别Identification相关命令:acpac这个图的特征是ac值虽然在减小,但其减少类似线性,这时候就要考虑差分了,通常使用的是一阶差分和二阶差分一阶差分generategrowth=lrgdp-L.lrgdp这个时候,growth就是经济增长率这张图的ac值快速减少到影音之内,说明在样本中,变量growth显现的是平稳。此时,这张图同时和pac图联合使用,来判定p,qac图决定是q,pac图决定的是p用STATA软件学习《时间序列分析》4可以判定,growth的模型是ARMA(1,2)2,模型估计Estimation,命令:ARIMAarimagrowth,arima(1,0,2)arimalrgdp,arima(1,1,2)用STATA软件学习《时间序列分析》5关键:如何看懂这个结果,如何写出ARMA的具体方程形式。3,模型检验和优化:这两个步骤通常交叉进行的a上述结果存在着系数显著性检验无法通过的情形,所以必须重新做arimagrowth,arima(1,0,1)/arima(0,0,2)等多种情形,直至系数检验通过为止。b系数显著性检验通过之后,要进行模型有效性检验,也就是检验残差项是否是白噪声,对应的两个命令:wntestq,wntestbc如果有两个以上的模型都通过了模型有效性检验以及参数显著性检验,那么就要计算AIC值来进行取舍。三、预测Forcasting命令:predict。隐含的格式是onestepaheadpredictions计算公式是:tttyyˆˆˆ11,注意:1ty是观测值使用的是观测值进行预测,对未来过于乐观动态预测dynamicforcast计算公式是:tttyyˆˆˆˆ11,注意:这里都是估计值注意:预测时间起始点的变更