应用时间序列分析教材介绍教材:《应用时间序列》,王燕编著,中国人民大学出版社。应用软件:SAS练习数据库:TimeSeriesDataLibrary=provider:tsdl第一章时间序列分析简介本章结构引言1.时间序列的定义2.时间序列分析方法简介3.时间序列分析软件4.最早的时间序列分析7000年前,古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。当天狼星第一次和太阳同时升起的那一天之后,再过200天左右,尼罗河就开始泛滥,泛滥期将持续70~80天,洪水过后,土地肥沃,随意播种就会有丰厚的收成。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,解放出大批的劳动力去从事非农业生产,从而创建了埃及灿烂的史前文明。1月1日6月17日10月12月尼罗河泛滥期“落泪夜本章结构引言1.时间序列的定义2.时间序列分析方法简介3.时间序列分析软件4.时间序列的定义随机序列:按时间顺序排列的一组随机变量观察值序列:随机序列的个有序观察值,称之为序列长度为的观察值序列随机序列和观察值序列的关系观察值序列是随机序列的一个实现我们研究的目的是想揭示随机时序的性质实现的手段都是通过分析观察值序列的性质,由观察值序列的性质来推断随机序列的性质,,,,,21tXXXtxxx,,,21nn案例我们想研究全国高校招生人数的发展变化规律那么每一年全国普通高等学校的招生人数就构成了一个随机序列通过统计,得到的1999—2008年全国高等学校的招生人数序列就构成一个序列长度为10的观察值序列我国1999~2008年全国普通高等学校招生人数(单位:万人)159.7,220.6,268.3,320.5,382.2447.3,504.5,546.1,565.9,607.71990199120122013,,,,,,XXXX1999-2008年全国普通高等学校招生人数(单位:万人)本章结构引言1.时间序列的定义2.时间序列分析方法简介3.时间序列分析软件4.时间序列分析方法描述性时序分析通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律序列统计时序分析利用数理统计学的基本原理,分析序列值内在的相关关系描述性时间序列分析早期的时序分析通常都是通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析。古埃及人发现尼罗河泛滥的规律就是依靠这种分析方法。在天文、物理、海洋学等自然科学领域,这种简单的描述性时序分析方法也常常能使人们发现意想不到的规律。描述性时序分析案例——粮食生产与价格《史记.货殖列传》记载,早在我国春秋战国时期,范蠡和计然就提出我国农业生产具有“六岁穰,六岁旱,十二岁一大饥”的自然规律。《越绝书.计倪内经》则描述得更加详细:“太阴三岁处金则穰﹐三岁处水则毁﹐三岁处木则康﹐三岁处火则旱……天下六岁一穰﹐六岁一康﹐凡十二岁一饥。”翻译成现代文就是:“木星绕天空运行﹐运行三年,如果处于金位,则该年为大丰收年﹔如果处于水位﹐则该年为大灾年;再运行三年,如果至木位﹐则该年为小丰收年﹔如果处于火位﹐则该年为小灾年,所以天下平均六年一大丰收,六年一小丰收,十二年一大饥荒。”这是2500多年前,我国对农业生产具有3年一小波动,12年左右一个大周期的记录,是一个典型的描述性时间序列分析。我国稳定粮价的方法——“平粜法”范蠡根据“六岁穰,六岁旱,十二岁一大饥”的自然规律提出了我国最早稳定粮价的方法:“平粜法”“夫粜,二十病农,九十病末。末病则财不出,农病则草不辟矣。上不过八十,下不减三十,则农末俱利,平粜齐物,关市不乏,治国之道也。”这段话的意思是:如果是丰收年,粮食贱卖,会伤害农民种粮的积极性。如果是大灾年,粮食天价,会伤到老百姓的生存。所以要实行“平粜法”。政府应该在粮食丰收时高于最低价购买粮食进行储备,以保护农民的利益;在粮食短缺时,将储备粮食投放市场,以稳定粮价,确保百姓的生存。这是对农民和百姓都有利的政策,是一个国家的治国之道。欧洲粮食产量的描述性时序图在范蠡之后2000年,欧洲经济学家在研究欧洲各地粮食产量时发现了类似规律。1884-1939年苏格兰与威尔士每英亩大麦产量时序图Beveridge小麦价格指数序列贝弗里奇(Beveridge)小麦价格指数序列,它由1500-1869年逐年估计的小麦价格构成,可以清晰地看到该序列有一个13年左右的周期太阳黑子的运动规律德国业余天文学家施瓦贝(S.H.Schwabe)发现太阳黑子的活动具有11-12年左右的周期粮食价格波动的天文学解释太阳黑子的运动周期和农业生产的周期长度非常接近,这引起了英国天文学家、天王星的发现者威廉·赫歇尔(F.W.Herschel)的关注。最后他发现当太阳黑子变少时,地球上的雨量也会减少。所以在没有良好人工灌溉技术的时代,农业生产会呈现出和太阳黑子近似的变化周期。我们没有采用任何复杂的模型或分析方法,仅仅是沿着时间顺序收集数据,描述和呈现序列的波动,就了解到小麦产量的周期波动特征,以及产生该周期波动的气候成因及该周期对价格的影响。描述性时序分析通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。局限性:它只能展示非常明显的规律性。而在金融、保险、法律、人口、心理学等社会科学研究领域,随机变量的发展通常会呈现出非常强的随机性,想通过对序列简单的观察和描述,总结出随机变量发展变化的规律,并准确预测出它们将来的走势通常是非常困难的。统计时序分析方法频域分析方法时域分析方法统计时序分析频域分析方法原理假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动发展过程早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段特点非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性时域分析方法原理事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律。目的寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势特点理论基础扎实,操作步骤规范,分析结果易于解释,是时间序列分析的主流方法时域分析方法的分析步骤考察观察值序列的特征根据序列的特征选择适当的拟合模型根据序列的观察数据确定模型的口径检验模型,优化模型利用拟合好的模型来推断序列其它的统计性质或预测序列将来的发展时域分析方法的发展过程启蒙阶段基础阶段发展阶段YuleWalkerBoxJenkinsEngleGranger启蒙阶段G.U.Yule英国数学家。1927年,Yule提出用线性回归方程来模拟一个时间序列,这是最早的AR模型。G.T.Walker英国数学家,天文学家。1931年,Walker利用Yule的分析方法研究了衰减正弦时间序列,得出Yule-Walker方程基础阶段G.E.P.Box和G.M.Jenkins1970年,他们出版了《TimeSeriesAnalysisForecastingandControl》一书书中,他们系统地阐述了ARIMA模型的识别、估计、检验及预测的原理及方法。这些知识现在被称为经典时间序列分析方法,是时域分析方法的核心内容。为了记念Box和Jenkins对时间序列发展的特殊贡献,现在人们也常把ARIMA模型称为Box-Jenkins模型。ARIMA模型的实质单变量、同方差场合的线性模型完善阶段异方差场合RobertF.Engle,1982年,ARCH模型Bollerslov,1985年,GARCH模型Nelson等人提出了GARCH模型的多种衍生模型多变量场合C.Granger,1987年提出了协整(co-integration)理论非线性场合汤家豪等,1980年,门限自回归模型C.Granger,1978年,双线性模型RobertF.EngleC.Granger本章结构引言1.时间序列的定义2.时间序列分析方法简介3.时间序列分析软件4.时间序列分析软件常用软件S-plus,Matlab,Gauss,TSP,Eviews和SAS推荐软件——SAS在SAS系统中有一个专门进行计量经济与时间序列分析的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势本章SAS软件操作指导SAS操作界面介绍菜单栏,工具栏,窗口创建SAS数据集使用DATA步创建数据集直接导入外部数据文件转换成SAS数据集时间序列数据集的处理间隔函数(intnx)的使用序列变换子集缺失数据插值