时间序列分析方法基本概念教学大纲•时间序列的基本概念•时间序列数据的数值标度•时间序列的分解•时间序列的实例时间序列的基本概念什么是数据•数据是一种信息,这种信息如以量的标志显现出来,就称其为数据。数据是一定条件下客体在量的方面的综合表现。在开始一项研究工作时,最基本的工作之一,就是收集数据。•数据按其本义来说是定量的(计数或计量)的。但在实际应用中,它们可以是定量的,也可以是定性的,或者是两者的结合。随着人类认识客体技术的提高与认识层次的深化,数据的外延还在不断的扩大。样本数据常用的样本数据有三类:•时间序列数据(Timeseriesdata),是一批按照时间先后顺序排列的统计数据•截面数据(Crosssectiondata),是一批发生在同一时间截面上的数据•虚拟变量数据(Dummyvariabledata),也称为二进制数据,一般取0或1。虚拟变量经常被用在计量经济学模型中,以表征政策、条件等因素时间序列数据•时间序列数据又俗称为纵向数据。同一现象在不同时间上的相继观察值排列而成的数列•形式上由现象所属的时间和现象在不同时间上的观察值两部分组成•时间序列的时间是变化的。常用的时间间隔有:年、季度、月、周、日•时间序列数据通常存在季节变动和序列相关——自相关(误差的协方差不等于0,即前期误差与后期误差之间存在相关)采纳时间序列数据的注意事项•样本区间内经济行为的一致性,例如80年代后期以来为供大于求(居民收入和出口额),80年代中期以前为供不应求(资本、劳动等)•样本点之间数据具有可比性,价值形态出现的数据往往是不可比的,应当消除物价因素的影响•样本观察值过于集中,不能反映经济变量间的结构关系,应增大观测区间•时间序列误差项间往往存在序列相关(自相关)截面数据•截面数据又俗称横向数据,是一批发生在同一时间截面上的调查数据。研究某个时点上的变化情况。例如,工业普查数据、人口普查数据、家计调查数据等。•截面数据的时间是凝固的。•截面数据中大多存在异方差,必须引起注意。采纳截面数据的注意事项•样本点间的同质性(样本与母体的一致性),截面数据很难用于总量估计。•截面数据一般存在误差项的异方差虚拟变量数据的定义•虚拟变量是只取1或0之一的一个变量,一般用以表示定性变量,例如政策变量、条件变量等。•虚拟变量组合起来可以表征多种状态。•使用的虚拟变量的个数=欲表征的状态数,3种状态只用2个虚拟变量,若3状态采用3个虚拟变量,将造成多重共线。用虚拟变量表示定性数据性别D卫生等级D1D2男0不清洁10女1清洁01最清洁11面板数据(PanelData)•面板数据是时间序列数据与截面数据的合成体。•例如,1978-1999年我国各省市城镇居民消费结构的调查资料。样本数据的质量•完整性(不能有遗失数据,必要时,采用插值技术补上)•准确性(准确真实且数据口径方面也符合建模要求)•可比性(将范围口径和价格口径调整一致)•一致性——同质性(样本与母体一致),用31个省市的数据作为全国总量模型的数据就违反了一致性完整性•指模型中包含的所有变量都必须得到相同容量的样本观测值。这既是模型参数估计的需要,也是经济现象本身应该具有的特征•“遗失数据”的现象是经常发生的,在中国,经济体制和核算体系都处于转轨之中。在出现“遗失数据”时,如果样本容量足够大,样本点之间的联系并不紧密的情况下,可以将“遗失数据”所在的样本点整个去掉•如果样本容量有限,或者样本点之间的联系紧密,去掉某个样本点会影响模型的估计质量,则要采取特定的技术将“遗失数据”补上准确性•准确性有两方面含义:–所得到的数据必须准确反映它所描述的经济因素的状态,即统计数据或调查数据本身是准确的;–必须是模型研究中所准确需要的,即满足模型对变量口径的要求;–在生产函数模型中,作为解释变量的资本、劳动等必须是投入到生产过程中的、对产出量起作用的那部分生产要素,以劳动为例,应该是投入到生产过程中的、对产出量起作用的那部分劳动者。于是,在收集样本数据时,就应该收集生产性职工人数,而不能以全体职工人数作为样本数据,尽管全体职工人数在统计上是很准确的,但其中有相当一部分与生产过程无关,不是模型所需要的可比性•是通常所说的数据口径问题•得到的经济统计数据,一般可比性较差,其原因在于统计范围口径的变化和价格口径的变化,必须进行处理后才能用于模型参数的估计•计量经济学方法,是从样本数据中寻找经济活动本身客观存在的规律性,如果数据是不可比的,得到的规律性就难以反映实际•不同的研究者研究同一个经济现象,采用同样的变量和数学形式,选择的样本点也相同,但可能得到相差甚远的结果。原因在于样本数据的可比性时间数列的编制原则•基本原则是保证可比性,主要包括:̶时间上可比̶总体范围可比̶计算口径可比̶经济内容可比一致性•指母体与样本的一致性•违反一致性的情况经常会发生–用企业的数据作为行业生产函数模型的样本数据,用人均收人与消费的数据作为总量消费函数模型的样本数据,用31个省份的数据作为全国总量模型的样本数据,等等。时间序列定义•一个时间序列时一时间顺序生成的观测值的集合̶若该集合是连续的,这层次时间序列为连续型时间序列̶若该集合是离散的,这层次时间序列为离散型时间序列•本课程所讨论的时间序列,是离散型时间序列,其观测值按固定时间间隔采样•设yt是时间序列在时刻(或时期)t的观测值,当在t=1,2,3,4,5,6,7,……,n采样时,得到时间序列:y1,y2,y3,y4,y5,y6,……,yn定义•时间数列——又称为动态数列。–把反映某一现象发展变化的一系列指标数值按时间先后顺序排列起来所形成的数列。–两个基本要素:现象所属时间、指标数值。时间序列的分类时间序列平均数序列绝对数序列相对数序列时期序列时点序列时间序列的分类•总量指标数列(绝对数时间数列)–最基本的时间数列;–反映现象在不同时间上达到的绝对水平、总规模;–按指标所反映的时间状况不同分为:时期数列——现象在不同时段内的活动总量;时点数列——现象在不同瞬间时点上的总量。二者的主要区别在于:时间状况、指标数值的可加性、及指标数值与时间长短的关系等方面。•相对指标数列(相对数时间序列)•平均指标数列(平均数时间序列)时间序列的分类这两种数列都是由有关总量时间数列派生的;反映现象相对水平或平均水平的发展变化过程;不同时间上的指标数值不能相加。时间序列的水平分析指标发展水平平均发展水平增长量平均增长量时间数列水平分析时间数列水平分析指标•发展水平–现象在不同时间上所达到的水平的数量反映。–也就是时间数列中的各项指标数值。–按指标表现形式不同分为总量水平、相对水平、平均水平。–按其在数列中的位置来看,分为最初水平、中间水平和最末水平。–从在分析中的作用看,分为报告期水平、基期水平.–文字表述:“为”、“(发展、增长…)到。”平均发展水平•平均发展水平(序时平均数或动态平均数)–现象在不同时间上发展水平的平均数,。–说明现象在一段时期内所达到的一般水平。•与一般平均数(也可称为静态平均数)的异同:–同:都是将数量差异抽象化,反映现象的一般水平.–异:1.所平均数值的时间不同。2.所说明的问题不同。3.计算方法也有不同。•计算方法:不同类型的时间数列有不同的计算方法。总量数列的序时平均数•计算公式:•计算结果表示:某段时间内平均每期的水平.–例:根据某年各月商品销售收入数据,计算该年的月平均销售收入。时期数列——简单算术平均法12ntyyyyynn时点数列的序时平均数•连续时点数列(已知每天数据,视为连续时点数列)–简单算术平均法•不连续时点数列——见下页12ntyyyyynn23112......121222......121yyyyyynnfffnyfffn•当时点间隔相等,上式简化为:“首末折半法”1......231221yynyyynyn先求分段平均数=相邻两点数据的简单算术平均再求全期总平均数=分段平均数的加权算术平均(权数f=时点间的间隔长度)不连续时点数列计算步骤和公式时间1月1日5月31日8月31日12月31日人数(万人)362390416420362390390416416420534222534396.75y(万人)设某地区1999年各统计时点的社会劳动者人数如下表,计算全年的平均社会劳动者人数。相对数数列或平均数数列的序时平均数•相对数(或平均数)用y表示,有y=x/z,x、z为总量指标。•求各期y的平均一般不能采用简单算术平均法,即•因为各期数据yt的对比基础zt不同,它们对全期总平均水平的影响作用应轻重有别.yyn计算公式xyz•分别计算其分子、分母的序时平均数•判断分子和分母是时期指标还是时点指标?•对比得:实例•计算1986-1999年间:•我国第三产业国内生产总值占全部国内生产总值的平均比重相对数序列的序时平均数(计算结果)第三产业国内生产总值的平均数全国国内生产总值的平均数第三产业国内生产总值所占平均比重xxnzzn12743.65100%31.67%40234.37xyz增减量和平均增减量•增减量(增长量)–增减量=报告期水平-基期水平–说明现象在观察期内增减的绝对数量;–基期不同,有逐期增长量与累计增长量之分:•逐期增减量=报告期水平-上期水平–说明现象逐期增减的数量。•累计增减量=报告期水平-固定基期水平–说明一段时期内总共增减的数量。•二者关系:累计增减量=相应时期的逐期增减量的总和。•平均增减(增长)量–逐期增减量的序时平均数;–其方法是算术平均法。0(1)(1yiiyynynn逐期增减量)平均增减量逐期增减量的个数累计增减量发展水平项数增减量和平均增减量时间序列的速度分析指标•发展速度•增减速度•平均速度–平均发展速度–平均增减速度发展速度•发展速度=报告期水平/基期水平–说明现象在观察期内发展变化的相对程度;–有环比发展速度与定期发展速度之分•*环比发展速度=报告期水平/上期水平•*定期发展速度=报告期水平/固定基期水平•二者关系:–定期发展速度(总速度)=相应时期的环比发展速度之积。–两个相邻的定基发展速度,用后者除以前者,等于相应的环比发展速度。增减速度(增长率)•增长量与基期水平之比,说明现象增长变化的相对程度%)(1001or发展速度基期水平增长量增长速度•基期不同,分环比增长速度与定期增长速度环比增减速度=逐期增减量/上期水平=环比发展速度-1定期增减速度=累计增减量/固定基期水平=定期发展速度-1•二者关系:总增减速度不等于相应环比增速之和(积)速度的表现形式和文字表述•一般表示用%、倍数,也有用‰、番番数与倍数的区别•从基期到报告期翻m番,则有:报告期水平=基期水平m2速度的表现形式和文字表述•发展速度—发展为、相当于、增长到、减少到、下降为…–报告期水平增长为基期水平的…%;–以基期水平为100%,报告期水平增长为…%.•增长速度—提高(了)、减少(了)、下降(了)、…–报告期水平比基期水平增长(了)的…%;–以基期水平为100%,报告期水平增长(了)…%。平均速度•平均增减速度–表示逐期增减变动的平均程度,即各期环比增减速度的一般水平,–但不能对各环比增减速度直接平均,因为:算术平均法或几何平均法都不符合增减速度这种现象的性质。•计算方法:平均增减速度=平均发展速度—1平均发展速度平均速度平均增减速度平均发展速度的计算方法•几何平均法(水平法)•以yt表示环比发展速度,根据环比发展速度与总速度的关系,计算平均发展速度应该采用几何平均法:12nnyyyynn发展总速度最末水平最初水平n=环比发展速度的个数=数列发展水平项数-1几何平均法的特点•用所求平均发展速度代表各环比发展速度,–推算的最末一期的水平与实际相等,–推算的总速度(最末一期的定基速度)也与实际相等。•着眼于最末一期的水平,故称为“水