时间序列分析方法确定型时间序列模型的参数估计教学大纲•参数估计的基础知识•时间序列平滑方法•时间序列模型的回归方法参数估计的基础知识总体和个体研究对象的全体称为总体,组成总体的每个基本单位称为个体。•按组成总体的个体的多寡分为:有限总体和无限总体;•总体具有同质性:每个个体具有共同的观察特征,而与其它总体相区别;•度量同一对象得到的数据也构成总体,数据之间的差异是绝对的,因为存在不可消除的随机测量误差;•个体表现为某个数值是随机的,但是,它们取得某个数值的机会是不同的,即它们按一定的规律取值,即它们的取值与确定的概率相对应。样本和样本容量•总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量,又称为样本的大小。•抽样是按随机原则选取的,即总体中每个个体有同样的机会被选入样本。随机变量根据概率不同而取不同数值的变量称为随机变量RV•一个随机变量具有下列特性:可以取许多不同的数值,取这些数值的概率为p,p满足:0p1•随机变量以一定的概率取到各种可能值,按其取值情况随机变量可分为两类:离散型随机变量和连续型随机变量–离散型随机变量的取值是有限的,最多是可列多个–连续型随机变量的取值充满整个数轴或某个区间离散型随机变量与连续型随机变量10203040501.0概率y离散型随机变量概率y1.0连续型随机变量总体、随机变量、样本间的联系•总体就是一个随机变量,所谓样本就是n个(样本容量n)相互独立且与总体有相同分布的随机变量x1,……,xn。•每一次具体抽样所得的数据,就是n元随机变量的一个观察值,记为(X1,……,Xn)。•通过总体的分布可以把总体和样本连接起来。样本与所抽自的总体具有相同的分布•某一次具体的抽样的具体的数值(y1,……,yn);•一次抽样的可能结果,它的每一次观察都是随机地从总体中(每一个个体有同样的机会被选入)抽取一个,所以它是一组随机变量(y1,y2,……,yn)•每一次抽样都来自同一总体(分布),也就是每一次抽样都带来了与总体一样的分布信息。所以,样本与所来自的总体分布相同。统计量•设(y1,y2,……,yn)为一组样本观察值,函数f(y1,y2,……,yn)若不含有未知参数,则称为统计量。•统计量一般是连续函数。由于样本是随机变量,因而它的函数也是随机变量,所以,统计量也是随机变量。•统计量一般用它来提取由样本带来的总体信息。样本与总体之间的关系•样本是总体的一部分,是对总体随机抽样后得到的集合•对观察者而言,总体是未知的,能够观测到的只是样本的具体情况•我们所要做的就是通过对这些具体样本的情况的研究,来推知整个总体的情况对总体的描述——随机变量的数字特征•数学期望•方差•数学期望与方差的图示研究数字特征的必要性•总体是一个随机变量。对总体的描述就是对随机变量的描述。随机变量的分布是对随机变量最完整的描述•求出总体的分布往往不是一件容易的事情;•在很多情况下,我们并不需要全面考察随机变量的变化情况,只需要了解总体的一些综合指标。一般说来,常常需要了解总体的一般水平和它的离散程度;•如果了解总体的一般水平和离散程度,就已经对总体有了粗略的了解;•在很多情况下,了解这两个数字特征还是求出总体分布的基础和关键。数学期望的性质•如果a、b为常数,则•E(aY+b)=aE(Y)+b•如果X、Y为两个随机变量,则•E(X+Y)=E(X)+E(Y)•如果g(x)和f(x)分别为X的两个函数,则•E[g(X)+f(X)]=E[g(X)]+E[f(X)]•如果X、Y是两个独立的随机变量,则•E(X.Y)=E(X).E(Y)方差•如果随机变量X的数学期望E(X)存在,称[X-E(X)]为随机变量X的离均差。显然,随机变量离均差的数学期望是0,即E[X-E(X)]=0•是连续型随机变量的方差•随机变量离均差平方的数学期望,叫随机变量的方差,记作Var(x)。方差的算术平方根叫标准差。dxxXVXXxEx2的方差以下式给出:为连续型随机变量,则若xEExVarxVxxExx222方差的意义•离均差和方差都是用来描述离散程度的,即描述X对于它的期望的偏离程度,这种偏差越大,表明变量的取值越分散。•一般情况下,采用方差来描述离散程度。因为离均差的和为0,无法体现随机变量的总离散程度。•事实上正偏差大亦或负偏差大,同样是离散程度大。方差中由于有平方,从而消除了正负号的影响,并易于加总,也易于强调大的偏离程度的突出作用。方差的性质•Var(c)=0•Var(c+x)=Var(x)•Var(cx)=c2Var(x)•x,y为相互独立的随机变量,则Var(x+y)=Var(x)+Var(y)=Var(x-y)•Var(a+bx)=b2Var(x)•a,b为常数,x,y为两个相互独立的随机变量,则(ax+by)=a2Var(x)+b2Var(y)•Var(x)=E(x2)-(E(x))2数学期望与方差的图示•数学期望描述随机变量的集中程度,方差描述随机变量的分散程度。1方差同、期望变大2期望同、方差变小51055样本分布的数字特征•样本分布函数•样本平均数•样本方差样本平均数•总体的数字特征:是一个固定不变的数,称为参数;•样本的数字特征:是随抽样而变化的数,是一个随机变量,称为统计量。•样本平均数的定义•样本平均数用来描述样本的平均水平。为样本平均数。,称对于样本niinxxxxnx1211,,样本方差和标准差•样本方差和标准差的定义xxsxxxxxxxxsxxxnnniinsinniiniinininin2122212121212221111111,,。来描述样本离散程度的样本方差和标准差是用差。分别为样本方差和标准以及,称对于样本估计方法矩法最大似然法最小二乘法最小卡平方法总体分布未知正态总体一般总体已知方差方差未知一般总体正态总体估计期望单个总体两个总体估计方差点估计区间估计估计量的优良性•无偏性•有效性•均方误最小•一致性无偏性无偏性的直观意义:•根据样本推得的估计值和真值可能不同,然而如果有一系列抽样依据同一估计方法就可以得到一系列估计值,很自然会要求这些估计的期望值与未知参数的真值相等。这就是无偏性的概念•无偏性的直观意义是:样本估计量的数值在真值周围摆动,即无系统误差。无偏性的定义。的有偏估计,其偏差为,我们称如果具有无偏性。亦称的无偏估计,为参数成立,我们称如果定义θ-θˆBiasθθˆθθˆθˆθθˆθθˆ1.5EEE的概率θˆ的概率θˆ的真值的真值有偏无偏的概率ˆ的真值θ的概率ˆ的真值θ有偏估计无偏估计有效性•总体某个参数的无偏估计量往往不只一个,而且无偏性仅仅表明^的所有可能的取值按概率平均等于,它的取值与相差可能很大。•为保证^的取值能集中于附近,必须要求^的方差越小越好。所以,提出有效性标准。有效性的定义具有有效性。的有效估计量,亦称称为的方差达到最小,则的一切无偏估计量中,如果在有效的估计量。是比的方差,则称的方差小于,总有意的样本容量的无偏估计量,若对任都是和设θˆθθˆθˆθθˆθˆθˆθˆθθˆθˆn的真值的真值^的概率^的概率无偏有效估计量的意义•一个无偏有效估计量的取值在可能范围内最密集于附近。换言之,它以最大的概率保证估计量的取值在真值附近摆动•可以证明,样本均值是总体数学期望的有效估计量。一致性•一致性是从概率和极限性质来定义的,因此只有样本容量较大时才起作用•一致性作为评价估计量好坏的一个标准,计量经济学中在无偏性和一致性之间更偏重选择一致性•虽然一个一致估计量可能在平均意义上与真值不同,但是当样本容量加大时,它会变得与真值十分接近,即有偏的一致估计量具有大样本下的无偏性。同时,根据大数定律,当n增大时,方差会变得很小,所以一致估计量具有大样本下的“无偏性”和“有效性”N小N大N极大小的概率参数和统计量•参数(parameter)–来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值–所关心的参数主要有总体均值()、标准差()、总体比例()等–总体参数通常用希腊字母表示•统计量(statistic)–用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数–所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等–样本统计量通常用小写英文字母来表示参数估计•时间序列模型设定以后,就要估计参数。参数是模型中表示变量之间数量关系的常系数•它将各种变量连接在模型之中,具体说明解释变量对被解释变量的影响程度•在未经实际资料估计之前,参数是未知的。模型设定之后,依据可资利用的数据资料,选择适当的估计方法,例如最小二乘进行估计•参数估计是一个纯技术过程参数的定义和分类•反映模型中各类方程式的经济结构特性的参数,称为结构参数•它有显含参数和隐含参数之分•显含参数就是与变量相乘的常系数,例如上述需求供给模型中的•隐含参数如随机扰动项的概率分布参数在方程中的作用•通过参数把各种变量连接在方程之中,借以说明外生变量或前定变量的变化对内生变量变化的影响程度。•参数值可以采用数理统计学方法依据样本资料估计出来•参数一经确定。因果(函数)关系亦随之确定了就可以依据外生变量和前定变量的值,通过模型预测内生变量的值对参数的约束•对参数的约束–确定参数的大小及其正负号就是对模型的事前约束。•零约束或非零约束–模型中排除或包含某个变量,可以看作是对模型中某个变量的参数施加零约束或非零约束。时间序列平滑方法确定性时间序列模型的参数估计•移动平均法•指数平滑法•季节性指数平滑法•直接平滑法移动平均法•简单移动平均法•二次移动平均法•加权移动平均法•几何移动平均法简单移动平均法•用于估计常数模型中的参数b。Yt=b+εt•通常用Mt表示移动平均结果,即NYYYYbNTTTT121......NYYMYNMNTTTTNTttT111二次移动平均法•用于估计线性趋势模型Yt=b0+b1t+εt中的参数b0和b1•公式:TbMMbMMNbMMTbbYNMMMMMNYYYYMTTTTTTTNTTTTTNTTTTT1)2(0)2(1)2(10121)2(1212)(122............指数平滑法•一次指数平滑法•二次指数平滑法•高次指数平滑法一次指数平滑法•用于估计常数模型Yt=b+εt中的参数b。•公式:11111)1()()b(YTTTTTTTTTTTTSYSYSSSbbbαααα设:一次指数平滑法•ST:平滑值(smoothingvalue)或平滑统计量(smoothingstatistics)•:平滑常数(smoothingconstant),取值范围是011)1(TTTSYSαα一次指数平滑法的性质•指数平滑统计量ST是时间序列观测值的线性组合•指数平滑法选用的权数以指数形式递减,指数平滑统计量是加权平均数•S0:初始平滑值,是参数b的初始估计值,用于引起平滑过程100)1(TkkTTSYSαα)-(1αk一次指数平滑法的性质•指数平滑统计量ST是时间序列观测值的线性组合•指数平滑法选用的权数以指数形式递减,指数平滑统计量是加权平均数观测值YT-k所乘的权数是(1-)k各时期观测值对应的权数随时间变化,可以把指数平滑法选用的一组权数看成是时间t的指数函数,即W=(1-)t较近期的观测值所乘的权数值较大,较早期观测值乘的权数较小100)1(TkkTTSYSαα)-(1αk一次指数平滑法的性质•当T趋于无穷大时,ST是参数b的无偏估计量,即:bbYEYESEkkTkkkTT1)()1(}{)(00