1《经济计量分析》讲义第一部分绪论一、经济计量学的内容体系1.理论经济计量学2.应用经济计量学二、经济计量学的研究步骤用经济计量方法研究社会经济问题是以经济计量模型的建立和应用为基础的,其过程可分为四个连续的步骤:建立模型、估计参数、验证模型和使用模型。(一)建立模型建立模型是根据经济理论和某些假设条件,区分各种不同的经济变量,建立单一方程式或方程体系,来表明经济变量之间的相互依存关系。1.经济计量模型的方程式(1)随机方程。是根据经济行为构造的函数关系式。(2)非随机方程。是根据经济学理论或政策、法规而构造的经济变量恒等式。2.模型变量的种类经济计量模型包括的变量有各种各样,如果按照它们的数值是在什么范围决定为标准,可分为内生变量(EndogenousVariable)和外生变量(ExogenousVariable)两种。(1)内生变量。是具有一定概率分布的随机变量,由模型自身决定,其数值是求解模型的结果。(2)外生变量。是非随机变量,在模型体系之外决定,即在模型求解之前已经得到了数值。有些方程还使用内生变量的前期或前几期的数值作解释变量,我们称这样的变量为滞后变量(LaggedVariable)。滞后变量如同外生变量一样,在模型求解之前为已知的。故一般将外生变量和滞后变量合称为前定变量(PredeterminedVariable)。2虚拟变量政策变量外生经济变量外生变量滞后变量前定变量内生变量经济变量(二)估计参数模型参数的估计是一个纯技术过程,这个过程可分以下几个阶段:1.收集模型所含经济变量的数据一般而言,模型所含经济变量的数据可分为以下几种类型。(1)时间序列数据。是指某一经济变量在各个时期的数值按时间先后顺序排列所形成的数列。(2)截面数据。是指在同一时点或时期上,不同统计单位的相同统计指标组成的数据。如人口数、企业数等。2.方程识别条件的研究3.选择适当的经济计量方法估计模型参数(三)验证模型第一,经济理论准则;第二,统计准则;第三,经济计量准则。(四)使用模型第二部分一元线性回归模型一、一元线性回归模型(一)总体回归函数Y的条件均值E(Y/Xi)是Xi的函数,即E(Y/Xi)=f(Xi)(二)样本回归函数iiXY21ˆˆˆ其中,的估计量为)/(ˆiXYEY,的估计量为11ˆ,的估计量为22ˆ。称该函数为样本回归函数。3样本回归函数随机形式:iiieXY21ˆˆ二最小二乘估计(一)普通最小二乘法(OLS)对于一元线性回归模型(总体)iiiuXY21样本回归模型为iiieXY21ˆˆiieYˆ最小二乘准则,使:22)ˆ(iiiYYe221)ˆˆ(iiXY尽可能地小,其中,2ie是残差的平方。得到下列方程:iiXnY21ˆˆ221ˆˆiiiiXXYX其中,n是样本容量。求解该联立方程,可得22)())((ˆXXYYXXiiiXY21ˆˆ其中,nXX,nYY分别为X和Y的样本均值。(二)经典线性回归模型对于总体线性回归模型,其经典假定如下。假定1:误差项ui的均值为零。假定2:同方差性或ui的方差相等。对所有给定的Xi,ui的方差都是相同的。假定3:各个误差项之间无自相关,ui和uj(i≠j)之间的相关为零。4假定4:ui和Xi的协方差为零或E(uiXi)=0假定5:正确地设定了回归模型,即在经验分析中所用的模型没有设定偏误。假定6:对于多元线性回归模型,没有完全的多重共线性。就是说解释变量之间没有完全的线性关系。(三)最小二乘估计量的性质:高斯—马尔可夫定理高斯—马尔可夫定理:在给定经典线性回归模型的假定下,最小二乘估计量是最佳线性无偏估计量。该定理说明最小二乘估计量jˆ是j的最佳线性无偏估计量。即第一,它是线性的,即它是回归模型中的被解释变量Y的线性函数。第二,它是无偏的,即它的均值或期望值)ˆ(jE等于其真值j,即jjE)ˆ(。第三,它在所有这样的线性无偏估计量中具有最小方差。具有最小方差的无偏估计量叫做有效估计量。(1)最小二乘估计的方差与标准误2ˆ的方差为22222)()ˆ(XXkVarii1ˆ的方差为2221)()ˆ(XXnXVari最小二乘估计的标准误为22)()ˆ(XXSei221)()ˆ(XXnXSeii(2)2的最小二乘估计量2ˆ22nei(四)判定系数R2--拟合优度的度量222)ˆ()(iiieYYYY52)(YYi表示实测的Y值围绕其均值的总变异,称为总平方和(TSS)。2)ˆ(YYi为来自解释变量的回归平方和,称为解释平方和(ESS)。2ie是围绕回归线的Y值的变异,称为残差平方和(RSS)。TSS=ESS+RSS这说明Y的观测值围绕其均值的总变异可分解为两部分,一部分来自回归线,而另一部分则来自扰动项ui。定义R2为TSSESSYYYYRii222)()ˆ(或222)(1YYeRiiTSSRSS1(三)假设检验1.检验回归系数的显著性--t检验)2(~)ˆ(ˆ222ntSet即t服从自由度为n-2的t分布。原假设0:20H备择假设0:21H此时,我们得到t统计量为标准误估计值)ˆ(ˆ22Set回归分析的结果,应该以清晰的格式予以表达,通常采用如下格式(以收入—消费模型为例)iiXY7616.08788.159ˆSe=(52.9184)(0.0149)t=(3.0212)(51.1354)P=(0.0165)(0.0000)6R2=0.9970ˆ=67.6376三、回归分析的应用--预测(二)均值预测均值预测就是预测对于给定的X0,Y的条件均值的值,也就是预测总体回归线本身上的点。0210ˆˆˆXY这里0ˆY是E(Y/X0)的估计量。这个点预测是一个最佳线性无偏估计量。0ˆY是一个估计量,不同于它的真实值E(Y/X0)。因为0ˆY是随机变量1ˆ、2ˆ的函数,因此,0ˆY也是一个随机变量。E(Y/X0)的置信区间为:1)]ˆ(ˆˆ)ˆ(ˆˆ[02/02102102/021YSetXXYSetXP对每个X值求置信区间,并把这些置信区间在二维直角坐标系中连结起来,我们就得到关于总体回归模型的置信域。(三)个值预测如果预测对应于给定X值(X=X0)的单个Y值(Y=Y0),其点预测为0210ˆˆˆXY,0ˆY为0Y的最佳线性无偏估计量。个值预测的点预测与均值预测的点预测结果相同,但其方差不同,区间预测的结果也不同。其方差据下式计算。])()(11[)ˆ(220200XXXXnYYVari在个值预测中,000ˆˆeYY,代表预测误差。0ˆe的来源有两个,一个是0ˆY的抽样误差,来自于我们对j的估计,即)ˆ(0YVar,它随样本容量的增大而变小。另一个是总体误差项u的方差2,它不随样本容量的变化而变化。个值预测的置信区间为:)ˆ(ˆ)ˆ(ˆ002/0002/0YYSetYYYYSetY个值预测的置信区间比均值预测的置信区间要宽。这是因为个值预测的误差除了来源于抽样波动外,还来源于误差项u的随机扰动,而均值预测的误差来源仅仅为抽样波动。对7第三部份多元线性回归模型一、多元回归模型的定义(一)多元回归模型的意义多元线性回归模型:在模型中包含二个以上的解释变量的线性回归模型称为多元线性回归模型。(二)含有两个解释变量的多元回归模型含有两个解释变量的多元回归模型是最简单的多元回归模型。模型形式为:iiiiuXXY33221(三)含有多个解释变量的模型多个解释变量的多元回归模型是一元回归模型和二元回归模型的推广。含被解释变量Y和k-1个解释变量X2,X3,…,Xk的多元总体回归模型表示如下:ikikiiiuXXXY33221i=1,2,…二、最小二乘估计(一)最小二乘估计量(二)判定系数R2及调整的判定系数2R1.判定系数R2在一元回归模型中,判定系数R2是回归方程拟合优度的一个度量;它给出了在被解释变量Y的总变差中由(一个)解释变量X解释了的比例或百分比。将其推广到多元回归模型中,判定系数依然为解释平方和ESS与总平方和TSS的比值,即:TSSRSSTSSESSR122.调整的判定系数2R)1/()()/(1222nYYkneRii式中,k为包括截距项在内的模型中的参数个数。所谓调整,就是指2R的计算式中的2ie8和2)(YYi都用它们的自由度(n-k)和(n-1)去除。调整的判定系数2R和R2的关系为:knnRR1)1(122(1)对于k1,2RR2。这意味着,随着X变量的个数增加,2R比R2增加得慢些。(2)虽然R2非负,但2R可以是负的。在应用中,如果遇到2R出现负的情形,就令2R=0。3.回归分析中2R的应用在回归分析中,我们的目的并不是为了得到一个高的2R,而是要得到真实总体回归系数的可靠估计并做出有关的统计推断。在实证分析中,经常碰到有着较高的2R,但某些回归系数在统计上不显著的回归模型,这样的模型是没有应用价值的。所以,我们应更加关心解释变量对被解释变量的理论关系和统计显著性。如果在其它条件相同的条件下,得到一个较高2R,当然很好;如果2R偏低,也不能说明模型不好。在经典线性回归模型中,并不要求2R一定是较高的。(三)最小二乘估计量的期望值和方差1.偏回归系数jˆ的期望值在多元回归模型满足经典假定的条件下,普通最小二乘估计量是总体参数的无偏估计。即:jjE)ˆ(,j=1,2,…,k2.jˆ的方差和标准误jˆ的期望值度量了jˆ的集中趋势。而jˆ的方差则度量了jˆ围绕其期望值的集中程度,也就是度量了jˆ的估计精度。在满足经典假定的条件下,偏斜率系数估计量的方差为:)1()ˆ(22jjjRSSTVar9式中,nijijjXXSST12)(为Xj的总样本变异;j=2,3,…,k;2jR为将Xj对所有其它解释变量(并括一个截距项)进行回归所得到的判定系数R2。3.2的估计量由于干扰项ui不可观测,因此必须据样本结果估计2。2的无偏估计量为:knRSSknenii122ˆ式中2ˆ为2的估计量,n为样本容量,k为多元回归模型中的参数个数。2的估计量2ˆ是2的无偏估计量。on)(四)最小二乘估计量的性质在多元回归模型中,最小二乘估计量同样具有一元回归中的优良性质。高斯--马尔可夫定理对此给予了精辟的阐述。高斯--马尔可夫定理:在多元线性回归模型的经典假定下,普通最小二乘估计量1ˆ,2ˆ,…,kˆ分别是1,2,…,k的最佳线性无偏估计量。就是说,普通最小二乘估计量1ˆ,2ˆ,…,kˆ是所有线性无偏估计量中方差最小的。高斯--马尔可夫定理的意义在于,当经典假定成立时,我们不需要再去寻找其它无偏估计量,没有一个会优于普通最小二乘估计量。也就是说,如果存在一个好的线性无偏估计量,这个估计量的方差最多与普通最小二乘估计量的方差一样小,不会小于普通最小二乘估计量的方差。三、多元线性回归模型的检验(一)偏回归系数的显著性检验--t检验)ˆ(ˆjjjSet服从自由度为n-k的t分布。k为总体回归模型的参数个数,j为总体回归参数,jˆ为j10的普通最小二乘估计量,Se(jˆ)为jˆ的标准误。在经济计量分析中,我们最关心的是解释变量Xj是否与被解释变量Y线性相关。因此,我们的主要目的在于检验原假设H0:j=0式中,j对应k-1个解释变量中的任意一个。如上式成立,即j=0,则意味着Xj对Y的期望值没有任何影响。在经济计量分析中,备择假设通常设定为:0:1jH上式表示Xj对Y有显著影响,j可正可负。对j进行检验使用