Econometrics计量经济学第一章计量经济学概论§1.1计量经济学§1.2建立计量经济模型的步骤和要点§1.3计量经济学模型的应用§1.1计量经济学一、计量经济学的定义与发展计量经济学是以经济理论为指导的,以数学、统计学为方法的,以事实为依据的,以电脑为手段的从事经济活动或经济关系数量规律研究的,并以建立、检验和运用计量经济模型为核心的一门经济学学科。(利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学)英文“Econometrics”一词最早是由挪威经济学家R.Frich提出来的,将计量经济学定义为经济理论、统计学和数学的三者结合。数理经济学计量经济学经济统计学数理统计学经济学统计学数学电脑这一必不可少的手段与工具自1969年设立诺贝尔经济学奖,首届获得者就是计量经济学的创始人弗里希和荷兰经济学家丁伯根,表彰他们开辟了用计量经济方法研究经济问题这一领域,之后,直接因为对计量经济学的发展作出贡献而获奖者达十余人,因为在研究中应用计量经济方法而获奖者占获奖总数的三分之二以上。2000年度,诺贝尔经济学奖获得者是赫克曼(Jams.J.Heckman)和麦克法登(Daniel.L.Mcfadden),原因是他们在微观计量经济学领域的贡献,他们发展了广泛应用于个人和家庭行为的实证分析的理论和方法。2003年诺贝尔经济学奖授予美国经济学家恩格尔(Engle)和英国经济学家格兰杰(Granger),以表彰他们在“分析经济时间序列”研究领域作出的突破性贡献。目前,计量经济学在西方国家经济学科占据重要的地位,著名计量经济学家、诺贝尔经济奖获得者克莱因(Klaien)在《计量经济学教科书》序言中写道:“在大多数大学和学院中,计量经济学的讲授已成为经济学课表中最有权威的一部分。”Samuelson曾说:“二次世界大战以后的经济学是计量经济学的时代”二、计量经济学模型模型是对现实的描述和模拟;计量经济模型是由随机性的数学方程或方程组构成的,通过它们可以揭示现实经济生活中的数量关系。计量经济模型是计量经济学研究的核心。计量经济学方法及其应用,都是围绕建立、估计、检验和运用计量经济模型这一核心进行的。如果离开了模型建立的经济背景、方法本身的经济学解释、方法应用的经济对象,计量经济学模型将是一堆无用的数学符号。揭示经济活动中各变量之间的定量关系,用一个或一个以上的随机性数学方程来描述现实的经济活动与经济关系,更深刻地揭示出该经济系统的数量变化规律。模型由系统(联立方程)或方程组成,方程由变量、参数(系数)、运算符和随机扰动项组成。通过计量经济模型可以对研究对象进行深入的研究——结构分析、经济预测、设计或评价经济政策。主要特点随机扰动项理论经济学和数理经济学一般假定经济变量之间存在确定性的规律,从而建立确定性的模型。计量经济模型与一般经济理论模型的主要区别就在于模型中添加随机扰动项或误差项,建立的是所谓的概率性模型。方程中列入随机扰动项的主要原因(1)观测误差(2)由于忽略了次要因素引起的误差(3)由于社会经济现象固有的不可重复性,即使相同条件下进行试验,也不可得出完全相同的结果,因而出现随机误差,即固有的随机性特性。这些误差越小,表明内生变量与外生变量的相关程度越高,亦即模型较好地描述各个经济变量之间的关系。§1.2建立计量模型的步骤和要点建立计量模型的基本步骤一、理论或假说的陈述二、样本数据收集三、建立数学模型四、建立统计或计量经济模型五、模型参数的估计六、模型的检验计量经济学模型成功三要素一、理论或假说的陈述经济理论是模型建立的基石。要了解经济理论对问题的阐述是怎样的。举例:经济形势对人们工作意愿的影响假说1、受挫-工人假说:当经济形势恶化时,表现为较高的失业率,许多失业工人放弃寻找工作的愿望并退出劳动市场2、增加-工人假说:当经济形势恶化时,许多目前并未进入劳动市场的后备工人(比如带孩子的母亲)可能会由于养家的人失去工作而决定进入劳动市场。劳动力参与率的增加或减少依赖于增加工人和受挫工人的力量对比二、样本数据收集几种常用的样本数据时间序列数据截面数据合并数据(面板数据Paneldata)虚拟变量数据1、时间序列数据(TimeSeriesData)时间序列数据又俗称为纵向数据,按时间的先后排列的统计数据。例如,我国自改革开放的1978-2003年GNP数据。在西方经济学中称它为流量,在统计经济学上称它为时期数。时间序列的时间是变化的。常用的时间间隔有:年、季度、月、周(7日或5日)、日时间序列数据通常存在季节变动和序列相关——自相关(误差的协方差不等于0,即前期误差与后期误差之间存在相关)。采纳时间序列数据的注意事项样本区间内经济行为的一致性,如建立纺织行业生产模型,80年代后期以来为供大于求(居民收入和出口额),80年代中期以前为供不应求(资本、劳动等)样本点之间数据具有可比性,价值形态出现的数据往往是不可比的,应当消除物价因素的影响样本观察值过于集中,不能反映经济变量间的结构关系,应增大观测区间时间序列误差项间往往存在序列相关(自相关)2、截面数据(Cross-SectionData)截面数据又俗称横向数据,是一批发生在同一时间截面上的调查数据。研究某个时点上的变化情况。例如工业普查数据、人口普查数据等。在西方经济学中称它为存量,在统计经济学上称它为时点数。截面数据的时间是凝固的。截面数据中大多存在异方差,必须引起注意。采纳截面数据的注意事项样本点间的同质性(样本与母体的一致性),截面数据很难用于总量估计。截面数据一般存在误差项的异方差3、合并数据(PooledData)合并数据:既有时间序列数据又有横截面数据平行数据(PanelData):同一个横截面单位,在不同时期的调查数据。是时间序列数据与截面数据的合成体。例如,1978-1999年我国各省市城镇居民消费结构的调查资料。4、虚拟变量数据虚拟变量数据也称二进制数据,一般取1或0,一般用以表示定性变量,例如政策变量、条件变量等。用虚拟变量表示定性数据性别D卫生等级D1D2男0不清洁10女1清洁01最清洁11样本数据的质量完整性(不能有遗失数据,必要时,采用插值技术补上)准确性(准确真实且数据口径方面要符合建模要求)可比性(将范围口径和价格口径调整一致)一致性——同质性(样本与母体一致),用31个省市的数据作为全国总量模型的数据就违反了一致性举例:美国1980-1996年间城市劳动参与率(CLFPR)和城市失业率(CUNR)的数据年份CLFPR(%)CUNR(%)年份CLFPR(%)CUNR(%)198063.87.1198966.55.3198163.97.6199066.55.61982649.7199166.26.81983649.6199266.47.5198464.47.5199366.36.9198564.87.2199466.66.1198665.37.0199566.65.6198765.66.2199666.85.4198865.95.5三、建立数学模型1.理论模型设计的定义依据一定的经济理论,先验地用一个或一组数学方程式表示被研究系统内经济变量之间的关系。三个主要阶段(1)选择变量(2)确定变量之间的数学关系(3)拟定模型中待估计参数的数值范围理论模型举例——生产函数成立。一个随机扰动项等式才论关系,认为只有加上理、劳动与产出量之间的公式描述了技术、资本表示劳动。表示资本,表示技术,表示产出量,公式中,,其中,LKTQNuuLkeAQLKTfQt101010,~,,,2(1)确定模型所包含的变量模型应该包括那些变量?哪个是因变量(被解释变量)?哪个是自变量(解释变量)?哪个是内生变量?哪个是外生变量?被解释变量是由研究目的确定的,即因果关系中“果”解释变量是用以说明被解释变量的,即被解释变量的变动是由解释变量的变动引起的,是因果关系中“因”。解释变量包括:外生变量(外生经济变量、外生条件变量、外生政策变量)和滞后被解释变量,其中有些变量如外生政策变量、条件变量经常以虚拟变量的形式出现。必须选择适当的统计指标(统计学上亦称变量)来表征模型中变量。如:用工业总产值来表征产出量用固定资产原值来表征资本用职工人数来表征劳动用技术进步的速度来表征技术选择解释变量的要求要求一需要正确把握所研究的经济现象中暗含的经济学理论和经济行为规律。这是正确选择变量的基础。要求二选择解释变量需要考虑数据的可得性要求三选择变量应考虑解释变量之间不相关注:从这里可以看出,建立模型的第一步就已经体现了计量经济学是经济理论、经济统计学和数学三者结合的思想。(2)确定模型的数学形式模型函数的数学形式,线性的?亦或是非线性的?选择模型数学形式的主要依据是经济行为理论。数理经济学中已对常用的生产函数、需求函数、消费函数、投资函数等模型的数学形式进行了广泛的研究,可以借鉴。将被解释变量和解释变量的散点图中样本点的分布形式作为模型的数学形式。反复采用多种可能函数形式对样本进行拟合,然后选择一种拟合较好的函数形式作为模型的数学形式。(3)拟定理论模型中待估计参数的理论期望值模型包括几个参数,符号如何?期望值的取值范围?参数一般都具有明确的经济含义,参数的具体数值只有在模型完成以后才能确定。但它们的取值范围,即理论期望值,可以根据它们的经济含义,在理论模型设计阶段拟定。可以用这些根据经济理论拟定的理论期望值,来检验模型估计的结果。生产函数中各参数的理论期望值2,,,~,tQfTKLuQAuuNekL222201001,01100000AQQKQQLKL其中,并接近于为技术进步的速度效率系数四、建立统计或计量经济模型根据散点图像,可以建立CLFPR与CUNR的简单数学模型:CLFPR=B1+B2*CUNR考虑到所有其他影响劳动力参与率的因素,并假定其包含在随机变量u中,于是可以得到以下计量模型:CLFPR=B1+B2*CUNR+u五、模型参数的估计参数是模型中表示变量之间数量关系的常系数。它将各种变量连接在模型之中,具体说明解释变量对被解释变量的影响程度。在未经实际资料估计之前,参数是未知的。模型设定之后,依据可利用的数据资料,选择适当的估计方法,例如最小二乘进行估计。参数估计是一个纯技术过程,包括对模型进行识别(对联立方程而言)、估计方法的选择、软件的应用等。参数估计的意义参数估计为经济理论提供了实际经验的内容,并验证经济理论。如凯恩斯消费理论:“当人们收入增加时,他们倾向于消费,但其增长的程度不和收入增加的程度一样多”。设y表示消费,x表示收入,建立模型如下:y=b1+b2*x+e。若参数b2的估计值为0.8,它不仅说明了边际消费倾向的实际内容,同时也证实了凯恩斯消费理论关于b2介于0-1之间的假定。六、模型的检验参数估计以后,模型便已确定。但模型是否符合实际,能否解释实际经济过程,提交使用前还需要进行检验。模型必须通过四级检验:经济意义检验统计假设检验计量经济学检验模型预测检验1、经济意义检验经济意义检验主要检验各个参数估计量是否与经济理论和实际经验相符主要方法是将参数的估计值与设计理论模型时拟定的期望值进行比较;检验估计参数的符号、大小以及相互之间的关系,判断是否合理煤炭行业生产模型检验参数估计量的符号木材耗量电力耗量职工人数固定资产原值煤炭产量00256.000681.001527.000067.0542.108在该模型中,电力消耗量前的参数估计量为负,意味着电力消耗越多,煤炭产量越低,从经济行为上无法解释。模型不能通过检验煤炭企业生产函数模型(进一步检验参数估计量的大小)51.085.151.085.169.251.085.169.2RdRMdMGdGMdMRLnGLnMLnLnLnLn职工人数固定资产原值煤炭产量在该模型中,固定资产原值前的参数的经济意义是明确的,即固定资产原值的产出弹性;表