计量经济学复习笔记CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。研究主体是经济现象及其发展变化的规律。2、运用计量分析研究步骤:模型设定——确定变量和数学关系式估计参数——分析变量间具体的数量关系模型检验——检验所得结论的可靠性模型应用——做经济分析和经济预测3、模型变量:解释变量:表示被解释变量变动原因的变量,也称自变量,回归元。被解释变量:表示分析研究的对象,变动结果的变量,也成应变量。内生变量:其数值由模型所决定的变量,是模型求解的结果。外生变量:其数值由模型意外决定的变量。外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响,但能够影响我们所研究的本期的内生变量。前定变量:前定内生变量和外生变量的总称。数据:时间序列数据:按照时间先后排列的统计数据。截面数据:发生在同一时间截面上的调查数据。面板数据:虚拟变量数据:表征政策,条件等,一般取0或1.4、估计评价统计性质的标准无偏:E(^β)=β随机变量,变量的函数?有效:最小方差性一致:N趋近无穷时,β估计越来越接近真实值5、检验经济意义检验:所估计的模型与经济理论是否相等统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著计量经济检验:是否符合计量经济方法的基本假定预测检验:将模型预测的结果与经济运行的实际对比CH2CH3线性回归模型模型(假设)——估计参数——检验——拟合优度——预测1、模型(线性)(1)关于参数的线性模型就变量而言是线性的;模型就参数而言是线性的。Yi=β1+β2lnXi+ui线性影响随机影响Yi=E(Yi|Xi)+uiE(Yi|Xi)=f(Xi)=β1+β2lnXi引入随机扰动项,(3)古典假设A零均值假定E(ui|Xi)=0B同方差假定Var(ui|Xi)=E(ui2)=σ2C无自相关假定Cov(ui,uj)=0D随机扰动项与解释变量不相关假定Cov(ui,Xi)=0E正态性假定ui~N(0,σ2)F无多重共线性假定Rank(X)=k2、估计在古典假设下,经典框架,可以使用OLS方法:OLS寻找min∑ei2^β1ols=(Y均值)-^β2(X均值)^β2ols=∑xiyi/∑xi23、性质OLS回归线性质(数值性质)(1)回归线通过样本均值(X均值,Y均值)(2)估计值^Yi的均值等于实际值Yi的均值(3)剩余项ei的均值为0(4)被解释变量估计值^Yi与剩余项ei不相关Cov(^Yi,ei)=0(5)解释变量Xi与剩余项ei不相关Cov(ei,Xi)=0在古典假设下,OLS的统计性质是BLUE统计最佳线性无偏估计4、检验(1)Z检验Ho:β2=0原假设验证β2是否显著不为0标准化:Z=(^β2-β2)/SE(^β2)~N(0,1)在方差已知,样本充分大用Z检验拒绝域在两侧,跟临界值判断,是否β2显著不为0(2)t检验——回归系数的假设性检验方差未知,用方差估计量代替^σ2=∑ei2/(n-k)重点记忆t=(^β2-β2)/^SE(^β2)~t(n-2)拒绝域:|t|=t2/a(n-2)拒绝,认为对应解释变量对被解释变量有显著影响。P值是尚不能拒绝原假设的最大显著水平。(所以P越小,显著性越好)P值a不拒绝P值a拒绝(3)F检验——回归方程显著性检验,检验整个模型原假设Ho:β2=β3=β4=0(多元,依次写下去)F=[ESS/(k-1)]/[RSS/(n-k)]~F(k-1,n-k)统计量F服从自由度为k-1和n-k的F分布FFa(k-1,n-k)(说明F越大越好)拒绝:说明回归方程显著,即列入模型的各个解释变量联合起来对被解释变量有显著影响一元回归下,F与t检验一致,且F=t25、拟合优度检验(1)可决系数(判定系数)R2=ESS/TSS=1-RSS/TSS特点:非负统计量,取值[0,1],样本观测值的函数,随机变量对其解释:R2=0.95,表示拟合优度比较高,变量95%的变化可以用此模型解释,只有5%不准确(2)修正的可决系数adjustedR2=1-(1-R2)(n-1)/(n-k)adjustedR2取值[0,1]计算出负值时,规定为0k=1时,adjustedR2=R2(3)F与可决系数F=[(n-k)/(k-1)]*[R2/(1-R2)]adjustedR2,R2,F都是随机变量联系:a都是显著性检验的方法b构成统计量都是用TSS=ESS+RSSc二者等价,伴随可决系数和修正可决系数增加,F统计量不断增加R2=0时,F=0;R2=1时,F趋近无穷;区别:aF有明确分布,R2没有bF检验可在某显著水平下得出结论,可决系数是模糊判断6、预测平均值预测和个别值预测A预测不仅存在抽样波动引起的误差,还要受随机扰动项的影响。个别值预测比平均值预测的方差大。个别值预测区间也大于平均值预测区间。B对平均值和个别值预测区间都不是常数。Xf趋近X均值,预测精度增加,预测区间最窄C预测区间和样本容量N有关,样本容量越大,预测误差方差越小,预测区间越窄。样本容量趋于无穷个别值的预测误差只决定于随机扰动项的方差。CH4多重共线性后果/原因——如何检验——如何修正1、后果/原因(1)完全/不完全多重共线X3=X1+2X2完全多重共线参数无法估计非满秩矩阵不可逆X3=X1+X2+u不完全多重共线性(2)无多重共线性模型无多重共线性,解释变量间不存在完全或不完全的线性关系X是满秩矩阵可逆Rank(X)=kRank(X’X)=k从而X’X可逆(X’X)-1存在(3)多重共线原因经济变量之间具有共同变化趋势模型中包含滞后变量使用截面数据建立模型样本数据自身原因(4)后果存在多重共线性时,OLS估计式仍然是BLUE(最佳线性无偏估计)不影响无偏性(无偏性是重复抽样的特性)不影响有效性(是样本现象,与无多重共线性相比方差扩大,但采用OLS估计后,方差仍最小)不影响一致性2、检验(1)两两相关系数(充分条件)两两相关可以推出多重共线性反过来不一定系数比较高,则可认为存在着较严重的多重共线性(2)直观判断(综合判断法)参数联合显著性很高(通过F检验)但个别重要解释变量存在异常,t不显著,或者β为负,与经济意义违背。F检验通过,t不通过,因为方差扩大了F是由RSS计算得出的(3)方差扩大因子VIFj=1/(1-Rj2)方差与VIF正相关VIF10严重多重共线Rj2是多个解释变量辅助回归确定多重可决系数(4)逐步回归(也是修正方法)不会有计算,但要了解过程针对多重共线性,没有什么特别好的修正方法,建模前要事先考虑,如果出现重要解释变量的多重共线性,可以考虑扩大样本容量CH5异方差原因、后果——检验——修正(WLS)异方差:被解释变量观测值的分散程度是随解释变量的变化而变化的。Var(ui|Xi)=E(ui2)=σi2=σ2f(Xi)1、原因后果(1)产生原因A模型设定误差B测量误差的变化C截面数据中总体各单位的差异异方差性在截面数据中比在时间序列数据中可能更常出现,因为同一时点不同对象的差异,一般来说会大于同一对象不同时间的差异。(2)后果A参数的OLS估计仍然具有无偏性(无偏性仅依赖零均值假定,解释变量的非随机性)B参数OLS估计式的方差不再是最小的,影响有效性(方差会被低估,从而夸大t统计量,t,F检验失效,区间预测会受影响,不显著的也有可能变显著)C不满足有效性,则也会影响一致性2、检验(要知道判断时原假设和备择假设;检验命题统计量;辅助回归函数形式;适用条件)原假设:同方差备择假设:异方差(1)图示:简单易操作,但判断比较粗糙(2)GQ:Goldfeld-Quanadt戈德菲尔德-夸特检验A大样本,除同方差假定不成立,其余假定要满足B对解释变量大小排序C去除中间C个观测值(样本的1/5-1/4),分成两个部分D构造F统计量,两个部分残差平方和服从卡方分布,则F=两部分残差平方和相除(大的除以小的)~F((n-c)/2-k,(n-c)/2-k)F临界值,拒绝原假设,则认为存在异方差E可判断是否存在异方差,不能确定是哪个变量引起(3)WhiteA大样本,丧失较多自由度B做残差对常数项、解释变量、解释变量平方及其交叉乘积等所构成的辅助回归^ei2C计算统计量nR2,n为样本容量,R2为辅助回归的可决系数D统计量服从卡方分布nR2卡方a(df)拒绝原假设,表明模型存在异方差E不仅能够检验异方差,还能判断是哪个变量引起的异方差(4)ArchA用于大样本,只对时间序列检验B做OLS估计,求残差,并计算残差平方序列et2,et-12….做辅助回归et2~et-12…et-p2C计算辅助回归可决系数R2,统计量(n-p)R2p是ARCH过程的阶数D统计量服从卡方分布(统计量就是”Obs*R-squared”所显示的数值)(n-p)R2卡方a(p)拒绝原假设,表明模型存在异方差E能判断是否存在异方差,但不能诊断是哪一个变量引起的(5)Glejser可以忽略。。要求大样本3、修正(1)对模型变换,取对数,但不能消除,只能减轻后果(2)WLS(不考计算,主要掌握思想)使残差平方和最小,在存在异方差时,方差越小的应约重视,确定回归线作用越大,反之同理。在拟合时应对较小的残差平方给予较大的权数,对较大的残差平方给予较小的权数。通常可取w=1/σi2将权数与残差平方相乘后再求和变换模型后剩余项u=ui/根号下f(Xi)已是同方差Var(u)=σi2/f(Xi)=σ2CH6自相关原因/后果——检验(DW是唯一方法)——修正(从广义差分出发)自相关:(序列相关)总体回归模型的随机误差项ui之间存在的相关关系。Cov(ui,uj)不为0自相关形式:ut=put-1+vt(-1p1)一阶线性自相关1、原因(从时间序列出发考虑)经济系统的惯性经济活动滞后效应数据处理造成的相关蛛网现象(某种商品的供给量受前一期价格影响而表现出的规律性)模型设定偏误(虚假自相关,可以改变模型而消除)2、后果(1)违背古典假定,继续适用OLS估计参数,会产生严重后果,和异方差情形类似(2)影响有效性,一致性;但不会影响无偏性。(3)通常低估参数估计值的方差,t统计量被高估,夸大显著性,t检验失去意义。t、F、R2检验均不可靠,区间预测精度降低,置信区间不可靠。3、检验(DW是唯一方法)(1)前提条件A解释变量X为非随机B随机误差项为一阶自回归形式C线性模型的解释变量中不包含之后的被解释变量D截距项不为零,只适用于有常数项的回归模型E数据序列无缺失项(2)表达式DW=∑(et-et-1)2/∑et2DW约=2(1-^p)|^p|=1所以DW[0,4](3)判断根据样本容量n,解释变量的数目k’(不含常数项)查DW分布表,得到临界值dL,dU0≦DW≦dL正相关dLDW≦dU无法判断dUDW4-dU无自相关4-dU≦DW4-dL无法判断4-dL≦DW≦4负相关模型中不存在滞后被解释变量,否则用得宾h检验4、修正(广义差分)(1)广义差分(p已知)ut=put-1+vtvt为白噪声,符合古典假定vt=ut-put-1所以△Yt=Yt-pYt-1此时,模型中随机扰动项ut-put-1无自相关(白噪声过程)(2)p未知情况下,先估计p,在使用广义差分A科科伦-奥科特迭代法^p=1-DW/2利用残差et辅助回归et=^pet-1+vt用第一次的估计p值进行广义差分,得到新的样本回归函数,继续辅助回归,直到两次估计的p值相差很小,或者回归所得DW统计量表明以无自相关为止。得到较高精度的估计p值后,再用广义差分对自相关修正效果较好。B得宾两步法第一步:利用广义差分形式,做Yt对Yt-1、Xt、Xt-1的回归模型,用OLS估计参数,Yt-1对应的系数就是p的估计值。但是是有偏、一致的估计。第二步:利用p的估计值,进行广义差分,再使用OLS对广义差分方程估计参数,得到无偏估计CH7分布滞后模