第二部分线性回归模型Chp9:回归模型的函数形式主要内容对数模型——度量弹性半对数模型对数-线性模型——度量增长率线性-对数模型——解释变量为对数形式倒数模型多项式模型零截距模型小结问题的提出在很多时候,自变量的变化与应变量并不是简单的线性关系,如考虑某一段时间内,某个经济变量增长率,如GDP增长率/货币供应/失业率等,这就需要引入回归模型的其他一些函数形式。在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。如著名的Cobb-Dauglas生产函数表现为幂函数曲线形式、宏观经济学中的菲利普斯曲线(Pillipscuves)表现为双曲线形式等。但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归模型的理论方法。122:,1,2,,iikkiiPRFYBBXBXuik因变量和解释变量之间的线性关系,包括参数线性和解释变量线性两种。前面的分析假定总体回归函数的形式为:但是根据经济现实或经济理论,变量之间不一定存在这种形式的线性关系。如参数线性形式的回归函数:121iiiYBBuX或参数、变量均为非线性形式的函数关系,如C-D生产函数:12BBuYALKe对于这些不符合线性假定的模型进行参数估计,必须加以适当的变换以后,才能用OLS方法估计模型参数。一、对数模型Doublelogmodel——度量弹性考虑博彩支出的例子:Y:博彩支出;X:个人可支配收入(PDI)上式可转化为:lnYi=lnA+B2lnXi模型特点:关于变量非线性BiiYAX2lnYi=lnA+B2lnXilnYi=B1+B2lnXilnYi=B1+B2lnXi+uilnYi=lnA+B2lnXi特点:**12iiiYBBXu双对数模型的特性:模型关于变量和参数都是线性的;斜率B2度量了Y对X的弹性,即X的单位变动引起Y变动的百分比。双对数模型的假设检验YYEXX图9-1Aconstantelasticitymodel.博彩的例子(数据见下,课堂操作)表9-1每周的博彩支出Y与个人可支配收入XYX18242623302734353340150175200225250275300325350375线性模型与双对数回归模型的比较回归模型的函数形式在一定程度上是个经验性问题。模型选择中的经验规律一般如下:根据数据作图——只适用于双变量情形;根据r2的大小选择的不当之处:两模型的应变量不同,一个是Y,一个是lnY解释变量的选择一般应考虑变量之间的相关性(理论基础)、解释变量系数的预期符号、统计显著性、弹性系数等度量工具。线性模型的弹性系数随着需求曲线上的不同点而变化,而双对数模型需求曲线上任何一点的弹性系数都是相同的。多元对数线性回归模型lnYi=B1+B2lnX2i+B3lnX3i+ui其中,B2,B3又称为偏弹性系数,它们度量了在其他变量保持不变条件下,应变量对某一解释变量的偏弹性。例:柯布-道格拉斯生产函数反应了产出与劳动力和资本投入之间的关系函数。劳动投入弹性+资本投入弹性=规模报酬参数规模报酬递增规模报酬递减规模报酬不变例9-3:对能源的需求二、半对数模型(semilogmodel)对数-线性模型——测量增长率半对数模型:仅有一个变量以对数形式出现Yt=Y0(1+r)tlnYt=lnY0+tln(1+r)lnYt=B1+B2·tYt*=B1+B2·t斜率度量了解释变量的绝对变化引起的Y的比例变动或相对变动。如果在上式中考虑进随机扰动项,则:lnYt=B1+B2·t+ut例:9-4关于美国人口增长率关于瞬时增长率和复合增长率b2=ln(1+r)r=eb2-1线性趋势模型:Yt=B1+B2t+ut线性趋势模型在实践中得到广泛应用的原因是,人们通常关注的是经济变量的相对变化,而非绝对变化由于两个模型的变量不同,故不能直接比较它们的r2。半对数模型:线性-对数模型:解释变量为对数形式线性-对数模型常用于研究解释变量每百分比变动引起应变量的绝对变化量。122lntttYBBXu2/YBXX2XYBX倒数模型(ReciprocalModel):倒数模型的特征:随着X的无限增大,Y接近渐近值或极限值B1三种常见形式:P193,图9-4121iiiYBBuX图9-4Thereciprocalmodel:Yi=B1+B2(1/Xi)例:9-6:美国的菲利普斯曲线年份Y(小时收入指数)X(城市失业率)年份YX1958195919601961196219634.23.53.43.03.42.86.85.55.56.75.55.71964196519661967196819692.83.64.356.16.75.24.53.83.83.63.5Figure9-5ThePhillipscurvefortheUnitedStates,1958-1969;(a)Reciprocalmodel;(b)linearmodel.例9-7共同基金收取的咨询费费率(%)净资产(10亿美元)费率(%)净资产(10亿美元)0.52000.50800.48400.46000.43980.42380.55.010.015.020.025.00.41150.40200.39440.38800.38250.373830.035.040.045.055.060.0多项式回归模型Polynomialmodel一般来说,令Y表示总成本,X表示产出,则二者关系可表示如下:Yi=B1+B2Xi+B2Xi2+B2Xi3根据价格理论,边际成本曲线和平均成本曲线为U型,故有:B1,B2,B40;B30B323B2B4Figure9-8Hypotheticalcost-outputdata.上述模型关于变量非线性,但却是参数线性。一般来说,X的不同次方项之间可能相关,却不会完全共线。例:9-8假想的总成本函数YX19322624024425712345260274297350420678910例如,描述税收与税率关系的拉弗曲线:抛物线:s=a+br+cr2其中,s:税收;r:税率c0设X1=r,X2=r2,则原方程变换为s=a+bX1+cX2c0例:9-9吸烟与肺癌的关系表9-9无截距回归——过原点的回归Yi=B2Xi+ui无截距模型与一般的模型不同在于:无截距模型使用了原始的平方和及交叉乘积,而有截距使用了均值调整后的平方和及交叉乘积;在样本方差时的自由度为n-1,而非n-2(只有一个未知参数);无截距模型一般不计算r2;有截距模型的残差平方和,总为0,但无截距模型不一定为0。关于度量比例和单位的说明例:关于私人总投资(GDI)与国内生产总值(GDP)的关系,P201结论:所有回归的相同;截距的单位总是与应变量的单位一致;若Y和X的度量单位相同,则斜率系数及其标准误相同,但截距及共标准误不同;若Y和X的度量单位不同,则斜率系数不同,但截距不变。本章小结本章主要介绍了不同的回归模型——参数线性,但不一定变量线性。每种模型的特殊性质及其适用条件。具体见表9-11Figure9-11Summaryoffunctionalforms.