《计量经济模型与经济预测》一、线性回归模型最小二方程原理和参数估计Ŷ=a+bxyQ=∑(y-ŷ)→最小=∑(y-a-bx)2→最小ŷ对a和b求一阶微分2Q/2A=2∑(y-a-bx)(-a)=02Q/2B=2∑(y-a-bx)(-bx)=0x得:∑y-na-b∑x=0→∑y=na+b∑x=0∑xy-a∑x-b∑x2=0∑xy=a∑x+b∑x2=0得:a=∑y/n-b(∑y/n)b=[∑xy-(∑x)(∑y)/n]/∑x2-(∑x)2=Lxy/Lxx回归系数b说明当x变动一个单位时,y平均变动一个b的值回归误差估计和相关系数估计标准误差:Sy=∑(y-ŷ)2/(n-2)=(∑y2-a∑y-b∑xy)/n-2相关系数:R=Lxy/LxxLyyLxy=∑xy-(∑x∑y)/nLxx=∑x2-(∑x)2/nLyy=∑y2-(∑y)2/n●线性回归模型预测当计算回归模型由大样本计算时(n30),其预测区间的误差分布服从正态分布,则预测区间为:ŷ0=(a+bx0)±(Z2/2)×Sy当计算回归模型由小样本计算时(n30),其预测区间的误差分布服从七分布,则预测区间为:ŷ0=(a+bx0)±(Ta/2)×Sy×1+1/n+[(X0-X)2/∑(X-X)2]例:建筑面积(万m2)x建造成本(万元)yx2y2xyŷy-ŷ(y-ŷ)2414.816219.0459.214.5820.2180.047524212.84163.8425.612.5860.2140.045796313.39176.8939.613.588-0.0840.047524515.425237.1677.015.580-0.1800.032400414.316204.4957.214.582-0.2820.079524515.925252.8179.515.580-0.3200.010240∑2386.5951254.23338.486.49_____0.181924解:b=[338.4-1/6(23)(86.5)]/[95-1/6(23)2]=0.998a=86.5/6-0.998×(23/6)=10.59待线性回归方程:ŷ=10.59+0.998x即建筑面程每增加一万m2,建造成本要平均增加0.998万元Sy=∑(y-ŷ)2/(n-2)=0.0181924/(6-2)=0.2133r=Lxy/LxxLyy=(∑xy-∑x∑y/n)/[∑x2-(∑x)2/n][∑y2-(∑y)2/n]=0.973预测:假设x0=4.5时,y0=10.59+0.998×4.5=15.081(万元),当n=630时,查七分布表ta/2(n-2)=t(0.025)(4)2.78ta/2(n-2)×Sy×1+1/n+(x0-x)2/∑(x-x)2=0.6579所以建造成本的区间预测在显著性水平为a=5%,即以95%的概率计算y0=15.081±0.6579,即在[14.4231—15.7389]万元之间二、非线性回归模型—曲线回归模型在对客观现象选择回归模型时,应注意:1、回归方程的形式应与经济学的基本理论相一致,应该在定性分析和定量分析的基础上选择适当的回归模型2、回归方程与实际现象的变量值应要有较高的拟合程度,能较好地反映经济实际运行趋势3、在对方程的模型一时无法判断时,可先画散点图,观察现象实际值的变动趋势,来选择相应的拟合回归模型。或者多选择几个回归模型,加以拟合,分别计算估计标准误差,选择估计标准误差最小的那个回归模型4、回归模型的数学形式要尽可能简单,一般说来,数字型式越简单,则基回归模型的可操作性越强。过于复杂的回归模型的数学形式在实际经济分析和经济预测中,其实际应用价值不大抛物线方程:ŷ=a+bx+cx2根据最小二乘法原理,求该方程待定a、b、c参数的方程组如下:∑y=na+b∑x+c∑x2y∑xy=a∑x+b∑x2+c∑x3∑x2y=a∑x2+b∑x3+C∑x4x判定某变量趋势是否符合抛物线议程时,可利用差分法:1、当X以一个常数变化时,Y的一阶差分即△Y=Yt-Yt-1的绝对值也接近一个常数时,该变量的变化可用直线方程来拟合。2、当X从一个常数变化时,Y的二阶差分即△Y2t=△Yt-△Yt-1的绝对值接近一个常数时,该变量的变化可用抛物线方程来拟合。●抛物线方程●指数曲线方程该方程常用于拟合某变量值的环比,即Yt/Yt-1的绝对值近似于一个常数时,就可用指数曲线方程来拟合。ŷ=abx对方程两边求对数:lgy=lga+lgb×x换元令lgy=Ylga=Algb=B得:Y=A+Bx,化成直线方程的形式,求出A、B的参数值,再分别求反对数,就可求出a、b的参数值,指数曲线因a、b的取值不同而表现出不同的变化形式:xxxxyyyy●对数函数曲线ŷ=a+blnx,令x’=lnx,把方程变成直线方程的形式,求出a、b的参数值。对数函数的特点是随着x的增大,x的单位变动对Y的影响效果递减。●S函数曲线(逻辑曲线)ŷ=1/a+be-xy换元令y’=1/y,x’=e-x得y’=a+bx’化成直线方程的形式p可求出a、b的参考值。该方程的特点是某变量刚开始时,随着Xx的增加,y的增长速度逐渐增加,IIIIIIIV当y达到一定水平时,其增长速度又放慢,最后超近于一条渐近线。该方程经常用来描述某消费品的生命周期的变化,可将其分为四个阶段,即缓慢增长→快速增长→增速放慢→相对饱和p为一拐点。三、多元回归模型模型与参数估计ŷ=a+bx1+cx2+dx3+……..多元回归就是分析在多个自变量(x)与因变量(y)相互关系的基础上,确定一个多元回归模型,然后根据各个自变量的变动来估计或预测因变量的变动程度。根据最小二乘法原理,以二元回归方程为例,说明求其参数的方法:ŷ=a+bx1+cx2∑y=na+b∑x1+c∑x2∑x1y=a∑x1+b∑x12+c∑x1x2∑x2y=a∑x2+b∑x1x2+c∑x22例:根据下表计算二元回归方程利润额y销售额x1流通费用x2X1yX2yX1x2X12X22ŷ1245003506200043400175000250000122500124.1142480315681604473015120023040099225141.41325203606864047520187200270400129600133.51345153556901047570182825265225126025133.91475253517717551597184275275625123201148.21405323677448051384195244283024134698138.11495503748195055726205700302500139876148.8∑9683622247250141534192312814441877174875116968.0将上述有关数字代入二元回归的方程组:986=7a+3622b+2472c501415=3622a+1877174b+1281444c341923=2472a+1281444b875116c得:a=-5.0657b=1.0072c=-1.0698二元回归方程:ŷ=-5.0657+1.0072x1-1.0698x2●多元回归方程的矩阵形式二元回归方程的矩阵形式表现为:Y=XB其中:y11x21……xk1b1y21x22……xk2b2Y=…X=……………B=…yn1x2n……xknbn按矩阵计算原理:Y=XB→X’Y’=X’XB→(X’X)-1×X’Y=(X’X)-1(X’X)B→B=(X’X)-1X’Y例:下表列出某商品销售量(Y)与居民人均收入(x1)和单价(x2)的有关资料。`年份12345678910销售量(y百件)10101513142018241923居民人均收入(x1百元)578991010121315单价(x1十元)2325434354上表中有关数据的矩阵表示为:15210b1109835X=173Y=10B=b2(x’x)=981038359……………35359133115423b31661.6416-0.0839-0.2054(x’y)=1743(x’x)-1=-0.08390.0188-0.0286592-0.2054-0.02860.13891.6416-0.0839-0.20541664.58751B=(x’x)-1×x’y=-0.08390.0188-0.02861743=1.86847-0.2054-0.02860.1389592-1.79957由此得多元回归方程为:ŷ=4.58751+1.86847x1-1.79957x2●回归方程的方差估计Sy2=∑(y-ŷ)2/(n-k)=∑e2/(n-k)∑e2=e’e=Y’Y-BX’Y=2980-4.58751×166-1.86847×1743+1.79957+1.79957×592=27.08∑e227.08S=S2=n-k=10-3=3.8686=1.97S称为回归方程的估计标准误差,S越小则表明样本回归方程的代表性越强●多元回归方程的检验根据线性方程方差分析的原理:∑(y-y)2=∑(ŷ-y)2+∑(y-ŷ)2(y-ŷ)ŷ(y-y)S总=S回+S残(ŷ-y)y1.回归方程拟合程度检验在回归方程拟合程度检验中,应用可决系数指标来回加以检验,可决系数越大,说明回归方程对实际数值的拟合程度越好R2=∑(ŷ-y)2/∑(y-y)2=S回/S总=1-S残/S总在考虑变量自由度的情况下,修正的可决系数:R2=[S回/(n-k)]/[S总/(n-1)]=1-[S残/(n-k)]/[S总/(n-1)]=1-[27.08/(10-3)]/244.4/(10-1)]=0.842.回归系数的显著性检验在这一检验的目的是为了检验各回归系数对应的自变量(xi)对因变量(y)的影响是否显著,以便对各个自变量的选择作出正确的判断。一般说来,当某个自变量(xi)的回归系数(bi)的显著性检验无法通过,则说明该自变量对因变量的影响在一定显著水平(一般a=0.05)不够显著,则就可以将该自变量从回归模型中删除,这样才能以尽可能少的自变量去建立回归模型,达到到尽可能高的拟合度,同时也可减少计算工作量多元回归模型中的回归系数检验采用t检验,公式如下:tbj=bj/sbjsbj=sy2×Ωjj=syΩjj式中Ωjj为(x’x)-1矩阵中的第j个对角线的元素,上例中Sy=1.97;Ω11=1.6416;Ω22=0.0188;Ω33=0.1389则tb1=4.5875/(1.97×1.6416)=1.82tb2=1.8685/(1.97×0.0188)=6.92tb3=-1.7996/(1.97×0.1398)=-2.45查t分布表(a=0.05),双侧临界值t(a/2)(n-k)=t(0.05/2)(10-3)=2.365,上述tb2=6.922.365,tb3=-2.452.365,说明b1和b2均能通过检验,说明x1和x2对y的影响是显著的,而tb1=1.822.365,不能通过检验,说明在建立回归方程时,不必设常数项,由此再根据实际资料,建立拟合的多元回归方程。3.回归方程的显著性检验该检验应用下检验来进行:F=[S回/(k-1)][S残/(n-k)],上例中S总=224.4,S残=27.08S回=S总-S残=224.4-27.08=197.32则F=[197.32/(3-1)]/[27.08(10-3)]=25.50查F分布表,当a=0.01,自由度为(2.7)时,F2=9.55,当a=0.05,自由度为(2.7)时,Fa=4.74,可知F=25.50都大于Fa,说明该多元回归方程是比较显著的,可以用该方程进行经济预测。设x1=2200元,x2=50元/件时,对某商品需求量(y)的预测值为y=4.5875+1.8685×22+(-1.7996)×5=36.70(百件)●多元回归方程的多重共线性问题在多元回归模型中,要求模型中任何自变量之间不存在密切的线性相关关系存在,则说明