1/120第三章经典单方程计量经济学模型:多元线性回归模型TheClassicalSingleEquationEconometricModel:MultipleLinearRegressionModel2/120本章内容•§3.1多元线性回归模型概述•§3.2多元线性回归模型的参数估计•§3.3多元线性回归模型的统计检验•§3.4多元线性回归模型的预测•§3.5可化为线性的非线性模型•§3.6受约束回归3/120§3.1多元线性回归模型概述(RegressionAnalysis)一、多元线性回归模型二、多元线性回归模型的基本假设4/120一、多元线性回归模型5/120•总体回归函数:描述在给定解释变量Xi条件下被解释变量Yi的条件均值。j称为偏回归系数(partialregressioncoefficients),表示在其他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化。或者说j给出了Xj的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。总体回归函数(PRF)ikkiiikiiXXXXXYE221101),(6/120总体回归模型(PRM)i=1,2…,n•总体回归模型:•是总体回归函数的随机表达形式说明:k为解释变量的数目。但习惯上,把常数项看成为虚变量的系数,该虚变量的样本观测值始终取1。于是,模型中解释变量的数目为(k+1)。iikkiiiXXXY221107/120总体回归模型的矩阵表示121nnYYYY1)1(210kkβ121nnμμXβY)1(212222111211111knnknnkkXXXXXXXXXX8/120样本回归函数与样本回归模型•从一次抽样中获得的总体回归函数的近似,称为样本回归函数(sampleregressionfunction)。•样本回归函数的随机形式,称为样本回归模型(sampleregressionmodel)。i=1,2…,niikkiiieXXXYˆˆˆˆ22110i=1,2…,nikkiiiXXXYˆˆˆˆˆ221109/120样本回归函数与样本回归模型的矩阵表示βXYˆˆeβXYˆkˆˆˆˆ10βneee21e10/120二、多元线性回归模型的基本假设对一元回归模型基本假设的回忆与扩展11/120•假设1:模型设定假设•正确性。Theregressionmodeliscorrectlyspecified.•线性性。Theregressionmodelislinearintheparameters.iikkiiiXXXY2211012/120•假设2:解释变量X假设•确定性。Xvaluesarefixedinrepeatedsampling.Moretechnically,Xisassumedtobenonstochastic.•各解释变量X之间不存在严格线性关系。Thereisnoperfectmulticollinearityamongtheexplanatoryvariables.•对于nk+1,rank(X)=k+1)1(212222111211111knnknnkkXXXXXXXXXX13/120•假设3:X样本方差假设•各解释变量的样本具有足够的变异性;•随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。nknknijijniijxxxxQnQXXnxnn11111212')(11xxx其中,或时,当14/120•假设4:随机扰动项假设•0均值假设。Theconditionalmeanvalueofμiiszero.由模型设定正确假设推断。•同方差假设。Homoscedasticity,theconditionalvariancesofμiareidentical.是否满足需要检验。()0,1,2,,iiEXin0μX)(EIXμμXμ2)'()(EVar15/120•假设5:X与随机项μ不相关。ThecovariancesbetweenXiandμiarezero.由确定性假设可以推断。0XμX)'(EkjXXμXCovkiij,,10),(116/120•假设6:μ服从多维正态分布。Theμ’sfollowthenormaldistribution.)0(,21,σ~NXXμki),(~2I0XμN17/120§3.2多元线性回归模型的估计一、普通最小二乘估计二、参数估计量的性质三、样本容量问题四、例题补充:变量相对重要性比较18/120说明估计方法:–3大类方法:OLS、ML或者MM–在经典模型中多应用OLS–在非经典模型中多应用ML或者MM–ML和MM基本思路2章已介绍,本章略19/120一、普通最小二乘估计(OLS)20/120kjniXYjii,2,1,0,,,2,1),,(KikiiiiXXXYˆˆˆˆˆ221102112)ˆ(niiiniiYYeQ2122110))ˆˆˆˆ((nikikiiiXXXY观测值已知SRF形式•步骤:1、普通最小二乘估计及其矩阵表述残差平方和21/120kiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)ˆˆˆˆ()ˆˆˆˆ()ˆˆˆˆ()ˆˆˆˆ(221102222110112211022110kjj,,2,1,0,ˆ0ˆ0ˆ0ˆ0ˆ210QQQQkQMinnknkknkkiikikikiiiikiiYYYXXXXXXXXXXXXXXXXn212111211102112111111ˆˆˆYXXXβ1)(ˆ条件?YXβX)X(ˆ•由散式到矩阵:22/120XXe=011121121110001in2iik1kknnkiieeXXXeXe===...XXXeXeXeˆXXβ=XYˆXY=XXβ+XeˆY=Xβ+eXe因为样本回归函数为两边乘有:因为,则正规方程为:2、正规方程组的另一种等价表达23/120补充:最简单的多元线性回归模型是二元线性回归模型:iiiiuXXY22110(i=1,2,…,n)其OLS参数估计量:22122212122211ˆxxxxxxyxxyx2211022122212112122ˆˆˆˆXXYxxxxxxyxxyx24/1203、随机误差项的方差2的无偏估计记住结论即可,证明不作要求!βXYeˆMμμXXXXIμXXXXμμXβXXXXμXβ))(()()()(111eeμMMμμMμM为等幂矩阵25/120))1(()))((())(()))((()(212121kntrtrtrEEXXXXIXXXXIμXXXXIμee1)(2knEee1ˆ2kneetr()为矩阵的迹,满足交换律Tr(AB)=tr(BA)26/120二、参数估计量的性质27/120说明•在满足基本假设的情况下,多元线性模型结构参数的普通最小二乘估计具有线性性、无偏性、有效性。•同时,随着样本容量增加,参数估计量具有一致性。•利用矩阵表达,可以很方便地证明。•注意证明过程中利用的基本假设。•理解其思路,记住结论即可。28/1201、线性性利用假设:E(X’)=0βμXXXβμXβXXXYXXXβ11)()())()(())(()ˆ(1EEEE2、无偏性由估计量表达式直观得到YXXXβ1)(ˆ29/1203、有效性(最小方差性)证明略Iμμ2)(E30/120三、样本容量问题31/1201、最小样本容量•所谓“最小样本容量”,即从最小二乘原理和最大或然原理出发,欲得到参数估计量(不管其质量如何),所要求的样本容量的下限。•样本最小容量,必须不少于模型中解释变量的数目(包括常数项),即nk+1为什么?32/1202、满足基本要求的样本容量•从统计检验的角度:n30时,Z检验才能应用;n-k8时,t分布较为稳定。•一般经验认为:当n30或者至少n3(k+1)时,才能说满足模型估计的基本要求。•模型的良好性质,只有在大样本下才能得到理论上的证明。33/120四、例题34/120教材例题:地区城镇居民消费模型•被解释变量:地区城镇居民人均消费Y•解释变量:–地区城镇居民人均可支配收入X1–前一年地区城镇居民人均消费X2•样本:2006年,31个地区35/120数据地区2006年消费支出Y2006年可支配收入X12005年消费支出X2地区2006年消费支出Y2006年可支配收入X12005年消费支出X2北京14825.419977.513244.2湖北7397.39802.76736.6天津10548.114283.19653.3湖南8169.310504.77505.0河北7343.510304.66699.7广东12432.216015.611809.9山西7170.910027.76342.6广西6792.09898.87032.8内蒙古7666.610358.06928.6海南7126.89395.15928.8辽宁7987.510369.67369.3重庆9398.711569.78623.3吉林7352.69775.16794.7四川7524.89350.16891.3黑龙江6655.49182.36178.0贵州6848.49116.66159.3上海14761.820667.913773.4云南7379.810069.96996.9江苏9628.614084.38621.8西藏6192.68941.18617.1浙江13348.518265.112253.7陕西7553.39267.76656.5安徽7294.79771.16367.7甘肃6974.28920.66529.2福建9807.713753.38794.4青海6530.19000.46245.3江西6645.59551.16109.4宁夏7205.69177.36404.3山东8468.412192.27457.3新疆6730.08871.36207.5河南6685.29810.36038.036/120变量间关系6000800010000120001400016000500010000150002000025000X1Y6000800010000120001400016000400060008000100001200014000X2Y37/120OLS估计结果38/120代数法计算实例:行估计我国1991~2000年消费模型进。人均居民消费额Y(千元),人均国内生产总值X1(千元),前一期人均居民消费额X2(千元)的有关数据:∑Yi=22.1∑X1i=47.5∑X2i=