第二章主要公式资料地址:、回归模型概述(1)相关分析与回归分析经济变量之间的关系:函数关系、相关关系相关关系:单相关和复相关,完全相关、不完全相关和不相关,正相关与负相关,线性相关和负相关,线性相关和非线性相关。相关分析:——总体相关系数cov(,)var()var()XYXYXY——样本相关系数12211()()()()niiiXYnniiiiXXYYrXXYY——多个变量之间的相关程度可用复相关系数和偏相关系数度量回归分析:相关关系+因果关系(2)随机误差项:含有随机误差项是计量经济学模型与数理经济学模型的一大区别。(3)总体回归模型总体回归曲线:给定解释变量条件下被解释变量的期望轨迹。总体回归函数:(|)()iiEYXfX总体回归模型:(|)()iiiiiYEYXfX线性总体回归模型:011,2,...,iiiYXin(4)样本回归模型样本回归曲线:根据样本回归函数得到的被解释变量的轨迹。(线性)样本回归函数:01ˆˆˆiiYX(线性)样本回归模型:01ˆˆˆiiiYXe2、一元线性回归模型的参数估计(1)基本假设①解释变量:是确定性变量,不是随机变量var()0iX②随机误差项:零均值、同方差,在不同样本点之间独立,不存在序列相关等()01,2,...,iEin2var()1,2,...,iincov(,)0;,1,2,...,ijijijn③随机误差项与解释变量:不相关cov(,)01,2,...,iiXin④(针对最大似然法和假设检验)随机误差项:2~(0,)1,2,...,iNin⑤回归模型正确设定。【前四条为线性回归模型的古典假设,即高斯假设。满足古典假设的线性回归模型称为古典线性回归模型。】(2)参数的普通最小二乘估计(OLS)目标:21minniie对于一元线性回归模型:011,2,...,iiiYXin正规方程组:011011ˆˆ2[()]0ˆˆ2[()]0niiiniiiiYXXYX解得:011112211ˆˆ()()ˆ()nniiiiiinniiiiYXXXYYxyXXx(3)最大似然估计(ML)对于一元线性回归模型:011,2,...,iiiYXin重要的基本假设:2~(0,)1,2,...,cov(,)0;,1,2,...,var()01,2,...,iijiNinijijnXin得到:201~(,)1,2,...,iiYNXin【且cov(,)0;,1,2,...,ijYYijijn,这个对最大似然法的估计很重要】则目标:12,,...,nYYY的联合概率密度最大,即2012112121ˆˆ()22max(,,...,)()()()12niiinnYXnfYYYfYfYfYe最终结果与OLS得到的结果相同。(4)OLS估计量的性质①线性性11ˆniiivY,其中21iiniixvx01ˆniiiwY,其中1iiwXvn②无偏性1111ˆ...nniiiiiivYv1111ˆ()()niiiEvE0011ˆ...nniiiiiiwYw0001ˆ()()niiiEwE③有效性2121ˆvar()niix,221021ˆvar()niiniiXnx可以证明,OLS得到的方差最小。④一致性随着样本量的增大,参数的估计量以概率趋向于真值11ˆlim()p,00ˆlim()p(5)OLS回归函数的性质①样本回归线过样本均值点(,)XY,即01ˆˆYX②被解释变量估计值的均值等于实际值的均值,即ˆYY③残差和为零,即10niie④解释变量与残差的乘积之和为零,即10niiiXe⑤解释变量的估计与残差的乘积之和为零,即1ˆ0niiiYe(6)随机误差项的估计OLS估计量(无偏):2211ˆ2niienML估计量(有偏):2211ˆniien3、拟合优度检验(1)离差分解总体平方和(or总离差平方和)2211nniiiiTSSyYY回归平方和21ˆniiESSYY残差平方和21ˆniiiRSSYY有TSSESSRSS(2)决定系数21ESSRSSRTSSTSS【总离差中,能够解释的部分所占的比重】4、统计推断(1)参数估计的分布(T检验)对于一元线性回归模型:011,2,...,iiiYXin由正态分布的基本假设和估计量的性质(线性性、无偏性、有效性),参数的估计量有如下性质:2210021ˆ~(,)niiniiXNnx,21121ˆ~(,)niiNx000ˆ~(0,1)ˆ()NSE,其中2210021ˆˆ()var()niiniiXSEnx111ˆ~(0,1)ˆ()NSE,其中21121ˆˆ()var()niiSEx由于2未知,用2ˆ代替,则0ˆ()SE不再为常数。此时,统计量1=000ˆˆ()SE,其中,0ˆ服从正态分布,2222(1)211021ˆ(2)ˆˆ()22nniiiiniiXenSEAAAnnnx说明说明(1):ie服从正态分布,则2ie服从2分布,残差平方和的自由度为n-2,故221~(2)niien用估计量2ˆ代替以后的统计量1=00202ˆˆ()tSE服从分布正态分布分布分布的自由度故:000^0ˆ~(2)ˆ()ttnSE同理:111^1ˆ~(2)ˆ()ttnSE(2)区间估计002ˆˆ()tSE,112ˆˆ()tSE(3)参数的假设检验原假设*011:H,备择假设*111:H双边检验原假设*011:H,备择假设*111:H单边检验统计量:*111^1ˆ~(2)ˆ()ttnSE临界值(临界水平为):2t双边t单边判断规则:如果12tt,则拒绝原假设;双边如果1tt,则拒绝原假设;单边【在实际应用中,一般取*10;当检验结果为拒绝原假设时,表明该参数显著地不为零,即认为该参数对应的变量具有显著的影响能力。】(4)结果表达【必须采用规范的表达方式】2ˆ414.0450.515(6.462)(30.773)0.992iiYXR或2414.0450.515(6.462)(30.773)0.992iiiYXR5、预测(1)总体均值的点预测(也是个别值的点预测)0010ˆˆˆ(|)iEYXYX(2)总体均值(|)iEYX的预测置信区间002ˆˆ()YtSEY其中,2020211ˆˆ()niiXXSEYnx(3)个别值0Y的预测置信区间002ˆ()YtSEe其中,2020211ˆ1niiXXenx。【由于误差项的存在,个别值的波动更加明显,因此其方差更大。在实际做题中,如果未特别说明,都是计算均值的置信区间。】