第二章1、变量间的关系分为函数关系与相关关系。相关系数是对变量间线性相关程度的度量。2、现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值。简单线性回归模型是只有一个解释变量的线性回归模型。3、总体回归函数(PRF)是将总体被解释变量Y的条件均值表现为解释变量X的某种函数。样本回归函数(SRF)是将被解释变量Y的样本条件均值表示为解释变量X的某种函数。总体回归函数与样本回归函数的区别与联系。4、随机扰动项是被解释变量实际值与条件均值的偏差,代表排除在模型以外的所有因素对Y的影响。5、简单线性回归的基本假定:对模型和变量的假定、对随机扰动项u的假定(零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定)6、普通最小二乘法(OLS)估计参数的基本思想及估计式;OLS估计式的分布性质及期望、方差和标准误差;OLS估计式是最佳线性无偏估计式。7、对回归系数区间估计的思想和方法。8、拟合优度是样本回归线对样本观测数据拟合的优劣程度,可决系数是在总变差分解基础上确定的。可决系数的计算方法、特点与作用。9、对回归系数假设检验的基本思想。对回归系数t检验的思想与方法;用P值判断参数的显著性。10、被解释变量平均值预测与个别值预测的关系,被解释变量平均值的点预测和区间预测的方法,被解释变量个别值区间预测的方法。11、运用EViews软件实现对简单线性回归模型的估计和检验。第二章主要公式表1、总体回归函数2、样本回归函数()iiEYX^iYiuiY()iiEYX12iiiYXu12()iiiEYXX^^12iiiYXe^^^12iiYX3、基本假定4、最小二乘估计5、参数OLS估计式的期望6、参数OLS估计式的方差7、参数估计式的标准误差8、的无偏估计9、t检验统计量8、样本可决系数9、参数估计的置信区间10、平均值预测区间11、个别值预测区间()0iEu12()iiEYX2()()iiVaruVarY(,)()0ijijCovuuEuu(,)0iiCovuX2~(0,)iuN^222()iiiiiiNXYXYNXX2iiixyx2^122()iiiiiiiXYXXYNXX^^12YX^()kkE2^22()iVarx2^212()iiXVarNx^22()iSEx2^12()iiXSENx2^22ien^^*222^^^^22~(2)()()ttnSESE^22221iiiyeyy2^22iyry2221iiery^^^^^^2222222[()()]1PtSEtSE22^^^^22221()1()[,]FFFFiiXXXXYtYtnxnx2^^221()1FFFiXXYYtnx2第三章1、多元线性回归模型是将总体回归函数描述为一个被解释变量与多个解释变量之间线性关系的模型。通常多元线性回归模型可以用矩阵形式表示。2、多元线性回归模型中对随机扰动项u的假定,除了零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定以外,还要求满足无多重共线性假定。3、多元线性回归模型参数的最小二乘估计式;参数估计式的分布性质及期望、方差和标准误差;在基本假定满足的条件下,多元线性回归模型最小二乘估计式是最佳线性无偏估计式。4、多元线性回归模型中参数区间估计的方法。5、多重可决系数的意义和计算方法,修正可决系数的作用和方法。6、F检验是对多元线性回归模型中所有解释变量联合显著性的检验,F检验是在方差分析基础上进行的。7、多元回归分析中,为了分别检验当其它解释变量不变时,各个解释变量是否对被解释变量有显著影响,需要分别对所估计的各个回归系数作t检验。8、利用多元线性回归模型作被解释变量平均值预测与个别值预测的方法。第三章主要公式表1、多元线性回归模型Y=Xβ+U2、样本回归函数Y=X+e3、基本假定E(U)=0Rank(X)=k4、最小二乘估计1212233(,,)ikiikkiEYXXXXXX12233iiikkiiYXXXu^^^^^12233iiikkiYXXX^^^^12233iiikkiiYXXXeˆβ2,(,)()0,ikikikCovuuEuuik(,)0(1,2,,)jiiCovXujkˆXY=XXβˆ-1β=(XX)XY2~(0,)iuN()EYXβ^^Y=Xβ5、参数OLS估计的期望6、参数OLS估计的方差==7、参数估计的标准误差8、的无偏估计9、参数估计的置信区间10、多重可决系数11、修正的可决系数12、F检验统计量13、t检验统计量14、点预测值15、平均值预测区间16、个别值预测区间第四章1、经典线性回归模型的假定之一是各个解释变量X之间不存在多重共线性。一般说来,多重共线性是指各个解释变量X之间有准确或近似准确的线性关系。2、多重共线性的后果是:如果各个解释变量X之间有完全的共线性,则它们的回归系数是不确定的,并且它们的方差会无穷大。如果共线性是高度的但不完全的,则回归系数的估计是^E(β)β)ˆ(jVarjjC2ˆ2()ijjeCnk22ˆienk^^^^22[]1jjjjjjjPtctc22211()iieRSSRTSSYY22222()111()(1)()iiiienkenRYYnnkYY(1)~(1,)()ESSkFFknkRSSnk^^*^^^~()()jjjjjjjttnkSEcˆˆfYfXβ^^^^22()ffffYtEYYt-1-1fffX(XX)XX(XX)X^^^22ˆ11fffYtYYt-1-1ffffX(XX)XX(XX)X^()jjjSEC2可能的,但有较大的标准误差的趋势。结果回归系数不能准确地加以估计。不过,如果目的是估计这些系数的线性组合用于预测,多重共线性不是严重问题。3、诊断共线性的经验方法主要有:(1)多重共线性的明显表现是可决系数R2异常高而回归系数在通常的t检验中在统计上不显著。(2)在仅有两个解释变量的模型中,检查两个变量之间的零阶或简单相关系数,一般说来高的相关系数通常可认为有多重共线性。(3)当模型中涉及多于两个解释变量的情形时,较低的零阶相关也可能出现多重共线性,这时需要检查偏相关系数。(4)如果R2高而偏相关系数低,则多重共线性是可能的,这时会存在一个或多个解释变量是多余的。如果R2高而偏相关系数也高,则多重共线性难以识别。(5)在建模时,首先可以将每一个解释变量对其余所有解释变量进行辅助回归,并计算出相应的可决系数。较高的可能表明和其余的解释变量高度相关,在不会引起严重的设定偏误的前提下,可考虑把从模型中剔除。4、降低多重共线性的经验方法有:(1)利用外部或先验信息;(2)横截面与时间序列数据并用;(3)剔除高度共线性的变量;(4)数据转换;(5)获取补充数据或新数据;(6)选择有偏估计量(如岭回归)。经验方法的效果取决于数据的性质和共线性的严重程度。第四章主要公式表方差—膨胀因子(简称VIF)多重共线性下参数估计式的方差特征根的病态指数β的岭回归估计第五章1、异方差性是指模型中随机误差项的方差不是常量,而且它的变化与解释变量的变动有关。2、产生异方差性的主要原因有:模型中略去的变量随解释变量的变化而呈规律性的变化、iX2iR2iRiXiX22311rVIFVIFxi2222ˆvarjjjjjVIFxRxVar22222^11)(k,0,1,2,i,imiCIYXIXXβ1~kk变量的设定问题、截面数据的使用,利用平均数作为样本数据等。3、存在异方差性时对模型的OLS估计仍然具有无偏性,但最小方差性不成立,从而导致参数的显著性检验失效和预测的精度降低。4、检验异方差性的方法有多种,常用的有图形法、Goldfeld-Qunandt检验、White检验、ARCH检验以及Glejser检验,运用这些检验方法时要注意它们的假设条件。5、修正异方差性的主要方法是加权最小二乘法,也可以用变量变换法和对数变换法。变量变换法与加权最小二乘法实际是等价的。第五章主要公式表异方差性Goldfeld-Qunandt检验的F统计量White检验中的辅助函数(原模型只有两个解释变量)ARCH检验中的辅助函数Glejser检验中常用的辅助函数一元函数下的加权最小二乘估计一元函数下的对原模型的变换设并且则对数变换的模型第六章1、当总体回归模型的随机误差项在不同观测点上彼此相关时就产生了自相关问题。2、时间序列的惯性、经济活动的滞后效应、模型设定错误、数据的处理等多种原因都2)(iiuVar21222122*]2/[]2/[iiiieekcnekcneF222122334253623ˆˆˆˆˆˆˆtttttttexxxxxx222011ˆˆˆˆttptpeeevXevXevXevXevXe;1;1;;2****2**2**1)())((ˆˆˆXXwYYXXwXYiiiiiiiiuXY21)()var(22iiiXfu)()()()(21iiiiiiiXfuXfXXfXfYiiiuXYlnln21可能导致出现自相关。3、在出现自相关时,普通最小二乘估计量依然是无偏、一致的,但不再是有效的。如果仍用OLS法计算参数估计值的方差,将会低估存在自相关时参数估计值的真实方差。而且会因低估真实的,导致参数估计值的方差被进一步低估。由于真实的低估和参数估计值方差的低估,通常的t检验和F检验都不能有效地使用,也使预测的置信区间不可靠,降低了预测的精度。4、随机误差项的自相关形式决定于其关联形式,可以为m阶自回归形式,即。为了研究问题的方便和考虑实际问题的代表意义,通常将自相关设定为一阶自相关即AR(1)模式。用一阶自相关系数表示自相关的程度与方向。5、由于ut不可观测,通常使用ut的估计量et判断ut的特性。绘制,的散点图或按照时间顺序绘制回归残差项的图形,可以判断自相关的存在。判断自相关的存在最常用的方法是依据et计算的DW统计量,但要注意DW检验法的前提条件和局限性。6、如果自相关系数是已知的,我们可以使用广义差分法消除序列相关。7、如果自相关系数是未知的,我们可采用科克伦—奥克特迭代法或德宾两步法求得的估计值,然后用广义差分法消除序列相关。第六章主要公式表1、自相关系数2、一阶自回归形式AR(1)ut=ut-1+vt3、m阶自回归形式AR(m)4、自相关时参数估计式的方差22)2,1mm)(mAR1tetete)(2212221nttnttntttuuuutmtmtttvuuuu2211)ˆ(2Varnttntttnttntttnttuxxxxxxx12212212111122221()21211nttnnxxx5、DW统计量6、DW值与的关系7、广义差分第七章1、由于心理、技术以及制度等原因,经济变量之间的影响往往具有滞后效应,滞后变量模型在经济分析中具有重要作用。分布滞后模型和自回归模型是两种常见的滞后变量模型。2、分布滞后模型不能直接运用OLS方法进行估计,原因在于自由度损失、多重共线性