计量经济学第一章use打开数据describe查看数据集情况summary描述统计tabstat+[stats]计算描述性统计量(指定)table+[contents]类别变量+连续变量列联表table/tabulate类别变量频次表histogram直方图第二章一元回归线性模型:基本思想2222XnXYXnYXxyxbiiiiiiXbYb21第三章第四章一元、多元线性回归模型:假设检验随机扰动项、参数的方差、标准误计算sort排序order排序drop去除记录keep保留记录generate生产新变量replace给变量赋新值rename给变量重命名统计检验1模型的拟合优度检验:R2判定系数(可决系数)调整的可决系数:范围在0和1之间,越接近1,说明模型具有较高的拟合优度2方程的显著性检验:F统计量,prob(F)FF(k-1,n-k),拒绝原假设H0,即显著。FF(k-1,n-k),则暂时不拒绝,不显著。显著性概率为0,小于给定显著性水平(0.05),表明模型对总体拟合显著3变量的显著性检验:T统计量(服从n-2,n-k),p值Β2一般为0,T2.306为显著,T2.306为不显著(5%水平)线性回归模型的基本假设:假设1:模型具有线性性(针对模型)。Y是参数βi的线性组合,不一定要求是变量X的线性组合。假设2:解释变量X与u不相关(针对扰动项)。数学表达:cov(Xi,ui)=0通常说法:X具有外生性假设3:给定X,扰动项的期望或均值为零(针对扰动项)。数学表达:,i=1,2,…,n假设4:同方差假定(针对扰动项)。数学表达:Var(ui)=2=Var(Yi)i=1,2,…,n.假设5:无自相关(针对扰动项)。数学表达:Cov(i,j)=0=Cov(Yi,Yj)i≠j假设6:回归模型设定是正确的(表面是针对模型,实质上是针对扰动项)假设7:扰动项符合正态分布(针对扰动项)数学表达:i~N(0,2)Yi~N(β0+β1X,2)2R第五章线性回归模型拓展(函数形式,变量测度单位)第六章虚拟变量回归有截距,m个类别(取值),仅引入m-1个虚拟变量,无截距可以m个第七章模型设定误差1包含无关变量:后果(F,T检验)参数估计是无偏且一致的估计,但不是有效的估计,检验仍然有效,但方差增大,接收错误假设的概率较高。2遗漏重要变量:后果(残差图)如果遗漏的变量X2与X1相关,那么是有偏且不一致的估计;如果X2与X1不相关,那么是无偏的,但是有偏的同理,参数估计量的方差估计也是有偏的,再次,参数显著性检验结果不可靠。第八,九,十章异方差、多重共线性、自相关检验异方差多重共线性自相关3不同函数形式的选择MWD检验,散点图4测量误差:应变量有误差:OLS估计量是无偏的。OLS估计量的方差也是无偏的。估计量的估计方差比没有测量误差时的大。自变量有误差:OLS估计量是有偏的(趋零偏误)OLS估计量的方差也是有偏的。含义例如:0)(jiuuE后果:自相关降低解U中包含未知xX中包含x,xxU,x异方差在截面数据中较常见,在时间序列中较少,多重共线性是样本现象。是程度问题,不是有无问题时间序列中常见后果1、参数OLS估计仍然是线性无偏的2、方差估计是错误的3、从而t检验效率降低。(无偏非有效)检验残差图检验Park,Glejster,Breusch–Pagan,WhiteGoldfeld–Quandt1、R方较大而显著的T值较小2、辅助回归3、方差膨胀因子判断法图形法Dw检验游程检验偏相关系数检验布罗斯-戈弗雷检验修正Wlsgls对数转换稳健回归、模型变换法变量:去除变量,变量转换样本:增加样本广义差分法2211tt*YpYpYY判断题1、简单线性回归模型与多元线性回归模型的基本假定是相同的。错,在多元线性回归模型里除了对随机误差项提出假定外,还对解释变量之间提出无多重共线性的假定。2、在模型中引入解释变量的多个滞后项容易产生多重共线性。对,在分布滞后模型里多引进解释变量的滞后项,由于变量的经济意义一样,只是时间不一致,所以很容易引起多重共线性。3、DW检验中的d值在0到4之间,数值越小说明模型随机误差项的自相关度越小,数值越大说明模型随机误差项的自相关度越大。错,DW值在0到4之间,当DW落在最左边(0ddL)、最右边(4−dLd4)时,分别为正自相关、负自相关;中间(dud4-du)为不存在自相关区域;其次为两个不能判定区域。4、在计量经济模型中,随机扰动项与残差项无区别。错,它们均为随机项,但随机误差项表示总体模型的误差,残差表示样本模型的误差;另外,残差=随机误差项+参数估计误差。5、在经济计量分析中,模型参数一旦被估计出来,就可将估计模型直接运用于实际的计量经济分析。错,参数一经估计,建立了样本回归模型,还需要对模型进行检验,包括经济意义检验、统计检验、计量经济专门检验等。6、线性回归模型意味着因变量是自变量的线性函数。错,线性回归模型本质上指的是参数线性,而不是变量线性。同时,模型与函数不是同一回事。7、多重共线性问题是随机扰动项违背古典假定引起的。错,应该是解释变量之间高度相关引起的。8、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与样本容量大小有关。错,引入虚拟变量的个数样本容量大小无关,与变量属性,模型有无截距项有关。9、双变量模型中,对样本回归函数整体的显著性检验与斜率系数的显著性检验是一致的。正确,要求最好能够写出一元线性回归中,F统计量与t统计量的关系,即F=t^2的来历;或者说明一元线性回归仅有一个解释变量,因此对斜率系数的t检验等价于对方程的整体性检验。11、在实际中,一元回归几乎没什么用,因为因变量的行为不可能仅由一个解释变量来解释。错,在实际中,在一定条件下一元回归是很多经济现象的近似,能够较好地反映回归分析的基本思想,在某些情况下还是有用的。13、虚拟变量只能作为解释变量。错,虚拟变量还能作被解释变量。14、设估计模型为。。。。。。表明模型有很好的拟合优度,则模型不存在伪(虚假)回归。错,可能存在伪(虚假)回归,因为可决系数较高,而DW值过低。15、随机扰动项的方差与随机扰动项方差的无偏估计没有区别。错,随机扰动项的方差反映总体的波动情况,对一个特定的总体而言,是一个确定的值。16、经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估计量将有偏的。错,即使经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估计量仍然是无偏的。17、虚拟变量的取值原则上只能取0或1。对,虚拟变量的取值是人为设定的,主要表征某种属性或特征或其它的存在与否,0或1正好描述了这种特性。当然,依据研究问题的特殊性,有时也可以取其它值。18、拟合优度检验和F检验是没有区别的。错(1)F-检验中使用的统计量有精确的分布,而拟合优度检验没有;(2)对是否通过检验,可决系数(修正可决系数)只能给出一个模糊的推测;而F检验可以在给定显著水平下,给出统计上的严格结论。20、双变量模型中,对样本回归函数整体的显著性检验与斜率系数的显著性检验是一致的;正确,最好能够写出一元线性回归模型;F统计量与T统计量的关系,即的F=t^2的来历;或者说明一元线性回归仅有一个解释变量,因此对斜率系数的t检验等价于对方程的整体性检验。22、在模型12233tttYXXβββ=+++的回归分析结果报告中,……则表明解释变量。。。对yt的影响是显著的。错,解释变量X2t和X3t对Yt的联合影响是显著的。23、结构型模型中的每一个方程都称为结构式方程,结构方程中,解释变量只可以是前定变量。错误,结构方程中,解释变量可以是前定变量,也可以是内生变量。24、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。错误,模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”,模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。25、在对参数进行最小二乘估计之前,没有必要对模型提出古典假定。错误,在古典假定条件下,OLS估计得到的参数估计量是该参数的最佳线性无偏估计(具有线性、无偏性、有效性)。总之,提出古典假定是为了使所作出的估计量具有较好的统计性质和方便地进行统计推断。26、当异方差出现时,常用的t和F检验失效正确,由于异方差类,似于t比值的统计量所遵从的分布未知;即使遵从t分布,由于方差不在具有最小性。这时往往会夸大t检验,使得t检验失效;由于F分布为两个独立的χ^2变量之比,故依然存在类似于t分布中的问题27、解释变量与随机误差项相关,是产生多重共线性的主要原因。错误,产生多重共线性的主要原因是:经济本变量大多存在共同变化趋势;模型中大量采用滞后变量;认识上的局限使得选择变量不当;……。29、由间接最小二乘法与两阶段最小二乘法得到的估计量都是无偏估计。错误,间接最小二乘法适用于恰好识别方程的估计,其估计量为无偏估计;而两阶段最小二乘法不仅适用于恰好识别方程,也适用于过度识别方程。两阶段最小二乘法得到的估计量为有偏、一致估计。32、在经济计量分析中,模型参数一旦被估计出来,就可将估计模型直接运用于实际的计量经济分析。错。参数一经估计,建立了样本回归模型,还需要对模型进行检验,包括经济意义检验、统计检验、计量经济专门检验等。33、假定个人服装支出同收入水平和性别有关,由于性别是具有两种属性(男、女)的定性因素,因此,用虚拟变量回归方法分析性别对服装支出的影响时,需要引入两个虚拟变量。错,是否引入两个虚拟变量,应取决于模型中是否有截距项。如果有截距项则引入一个虚拟变量;如果模型中无截距项,则可引入两个虚拟变量。34、随机扰动项的方差与随机扰动项方差的无偏估计没有区别。错,随机扰动项的方差反映总体的波动情况,对一个特定的总体而言,是一个确定的值。35、在简单线性回归中可决系数2R与斜率系数的t检验的没有关系。错误,可决系数是对模型拟合优度的综合度量,其值越大,说明在Y的总变差中由模型作出了解释的部分占的比重越大,模型的拟合优度越高,模型总体线性关系的显著性越强。反之亦然。斜率系数的t检验是对回归方程中的解释变量的显著性的检验。在简单线性回归中,由于解释变量只有一个,当t检验显示解释变量的影响显著时,必然会有该回归模型的可决系数大,拟合优度高。36、异方差性、自相关性都是随机误差现象,但两者是有区别的。正确。异方差的出现总是与模型中某个解释变量的变化有关。…自相关性是各回归模型的随机误差项之间具有相关关系。……37、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。错误,模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”;模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。40、半对数模型Y=β0+β1lnX+μ中,参数1β的含义是X的绝对量变化,引起Y的绝对量变化。错误,半对数模型的参数β1的含义是当X的相对变化时,绝对量发生变化,引起因变量Y的平均值绝对量的变动。41、对已经估计出参数的模型不需要进行检验。错误,有必要进行检验。首先,因为我们在设定模型时,对所研究的经济现象的规律性可能认识并不充分,所依据的得经济理论对研究对象也许还不能做出正确的解释和说明。或者虽然经济理论是正确的,但可能我们对问题的认识只是从某些局部出发,或者只是考察了某些特殊的样本,以局部去说明全局的变化规律,必然会导致偏差。其次,我们用以及参数的统计数据或其他信息可能并不十分可靠,或者较多采用了经济突变时期的数据,不能真实代表所研究的经济关系,也可能由于样本太小,所估计的参数只是抽样的某些偶然结果。另外,我们所建立的模型,所用的方法,所用的统计数据,还可能违反计量经济的基本假定,这是也会导致错误的结论。43、随机误差项和残差