计量经济学,浙江财经学院经贸学院,柴志贤计量经济学应用实践专题计量经济学,浙江财经学院经贸学院,柴志贤本章主要内容一、提出问题二、关于数据三、回归模型的选择四、处理结果描述计量经济学,浙江财经学院经贸学院,柴志贤一、提出问题要有明确的分析目标,对你将要估计的模型进行细致的形式化表述,同时,评价数据的可获得性(切勿随意地抓一把数据过来。)所构思的问题应该让人感兴趣,并不需要有广泛的政策内涵,只需要能引起部分人的兴趣就可以了所研究的领域可以涉及经济学、管理学、社会学、教育学等众多领域。计量经济学,浙江财经学院经贸学院,柴志贤二、关于数据1、数据收集确定采用的数据类型(横截面、时间序列、面板数据)大致确定有关变量及其数据类型与单位选择。(对于同一类变量,单位应该是一致的)主要标识缺省值,不要混淆,最好采用句号或问好,或不容易混淆的数字。计量经济学,浙江财经学院经贸学院,柴志贤二、关于数据1、数据收集对数据集合中可能遇到的错误进行检测,保持数据的完整性,了解每项数据的有关统计特征。(如样本中教育的最小值为-99,则说明这是缺省值,在分析中应该忽略这些缺省值。对于时间序列数据,必须注意时间顺序,做好时间标记。计量经济学,浙江财经学院经贸学院,柴志贤二、关于数据2、数据描述对数据进行详细解释,说明数据收集的方式与来源,及其所做的有关处理。使读者能获得相应数据,并重新进行分析若有问卷,应附在后面;其他数据也须包括在参考书或附录中列出变量定义表,并明确变量单位给出一张总结统计量,如最小值、最大值、均值和每个变量标准差的表格清楚地表明观察值的个数,对时间序列数据的特殊时期进行描述。计量经济学,浙江财经学院经贸学院,柴志贤三、回归模型的选择1、被解释变量与解释变量的形式选择。对数形式的特点:系数度量了变化百分比或弹性、斜率系数不随测度单位而变化、logy(y大于0)比y的水平值的模型更接近经典假设即条件分布更接近正态分布、缩小被解释变量的取值范围(对异常观测并不敏感。一般地,工资、薪水、销售额、人口、雇员数量、学校人数都具有大的正整数特征,常取对数形式。计量经济学,浙江财经学院经贸学院,柴志贤三、回归模型的选择1、被解释变量与解释变量的形式选择。一般地,以年度量的变量(如教育年数、工作经历等)常以原形出现;比例或百分比(失业率等)可采用对数或水平值。计量经济学,浙江财经学院经贸学院,柴志贤三、回归模型的选择2、模型的选择二次函数:描述递减或递增的边际效应。(如描述工资与工作经历关系时采用,需要注意最高点,若这个转折点超过了样本中绝大多数人的工作经历,就无须考虑二次项。)含交互作用项的模型(若模型中一个解释变量对被解释变量的偏效应取决于另一解释变量,则可以采用交互项。)计量经济学,浙江财经学院经贸学院,柴志贤三、回归模型的选择2、模型的选择嵌套模型的选择(诊断是否存在一组不相关变量):用排除性约束下的F检验。P132。对多重排除性约束进行联合假设检验,构造q个排除性约束的F统计量。若发现零假设是正确的,即系数都为零,则可以在模型中排除这些解释变量若拒绝零假设,则说明这些约束中有些变量应该纳入到模型中来。(这种检验对于检验一组高度相关变量的排除很有作用。如企业业绩与经理薪水,对业绩度量可能高度相关,由于多重共线性,难以发现单个有显著影响的变量,但F检验可决定一组业绩变量是否会影响薪水)让我们看一个例子。计量经济学,浙江财经学院经贸学院,柴志贤三、回归模型的选择2、模型的选择非嵌套模型的选择:a:用调整的R平方进行选择。P186。选择比较大的那个模型。(缺陷:不能用与被解释变量不同的两个模型进行检验。)b:借鉴排除性约束下的F检验,创造一个包含两个非嵌套模型的不受约束的一般复合模型,并对这个不受约束模型进行F检验,方法与上面类似。c:Davidson-Mackinnon检验。P272。对于两个比较的模型,将a模型的拟合值添加到b模型,检验其系数的统计显著性,若拒绝,则说明b模型误设。计量经济学,浙江财经学院经贸学院,柴志贤三、回归模型的选择3、增加解释变量(对研究对象不很清楚,缺乏熟练的理论指导时容易发生大杂烩式的过度拟合)好处:随机误差项的总误差方差会减少,拟合优度提高;坏处:解释起来更加麻烦,导致多重共线性加剧,估计系数的方差会变大,置信区间变宽,对真实参数的假设检验不准确。用stepwise的方法应该慎重。计量经济学,浙江财经学院经贸学院,柴志贤三、回归模型的选择4、遗漏解释变量若被遗漏变量与解释变量无关。现有估计量是无偏而且一致的若被遗漏变量与解释变量有关。现有估计量是有偏而且不一致的,无论样本容量多大,偏差都不消失。误差方差是真实误差方差的有偏估计量;估计量方差也是真实估计量方差的有偏估计量;置信区间与假设检验不再可靠。计量经济学,浙江财经学院经贸学院,柴志贤三、回归模型的选择5、函数形式误设的一般性检验:RESETP270。在待诊断的回归函数中添加拟合值的平方项和三次项。然后检验约束下的多重假设检验,与前面的F检验类似。(其中,分子自由度是2,分母自由度是n-k-1-2)。若接受零假设,意味着添加项系数不显著,从而原模型是正确设定的。不足:当拒绝零假设,即判断模型设定有误时,不能提供改进的方向。而且,如果遗漏变量是线性特征时,无法诊断出来。计量经济学,浙江财经学院经贸学院,柴志贤在某商品进口回归中,估计了中国商品进口M与GDP的关系,并发现具有强烈的一阶自相关性。然而,由于仅用GDP来解释商品进口的变化,明显地遗漏了诸如商品进口价格、汇率等其他影响因素。因此,序列相关性的主要原因可能就是建模时遗漏了重要的相关变量造成的。下面进行RESET检验。用原回归模型估计出商品进口序列ttGDPM020.091.152ˆR2=0.9484应用实例计量经济学,浙江财经学院经贸学院,柴志贤(-0.085)(8.274)(-6.457)(6.692)R2=0.984232ˆ0759.8ˆ0028.0072.0860.3~tttMEMGDPM))1(/()1(/)(222qknRqRRFURU5.22)424/()984.01(2/)948.0984.0(在=5%下,查得临界值F0.05(2,20)=3.49判断:拒绝原模型与引入新变量的模型可决系数无显著差异的假设,表明原模型确实存在遗漏相关变量的设定偏误。计量经济学,浙江财经学院经贸学院,柴志贤三、回归模型的选择6、诊断是否存在异方差(截面数据)或自相关(序列数据)并采用广义最小二乘法对模型进行变换。计量经济学,浙江财经学院经贸学院,柴志贤四、处理结果描述应包括任何模型的估计,可从易到难;若仅仅估计了几个方程,直接用方程形式展示出来,标准差用括号放在系数之下;若模型有不少解释变量,而且模型形式有差异,最好用表格记录并描述结果,包括调整的R平方、观测次数、t值等;计量经济学,浙江财经学院经贸学院,柴志贤四、处理结果描述讨论对经验结果的解释程度与显著性,系数符号等;描述主要解释变量系数的大小,对于重要变量系数的符号、大小与显著性应特别关注。对于产生结果的特定计量经济学软件包命令,不应该出现论文之中。对处理的结果进行经济学分析,并对模型分析进行评价。从政策与经验的角度提出相应的建议。