计量经济学的统计检验

241208251
3 ℃
2019-07-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

计量经济学与应用4.模型的统计学检验本章提要1.计量模型的检验概述2.拟合优度检验3.假设检验：显著性4.假设检验：置信区间计量经济学研究的三个步骤1.设定模型或要证明的假定，用随机方程式明确的表达出来，并对方程中个参数的符号以及大小作出事先的理论预计。2.收集模型中各变量的数据，利用数党的计量经济学技术估计方程中各个系数。3.基于经济学标准、统计标准、计量标准，评价被估计得模型和模型的预测能力。设计模型参数估计模型检验第三步？1.先验理论标准是指根据经济理论对模型参数的符号和大小作出事先的判定。如果估计所得系数与这些判定不符，则模型需要修改或应被拒绝。2.统计学标准是指：1.因变量的变异能被自变量或解释变量的变动所解释的程度；2.验证每个估计的系数围绕其真实参数的离散或扩散程度足够小，以使我们对估计有信心。3.计量经济学标准是指检验基本回归模型的假定是被满足的，尤其是关于干扰或误差项的假定是被满足的。4.模型预测能力是指在自变量或解释变量已有值或未来预测值的基础上，模型准确预测因变量未来值的能力。统计检验回归分析是要通过样本所估计的参数来代替总体的真实参数，或者说是用样本回归线代替总体回归线。•尽管从统计性质上已知，如果有足够多的重复抽样，参数的估计值的期望（均值）就等于其总体的参数真值，但在一次抽样中，估计值不一定就等于该真值。•那么，在一次抽样中，参数的估计值与真值的差异有多大，是否显著，这就需要进一步进行统计检验。•主要包括拟合优度检验、显著性检验及参数的区间估计。统计检验显著性检验•方程的显著性检验•参数的显著性检验拟合优度•𝑅2•R•调整𝑅2区间估计拟合优度拟合优度（GoodnessofFit）是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数（亦称判定系数）𝑅2。拟合优度是样本回归线对数据的拟合有多么好的一个度量。𝑟2是双变量情形下的表示，𝑅2是多变量情况下的表示。维恩图：(a)𝑟2=0(f)𝑟2=1𝑅2𝑅2公式𝑅2性质1.𝑅2测量了在Y的总变异中由回归模型解释的哪个部分所占的比例或百分比。2.𝑅2是一个非负量3.界限为0和1之间，等于1意味着一个完美拟合，等于0意味着回归值与回归元之间无任何关系。R2=(Yi-Y)2(Yi-Y)2^ESSTSS==yi2yi2^TSSRSSTSSESSR12分解TSS=RSS+ESS被解释变量Y总的变动（差异）=解释变量X引起的变动（差异）+除X以外的因素引起的变动（差异）如果X引起的变动在Y的总变动中占很大比例，那么X很好地解释了Y；否则，X不能很好地解释Y。总自由度：dfT=n-1回归自由度：dfR=k（自变量的个数）残差自由度：dfE=n-k-1自由度分解：dfT=dfR+dfER𝑅2与R：𝑅2是正数，R可正可负样本相关系数r测量两个变量之间的关联度RR的性质1.可正可负，其符号由两变量之间的相互关系决定2.其值落在极限+1和-1之间3.具有对称性，XY之间的相关系数𝑟XY与YX之间的相关系数𝑟Y𝑋相同相关式样调整𝑅2在应用过程中发现，如果在模型中增加一个解释变量，R2往往增大从而增加模型的解释功能。这就给人一个错觉：要使得模型拟合得好，只要增加解释变量即可。但是另一方面，在样本容量一定的情况下，增加解释变量必然会使得待估参数的个数增加，从而损失自由度；而且在实际中，有些解释变量的增加根本就是不必要的。对于这些不必要的解释变量的引入不仅对于估计结果无益，同时还意味着预测的精确度的降低。也就是说，不应该仅根据决定系数是否增大来决定某解释变量是否应引入模型。但是，现实情况往往是，由增加解释变量个数引起的R2的增大与拟合好坏无关，R2需调整。调整𝑅2在样本容量一定的情况下，增加解释变量必定使得自由度减少，所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度，以剔除变量个数对拟合优度的影响:其中：n-k-1为残差平方和的自由度，n-1为总体平方和的自由度。𝑅2与𝑅2的关系用自由度调整后，可以消除拟合优度评价中解释变量多少对决定系数计算的影响，增加过多变量其拟合优度值反而会降低。对于包含的解释变量个数不同的模型，可以用调整后的决定系数直接比较它们的拟合优度的高低，但不能直接用未调整的决定系数来比较。)1/()1/(12nTSSknRSSR11)1(122knnRR𝑅2多大？经验认为：时间序列数据做回归的话，判定系数要高一点，0.8、0.9也很常见；横截面数据做回归判定系数则要低的多，0.5已经算高不只参考𝑅2，还需关注模型的F统计量有许多著名的模型，R2小于0.5，支持了重要的结论，例如收入差距的倒U型规律。不要片面追求拟合优度社会科学拟合优度𝑅2一般较低，自然科学拟合优度𝑅2较高0.3-0.8,0.3-0.5实际计算𝑅2与F值相关解释变量需要多少个？为了比较所含解释变量个数不同的多元回归模型的拟合优度，常用的标准还有:赤池信息准则（Akaikeinformationcriterion,AIC）其中Ln是对数似然值，n是观测值数目，k是被估计的参数个数施瓦茨准则（Schwarzcriterion，SC）这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量。nknAIC)1(2lneennknAClnlneeSPSSEVIEWS显著性检验显著性检验所应用的方法是数理统计学中的假设检验。包括方程的显著性检验，以及变量的显著性检验。所谓假设检验，就是事先对总体参数或总体分布形式作出一个假设，然后利用样本信息来判断原假设是否合理，即判断样本信息与原假设是否有显著差异，从而决定是否接受或否定原假设。假设检验采用的逻辑推理方法是反证法。先假定原假设正确，然后根据样本信息，观察由此假设而导致的结果是否合理，从而判断是否接受原假设。判断结果合理与否，是基于“小概率事件不易发生”这一原理的方程的显著性检验方程的显著性检验，旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。即检验模型Yi=0+1X1i+2X2i++kXki+ii=1,2,,n中的参数j是否显著不为0。可提出如下原假设与备择假设：H0：0=1=2==k=0H1：j不全为0方程的显著性检验在原假设H0成立的条件下，统计量服从自由度为(k,n-k-1)的F分布给定显著性水平，可得到临界值F(k,n-k-1)，由样本求出统计量F的数值，通过FF(k,n-k-1)或FF(k,n-k-1)来拒绝或接受原假设H0，以判定原方程总体上的线性关系是否显著成立。SPSS中：通过F的Sig.值来判断------与置信度比较)1/(/knRSSkESSF拟合优度检验与方程显著性检验F检验和拟合优度检验都是把总变差TSS分解为回归平方和与残差平方和，并在这一分解的基础上构造统计量进行的检验。区别在于前者有精确的分布而后者没有。一般来说，模型对观测值的拟合程度越高，模型总体线性关系的显著性越强。F与𝑅2有如下关系F与𝑅2同方向变化，𝑅2=0时，F=0，F越大，𝑅2越大，𝑅2=1时，F为无穷大。F检验是检验回归方程总显著性的，也是检验𝑅2的显著性的。通过F值的取值范围算出𝑅2的取值范围，与实值比较，满足取值范围说明模型在该置信水平下成立。)1/()1(/22knRkRF变量的显著性检验回归分析是要判断解释变量Xi是否是被解释变量Y的一个显著性的影响因素。即，要判断X是否对Y具有显著的线性性影响。方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的，因此，必须对每个解释变量进行显著性检验，以决定是否作为解释变量被保留在模型中。这一检验是由对变量的t检验完成的。T统计量：)1(~1ˆˆˆkntkncStiiiiiiiee变量的显著性检验T检验设计原假设与备择假设：H0：i=0（i=1,2…k）H1：i0给定显著性水平，可得到临界值t/2(n-k-1)，由样本求出统计量t的数值，通过|t|t/2(n-k-1)或|t|t/2(n-k-1)来拒绝或接受原假设H0，从而判定对应的解释变量是否应包括在模型中。SPSS中：观察t值的Sig.值，与置信度相比较。置信区间回归分析希望通过样本所估计出来的参数𝜷𝒊来替代总体的参数𝜷𝒊假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围（如是否为零），但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值，往往需要通过构造一个以样本参数的估计值为中心的“区间”，来考察它以多大的可能性（概率）包含着真实的参数值。这种方法就是参数检验的置信区间估计。置信区间在统计学中，一个概率样本的置信区间（Confidenceinterval）是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度，即前面所要求的“一定概率”。这个概率被称为置信水平。举例来说，如果在一次大选中某人的支持率为55%，而置信水平0.95上的置信区间是（50%,60%），那么他的真实支持率有百分之九十五的机率落在百分之五十和百分之六十之间，因此他的真实支持率不足一半的可能性小于百分之2.5（假设分布是对称的）。如例子中一样，置信水平一般用百分比表示，因此置信水平0.95上的置信区间也可以表达为：95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说，置信水平越高，所对应的置信区间就会越大。缩小置信区间由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度，因此置信区间越小越好。要缩小置信区间，需1.增大样本容量n，因为在同样的样本容量下，n越大，t分布表中的临界值越小，同时，增大样本容量，还可使样本参数估计量的标准差减小；2.提高模型的拟合优度，因为样本参数估计量的标准差与残差平方和呈正比，模型优度越高，残差平方和应越小。3.提高样本观测值的分散度,一般情况下，样本观测值越分散，(X’X)-1的分母的|X’X|的值越大，致使区间缩小。SPSS谢谢！下次讲解：模型的计量经济学检验