第五章 受限因变模型2

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第五章受限因变量模型本章内容第一节二元选择模型线性概率模型PROBIT模型LOGIT模型极端值模型拟合优度测定第二节多元选择模型无序多元选择模型有序因变量模型(Ordereddata)计数模型(Countdata)第三节删改与截取模型删改数据或截取数据模型估计中的问题受限因变量模型(TOBIT模型)模型估计方法与统计检验二元因变量模型二元因变量模型是有限因变量模型的一种特殊形式。因变量取值仅为0或1的情况。我们可以将其看作是一种选择决策模型,当选择时y=1,未选择时y=0;我们可以用线性概率模型来研究这种情况,模型可以写作P(y=1|x)=b1x1+…+KxK+ej表示当xj变化时概率的变化该方程推断的y的值表示做出该选择的概率。一个问题是,由线性概率方程推断得出的概率值可能落在区间[0,1]之外,因而只有在均值附近才较为可靠。二元因变量模型异方差问题由于线性概率函数的取值仅为0或1,因而误差项与模型参数β出现相关,即e或是等于-β΄X,或是等于1-β΄X,因而存在异方差问题。此时线性概率模型违反了相同方差的古典假定,这使得对模型做的统计检验失效。随着计量经济学软件的不断发展,现在已经很少使用线性概率模型。概率模型Z1FZZ*线性概率函数概率函数模型如前面所述,利用概率模型做推断时可能会遇到计算值超出0~1区间的情况。为了解决这一问题,我们用概率函数G(b0+xb)来模拟事件发生的概率,该函数应满足0G(z)1。常用的分布和模型形式有:正态分布→Probit模型Logistic分布→Logit模型Gompertz分布→极端值(Extremevalue)模型不同分布的特征Probit模型G(z)的一种可选形式是标准正态累积分布函数,此即Probit模型。式中s是误差项,假定服从标准正态分布;P代表事件发生的概率。估计指标Z,需要应用累计正态分布函数的逆函数由于Probit模型是参数非线性函数,因而不能用OLS方法估计,需要用最大似然法来估计(因变量是0或1,会导致异方差)。iZsiidseZGP2221iiiXPGZ1Logit模型G(z)的另一种可选形式是逻辑曲线,它是标准逻辑随机变量的累积分布函数,即Logit模型,有时也称为Logistic曲线回归;Pi=G(Z)=exp(Z)/[1+exp(Z)]=1/[1+exp(-Z)]对该式做以下变换:[1+exp(-Z)]Pi=1exp(-Z)=1/Pi-1=(1-Pi)/PiZ=log[Pi/(1-Pi)]=+X上述变换使因变量成为选择机会比的对数,即模型的因变量是发生概率与不发生概率的比值。Logit模型是参数非线性函数,但可以线性化。ExtremeValue模型G(z)的第三种可选形式是极端值分布;Pi=G(Z)=exp(-e-Z)ExtremeValue模型是参数非线性函数。模型选择由前面的图形可以看出,三种模型基于的三种分布有类似的变化模式,接近零时密度函数最大(此时累积分布函数上升最迅速),但分散程度有一定差异。早期研究中使用Logit模型的情况较多,这是因为该模型较容易计算。现有的计量经济学软件提供了三种模型的计算程序,因而都很容易计算。没有严格的理由表明哪一个模型更可取得到的参数不会相同但分析结论不会有大的差别因而通常基于模型的统计表现和经验来决定取舍对Probit模型和Logit模型的解释利用概率模型做分析时,我们关心的通常是X的变化如何影响概率P(y=1|x),即∂p/∂x。对于线性概率函数,X的影响可以很容易的从其回归系数得知。对于Probit模型和Logit模型,计算这一影响的方法较为复杂:∂p/∂xj=g(b0+xb)bj,式中g(z)表示dG(z)/dz从公式可以看出,边际效果随x的变化而改变。对Probit模型和Logit模型的解释因而,对三种形式的函数中X的系数直接做比较是不正确的;但仍可以通过比较估计系数的符号和显著性来确定哪些变量最可能产生影响及其影响方向;为了比较X变化所产生影响效果的大小,我们需要计算相应的导数(一般取自变量的均值做计算);有些计量经济学软件(如Stata)可以直接提供这些结果。似然值比率检验对于线性概率模型,我们可以利用F统计值或LM统计值检验是否可以排除某些变量;对于Probit模型和Logit模型,则需要采取新的方式进行这样的检验;在利用最大似然法估计Probit模型和Logit模型时,我们同时也获得了对数似然值;我们可以估计有系数限制和没有系数限制的模型,然后利用得到的两个对数似然值进行检验,相应的统计值为:LR=-2(Lr–Lur)~c2q如果未受约束似然值与受约束似然值相等,说明模型效果差,未通过检验;相反,如果未约束似然值远大于约束似然值,说明所设自变量通过检验,模型总体效果较好。它对应于线性模型中的F值。拟合优度对于线性概率模型,可以直接用得到R2来判断拟合优度;Probit模型和Logit模型没有R2,因而需要利用其他方法来反映拟合优度。一种方法是利用对数似然值计算伪R2(pseudoR2)或McFaddenR2,该值也被称作似然值比值指数,定义为1–Lur/Lr式中Lur和Lr分别为包括所有解释变量的对数似然值和只包括常数项的对数似然值另一种方式是根据模型做出的正确推断当计算出的概率大于0.5时认为事件发生了,即有y=1,反之则认为事件未发生。用列表的方式可以反映出正确推断的比例,在EVIEWS下可以直接生成。用EVIEWS估计有限因变量模型EVIEWS包括估计单方程有限因变量模型的程序;在录入数据和给出变量表后,调用指令:Quick-Estimateequation-模型选项Binary–Binarychoice(Logit,Probit,Extremevalue)Ordered–OrderedchoiceCensored–Censoreddata(Tobit)必要时给出选项得到估计结果用EVIEWS估计有限因变量模型得到结果后可以在VIEW子菜单下调用:Coefficienttests各种对系数的统计检验Residualtests对残差的统计检验Expectation-PredictionTable可以得到正确和错误推断的比例Goodness-of-FitTests检验拟合优劣第二节多元选择模型无序多元选择模型有序因变量模型(Ordereddata)20多元选择模型基本概念对于多元选择模型,可以根据因变量的性质分为有序和无序两种类型。无序模型:因变量Y表示观察对象的类型归属,这时可以将其设成多个单独的二元选择模型,例如:例1:上班的交通工具有走路、自行车、公共汽车、出租车、自有汽车等。例2:结构调整中农民主产品的选择,如蔬菜、果树、动物养殖、水产养殖等。21多元选择模型基本概念有序模型:观察到的因变量Y表示出按数值大小(ordered)或重要性(ranked)排序的分类结果:例1:教育水平分文盲、小学、初中、高中、大学、研究生等例2:农民就业分纯农业、兼业、非农业等例3:收入水平分级例4:考试成绩分优秀、良好、及格和不及格等22无序多元选择模型(略)对于无序的选择模型,其行为选择假定出于优化一个随机效用函数。考虑第i个消费者面临j种选择,假定选择j的效用为:如果消费者选择了j,那么我们假定其获得的效用高于其他选择。考虑效用比较的概率函数就误差分布形式做出假定后得到可以估计的模型。ijijijUzePrijikobUUkj所有的23无序多元选择模型考虑有三种选择的Logit模型即每个方程都假定,任两个选择机会比对数是特征X的线性函数。由于所有概率之和等于1,因而机会比相互依赖,上述限制使需要估计的参数由6个减少到4个。XPPXPPXPP323223313113212112logloglog24无序多元选择模型产生系数限制的原因:这意味着以下限制条件:即只需要估计系统中的两个方程便可以得到所有参数。XXXPPPPPPPPPP21312131212131311213211323logloglogloglog21313221313225无序多元选择模型如果样本属于重复试验,那么可以计算出与每个组相联系的概率rij/ni,然后计算出机会比的对数,与X做回归。式中rij表示组i中选择J的次数占该组观察对象总数ni的比例如果没有足够多的重复,则需要利用最大似然法进行估计。26有序因变量模型基本概念同二元选择模型一样,我们可以考虑隐变量y*的值取决于一组自变量X,即:观察到的Y由Y*决定,其规则是:需要注意的是,反映类型差别的数字大小是任意的,但必须保证当。iiiXY**3*22*11*210iMiiiiYMYYYY如果如果如果如果jijiYYYY时有**27有序因变量模型基本概念观察到每个Y的概率为:式中F为误差项的累积分布函数。12110,,1,,2,,,,1iiiiPrYPrYPrYPrYiiiiiiiiiMiXFXXFXFXXFXFXMXFX28有序因变量模型基本概念分类界限和参数β均通过求以下的似然函数最大值的方式估计得出:式中函数I(.)是一个指标函数,当括号中的逻辑关系为真时等于1,反之等于0。为了保证概率为正值,所有的必须满足012…M。10,|,,NMiiiijlLogPrYjXIYj29有序的Probit模型下的概率fxx1x2x300.10.20.30.4Y=0Y=1Y=2Y=3Y=430有序因变量模型估计结果的解释如同其他概率模型一样,有序因变量模型估计系数的直接用途一般并不大,受到关注的有:自变量的边际效果模型对行为的推断能力模型拟合31X变化对概率推断的影响对于此类模型,X变化的边际效果不同于所得到的估计系数。考虑一个只有三种选择的简化情况,此时模型只有一个临界参数(假定1=0)。相应的三个概率为:0121iiiPrYPrYPrYFxFxFxFx32X变化对概率推断的影响与三个概率相对应的自变量的边际效果为:当X增加而参数和保持不变时,这相当于将分布曲线向右移动。最小和最大段的边际影响方向可以根据估计参数的符号确定,但中间段的影响方向取决于两项的综合结果。Pr0Pr1Pr2iiiYfxxYfxfxxYfxx33X变化对概率推断的影响f00.10.20.30.4012X的边际效果为正或负取决于参数的符号和概率分布的变化。34用EVIEWS估计有序因变量模型在有序因变量模型中,因变量的值仅仅反映排序,因而对其数值及间隔并无特殊要求。例:序列(1,2,3,4)等同于序列(1,10,30,100)因变量必须是整数,可以利用EVIEWS的函数功能做转换(@Round,@Floor,@Ceil)估计该方程时的步骤为:选择Quick→Estimateequation在随后出现的对话窗口中,先选择模型设定窗口,给出因变量和自变量(不需要常数项)。35用EVIEWS估

1 / 45
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功