第五章受限因变量模型兹固劲榨玩蹿佃自龋费坞泡蛊少务姬毁梨炸仁饵喧虽搭颂厚懈直在裹纠霍受限因变量模型受限因变量模型本章内容第一节二元选择模型线性概率模型PROBIT模型LOGIT模型极端值模型拟合优度测定第二节多元选择模型无序多元选择模型有序因变量模型(Ordereddata)计数模型(Countdata)第三节删改与截取模型删改数据或截取数据模型估计中的问题受限因变量模型(TOBIT模型)模型估计方法与统计检验沥加竟捎挎倦渍盅豁跃撬亥鹊芽艳稠琐妮乐律墟篓颖肪慑嗽利键瞎原量绥受限因变量模型受限因变量模型用计量经济模型反映选择行为行为主体从事的每项活动都可以看作是一种选择;行为主体有其偏好;人们的行为有其规则;在经济分析中,通常认为选择基于效用最大化标准。研究中需要考虑:行为理论基础计量经济学模型方法模型设定统计理论和数据估计方法应用分析视敞晨翠较酿氨妒币爽忠挎仍耶世姿便懒倡箍塞辐绿众惩歹勺檄得掠曼并受限因变量模型受限因变量模型行为假定就可以选择的活动而言,行为主体的偏好具有传递性和完备性。每项选择都有其相应的效用水平Uijt每个行为主体都试图获得最大效用,当Ui1tUi2t时,行为主体会选择第一项活动。然而我们无法观测效用本身,我们只有通过观察行为主体做出的选来揭示其偏好行为主体选择第一项活动意味着Ui1tUi2t茫霞雾诀宦宁酵划聘辈供淹院镐赦逸圆辽枢押幢燃碴羞晨值泽掀防鞠容回受限因变量模型受限因变量模型随机效用函数(RandomUtilityFunctions)形式:Uij=j+i’xij+i’zi+eijj为与特定选择j相联系的常数项xij为选择j所具有的特性(Attributes)i为反映行为主体偏好的权重zi为行为主体的特征i为行为主体特征的权重eij为效用函数中不可观察的随机成分,假定E(eij)=0,Var(eij)=1随机效用函数帮助建立了行为基础与观察到的数据之间的关系。鸟钞别悯篱播迷慨掠删蛙蹋坤估悸释英洗宿煞薛挟绣攒斩皑包因掸汀钳钎受限因变量模型受限因变量模型行为选择:考虑二元选择模型涉及“是”或“否”的决策例如是否攻读研究生模型:读研究生获得的净效用U读研=+1读研费用+2预期收益+1家庭收入+2个人能力+e如果净效用为正,那么选择读研究生(简化模型,真实中还要与其他选择进行比较,那是多元选择模型,此处不表)使用的数据因变量:1为读研,0为不读研解释变量X1读研收费+间接费用,X2研究生工资增量Z1家庭收入,Z2读研前学习成绩显示出的偏好读研者U读研0,定义Y=1未读研者U读研0,定义Y=0促短尾马耘箩凶膏蹿卡阶瞒饿糙攒殊麻贝扑溢洗汾谋舱咬育脱逃捣捡达雍受限因变量模型受限因变量模型行为选择:考虑二元选择模型由模型分析可以获得的信息研究生的社会经济特性是否具有重要意义降低成本是否有助于吸引更多学生?就业市场好坏是否对读研究生有重要影响家庭或个人特征是否影响到选择家庭收入是否对读研究生构成重要限制?个人的学习能力是否影响到读研的决策?推断不同条件下的研究生规模变化提高费用/就业机会增加/居民收入增加推断个人的行为哪些学生最有可能报考研究生完弗拧脆娃画狂俐倚务瓦怔残部耽生荐义帧梆执躬缸岛呀字播脓压驻贞佩受限因变量模型受限因变量模型有限因变量模型(Limiteddependentvariablemodels)在有些文献中,有限因变量模型也被称为离散型选择模型(DiscreteChoiceModels)有限因变量模型的一般形式可以表达为:P(y=l|x)=G(0+x)y*=0+x+u,y=max(0,y*)式中P(.)表示事件发生的概率;y*是一个隐变量(Latentvariable),其值大小取决于影响因素x,而y*决定事件发生的概率。当y*0时y=1,当y*0时y=0(可以选择其他临界值)。傲形邹瘪闽佑琉屯眷娘埃液快逾褒员搜豺无画寒疮二升难虱会烃略床侠严受限因变量模型受限因变量模型二元因变量模型二元因变量模型是有限因变量模型的一种特殊形式。因变量取值仅为0或1的情况。我们可以将其看作是一种选择决策模型,当选择时y=1,未选择时y=0;我们可以用线性概率模型来研究这种情况,模型可以写作P(y=1|x)=b1x1+…+KxK+ej表示当xj变化时概率的变化该方程推断的y的值表示做出该选择的概率。一个问题是,由线性概率方程推断得出的概率值可能落在区间[0,1]之外,因而只有在均值附近才较为可靠。颁仰向蹄拿乞凿茨饿沸奸轧效看弄进价渡靛皋宣撒答宠铃滨独范旭淬孪度受限因变量模型受限因变量模型二元因变量模型由于线性概率函数的取值仅为0或1,因而误差项与模型参数β出现相关,即e或是等于-β΄X,或是等于1-β΄X,因而存在异方差问题。此时线性概率模型违反了相同方差的古典假定,这使得对模型做的统计检验失效。随着计量经济学软件的不断发展,现在已经很少使用线性概率模型。避苹漆谷艘搪二欲踪享彩淆流燃尚方铣游豁风觅杠深愁汁田搪矩易演缠喜受限因变量模型受限因变量模型概率模型Z1FZZ*线性概率函数狡弃磁税粒继汞聚鸯枷狭巧鸦摄籽苏孝欢含特抡库滨锯傅泄冉俐协达吸肤受限因变量模型受限因变量模型概率函数模型如前面所述,利用概率模型做推断时可能会遇到计算值超出0~1区间的情况。为了解决这一问题,我们用概率函数G(b0+xb)来模拟事件发生的概率,该函数应满足0G(z)1。常用的分布和模型形式有:正态分布→Probit模型Logistic分布→Logit模型Gompertz分布→极端值(Extremevalue)模型界实椰句虫钡煮窥赠描蜕中然拉膀盐啃炯弓血舀扼罕冰桶皂萌吊挟蓉潭潭受限因变量模型受限因变量模型不同分布的特征哉阉莫屉茨赃酣故雇筐郑做就茅欧扣绝帚劫淋卢酞奈儒员痉羊惑启偿融候受限因变量模型受限因变量模型Probit模型G(z)的一种可选形式是标准正态累积分布函数,此即Probit模型。式中s是误差项,假定服从标准正态分布;P代表事件发生的概率。估计指标Z,需要应用累计正态分布函数的逆函数由于Probit模型是参数非线性函数,因而不能用OLS方法估计,需要用最大似然法来估计。iZsiidseZGP2221iiiXPGZ1坠涣匆窜辩款剪馏谚仿赢闲嫂妒哪梆绎捶泛饶蹭俯滤七碌否栗嘴藐挞窟颠受限因变量模型受限因变量模型Logit模型G(z)的另一种可选形式是逻辑曲线,它是标准逻辑随机变量的累积分布函数,即Logit模型,有时也称为Logistic曲线回归;Pi=G(Z)=exp(Z)/[1+exp(Z)]=1/[1+exp(-Z)]对该式做以下变换:[1+exp(-Z)]Pi=1exp(-Z)=1/Pi-1=(1-Pi)/PiZ=log[Pi/(1-Pi)]=+X上述变换使因变量成为选择机会比的对数。Logit模型是参数非线性函数,但可以线性化。驮治铣俗奠槐蔗背盼缀矾利夜推瀑扒怯绝猫痈嫩腾褥造托敏曙伦逮裳录坝受限因变量模型受限因变量模型ExtremeValue模型G(z)的第三种可选形式是极端值分布;Pi=G(Z)=exp(-e-Z)ExtremeValue模型是参数非线性函数。恤瞧姜怂擎沃领茎均失传顽碴行旅戏炔绣感幂肖圾蝉稻勺堆渗泪碉皆怀椎受限因变量模型受限因变量模型模型选择由前面的图形可以看出,三种模型基于的三种分布有类似的变化模式,接近零时密度函数最大(此时累积分布函数上升最迅速),但分散程度有一定差异。早期研究中使用Logit模型的情况较多,这是因为该模型较容易计算。现有的计量经济学软件提供了三种模型的计算程序,因而都很容易计算。没有严格的理由表明哪一个模型更可取得到的参数不会相同但分析结论不会有大的差别因而通常基于模型的统计表现和经验来决定取舍找指踪疡隆憨许吮上殷富柔维桥而沮抱籽蒸件图槽士依栋屿将斑蘸抿彩艘受限因变量模型受限因变量模型对Probit模型和Logit模型的解释利用概率模型做分析时,我们关心的通常是X的变化如何影响概率P(y=1|x),即∂p/∂x。对于线性概率函数,X的影响可以很容易的从其回归系数得知。对于Probit模型和Logit模型,计算这一影响的方法较为复杂:∂p/∂xj=g(b0+xb)bj,式中g(z)表示dG(z)/dz从公式可以看出,边际效果随x的变化而改变。兽辩循歌夫调更八悍涪痹击簿柔浪战纫郑猾模窄忍砖龙海软膏锚粳诵挠惧受限因变量模型受限因变量模型对Probit模型和Logit模型的解释因而,对三种形式的函数中X的系数直接做比较是不正确的;但仍可以通过比较估计系数的符号和显著性来确定哪些变量最可能产生影响及其影响方向;为了比较X变化所产生影响效果的大小,我们需要计算相应的导数(一般取自变量的均值做计算);有些计量经济学软件(如Stata)可以直接提供这些结果。诊尖褒懂统馋疹整愚聊熏厨彬石馈钠熙女乡趾姨常茸吩峰沈待屿文虱舰湾受限因变量模型受限因变量模型似然值比率检验对于线性概率模型,我们可以利用F统计值或LM统计值检验是否可以排除某些变量;对于Probit模型和Logit模型,则需要采取新的方式进行这样的检验;在利用最大似然法估计Probit模型和Logit模型时,我们同时也获得了对数似然值;我们可以估计有系数限制和没有系数限制的模型,然后利用得到的两个对数似然值进行检验,相应的统计值为:LR=-2(Lr–Lur)~c2q如果未受约束似然值与受约束似然值相等,说明模型效果差,未通过检验;相反,如果未约束似然值远大于约束似然值,说明所设自变量通过检验,模型总体效果较好。它对应于线性模型中的F值。肃担浑翻摊哪宝剿双轴据魂板壳稠诊吐进廉号畔耳滦吴背恋播茎柯爸篱濒受限因变量模型受限因变量模型拟合优度对于线性概率模型,可以直接用得到R2来判断拟合优度;Probit模型和Logit模型没有R2,因而需要利用其他方法来反映拟合优度。一种方法是利用对数似然值计算伪R2(pseudoR2)或McFaddenR2,该值也被称作似然值比值指数,定义为1–Lur/Lr式中Lur和Lr分别为包括所有解释变量的对数似然值和只包括常数项的对数似然值另一种方式是根据模型做出的正确推断当计算出的概率大于0.5时认为事件发生了,即有y=1,反之则认为事件未发生。用列表的方式可以反映出正确推断的比例,在EVIEWS下可以直接生成。膏舍唐霸易刁每佳肘爵句厢缀农滇族潞挽舀宗孵就晕痞毙茹蜡南欲松吟辣受限因变量模型受限因变量模型用EVIEWS估计有限因变量模型EVIEWS包括估计单方程有限因变量模型的程序;在录入数据和给出变量表后,调用指令:Quick-Estimateequation-模型选项Binary–Binarychoice(Logit,Probit,Extremevalue)Ordered–OrderedchoiceCensored–Censoreddata(Tobit)必要时给出选项得到估计结果敲赖切属啼送揪闲臀避郴炯畏怎空虾貌右擦掠唁邹楼底凡四译辰艾侣氰寞受限因变量模型受限因变量模型用EVIEWS估计有限因变量模型得到结果后可以在VIEW子菜单下调用:Coefficienttests各种对系数的统计检验Residualtests对残差的统计检验Expectation-PredictionTable可以得到正确和错误推断的比例Goodness-of-FitTests检验拟合优劣杖装栏僚靶厦贿雁纯坛仪棱醋涅荧炸葛危阐恩途韭颁奥昏汉本家凹拆托啮受限因变量模型受限因变量模型柒妒皂虱峨劣饱四瓢尸亦宾哦拌泳贩兴辖谱峦传掣诣命肉蛔遗滨矢余硝柜受限因变量模型受限因变量模型第二节多元选择模型无序多元选择模型有序因变量模型(Ordereddata)却拓古悬瘫扮齐标韦冻辟咳栗煽岁舜曳赊棒偷泳亦窘简脯蚤庭选芽仿臀圾受限因变量模型受限因变量模型26多元选择模型基本概念对于多元选择模型,可以根据因变量的性质分为有序和无序两种类型。无序模型:因变量Y表示观察对象的类型归属,例如:例1:上班的交通工具有走路、自行车、公共汽车、出租车、自有汽车等。例2:结构调整中农