离散因变量模型(Logit-模型,Probit模型)

颠疯放逐
2 ℃
2020-07-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

实际经济分析当中的离散变量问题对于单个方案的取舍购买决策、职业的选择、贷款决策；对于两个方案的选择。例如，两种出行方式的选择，两种商品的选择。由决策者的属性和备选方案的属性共同决定。农业经济分析当中的离散因变量问题农民技术采用、农村选举等等离散因变量模型（Logit模型，Probit模型）内容二元选择模型的三类模型介绍二元选择模型的估计:二元选择模型的检验：二元选择模型的应用一、二元选择模型二元选择模型的理论模型二元选择模型经济计量的一般模型线性概率模型（LPM)Logit模型Probit模型（一）二元选择模型的理论模型选择理论：效用是不可观测的，只能观测到选择行为Uiii11X1Uiii000XUUiiiii1010X10()()*iiyiX第i个个体选择1的效用第i个个体不选择1（选择0）的效用1(0)0(0)iiiiyyyy选择1不选择1（选择0）（二）二元选择的经济计量一般模型FtFt()()1***(1)(0)()1()1()()iiiiiPyXPyPPFFiiiiXXXX()10(1)()iiEyXPPFiX()YEYX()YFXB()(1,2......)iiiyFXBin总体回归模型样本回归模型（三）二元选择模型随机误差项及斜率()iiiyFXB()1()()()1()0iiiiiEFXBFXBFXBFXB222()()1()()()1()()1()iiiiiiiiVarEFXBFXBFXBFXBFXBFXB对于回归模型：斜率：()()()()()()iiijjjiiijijEyXFXBPrxxxdFXBXBfXBdXBx（四）分布函数F的选取选取分布函数F的原则：0()1iFXBiXB()1iFXBiXB()0iFXBF是单调函数按照上述原则F取作累计分布函数。下面介绍三种不同分布函数下的计量模型：LPM,Probit,Logit1、线性概率模型（LPM)()iiFXBXB如果选择iiiyXB()iiiiyEyX()()iiiiiEyXEXBXB()1*(1)0*(0)10(1)iiiiiiiiiEyXPyXPyXppp(1)iiiPyXp(0)1iiiPyXp()iiiiiiiiyEyXpXBLPM的估计方法：OLS对响应概率(p)的偏效应：jjx线性概率模型存在的问题及适用性LPM在实际的回归当中应用很少，用于理论模型的比较。()(1)iiiVarpp*iy11iXBiy01iXB00iXB办法：强令预测值相应等于0或1进行约束估计。随机误差项是异方差：办法：可用WLS估计。拟合值可能不在0－1之间，有可能大于1或小于0:2、Logit模型11()1111ZZZZeFZeee如果选择05101520253000.20.40.60.81Logistic分布函数（1）Logit模型的分布函数具有以上分布函数的二元选择模型称为Logit模型。（2）Logit模型的设定()()1ZZeFZZe'2()()()(1())(1)ZZefZFZZZe()iiiyFXB()iiiyXB模型线性化ln()1iiipXBp()iipXB()11()iXBiiiipXBepXBiiiLXBiy取1或00,1ip,iLln1iiipLp其中得到：P为y取1时的概率取值范围()1ZZeZe∵机会比率odds（3）Logit模型的边际分析2()(1)ZZdpefZdZeln()1jjjpddZpdxdx2()z(1)ZjjjZjjpdpZefZxdZxe（）(1-(z))1、自变量的变化对响应概率（p）的影响：2、对Logit模型系数的解释：ln()ln()1jjjjjpoddsLoddspoddsxxxx当xj增加一个单位时机会比率的增长率为j南开大学国际经济研究所1999级研究生考试分数及录取情况见数据表（N=95）。定义变量：Y：考生录取为1，未录取为0；SCORE：考生考试分数；D1：应届生为1，非应届生为0。例1：obsYSCORED1obsYSCORED1obsYSCORED1obsYSCORED11140112603471510303176025602140102703471520299177025203139212803441530297178025214138702903391540294079024515138413003380550293180024316137903103381560293181024207137803203361570292082024108137803303340580291183023919137613403321590291184023501013710350332160028718502320111362036033216102861860228112136213703311620286087021911313611380330163028218802191140359139032816402821890214115035814003281650282090021011613561410328166027809102041170356142032116702750920198018035514303211680273093018911903541440318169027319401881200354045031807002721950182121035314603161710267096016612203500470308072026619701230230349048030817302631240349049030407402611250348150030317502600数据表模型结果：（1）模型()Yx（2）估计：用logit法估计。（调用数据库和程序E:\logit）1231ScoreYD模型形如：Stata命令：logityscored1LogitestimatesNumberofobs=97LRchi2(2)=72.11Probchi2=0Loglikelihood=-3.979482PseudoR2=0.9006yCoef.Std.Err.zPz[95%Conf.Interval]score.67706110.3480361.950.052-.00507661.359199d1-.47660442.984581-0.160.873-6.3262765.373068_cons-242.4575124.5184-1.950.052-486.5091.593967（3）得到估计式：1ln()242.45760.67710.47661pScoreDp(0.052)(0.052)(0.873)注：括号里是p值。（4）检验：可以直接根据括弧里的p值进行判断，也可以利用正态分布表查临界值进行检验。02:0H检验假设0121212Hzpzz分位点。表查出的－其中为由正态N（0，1）(5)对参数加以解释：20.6771说明当考生分数增加一分，被录取的机会比率增长率增加0.6771.另外，是否应届生对录取与否没有显著影响。121.65z当＝0.1时查表可得因为Z=2.051.96，所以score变量在0.05的显著水平下对Y的影响是显著的。121.96z当＝0.05时查表可得3.Probit模型如果选择212(2)()(2)txFtedx-4-202400.20.40.60.81累积正态概率分布曲线Probit曲线和logit曲线很相似。两条曲线都是在pi=0.5处有拐点，但logit曲线在两个尾部要比Probit曲线厚。（1）Probit模型的设定()iiiyFXB212(2)()()(2)iXBxiiFXBXBedx()iiiyXB模型212(2)()(2)iXBxiipXBedx1()iiiiZFpXBixYXZXB是的线性函数，是的非线性函数（2）Probit模型的边际分析22121)(ZeZfdZdpjjdZdx自变量的变化对响应概率（p）的影响：2121()2ZjjjjpdpZfZexdZxˆˆˆ(1|)[()]jjPYXXX一般情况下对连续变量，X取样本均值，指的是X在平均意义上每增加一个单位会导致事件发生的概率将会变化多少个单位。样本iYx11x120x2………n1xn二、二元选择模型的估计(ML)Yi值10PiF（XB）i1F（XB）（成功）（失败）样本每次取值设为贝努里分布取值。样本取值形式如图：PyyyFFnyyii(,,,)(())()12011XXii11(())(1())niLFFiiyyiiXXln(ln()()ln(()))LyFyFiiinXXii111ln()()LyfFyfFiiiiiiin111X0i(1)()iiPyXFiX所以似然函数为：求驻点即可。三、二元选择模型的显著性检验()/~(,)/()rurureeeejFFjnkeenk22(loglog)~()rurLRLLj2logPseudoR1logurrLL3.线性约束F检验4.似然比检验2.准R21.t检验(大样本下用正态分布),ree其中为有约束的模型的残差平方和.uree为无约束的模型的残差平方和j为约束方程的个数01::RQHRQHrL其中为有约束的ML估计得到的似然函数估计值urL为无约束的ML估计得到的似然函数估计值例技术采用分析模型及变量说明农户的技术采用变量＝f（社会关系情况变量；诱导因素变量；农户基本特征变量；生产要素禀赋变量；风险变量；地区变量）变量说明：农户的技术采用变量：农户是否采用除草剂（1＝是；0＝否）社会关系网络：本村亲友的户数诱导因素：村离最近的公路的距离；技术培训农户基本特征：户主年龄、性别、教育水平生产要素禀赋：家庭财产；非农劳动力；耕地面积风险因素：近五年内是否向信用社贷过款地区影响：村级特征，县级虚变量四、二元选择模型的应用数据来源根据全国粮食生产的区域布局，分别从东北、华北、华中和西南四个区域，采用分层随机抽样的方法，分别选取辽宁省的辽阳县、山东省的桓台县、湖南省的南县和广西的马山县4个县、40个乡镇、80个村、400个农户的样本，主要针对农民粮食生产技术的需求和采用行为进行调查，内容涉及县、乡、村各级的社会经济基本情况和农户特征、技术需求、技术采用等方面的内容，以及县乡两级农业技术推广部门情况。经过数据的分析整理得到关于农户粮食作物除草剂采用的有效样本397个。数据描述分析采用不采用采用不采用采用不采用采用不采用采用不采用被解释变量除草剂采用982633692896234948解释变量本村亲友数量3510312291424045024户主年龄50545054555352625254教育水平7486787576户主性别男972573391786233144女106311100184家庭财产14.823.8825.8520.1737.6334.6736.6878.2328.8324.32非农劳动力1222112322耕地面积12.488.00