第八章离散和受限被解释变量模型

oiuyttr
2 ℃
2019-12-18

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第8章离散和受限被解释变量模型§8.1二元离散选择模型§8.2选择性样本模型•这些模型与方法，无论在计量经济学理论方面还是在实际应用方面，都具有重要意义。但是，这些模型都形成了各自丰富的内容体系，甚至是计量经济学的新分支学科，模型方法的数学过程较为复杂。•本章只介绍其中最简单的模型，以了解这些模型理论与方法的概念与思路。§8.1二元选择模型BinaryChoiceModel一、二元离散选择模型的经济背景二、二元离散选择模型三、二元Probit离散选择模型及其参数估计四、二元Logit离散选择模型及其参数估计五、二元离散选择模型的检验说明•在经典计量经济学模型中，被解释变量通常被假定为连续变量。•离散被解释变量数据计量经济学模型（ModelswithDiscreteDependentVariables）和离散选择模型(DCM,DiscreteChoiceModel)。•二元选择模型(BinaryChoiceModel)和多元选择模型(MultipleChoiceModel)。•本节只介绍二元选择模型。•离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。•1962年，Warner首次将它应用于经济研究领域，用以研究公共交通工具和私人交通工具的选择问题。•70、80年代，离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。•模型的估计方法主要发展于80年代初期。一、二元离散选择模型的经济背景实际经济生活中的二元选择问题•研究选择结果与影响因素之间的关系。•影响因素包括两部分：决策者的属性和备选方案的属性。•对于单个方案的取舍。例如，购买者对某种商品的购买决策问题，求职者对某种职业的选择问题，投票人对某候选人的投票决策，银行对某客户的贷款决策。由决策者的属性决定。•对于两个方案的选择。例如，两种出行方式的选择，两种商品的选择。由决策者的属性和备选方案的属性共同决定。二、二元离散选择模型1、原始模型•对于二元选择问题，可以建立如下计量经济学模型。其中Y为观测值为1和0的决策被解释变量；X为解释变量，包括选择对象所具有的属性和选择主体所具有的属性。YXyiXii0)(iEiX)(iyEiiiipyPyPyE)0(0)1(1)(EyPyii()()1Xi)0(1)1(iiiiyPpyPp左右端矛盾•由于存在这两方面的问题，所以原始模型不能作为实际研究二元选择问题的模型。•需要将原始模型变换为效用模型。•这是离散选择模型的关键。iiiyy1101XXXXiiii当，其概率为当，其概率为具有异方差性2、效用模型作为研究对象的二元选择模型Uiii11X1Uiii000XUUiiiii1010X10()()yii**Xi第i个个体选择1的效用第i个个体选择0的效用PyPyPiii()()()**10Xi•注意，在模型中，效用是不可观测的，人们能够得到的观测值仍然是选择结果，即1和0。•很显然，如果不可观测的U1U0，即对应于观测值为1，因为该个体选择公共交通工具的效用大于选择私人交通工具的效用，他当然要选择公共交通工具；•相反，如果不可观测的U1≤U0，即对应于观测值为0，因为该个体选择公共交通工具的效用小于选择私人交通工具的效用，他当然要选择私人交通工具。3、最大似然估计•欲使得效用模型可以估计，就必须为随机误差项选择一种特定的概率分布。•两种最常用的分布是标准正态分布和逻辑（logistic）分布，于是形成了两种最常用的二元选择模型—Probit模型和Logit模型。•最大似然函数及其估计过程如下：FtFt()()1PyPyPPFFiiii()()()()()()***1011XXXXiiiiPyyyFFnyyii(,,,)(())()12011XXiiLFFin(())(())XXiyi1yii11标准正态分布或逻辑分布的对称性似然函数ln(ln()()ln(()))LyFyFiiinXXii111ln()()LyfFyfFiiiiiiin111X0i•在样本数据的支持下，如果知道概率分布函数和概率密度函数，求解该方程组，可以得到模型参数估计量。1阶极值条件三、二元Probit离散选择模型及其参数估计1、标准正态分布的概率分布函数Ftxdxt()()exp()22122fxx()()exp()221222、重复观测值不可以得到情况下二元Probit离散选择模型的参数估计ln()()LfFfFqfqFqiiyiiiyiiiiiiniinii10111XXXXXX0iiiqyii21•关于参数的非线性函数，不能直接求解，需采用完全信息最大似然法中所采用的迭代方法。•应用计量经济学软件。•这里所谓“重复观测值不可以得到”，是指对每个决策者只有一个观测值。如果有多个观测值，也将其看成为多个不同的决策者。例8.1.1贷款决策模型•分析与建模：某商业银行从历史贷款客户中随机抽取78个样本，根据设计的指标体系分别计算它们的“商业信用支持度”（CC）和“市场竞争地位等级”（CM），对它们贷款的结果（JG）采用二元离散变量，1表示贷款成功，0表示贷款失败。目的是研究JG与CC、CM之间的关系，并为正确贷款决策提供支持。•样本观测值JGXYSCJGFJGXYSCJGFJGXYSCJGF0125.0-20.000001500-20.0000054.00-10.00000599.0-20.0000096.0000.0000142.0021.00000100.0-20.00001-8.00001.0000042.0000.02090160.0-20.00000375.0-20.0000118.0021.0000046.00-20.0000042.00-16.5E-13080.0016.4E-12080.00-20.000015.00021.00001-5.00001.00000133.0-20.00000172.0-20.00000326.020.00000350.0-10.00001-8.00001.00000261.010.0000123.0000.9979089.00-20.00001-2.000-10.9999060.00-20.00000128.0-20.0000014.00-23.9E-07070.00-10.000016.00001.0000122.0000.99911-8.00001.00000150.0-10.00000113.010.00000400.0-20.0000154.0021.0000142.0010.9987072.0000.0000028.00-20.0000157.0020.99990120.0-10.0000125.0000.99060146.000.0000140.0010.9998123.0000.9979115.0001.0000135.0010.9999114.0001.0000026.00-24.4E-16126.0011.0000049.00-10.0000089.00-20.0000115.00-10.4472014.00-10.549815.00011.0000069.00-10.0000061.0002.1E-121-9.000-11.00000107.010.0000140.0021.000014.00011.0000129.0011.0000030.00-20.0000054.00-20.000012.00011.00000112.0-10.0000132.0011.0000137.0010.9999078.00-20.0000054.0001.4E-07053.00-10.000010.00001.00000131.0-20.00000194.000.00000131.0-20.0000115.0001.0000CC=XYCM=SC•该方程表示，当CC和CM已知时，代入方程，可以计算贷款成功的概率JGF。例如，将表中第19个样本观测值CC=15、CM=－1代入方程右边，计算括号内的值为0.1326552；查标准正态分布表，对应于0.1326552的累积正态分布为0.5517；于是，JG的预测值JGF=1－0.5517=0.4483，即对应于该客户，贷款成功的概率为0.4483。输出的估计结果模拟预测•预测：如果有一个新客户，根据客户资料，计算的“商业信用支持度”（XY）和“市场竞争地位等级”（SC），代入模型，就可以得到贷款成功的概率，以此决定是否给予贷款。3、重复观测值可以得到情况下二元Probit离散选择模型的参数估计•思路–对每个决策者有多个重复（例如10次左右）观测值。–对第i个决策者重复观测ni次，选择yi=1的次数比例为pi，那么可以将pi作为真实概率Pi的一个估计量。–建立“概率单位模型”，采用广义最小二乘法估计。–实际中并不常用。四、二元Logit离散选择模型及其参数估计1、逻辑分布的概率分布函数Ftet()11fteett()()12Fteettt()()1fteetttt()()()(())112.00.05.10.15.20.25.30510152025303540F0.00.20.40.60.81.0510152025303540DFBörsch-Supan于1987年指出:•如果选择是按照效用最大化而进行的，具有极限值的逻辑分布是较好的选择，这种情况下的二元选择模型应该采用Logit模型。2、重复观测值不可以得到情况下二元logit离散选择模型的参数估计•关于参数的非线性函数，不能直接求解，需采用完全信息最大似然法中所采用的迭代方法。•应用计量经济学软件。ln()()(())LyfFyfFyiiiiiiiniin1111XXX0iiiProbit0.9999991.0000000.4472330.000000五、二元离散选择模型的检验1、计量经济学模型中的两类检验统计量•基于LS–R2–总体显著性F检验–约束回归的F检验•基于ML–Wald–LR(likelihoodratio)–LM(lagrangemultiplier)•原理相同2、拟合检验•P：样本观测值中被解释变量等于1的比例。L0：模型中所有解释变量的系数都为0时的似然函数值。•LRI=1，即L=1，完全拟合。LRI=0，所有解释变量完全不显著，完全不拟合。0lnln1LLLRI))1ln()1(ln(ln0PPPPnLLnL=－1.639954LnL0=－52.80224LRI=0.9689423、回代检验•当二元离散选择模型被估计后，将所有样本的解释变量观测值代入模型，计算得到每个样本的被解释变量选择1的概率，与每个样本被解释变量的实际观测值进行比较，以判断模型的预测（回代）效果，是一种实际有效的模型检验方法。•概率阈值–朴素选择：p=0.5(1、0的样本相当时）–先验选择：p=（选1的样本数/全部样本）（全样本时）–最优阈值：犯第一类错误(弃真)最小原则例8.1.1•朴素选择，即以0.5为阈值：除了2个样本外，所有样本都通过了回代检验。•先验选择，即以选择1的样本的比例0.41为阈值：除了1个样本外，所有样本都通过了回代检验。实例—财务欺诈识别模型•我国上市公司财务欺诈识别模型•样本：年度报告审计意见为“无法发表意见”或者“证监会立案调查”等公司属于财务欺诈样本；年度报告审计意见为“标准无保留意见”和财务报表满足“利润×现金流量＞0”的公司属于配对样本。•解释变量：开始选择11个财务指标；通过T检验