第04章--分位数回归模型

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第四章分位数回归模型2分位数回归(QuantileRegression)最早由科恩克和巴塞特(Koenker和Bassett,1978)于1978年提出,它提供了回归变量X和因变量Y的分位数之间线性关系的估计方法。绝大多数的回归模型都关注因变量的条件均值,但是人们对于因变量条件分布的其他方面的模拟方法也越来越有兴趣,尤其是能够更加全面地描述因变量的条件分布的分位数回归。利用分位数回归解决经济学问题的文献越来越多,尤其是在劳动经济学中取得了广泛应用。如在教育回报和劳动市场歧视等方面都出现了很好的研究成果。在经济学中的应用研究还包括诸如财富分配不均问题、失业持续时间问题、食品支出的恩格尔曲线问题、酒精需求问题和日间用电需求问题等。在金融学领域也涌现出大量使用分位数回归的应用研究成果,主要应用领域包括风险价值(ValueatRisk,VaR)研究和刻画共同基金投资类型的指数模型。3相对于最小二乘估计,分位数回归模型具有四个方面的优势:(1)分位数模型特别适合具有异方差性的模型。(2)对条件分布的刻画更加的细致,能给出条件分布的大体特征。每个分位点上的回归都赋予条件分布上某个特殊点(中央或尾部)一些特征;把不同的分位点上的分位数回归集中起来就能提供一个关于条件分布的更完整的统计特征描述。并且不同分位点下所给出的参数估计本身也可能有值得进一步探讨的意义。(3)分位数回归并不要求很强的分布假设,在扰动项非正态的情形下,分位数估计量可能比最小二乘估计量更为有效。(4)与最小二乘法通过使误差平方和最小得到参数的估计不同,分位数回归是通过使加权误差绝对值之和最小得到参数的估计,因此估计量不容易受到异常值的影响,从而估计更加稳健。415.1总体分位数和总体中位数对于一个连续随机变量y,其总体第τ分位数是y(τ)的定义是:y小于等于y(τ)的概率是τ,即τ=P(y≤y(τ))=F(y(τ))其中P()表示概率,F(y(τ))表示y的累积(概率)分布函数(cdf)。比如y(0.25)=3,则意味着y≤3的概率是0.25。且有y(τ)=F-1(y(τ))即F(y(τ))的反函数是y(τ)。当τ=0.5时,y(τ)是y的中位数。τ=0.75时,y(τ)是y的第3/4分位数,τ=0.25时,y(τ)是y的第1/4分位数。若y服从标准正态分布,y(0.5)=0,y(0.95)=1.645,y(0.975)=1.960。另外,如果随机变量y的分布是对称的,那么其均值与中位数是相同的。当其中位数小于均值时,分布是右偏的。反之,分布是左偏的。对于回归模型,被解释变量yt对以X为条件的第τ分位数用函数y(τ)tX表示,其含义是:以X为条件的yt小于等于y(τ)tX的概率是τ。这里的概率是用yt对X的条件分布计算的。且有y(τ)tX=F-1(y(τ)tX)其中F(y(τ)tX)是yt在给定X条件下的累积概率分布函数(cdf)。则y(τ)tX称作被解释变量yt对X的条件分位数函数。而F'(y(τ)tX)=f(y(τ)tX)则称作分位数概率密度函数。其中F'(y(τ)tX)表示F(y(τ)tX)对y(τ)tX求导。515.3分位数回归Koenker和Bassett(1978)证明,若用ty)(ˆ表示yt的分位数回归估计量,则对于以检查函数(checkfunction)w为权数,yt对任意值的加权离差绝对值和tyw只有在=ty)(ˆ时取得最小值。其中tyw=)())(1(::TyttTyitiiyy(15.2)(0,1)。据此,分位数回归可以通过加权的最小绝对离差和法(weightedleastabsolutedeviation,WLAD)进行估计。根据式(15.2),对于线性回归模型yt=X+ut,求第分位数回归方程系数的估计量)(ˆβ的方法是求下式(目标函数)最小,TutTutttuuQ0ˆ)(0ˆ)()()(ˆˆ)1(TXyttTXyttttyy)()(ˆ:)(ˆ:)()ˆ()ˆ)(1(βXβX(15.3)其中tu)(ˆ表示第分位数回归方程对应的残差。(0,1)。第分位数的回归方程表达式是ty)(ˆ=)(ˆβX其中X,都是k1阶列向量。)(ˆβ称作分位数回归系数估计量,或最小绝对离差和估计量,估计方法称作最小绝对离差和估计法。6当=0.5时,式(15.3)变为TttTXyttTXyttyyyQtt1)0.5(ˆ:)0.5(ˆ:)0.5(ˆ0.5)ˆ(0.5)ˆ(0.5)0.5()0.5(βXβXβXty)0.5(ˆ=)0.5(ˆβX称作中位数回归方程,)0.5(ˆβ称作中位数回归系数估计量。一旦得到估计的分位数回归方程,就可以计算分位数回归的残差tu)(ˆ。ttttyyyu)()(ˆˆ-)(ˆβX对一个样本,估计的分位数回归式越多,对被解释变量yt条件分布的理解就越充分。以一元回归为例,如果用LAD法估计的中位数回归直线与用OLS法估计的均值回归直线有显著差别,则表明被解释变量yt的分布是非对称的。对于不同分位数回归函数如果回归系数的差异很大,说明在不同分位数上解释变量对被解释变量的影响是不同的。715.5分位数回归模型的检验评价分位数回归函数好坏的统计量主要有3个,拟合优度、拟似然比检验和Wald检验。(1)拟合优度(Goodness-of-Fit)Koenker和Machado(1999)提出了分位数回归的拟合优度的概念。它与一般回归分析中的R2很类似。假设分位数回归直线为)()(ˆˆXy将解释变量矩阵和参数向量都分为两部分,即),1(ZX和)ˆ,ˆ(ˆ)(1)(0)(,且有)(1)(0)(ˆZy定义:])ˆˆ()ˆˆ)(1(min[ˆ)()(ˆ:)(1)(0ˆ:)(1)(0)(TXyttTXyttttZyZyQ(15.22)])ˆ()ˆ)(1(min[~)(ˆ:)(0)(ˆ:)(0)(TXyttTXyttttyyQ(15.23)式(15.22)和(15.23)分别表示无约束分位数回归目标函数(最小绝对离差和)和约束的分位数回归目标函数(最小绝对离差和)的极小值。无约束目标函数中的减项既包含常数项也包含所有回归因子。约束目标函数中的减项仅包含常数项,其他参数都约束为零。则Koenker和Machado拟和优度准则表达式如下:)()()(*~ˆ1QQR(15.24)很明显,上述统计量与传统的R2非常相似。因为)()(~ˆQQ,所以R*(τ)的值在0和1之间,解释变量的作用越强,)(ˆQ越远远小于)(~Q,)(*R越接近1。反之越接近0。所以)(*R可用来考察解释变量对被解释变量第τ分位数回归拟和的好坏。8(2)拟似然比检验(Quasi-LikelihoodRatioTests)Koenker和Machado(1999)根据目标函数在施加约束条件前后得到的两个极小值构造了两个拟似然比检验统计量(QLR)。这两个拟似然比检验也称作分位数ρ检验(quantile-ρtests)。两统计量的表达式如下:)()1()ˆ~(2)()()(sQQLT(15.25))ˆ~log()()1(ˆ2)()()()(QQsQT(15.26)两个统计量都渐近服从自由度为q的χ2分布,其中q是原假设目标函数中约束条件的个数。)(~Q和)(ˆQ分别代表约束的和无约束目标方程的极小值。另外,两个统计量的分母都含有稀疏项s(τ),上面给出的稀疏项s(τ)的3种计算方法都可在式(15.25)和(15.26)中使用。EViews估计的是其在备择假设下的估计量。使用上述两统计量的前提是必须满足分位数密度函数s(τ)与解释变量X不相关。然而,尽管有时并不满足独立同分布的假设,EViews在进行分位数回归的时候,不管选择何种估计参数渐近分布的方法,总会估计稀疏函数s(τ),从而构造拟似然比(QLR)检验统计量。因此,这种检验方法与下面的Wald统计量相比稳健性较差。(3)Wald检验给定分位数回归参数估计量的渐近方差协方差矩阵,我们就可以构造Wald形式的统计量进行各种约束形式的参数检验。9(4)分位数过程检验(QuantileProcessTesting)有时候,我们不仅对某个分位数回归感兴趣,而是希望对不只一个分位数回归的系数进行联合检验,比如下面将要研究的检验斜率系数是否相等,即不同分位数回归计算出的斜率系数是否相等,类似这种问题需要同时估计多于一个分位数回归,这种分析称为分位数过程(QuantileProcess)分析。定义过程系数向量:(4.7.36)))(,,)(,)((21Kββββ10(1)斜率相等检验(SlopeEqualityTesting)(2)对称检验(SymmetryTesting)如果对于给定的X,Y的分布是对称的,则应该有:(4.7.42)具体而言,假定分位数过程包含了s个分位数回归,这里s是奇数,中间值(s+1)/2为0.5,并且j=1i–j+1,j=1,2,…,(s-1)/2,则对称检验的原假设为:(4.7.43)1,,2,1),()()(:210piHkiii)2/1(2/))1()((βββ)2/1(2/))1()((:10βββjsjH2/)1(,,2,1sj11在EViews中进行分位数回归1.方法选择为了使用分位数回归方法估计方程,在方程设定对话框的估计方法中选择“QREG”,打开分位数回归估计对话框:“Quantiletoestimate”后面输入值,可以输入0~1之间的任意数值,默认值是0.5,即进行中位数回归。12例4.10分位数回归file:4_10利用例3.1的消费和收入数据,我们建立如下的回归方程研究政府支出对居民消费的影响:(4.7.44)其中,cs为实际居民消费,inc为实际可支配收入,fe为财政支出,考虑到财政政策通常具有时滞的特点,模型中采用滞后一期的财政支出作为解释变量。所有变量均为剔除了价格因素的年度数据,样本区间为1978~2006年。为了进行比较,我们同时给出最小二乘法以及三个不同分位点的分位数回归估计结果(见表4.4)。)ln()ln()ln()ln(131210ttttfecsinccs13OLS估计结果:14分位数回归估计结果:•PseudoR-squared:伪拟合优度(伪R2),•AdjustedR-squared:调整的伪拟合优度,•S.E.ofregression:分位数回归式的标准误差,•Quantiledependentvar:分位数回归式中只有常数项存在的系数估计值(也即被解释变量的分位数估计值)。•Objective:目标函数极小值,•Objective(const.only):分位数回归式中只有常数存在的目标函数极小值,•Sparsity:分位数密度函数(稀疏函数)估计值(本例是用核估计法计算的)。•Quasi-LRstatistic:准似然比估计量的值•Prob(Quasi-LRstat):准似然比估计量的值所对应的概率值。15注:括号内为弹性系数的t值;Quant20,Quant50,Quant80分别代表20%,50%,80%分位数。系数估计结果OLSQuant20Quant50Quant800.28(5.78)0.21(2.78)0.25(3.44)0.28(3.17)0.47(7.22)0.49(4.49)0.38(2.33)0.45(2.93)0.47(7.57)0.44(4.22)0.56(3.55)0.49(3.43)0.0

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功