§2.4分位数回归估计QuantileRegression,QR一、分位数回归的提出二、分位数回归及其估计三、分位数回归的假设检验四、实例一、分位数回归的提出•分位数回归由KoenkerRoger和BassettGilbertJr于1978年提出–利用解释变量和被解释变量的条件分位数进行建模,试图揭示解释变量对被解释本来分布的位置、刻度和形状的影响。–经典回归模型称为均值回归。建立了被解释变量的条件均值与解释变量之间的关系。•实例1–Koenker和Machado(1999)分析了1965~1975以及1975~1985两段时间内世界主要国家的经济增长情况。模型选取了13个影响经济增长的解释变量。–通过分位数回归得出结论:对于初始单位资本产出这一解释变量,它的全部回归分位系数基本保持不变,这就意味着对于经济发展迅速与缓慢的国家而言,初始单位资本产出对于经济增长的影响基本相同;–教育支出占GDP的比重以及公共消费占GDP的比重这两个解释变量对于经济发展缓慢的国家影响更加强烈。•实例2–Chen(2004)使用分位数回归方法研究了美国8250名男性的BMI(身体质量指数,一种广泛用于测量偏胖还是偏瘦的指标)情况,并得出结论:•在2~20岁这一快速成长期中,BMI迅速增加;•在中年期间BMI值保持比较稳定;•60岁以后,BMI的值开始减少。•分位数回归估计与经典模型的最小二乘估计相比较,有许多优点。–当数据出现尖峰或厚尾的分布、存在显著的异方差等情况,最小二乘法估计将不再具有优良性质,且稳健性非常差。分位数回归系数估计比OLS估计更稳健。–最小二乘估计假定解释变量只能影响被解释变量的条件分布的均值位置,不能影响其分布的刻度或形状的任何其他方面。而分位数回归估计能精确地描述解释变量对于被解释变量的变化范围以及条件分布形状的影响。普通最小二乘估计分位数回归估计基本思想设法使所构建的方程和样本之间的距离最短同普通最小二乘估计方法目的借助数学模型对客观世界所存在的事物间的不确定关系进行数量化描写同普通最小二乘估计方法原理以平均数为基准,求解最短距离以不同的分位数为基准,求解最短距离算法最小二乘法加权最小一乘法前提假设独立、正态、同方差独立假设要求强假设弱假设检验类型参数检验非参数检验承载信息描述平均的总体信息充分体现整个分布的各部分信息极端值无法考虑极端值的影响可以充分考虑极端值的影响异方差影响大影响小拟合曲线只能拟合一条曲线可以拟合一簇曲线计算方法求偏导解行列式,算法完备自助方法估计标准误差,多种算法求解目标函数二、分位数回归及其估计1、分位数回归原理分位数回归是对如上简单形式的扩展。()rob()FyYy=P假定随机变量y的概率分布函数Q()=inf{:()}yFy定义y的θ分位数Q()=inf{:()}nnyFy给定y的n个观测值,相对应的分位数::Q()=argmin{||(1)||}=argmin{()}iiniiiiYiYiYYY等价地转化为求一个最优化问题如果Y的条件分位数由k个解释变量X线性组合表示,即Y的θ条件分位数被定义为:Q(|,())=()iiXβXβ分位数回归参数估计量为()()=argmin{(())}iiniYβXβ2、分位数回归估计方法•参数估计方法有两类:–一类是直接优化方法,例如单纯形法、内点法等;–一类是参数化方法,例如结合MCMC(MarkovChainMonteCarlo)的贝叶斯估计方法。–常用的计量经济和统计软件都可以实现对分位数回归模型的估计和假设检验,如stata、sas、r、eviews等。3、分位数回归的扩展•如果被解释变量的条件密度非同质,可以采用加权的方法提高分位数回归估计的效率,权重与某概率水平下的局部样本密度成比例。•加权分位数回归估计为:()()=argmin{()(())}iiiinifYβXβ•将分位数回归应用PanelData,构造PanelData分位数回归模型。对于固定效应变截距PanelData模型:(),()ˆˆ((),())=argmin{(()())()}itiitiitiYβXβ对应的PanelData分位数回归参数估计为:itiititYXβni,,1Tt,,1•将分位数回归应用于归并数据(CensoringData),构造归并数据分位数回归模型:max(0,),1,2,,iiYiniXβ1ˆ()argmin{()(max(0,())}iniYiβXβ对应的“归并”数据分位数回归参数估计为:•凡是连续随机变量作为被解释变量的计量经济学模型,都可以进行分位数回归估计。三、分位数回归的假设检验•分位数回归估计的检验包括两部分:–一是与均值回归类似的检验,例如拟合优度检验、约束回归检验等;–一是分位数回归估计特殊要求的检验,例如斜率相等检验和斜率对称性检验等。1、拟合优度检验•分位数回归估计拟合优度检验统计量(Machado拟合优度)为:1ˆ()()1()VRV()ˆV()=min(())iiiYXβ0()0V()=min(())iiY最小化θ分位数回归的目标函数回归方程中不包含任何解释变量,只包含常数项情况下最小化θ分位数回归的目标函数该统计量越大,说明拟合效果越好2、约束回归检验•分位数回归约束回归检验似然比统计量,采用无约束和有约束情况下最小化θ分位数回归的目标函数值构造。2ˆ2(()())()~()(1)()VVLRqs有约束情况下最小化θ分位数回归的目标函数值无约束情况下最小化θ分位数回归的目标函数值稀疏度约束的数目3、斜率相等检验•斜率相等检验,即检验对于不同的分位点,估计得到的结构参数(在线性模型中即为斜率)是否相等。•原假设被设定为:012:()=()=...=()iiipH1,,ik•如果接受该假设,说明每个斜率对于不同分位点具有不变性,此时,应该采用普通最小二乘估计;如果拒绝该假设,说明模型应该采用分位数回归估计,以反映每个斜率在不同分位点的不同值。•斜率相等检验可以通过约束回归检验实现。原假设相当于对分位数回归估计施加了个约束(斜率中不包括常数项)。•应用软件中给出了一些相应的检验统计量,例如,EVIEWS6.0中的Wald统计量可以实现该约束检验。•例:软件EVIEWS6.0使用手册中实例的斜率相等性检验结果,其中Y为家庭食物消费支出,X为家庭收入。QuantileSlopeEqualityTestEquation:EQ1Specification:YCXTestSummaryChi-Sq.StatisticChi-Sq.d.f.Prob.WaldTest25.2236620.0000RestrictionDetail:b(tau_h)-b(tau_k)=0QuantilesVariableRestr.ValueStd.ErrorProb.0.25,0.5X-0.0860770.0259230.00090.5,0.75-0.0838340.0305290.0060Wald统计量为25.22,应该拒绝斜率在tau=0.25、0.5和0.75相等性的假设,即斜率在不同分位点上的值是不同的。4、斜率对称性检验•斜率对称性检验,即检验对于给定的X,Y的分布是否是对称的。•原假设被设定为:0:()+(1-)=2(1/2)iiiH1,,ik•如果接受斜率相等性假设,就不必进行斜率对称性检验。•如果拒绝斜率相等性假设,则可以进一步进行斜率对称性检验,若接受原假设,则认为斜率具有对称性,否则,则认为斜率不具有对称性。•例:软件EVIEWS6.0使用手册中实例的斜率对称性检验结果,其中Y为家庭食物消费支出,X为家庭收入。SymmetricQuantilesTestEquation:EQ1Specification:YCXTeststatisticcomparesallcoefficientsTestSummaryChi-Sq.StatisticChi-Sq.d.f.Prob.WaldTest0.53002420.7672RestrictionDetail:b(tau)+b(1-tau)-2*b(.5)=0QuantilesVariableRestr.ValueStd.ErrorProb.0.25,0.75C-5.08437034.598980.8832X-0.0022440.0450120.9602Wald统计量为0.53,应该不拒绝斜率在tau=0.25和0.75对称的假设。四、实例