统计与决策2011年第6期(总第330期)基于OrderedLogistic模型的居民幸福感组群差异分析摘要:文章以兰州市居民幸福感调查结果为数据源,应用OrderedLogistic模型对居民幸福感在若干变量上的组群差异进行了较系统的分析。结果表明,幸福感在性别、教育程度、婚姻状况、健康状况、家庭氛围、职业稳定变量上的组群差异显著,可以认为这些变量是影响当前兰州市居民幸福感的主要因素。提出了提高兰州市居民幸福感的政策建议。关键词:OrderedLogistic模型;幸福感组群差异;政策建议中图分类号:F222.1文献标识码:A文章编号:1002-6487(2011)06-0083-03姚晓军1,孙美平1,2(1.西北师范大学地理与环境科学学院,兰州730070;2.中国科学院寒区旱区环境与工程研究所,兰州730000)基金项目:西北师范大学地环学院青年教师科研基金资助项目(NWNUDHXYKYXM-2009-3);甘肃省教育厅科研项目(0701-24)作者简介:姚晓军(1980-),男,山西夏县人,博士研究生,研究方向:生态经济。孙美平(1981-),男,辽宁沈阳人,博士研究生,研究方向:生态经济与国民幸福核算。1问题的提出幸福研究正在成为国内外学术界高度关注的一个热点。国民幸福研究可以体现一个国家的发展观,是与经济可持续发展、落实科学发展观和构建和谐社会紧密相关的议题。目前,幸福研究在全世界范围内、不同学科领域形成了热潮。社会公众对幸福的追求,以及学术界对幸福这个主题的关注,均与人们对经济迅猛发展和现代化的反思密切相关。在GDP等经济指标大幅度提高背景下,学术界和社会各界更加关心的是,改革开放的30多年来,人们的幸福程度是否得到同步提高?哪些群体的幸福程度可能更高一些?哪些群体的幸福感低,他们的差异是否显著?对这些问题的初步回答,对于增进人们对社会变迁路径的理论认识,丰富幸福的实证研究和辅助相关部门的决策,无疑具有重要的学术意义和现实意义。2数据与模型建立2.1数据来源本研究数据来源于兰州市居民幸福感调查。调查方式采用面对面采访方式,问卷发放范围包括兰州市4个区:城关区、七里河区、安宁区和西固区,共发放问卷592份。排除14份作废(9份回答不完全、4份漏答、1份受访者态度不严肃)外,共获得有效问卷578份,占总发放问卷数的97.64%。2.2幸福感OrderedLogistic模型建立幸福感变量为有序分类变量(非常幸福、比较幸福、一般幸福、不太幸福、一点也不幸福),根据国内外学者研究成果,我们采用OrderedLogistic模型进行分析[2],形式如下:y*=α+β'xi+ε式中y*表示观测现象内在趋势,不能直接测量;xi是被调查者的社会经济变量,包括年龄、性别、教育程度等;α为常数项;β为模型回归系数;ε为服从Logistic分布的随机误差项。受访市民的幸福感按5个等级给出评价。若y*≤μ1,对应等级1(非常幸福);μ1y*≤μ2,对应等级2(比较幸福);μ2y*≤μ3,对应等级3(一般幸福);μ3y*≤μ4,对应等级4(不太幸福);y*μ4,对应等级5(一点也不幸福)。这里μ1μ2μ3μ4,均为y*突变的临界点。上述等级划分条件可改写成下列形式:等级1ε≤μ1-(α+β'xi)等级2μ1-(α+β'xi)ε≤μ2-(α+β'xi)等级3μ2-(α+β'xi)ε≤μ3-(α+β'xi)等级4μ3-(α+β'xi)ε≤μ4-(α+β'xi)等级5εμ4-(α+β'xi)ε的分布函数为F(ε)=1/[1+exp(-ε)],其分布图形和等级划分如图1所示:由图1可知:出现等级1的概率P1=F[μ1-(α+β'xi)]出现等级2的概率P2=F[μ2-(α+β'xi)]-F[μ1-(α+β'xi)]出现等级3的概率P3=F[μ3-(α+β'xi)]-F[μ2-(α+β'xi)]出现等级4的概率P4=F[μ4-(α+β'xi)]-F[μ3-(α+β'xi)]出现等级5的概率P5=1-F[μ4-(α+β'xi)]统计观察83统计与决策2011年第6期(总第330期)进而可推导出:P(y≤j)=P(y=1)+P(y=2)+…+P(y=j)=F[μj-(α+β'xi)]式中:y表示等级,j=1,2,3,4,5。结合ε的分布函数F(ε)=1/[1+exp(-ε)]得到如下累计Logistic模型:lnp(y≤j)1-P(y≤j)≤≤=μj-(α+β'xi)将此表达式展开,可得四个累计Logit函数,即:lnP1P2+P3+P4+P5≤≤=μ1-(α+β'xi)=β01-β'xilnP1+P2P3+P4+P5≤≤=μ2-(α+β'xi)=β02-β'xilnP1+P2+P3P4+P5≤≤=μ3-(α+β'xi)=β03-β'xilnP1+P2+P3+P4P5≤≤=μ4-(α+β'xi)=β04-β'xi其中P1、P2、P3、P4、P5分别表示非常幸福、比较幸福、一般幸福、不太幸福、一点也不幸福的概率,且P1+P2+P3+P4+P5=1。等式右端β0j是反应变量各类中截距α和阈值μj的综合,对以上四个Logit函数,不管因变量的分割点在什么位置,模型中各自变量的系数β都保持不变,所改变的只是β0j。通过最大似然估计法构建似然函数L,L对β01~β04和诸β进行优化,能使L值最大的诸β和β0j值即为所求的参数。3变量设置及样本特征统计描述3.1变量设置模型中因变量、解释变量及变量类型见表1。3.2样本特征统计描述关于有效问卷578位被调查者的基本情况统计如下:男性326人,女性252人;年龄在小于等于30岁、31~50岁和50岁以上分别为250人、231人和97人;教育程度在大学及以上、大专、高中或中专、初中、小学及文盲的人数分别有146人、127人、169人、99人和37人;未婚197人,已婚354人,婚姻异常(包括离婚、丧偶和分居)27人;健康状况很好的153人,较好253人,一般135人,较差37人;城镇户口453人,农村户口125人;职业稳定327人,不稳定251人;家庭年收入在7000元以下、7001~15000元、15001~30000元、30001~50000元和50000元以上的人数分别为117人、163人、172人、79人和47人。4结果分析4.1模型结果采用SPSS13.0对因变量和解释变量进行OrderedLo-gistic回归分析,结果见表2。其中一般模型包含了所有解释变量,显著模型只包含解释变量中对幸福感影响显著的变变量因变量解释变量变量名幸福感年龄、年龄2性别教育程度婚姻状况收入状况健康状况家庭关系人际关系职业稳定否民族户口变量类型有序分类变量数值型变量虚拟变量(女=1,男=0)虚拟变量(小学及文盲=0,反之=1)虚拟变量(已婚=0,反之=1)虚拟变量(7000以下=0,反之=1)虚拟变量(一般=0,反之=1)虚拟变量(一般=0,反之=1)虚拟变量(有朋友=1,没有=0)虚拟变量(职业稳定=1,不稳定=0)虚拟变量(少数民族=1,汉族=0)虚拟变量(城镇=1,农村=0)表1OrderedLogistic模型的因变量和解释变量表2OrderedLogistic模型结果年龄性别教育程度婚姻状况收入状况民族健康状况家庭关系人际关系职业稳定否户口一般模型显著模型解释变量注:**表示在1%上显著,*表示在5%上显著;由于因变量各分类常数项对自变量产生的影响没有解释作用,这里没有列出。年龄年龄2男(参照)女小学及文盲(参照)初中高中或中专大专大学及以上已婚(参照)未婚婚姻异常7000以下(参照)7001~1500015001~3000030001~5000050000以上汉族(参照)少数民族一般(参照)很好较好较差一般(参照)很融洽比较融洽比较差没有朋友(参照)有朋友不稳定(参照)稳定农村(参照)城镇系数(-β)-0.17**0.002**0.60**-1.50**-1.66**-1.38**-1.21**-0.57-0.68*0.320.380.65*0.78*-0.400.89**0.59**-0.87*1.60**1.16**-1.76*0.530.47**0.31e-β0.841.001.820.220.190.250.300.570.511.381.461.922.180.672.441.800.424.953.190.171.701.601.36系数(-β)-0.16**0.002**0.65**-1.00**-1.23**-0.95*-0.76*-0.72**0.89**0.60**-0.77*1.65**1.22**-1.82*0.58**e-β0.851.001.920.370.290.390.470.492.441.820.465.213.390.161.79统计观察84统计与决策2011年第6期(总第330期)量。两个模型平行线检验的P值(一般模型0.368、显著模型0.395)均>0.05,适合用Logit分析。需要指出的是:①模型中系数为公式中的-β;②解释变量中的各分类变量系数代表该类变量对比参考类别变量的效果,其中参考类别变量的系数为0;③e-β表示在其它变量相同的情况下,研究的变量类别与参考类别幸福感的比值。4.2结果解释显著模型与一般模型的对比结果表明:幸福感在年龄、教育程度、婚姻状况、健康状况、家庭关系和职业稳定变量上存在显著的组群差异,而在收入状况、民族、人际关系和户口变量上没有表现出显著的组群差异。(1)年龄。年龄的系数显著为负,年龄的平方项显著为正,这一结果表明年龄与幸福感呈“U”型曲线关系,表现为与年轻人和老年人相比,中年人幸福感最低。这可能与中年人所面对的“上有老下有小”的生活压力有关。这一结论也被BerndHayo[3]对东欧一些转型国家的研究所验证。(2)性别。女性的系数显著为正,表明女性的幸福感明显高于男性,在其他变量相同的情况下,女性的幸福感是男性的1.92倍,说明不同性别幸福感的差异显著。这可能与城市中男女经济地位基本平等有关;也可能与我国职业女性比例较高,男女同工同酬的现实有关。(3)教育程度。与小学及文盲学历的人们相比,其它4个学历的系数都显著为负,表明这4种学历的人们幸福感没有小学及文盲学历的幸福程度高。不同学历幸福感大小具体表现为:小学及文盲大学及以上大专初中高中或中专。这一结果在一定意义上解释了学历高的人未必幸福,学历低的人也未必不幸福。(4)婚姻状况。与已婚群体相比,未婚群体和婚姻异常群体的系数为负,表明这两组的幸福程度都不及已婚群体。由显著性水平可知,已婚群体与未婚群体的幸福感差异不显著,但与婚姻异常群体的幸福感差异显著,表明婚姻异常是降低居民幸福感的主要因素。这一结论与国外研究结果基本吻合。Diener[4]的研究表明,婚姻状况与幸福水平呈正相关,已婚者相比单身、离婚、分居或者丧偶有较强的幸福感。Blanchflower[5]用计量经济学方法计算出和睦的婚姻给人们带来的幸福价值大约为10万美元/年。(5)收入状况。与收入低于7000元的人们相比,其他4组收入系数为正,且呈逐渐增大趋势,表明幸福感随着收入等级的提高而增加。其中收入在30001~50000元和50000元以上的人们幸福感明显高于参照人群的幸福感,这可能与收入较高,也就意味着个人生存与发展的自我控制力与自我选择力较多,因而也就会有较多的幸福体验有关。但是收入变量最终没有通过显著模型的检验,表明收入对幸福的影响不显著。(6)健康状况。与健康状况一般的人们相比,健康状况很好和较好的系数显著为正,而健康状况较差的系数显著为负,表明不同健康状况的幸福感差异显著。健康状况很好和较好的人们幸福感分别是一般健康人们幸福感的2.44倍和1.82倍,而身体健康状况较差的人们仅是一般健康的人们0.46倍,这就充分说明健康与幸福之间关系的密切性以及人们对自身健康高度关注的合理性。(7)家庭关系。幸福感在家庭关系变量上的组群差异显著,类似于健康状况变量。表现为家庭关系很融洽