***社会科学研究中的一个基本概念是,社会是一个具有分级结构的整体,社会的分级结构自然而然地使由其所产生的数据呈现水平(层次)结构。在该类数据中,低一水平(层次)的数据单位嵌套与或聚集在高一水平(层次)的单位中。*长期以来用以说明具有多种水平结构的数据的例子是对学生学习成绩的研究。学生的学习状况不仅与个人的内在因素(如智力水平)相联系,而且与其所处的环境相联系,如学习风气、教师的教学经验、学校的设施等。因此在对学习成绩与个体水平变量(如性别、智力水平、种族等)关系的研究中,可将学生个体嵌套在班级里,而将班级嵌套在学校里的形式进行数据采集,由此形成了3个水平(层次)的结构数据,第1个水平(层次)的观察数据单位是学生个体,第2个水平(层次)的观察数据单位是班级,第3个水平(层次)的观察数据单位是学校。*在经济领域相关问题的研究中,国家、省、地市、县的众多经济指标数据就存在着明显的水平结构,县级指标数据嵌套于地市数据,地市嵌套于省份,省份又嵌套于国家,因此可视为多水平数据,即第1水平的观察单位是县,第2水平的观察单位是地市,第3水平的观察单位则是省份,第4水平的观察单位则是国家。*通过分层抽样得到的样本数据,具有明显的水平结构,所以也是多水平数据。**多水平统计分析模型的产生是社会科学理论研究和方法论的进步,为研究具有多水平结构的数据提供了一个方便的分析框架,研究者可以利用该框架系统分析微观和宏观水平的效应,检验宏观变量如何调节微观变量的效应,以及个体水平解释变量是否影响组水平解释变量的效应。另外,多水平统计分析模型还可以用来研究纵向数据中被解释变量随时间变化的发展轨迹,即多水平模型中的发展模型。**1)由于多水平模型同时考虑不同水平上的差异,因此当数据水平结构较多时,多水平模型结构较一般计量模型结构复杂;*(2)需要较大的样本量才可以保证多水平模型估计的稳定性,较小的样本会带来偏差**无条件两水平模型首先建立无条件两水平模型,又称为截距模型(intercept-onlymodel)或空模型(emptymodel),是两水平模型建模的基础。其模型形式为:总模型为:*组内相关系数ICCICC被定义为组间方差与总方差之比。对于截距模型而言,其ICC定义为:ICC既能反映组间变异,也能表示组内个体间的相关,其范围在0到1之间,当ICC值趋于1时表示组间方差相对于组内方差非常大,相反当ICC值趋于0时表示没有组群效应,此时两水平模型可简化为固定效应模型。22200()uuICC*条件两水平模型*条件两水平模型既是在截距模型中加入了解释变量,其中既包括一水平解释变量也可能包括二水平解释变量。设为因变量,为一水平解释变量,为二水平解释变量,且均为线性函数形式的关系(可以具有其他函数形式的关系)。当只有一水平解释变量时模型如下:水平1:ijiiijijyxe水平2:00iiu01iiu,总模型为:0001ijijiiijyxuue*当存在二水平解释变量时模型如下:水平1:水平2:总模型为:ijiiijijyxe010iiiwu011iiiwu010101ijiijiijiiijijywxwxuuxe以定义水平1方差可解释的比例222122ˆˆˆ((1ˆˆR零模型)(设定模型)设定模型)(零模型)(零模型)水平2方差可解释的比例2222000202200ˆˆˆ(1ˆˆ((uuuuuR零模型)(设定模型)(设定模型)零模型)零模型)*例1:农户的收入函数模型*为了研究影响西部民族地区农户收入的因素,我们考虑如下变量:结局测量:y:农户家庭人均纯收入的对数;水平1解释变量或个体水平解释变量:invest:农户家庭的人均生产性固定资产原值;till:农户家庭的人均耕地数量;Structure:农户家庭的就业结构(调查户按从业劳动力比重计算的从业类型,1.农业户;2.农业兼业户;3.非农业兼业户;4.非农业户)水平2解释变量:地理环境,分为三类:平原、丘陵和山区,引入两个虚拟变量表示:*空模型也称为截距模型(Intercept—onlymodel)或无条件均值模型(Unconditionalmeansmodel)。该模型是最简单的随机效应模型,即单因素随机效应方差分析。运行该模型的目的是评估组内同质性(Within—grouphomogeneity)或组间异质性(Between—groupheterogeneity)。设本例中的空模型为:结果表明:各村农户的人均收入增长率存在显著差异。组内相关系数(ICC):ICC=0.368表明结局测量中约有36.8%的总变异是由村之间的差异造成的。**上述空模型的运行结果表明结局测量y中存在显著的组间变量(方差=0.2278,P0.0001)。我们在模型中加入2水平的解释变量来解释各村之间的组间变异。为简洁起见,我们在模型中纳入一个表示地理位置的2水平解释变量(用D1、D2两个虚拟变量表示)***till和Structure的方差估计分别为0.002449和0.01518,对应的Z检验统计量为1.65和2.30,prob(Z)分别为0.0490和0.0108,说明这两个变量的回归系数是随机系数。**在建模的最后,我们需要讨论多层模型分析中的一个非常重要的问题——跨层交互作用(across—levelinteractions),即讨论2水平解释变量如何调节水平1解释变量对结局测量的效应。在多层模型中设定跨层交互作用相当于将模型中水平1随机系数设定为相应水平2方程中解释变量的函数: