第九章对数线性模型第一节General过程9.1.1主要功能9.1.2实例操作第二节Hierarchical过程9.2.1主要功能9.2.2实例操作第三节Logit过程9.3.1主要功能9.3.2实例操作对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。对于列联表资料,通常作χ2检验,但χ2检验无法系统地评价变量间的联系,也无法估计变量间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。第一节General过程9.1.1主要功能调用该过程可对一个或多个二维列联表资料进行非层次对数线性分析。它只能拟合全饱和模型,即分类变量各自效应及其相互间效应均包含在对数线性模型中。返回目录返回全书目录9.1.2实例操作[例9-1]在住院病人中,研究其受教育程度与对保健服务满意程度的关系,资料整理成列联表后如下所示。对保健服务满意程度(%)受教育程度高中低满意不满意65(91.5)6(8.5)272(93.8)18(6.2)41(97.6)1(2.4)按一般情形作χ2检验,结果显示不同受教育程度的住院病人其对保健服务满意程度无差别。但从百分比分析中可见,随受教育程度的提高,满意程度有下降的趋势;且我们还想了解受教育程度与满意程度有无交互作用和交互作用的大小。对此,必须采用对数线性模型加以分析。9.1.2.1数据准备激活数据管理窗口,定义变量名:实际观察频数的变量名为freq,受教育程度和满意程度作为行、列分类变量(即独立变量),变量名分别为educ、care。输入原始数据,结果如图9.1所示。如同第四章Crosstab过程中所述,为使列联表的频数有效,应选Data菜单的WeightCases...项,弹出WeightCases对话框(图9.2),激活Weightcasesby项,从变量列表中选freq点击钮使之进入FrequencyVariable框,点击OK钮即可。图9.1原始数据的输入图9.2频数的加权定义9.1.2.2统计分析激活Statistics菜单选Loglinear中的General...项,弹出GeneralLoglinearAnalysis对话框(图9.3)。从对话框左侧的变量列表中选care,点击钮使之进入Factor(s)框,点击DefineRange...钮,弹出GeneralLoglinearAnalysis:DefineRange对话框,定义分类变量care的范围,本例为1、2,故可在Minimum处键入1,在Maximum处键入2,点击Continue钮返回GeneralLoglinearAnalysis对话框。同法将变量educ选入Factor(s)框,并定义其范围为1、3。本例要求计算各分类变量主效应和交互作用的参数估计,故点击Contrast...钮,弹出GeneralLoglinearAnalysis:Contrasts对话框,选择Displayparameterestimates项,点击Continue钮返回GeneralLoglinearAnalysis对话框,最后点击OK钮即完成分析。图9.3非层次对数线性模型分析对话框9.1.2.3结果解释在结果输出窗口中将看到如下统计数据:首先显示系统对403例资料进行分析,共有二个分类变量:CARE为2水平,EDUC为3水平。分析的效应有三类:满意程度(CARE)、教育程度(EDUC)和两者的交互作用(CAREBYEDUC)。系统经2次叠代后即达到相邻二次估计之差不大于规定的0.001。DATAInformation6unweightedcasesaccepted.0casesrejectedbecauseofout-of-rangefactorvalues.0casesrejectedbecauseofmissingdata.403weightedcaseswillbeusedintheanalysis.FACTORInformationFactorLevelLabelCARE2EDUC3DESIGNInformation1Design/Modelwillbeprocessed.CorrespondenceBetweenEffectsandColumnsofDesign/Model1StartingEndingColumnColumnEffectName11CARE23EDUC45CAREBYEDUCNote:forsaturatedmodels.500hasbeenaddedtoallobservedcells.ThisvaluemaybechangedbyusingtheCRITERIA=DELTAsubcommand.***MLconvergedatiteration2.Maximumdifferencebetweensuccessiveiterations=.00000由于本例对Model(模型)未作定义,故系统采用默认的全饱和模型,因而期望例数(EXP.count)与实际例数(OBS.count)相同,进而残差(Residual)、标准化残差(Std.Resid)和校正残差(Adj.Resid)均为0。Observed,ExpectedFrequenciesandResidualsFactorCodeOBS.count&PCT.EXP.count&PCT.ResidualStd.Resid.Adj.Resid.CARE1EDUC165.50(16.13)65.50(16.13).0000.0000.0000EDUC2272.50(67.12)272.50(67.12).0000.0000.0000EDUC341.50(10.22)41.50(10.22).0000.0000.0000CARE2EDUC16.50(1.60)6.50(1.60).0000.0000.0000EDUC218.50(4.56)18.50(4.56).0000.0000.0000EDUC31.50(.37)1.50(.37).0000.0000.0000最后输出参数估计的结果。为了唯一地估计参数,系统强行限定同一分类变量的各水平参数之和为0,故根据下列结果可推得各参数为:λ满意=1.386724028λ不满意=-1.386724028λ高教育程度=-0.091477207λ中教育程度=1.144301306λ低教育程度=-1.052824099λ满意.高教育程度=-0.231600045λ满意.中高教育程度=-0.041790087λ满意.低教育程度=0.273390132λ不满意.高教育程度=0.231600045λ不满意.中教育程度=0.041790087λ不满意.低教育程度=-0.273390132λ值为正,表示正效应;反之为负效应;零为无效应。分析提供的信息是:①对保健服务的满意程度高于不满意程度;②中等教育程度者的满意程度高等教育程度者的满意程度低等教育程度者的满意程度;③通过受教育程度与对保健服务满意程度的交互作用研究,结果表明高、中等教育未能增加人们对现有保健服务状况的满意程度。EstimatesforParametersCAREParameterCoeff.Std.Err.Z-ValueLower95CIUpper95CI11.386724028.159658.685891.073811.69964EDUCParameterCoeff.Std.Err.Z-ValueLower95CIUpper95CI2-.091477207.19895-.45980-.48142.2984731.144301306.174076.57393.803131.48547CAREBYEDUCParameterCoeff.Std.Err.Z-ValueLower95CIUpper95CI4-.231600045.19895-1.16410-.62154.158345-.041790087.17407-.24008-.38296.29938返回目录返回全书目录第二节Hierarchical过程9.2.1主要功能调用该过程可对多维列联表资料进行分层对数线性分析。所谓分层即并可根据用户指定的条件,对某一或某些主效应与交互作用进行剔除,从而形成包含特定层次阶项的各种模型。返回目录返回全书目录9.2.2实例操作[例9-2]为了研究Colles骨折在不同性别中的年龄分布情况,以说明不同性别者骨折的年龄差异及其年度变化,某地收集了1978--1981年的骨折资料,数据见下表。请作对数线性模型的分析。年龄1978197919801981男女男女男女男女0—1920--5960--8955165501726094431012992331158910456202029514013754412781539.2.2.1数据准备激活数据管理窗口,定义变量名:实际观察频数的变量名为freq,年份、性别和年龄为分类变量,变量名分别为year、sex和age。输入原始数据,其中年份1978至1981依次为1、2、3、4,性别男为1、女为2,年龄分组依次为1、2、3。之后选Data菜单的WeightCases...项,在WeightCases对话框中激活Weightcasesby项,从变量列表中选freq点击钮使之进入FrequencyVariable框,点击OK钮完成对频数的权重定义。9.2.2.2统计分析激活Statistics菜单选Loglinear中的Hierarchical...项,弹出HierarchicalLoglinearAnalysis对话框(图9.4)。从对话框左侧的变量列表中选age,点击钮使之进入Factor(s)框,点击DefineRange...钮,弹出HierarchicalLoglinearAnalysis:DefineRange对话框,定义分类变量age的范围,在Minimum处键入1,在Maximum处键入9,点击Continue钮返回HierarchicalLoglinearAnalysis对话框。同法将变量sex选入Factor(s)框,定义其范围为1、2;将变量year选入Factor(s)框,定义其范围为1、4。图9.4层次对数线性模型分析对话框为了更好地拟合数据,并尽可能的简单和易于解释,本例选择向后剔除法建立模型,即从所有效应均在模型中开始,然后消除那些不满足保留判据的效应。点击Model...钮,弹出HierarchicalLoglinearAnalysis:Model对话框,在ModelBuilding栏中选Usebackwardelimination项,点击Continue钮返回HierarchicalLoglinearAnalysis对话框。本例要求作参数估计,故点击Options...钮,弹出HierarchicalLoglinearAnalysis:Options对话框,在DisplayforSaturatedModel栏中选Parameterestimates项,点击Continue钮返回HierarchicalLoglinearAnalysis对话框,之后点击OK钮即完成分析。9.2.2.3结果解释在结果输出窗口中将看到如下统计数据:首先显示,共有2540个观察例数进入分析,其中分类变量AGE为3水平,SEX为2水平,YEAR为4水平。采用全饱和模型,高阶项为年龄、性别和年份三者的交互作用。(在层次对数线性模型分析中,当指定高阶项时,即意味着包含其所属变量所有可能组合的低阶项;如本例,即包含年龄和性别的交互作用、年龄和年份的交互作用、性别和年份的交互作用、年龄的主效应、性别的主效应、年份的主效应。从最高阶到最低阶共为3阶。)DATAInformation24unweightedcasesaccepted.0casesrejectedbecauseofout-of-rangefactorvalues.3casesrej