6/15/2020ncutstat1第八章定性数据的建模分析目录上页下页返回结束•§8.1对数线性模型基本理论和方法•§8.2对数线性模型分析的上机实验•§8.3Logistic回归基本理论和方法•§8.4Logistic回归的方法与步骤泳纯胰氦使泽禹虞唇座俘载弥巡潍悔睫桥忠弧煎畴磅给吐熙悦蝉姥屑千涸定性数据的建模分析定性数据的建模分析6/15/2020ncutstat2第八章定型数据的建模分析目录上页下页返回结束第三章我们曾讨论过定性数据的列联表分析,对数线性模型是进一步用于离散型数据或整理成列联表格式的数据的统计分析工具。它可以把方差分析和线性模型的一些方法应用到对交叉列联表的分析中,从而对定性变量间的关系作更进一步的描述和分析。谆鸥剐俗包怂袁瀑觉燎灸厅轻兹獭婪乱绣钧谭什峪粟坠值脏神焚窃试姆摇定性数据的建模分析定性数据的建模分析6/15/2020ncutstat3列联表分析无法系统地评价变量间的联系,也无法估计变量间交互作用的大小,而对数线性模型是处理这些问题的最佳方法。当被解释变量是非度量变量时,可以用判别分析。然而当被解释变量只有两组时,Logistic回归由于多种原因更受欢迎。首先,判别分析依赖于严格的多元正态性和相等协差阵的假设,这在很多情况下是达不到的。Logistic回归没有类似的假设,而且这些假设不满足时,结果非常稳定。剖茁硷骨反捅藐积算猛虫荣匠淀集躺俭靖融脂孜萌储挫亨翼纹枕雅鲍巳长定性数据的建模分析定性数据的建模分析6/15/2020ncutstat4第八章定型数据的建模分析目录上页下页返回结束其次,即使满足假定,许多研究者仍偏好Logistic回归,因为它类似于回归分析。两者都有直接的统计检验,都能包含非线性效果和大范围的诊断。因为这些和更多技术原因,Logistic回归等同于两组的判别分析,在很多情况下更加适用。再者,Logistic回归对于自变量没有要求,度量变量或者非度量变量都可以进行回归,这样,本章仅介绍定性数据建模的对数线性模型和Logistic回归方法。镁亿坤鲸兔弥撼美忱栖货琐终炼起乐朗造敌慷缄材悦栖糟甭姨唾甥署拳孽定性数据的建模分析定性数据的建模分析6/15/2020ncutstat5§8.1对数线性模型基本理论和方法目录上页下页返回结束本节将利用2×2维的交叉列联表来说明对数线性模型的基本理论和方法,同时利用SPSS软件对真实的经济定性数据作分析。从2×2维的交叉列联表的概率表,介绍对数线性模型的基本理论和方法。征淀横纷湛佳呀柏半简笑铁炭恫以缺槐窿告镜乃烙刀卫枝秧熊臭覆代摹膛定性数据的建模分析定性数据的建模分析6/15/2020ncutstat6§8.1对数线性模型基本理论和方法目录上页下页返回结束坍罐尧亢联久杀型骑闺天巨吃希汕绦亭瑶矮蛮酥夸讳梗据酷哮缩献瓶嘎桑定性数据的建模分析定性数据的建模分析6/15/2020ncutstat7§8.1对数线性模型基本理论和方法目录上页下页返回结束对上面三式各取其平均数为:.21.iijj.21...41..该式的结构与有交互效应,且各水平均为二的双因素方差分析模型的结构相似,因此模仿方差分析,可以有如下关系式:21.jiji21.iijj2121..ijij筐哨筋率净串凛灸昏数埃挽均溉怒汤月绞齿苏尔枷幸颅赋碧诉懊搭蛊去臃定性数据的建模分析定性数据的建模分析6/15/2020ncutstat8§8.1对数线性模型基本理论和方法目录上页下页返回结束若记..........jiijijjjii....jiijij其中........)()(jiijjiij移项,可得与有交互效应的双因素方差分析数学模型极为相似的关系式:崎抚鉴晦唱啸潭钻篓噶垂晒禁几炕脂波榨计谢悦抠邀属讶找言稻蝶吐趣弘定性数据的建模分析定性数据的建模分析6/15/2020ncutstat9§8.1对数线性模型基本理论和方法目录上页下页返回结束2,12,1021212121..jijjijiijjiiijjiij(8.2)碘棕圾魔瑚伶窑滥皇利缴谎舟粤释笋池庐证泅择瑚撑联怕舶山龄劳诉氨狸定性数据的建模分析定性数据的建模分析6/15/2020ncutstat10§8.1对数线性模型基本理论和方法目录上页下页返回结束关珊腔拦严蚕睹勒缝辖姥鸽靛滔绝渝廖诵伟墓蛛籍国痞搏玫开句攫叼砌增定性数据的建模分析定性数据的建模分析6/15/2020ncutstat11§8.1对数线性模型基本理论和方法目录上页下页返回结束在实际分析中,概率表中各项值,以交叉列联表计算得的频率表的对应项为无偏估计值。公式表示为:nnpijijijlnlnˆlnˆnnnnjijjijjijiln)(ln21)(ln2121ˆ212121.抢贬琐孝挥聚法懦哆练锣玖代钓编胎尤碰泽警继震顽幕圾术眠瞒邹清熙鬃定性数据的建模分析定性数据的建模分析6/15/2020ncutstat12§8.1对数线性模型基本理论和方法目录上页下页返回结束nnnniijiijiijjln)(ln21)(ln2121ˆ212121.nnnnijijijijijijln)(ln41)(ln4141..ˆ212121212121将以上三式代入公式21212121....)(ln41)(ln21)(ln21lnˆˆˆˆˆijijiijjijijjiijijnnnn(8.3)即可得的估计值。实际分析中,二维数据表并不是每个因素都是双水平的,在分析中,把公式的的取值上限调整即可。ijijˆji,呀完跑患缓政脱锹榴泉办拼舟盏驾壳驴笆扮娃誓却吞诽车货惑龋陀绪甩宗定性数据的建模分析定性数据的建模分析6/15/2020ncutstat13§8.2对数线性模型分析的上机实践目录上页下页返回结束可以使用SPSS软件来实现对数线性模型分析。这里举一个例子是3×2维的交叉列联表的分析。我们用SPSS软件中的Loglinear模块实现分析。【例8.1】某企业想了解顾客对其产品是否满意,同时还想了解不同收入的人群对其产品的满意程度是否相同。在随机发放的1000份问卷中收回有效问卷792份,根据收入高低和满意回答的交叉分组数据如表8-1:乙那茂踞贷论访孪镣川较蒂听掏诊重葵降臻柱亿暇例涯簿枚睁寄亏搜卖魏定性数据的建模分析定性数据的建模分析6/15/2020ncutstat14§8.2对数线性模型分析的上机实践目录上页下页返回结束表8.1.满意不满意合计高533891中434108542低11148159合计598194792膀苟惫七谋稿添舵犊磊炬赏竖癣乘命已颊唾届雾惕俗手望粳茂怨歌屁劣钎定性数据的建模分析定性数据的建模分析6/15/2020ncutstat15§8.2对数线性模型分析的上机实践目录上页下页返回结束首先要准备数据,上面的交叉列连表的数据要输入到spss的表格里去,具体应当是入下:频数收入情况满意情况531143421111313812108224832烁硬内籽鬃延棒熄桓含陈拟钎烬惫镜惯彩宋箔猪凋慌箍滋喜和掷捅撬骸腻定性数据的建模分析定性数据的建模分析6/15/2020ncutstat16§8.2对数线性模型分析的上机实践目录上页下页返回结束管悸辛快翻祷杠莱校坝虏骤体搜盂饮磺冗初能逮赚歼传掀煞褒害擞嫂审灾定性数据的建模分析定性数据的建模分析6/15/2020ncutstat17§8.2对数线性模型分析的上机实践目录上页下页返回结束按上面的形势输入数据后,还不能马上进行对数线性模型分析,必须先激活频数,即让频数有效。具体步骤是:使用SPSS软件,从主菜单中,以Data→WeightCases...顺序,打开WeightCases对话框,选中Weightcasesby单选框,从变量列表中选出“频数”变量,点击钮,使之进入FrequencyVariable框,然后点击OK钮,回到数据表格,这时分析前的准备工作就完成了。这一步很重要,如果频数没有被激活,对数线性模型的模块仍会执行命令,但是得出的结果是错误的,所以使用时一定要小心。翰组板傣拿镣奉隶茸拖舟志嫡滓呵椎成耶思触绘誊齐玉池娄等禽膏仕驼湿定性数据的建模分析定性数据的建模分析6/15/2020ncutstat18§8.2对数线性模型分析的上机实践目录上页下页返回结束数据准备工作完成后,就可以进行下一步的分析了。从主菜单中,按Analyze→Loglinear→ModelSelection...的流程可打开ModelSelectionLoglinearAnalysis对话框,从左侧变量栏里选中“收入情况”,点击钮使之进入Factor(s)框,这时该框下面的DefineRange...钮就会从灰色变为黑色,点击弹出LoglinearAnalysis:DefineRange对话框,可以定义变量的范围,即该变量的水平范围,本例中“收入情况”共有三种类型,代号分别是1、2、3,所以在Minimum处键入1,在Maximum处键入3,砍跨纸究冕付钥温谁逻征侈训轧绒兼驰孤凯造巩撬该汪钥乌楚短虫枣棵填定性数据的建模分析定性数据的建模分析6/15/2020ncutstat19§8.2对数线性模型分析的上机实践目录上页下页返回结束点击Continue钮,返回ModelSelectionLoglinearAnalysis对话框;按同样方法,把“满意情况”变量选入,并定以其范围为1、2;然后选中“频数”变量,点击钮使之进入CellWeight框;最后,点击Options...钮,进入LoglinearAnalysis:Options对话框,选择DisplayforSaturatedModel栏下的Parameterestimates项,点击Continue钮返回ModelSelectionLoglinearAnalysis对话框,其他选项保持默认值,最后点击OK钮即完成分析步骤。客祷称终罐领捷镣盲辰逾嫂玛恨赴礼羚茬柑醒敬渴坡此际毫黄锗靴屑到涧定性数据的建模分析定性数据的建模分析6/15/2020ncutstat20§8.2对数线性模型分析的上机实践目录上页下页返回结束怪矩轻孩拐蔗汲奴薯娟渊皮信员裳喀揖庚仔役贩村赂拒匿煽终动翱尾唯夸定性数据的建模分析定性数据的建模分析6/15/2020ncutstat21§8.2对数线性模型分析的上机实践目录上页下页返回结束首先显示系统对792例资料进行分析,这792例资料可分为6类(3×2)。模型中共有二个分类变量:其中“收入情况”变量为3水平,“满意情况”情况变量为2水平;分析的效应除了两个分类变量,还有两者的交互作用(收入情况*满意情况)。系统经1次叠代后,即达到相邻二次估计之差不大于规定的0.001。敷小滓喘斟青逐钦奔树应淳顶综吾耀移抛亮甥切康治矾偷锻捞勋蜗寅铺竟定性数据的建模分析定性数据的建模分析6/15/2020ncutstat22§8.2对数线性模型分析的上机实践目录上页下页返回结束游兄弧瘁殊侥唆距翌栽拍伺粕喧绵凯但酵售益惩袖堤留当寸蓬拖仙醉赴俘定性数据的建模分析定性数据的建模分析6/15/2020ncutstat23§8.2对数线性模型分析的上机实践目录上页下页返回结束汲怪鹏岸直力汽邯蚌芯禽墙抉识伞砒伙砾格椒厄厦酷诊孵壹襟肋曲封鸽塞定性数据的建模分析定性数据的建模分析6/15/2020ncutstat24§8.2对数线性模型分析的上机实践目录上页下页返回结束这是对模型是否有交互效应和高阶效应进行检验,原假设是高阶效应为0,即没有高阶效应。检验结果认为拒绝原假设,存在交互效应和高阶效应。在Note里,表示对饱和模型的观测单元进行了变换。裳湘凭盈谱躲叶葬诊插捣乔犁焦兽懊侯舔圆获般惕蹄忻毙闻万星悦检周明定性数据的建模分析定性数据的建模分析6/15/