非条件Logistic回归实例解析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

非条件Logistic回归实例解析学生:李清金SPSS19.0统计软件在医学统计中实例应用演示导师:黄宣银SPSS19.0简介SPSS的全称StatisticalProgramforSocialSciences,即社会科学统计程序。该软件是公认的最优秀的统计分析软件包之一。SPSS19.0软件面向行业应用人员,软件设计突出统计方法的成熟、实用、易用性、界面易操作性及与文字处理软件等的交互性上。相比以前SPSS版本,19.0版具备多国语言操作界面,当然也有中文版的!在18.0版前都是英文版的,除非安装中文破解版,但装破解版的容易引起一些系统错误。本人可提供软件:SPSS19.0版:win7-64试用版win7-32破解版、云端版SPSS18.0版:云端版1.了解Logistic回归分析的基本思想;学习要点:2.了解Logistic回归分析的医学应用;3.熟悉非条件Logistic回归分析在SPSS19.0中操作演练及统计结果解释;4.了解非条件Logistic回归分析的注意事项。一、Logistic回归分析的基本思想多重线性回归模型适用于分析一个连续型因变量与一组自变量之间的关系,但如果因变量为分类变量,那么因变量与自变量之间就丧失了线性关系,则不适用线性回归分析来解决,但经过Logit变化后,就可以将模型转变为线性关系,这就产生了Logistic回归模型。1、线性回归资料:比如肺活量可能与患者的年龄、身高、体重、胸围等因素是否有关?适合用线性相关与回归的模型。2、分类回归资料:比如冠心病发生与否和患者的性别、年龄、心电图是否异常等因素是否有关?适合用非条件Logistic回归模型。3.Logistic回归模型分类:(1)非条件Logistic回归:又称为二分类Logistic回归,即回归模型中的因变量是二元分类变量,比如疾病发生与否和患者年龄、性别、体重等因素是否有关。(2)条件Logistic回归:又称为1:1配对Logistic回归,即回归模型中的因变量是多元分类变量,比如以年龄为配对条件,有无肺癌的患者与饮酒、服用NSAIDs、服用激素等因素是否有关。学习要点:1.了解Logistic回归分析的基本思想;2.了解Logistic回归分析的医学应用;3.熟悉非条件Logistic回归分析在SPSS19.0中操作演练及统计结果解释;4.了解非条件Logistic回归分析的注意事项。二、了解Logistic回归分析的医学应用1.校正混杂因素:将研究因素、混杂因素及其交互作用全部纳入模型,能够在控制混杂因素的作用下,对研究因素与因变量间的联系作出定量描述。2.筛选危险因素:如果自变量太多或变量作用不清楚,则需要事先按规定的检验水准,将有统计学意义的变量纳入模型,而将无统计学意义的变量剔除,以保证模型最优。3.预测与判断:这是非条件Logistic回归的重要作用,我们可以给定变量的数值,则可通过回归方程计算相应的概率预测值,对个体所属类别作出概率性的判断。学习要点:1.了解Logistic回归分析的基本思想;2.了解Logistic回归分析的医学应用;3.熟悉非条件Logistic回归分析在SPSS19.0中操作演练及统计结果解释;4.了解非条件Logistic回归分析的注意事项。三、SPSS19.0实例应用与解析1、自变量进入模型的方法:一般分为:进入法(enter)、前进法(forward)和后退法(backward)3种,后两种方法还可以分为条件(conditional)、偏拟然比(LR)和Wald检验3种。如果变量较少,通常采用进入法,如果变量太多,则选用前进LR,前进LR相当于多重线性回归分析中的逐步回归,本例当中采用进入法。2、自变量---设置哑变量如果自变量为多分类变量,比如血型,由于多分类变量和因变量之间不存在线性关系,需用哑变量的方式来分析,系统将产生K-1个哑变量(K为该变量的水平数)哑变量设置有对比方式和参考类别两种设置项目,对比方式有指示符、简单、差值等形式,我们通常默认指示符,而参考类别需要以最后一个或者第一个为参照,其他水平与参考水平做比较。本例的心电图表现哑量设置若以第一个(F)为参考,产生2个哑变量如下:00该组为参考的正常水平,在统计中无法体现。10该组反映轻度异常与正常水平的比较。01该组反映重度异常与正常水平的比较。若以最后一个(L)为参考,产生2个哑变量如下:10该组反映正常组与重度异常的比较01该组反映轻度异常与重度异常的比较。00该组为参考的重度异常水平,在统计中无法体现。OR值定义及其意义OR值=(病例中暴露的比例/病例中非暴露的比例)/(对照中暴露的比例/对照中非暴露的比例)OR值=2,说明病例中暴露于某个危险因素的比例为对照组的2倍,说明该因素可能与疾病发生有关。统计结果解释结果显示:最终引入模型的变量及常数项的偏回归系数值B,标准误(SE),Wald卡方值(Wals),自由度(df),P值(Sig),及其OR值(ExpB)和OR的95%CI。结果解释:1、年龄的回归系数为0.163,Wald检验结果P0.05,有统计学意义,OR值为1.178,CI为1.042-1.330,说明年龄大的患者患冠心病的概率比年龄小的患者大1.178倍。结果解释:2.心电图的第二个哑变量,即心电图(2)也有统计意义,其回归系数为2.650,p0.05,OR值为14.160,CI为1.467-136.709,说明心电图重度异常与正常的相比较,患有心脏病的概率要高。3.其他变量,如性别,心电图轻度异常与正常比较均没有统计学意义(p0.05)。学习要点:1.了解Logistic回归分析的基本思想;2.了解Logistic回归分析的医学应用;3.熟悉非条件Logistic回归分析在SPSS19.0中操作演练及统计结果解释;4.了解非条件Logistic回归分析的注意事项。4、非条件Logistic回归分析的注意事项1.赋值注意:二分类过程默认以因变量较大取值的概率P来建立模型,因此赋值要注意,0代表不发生(即不感兴趣的事件,y=0),1代表发生(即感兴趣的事件,y=1)比如,以是否患有心脏病为因变量,那么y=1表示有心脏病,y=0表示无心脏病。因变量的赋值决定了模型的解释,须注意!同样,对于自变量的赋值也要尽量遵循这一规则,以免导致解释的方向反了。4、非条件Logistic回归分析的注意事项2.哑量设置:Logistic回归分析的变量包括连续变量、等级变量和分类变量,对于连续变量和分类变量(转换为哑变量)直接引入模型。等级变量需要则须满足一个前提条件:即等级分组与Logit(p)呈线性关系,其效应等比例增加或降低。如疗效好、中、差与血型A、B、AB、O型的区别?如果满足此条件可以连续变量的形式引入模型,否则只能用哑变量来分析。4、非条件Logistic回归分析的注意事项3.回归系数:Logistic回归的回归系数与线性回归系数有区别,自变量作用大小取决于Exp(B)即OR值,而不是其回归系数。因此Logistic回归系数又成“伪回归系数”。B(年龄)=0.163,OR=1.178,指年龄大的患者患心脏病的概率是年龄小患者的1.178倍,提示年龄大是危险因素。B(年龄)=-1.155,OR=0.315,指年龄大的患者患心脏病的概率是年龄小患者的31.5%倍,提示年龄大是有利因素。4、非条件Logistic回归分析的注意事项4.理解危险因素和有利因素,注意以下几点:(1)因变量的赋值方向:比如疾病发生与否,不发生=0,发生=1,那么0R值1的自变量为危险因素,OR值1的自变量为有利因素。比如治疗效果,无效=0,有效=1,那么0R值1的自变量为有利因素,OR值1的自变量为危险因素。如果自变量赋值0和1互换后,OR值意义相反。4.理解危险因素和有利因素(2)哑变量的赋值方向:注意参考类别选择。比如本例心电图异常情况,选择L和F两个参考类型,选择方向不同,其解释的方向也不同,具体参考前面结果。4、非条件Logistic回归分析的注意事项5.自变量的处理技巧:若自变量为3-5个,一般选择进入法,若自变量5个,一般采取前进(LR);此外,自变量比较多的资料,应该先采用单因素分析对自变量进行筛选,然后对单因素分析有统计意义的变量进行Logistic回归分析。单因素分析(t检验、卡方检验等)主要筛选出可能影响因素,回归分析筛选出相关性因素。5、思考与交流?如何运用SPSS19.0在Logistic回归中分析两个变量之间的协调作用(交互作用)?我的读书报告汇报完毕了。感谢老师和同学们听取了我的读书报告,对于报告中存在的问题或不足,欢迎大家给予批评和指点。谢谢!!

1 / 29
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功