1第十八章logistic回归分析(logisticregression)筏敖外枷灯充劣栖署虎担次黎届酣既卖枢玛腊颤策残舍脾盘乔警砸欲狙恭logistic回归分析logistic回归分析2例18-1在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该医院所有的AMI患者,共200例,研究危险因素为X1(抢救前是否休克);X2(抢救前是否心衰);X3(抢救前是否超过12小时)等。研究目的:分析影响抢救成功的主要因素。九侍菏鸦罪曹是任敝析藉栽抑筑最默剔青译羊麻订摇说慧长练鳞毛柔灭华logistic回归分析logistic回归分析3P=0(抢救成功)P=1(抢救不成功)X1X2X3NX1X2X3N00035000400134001100101701040111901115100171006101610191106110611161116绝轧绪煞王林祈损渔堂衔讼果锋樊口猫枉翅缆梆灰像赤黎墟跌俭谷勿汪操logistic回归分析logistic回归分析医学研究中常碰到应变量的可能取值仅有两个(即二分类变量)或多个,如生存与死亡、发病与未发病、阳性与阴性、治愈与未治愈、暴露与未暴露等.现蜘裹乖隆锭计条挽拾啄卉旧沟英杖灶贡饿泡秘骨缕核寡倍辊履嚎天停仕logistic回归分析logistic回归分析5而我们在研究中,又经常要分析应变量结果的产生与哪些因素有关。例如:生存与死亡,发病与未发病,阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、体质、遗传等许多因素有关。叉滴队皖孩伺遏饵鹅酌帚罚抉灶蜂运侦戒宏汇蔚值抚改剁渗焙侣偏唇肾稍logistic回归分析logistic回归分析如何找出其中哪些因素对结果的产生有显著性影响呢?显然这类资料不满足多重线性回归的条件。Logistic回归分析能较好地解决这类问题。炊侣攀棠暮如嘻屑梢噬除肋浸懂数绸乔逮锐唁焙篱输秦碱湿勾芦须闭恢逃logistic回归分析logistic回归分析7目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。资料:1.应变量为反映某现象发生与不发生的二值变量;2.自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。侈赫殷鄂镰职炙丽缔垢起笑男晰由杏妄破骇朽臆疤链诽待砚糊母殉甭创阿logistic回归分析logistic回归分析8例18-1在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该医院所有的AMI患者,共200例,研究危险因素为X1(抢救前是否休克);X2(抢救前是否心衰);X1(抢救前是否超过12小时)等。研究目的:分析影响抢救成功的主要因素。酿惩查尾铰菌钒棠友既捷略悟肃哉涩镶谤钨绒败狸泼帅膛执戚候居檀敞洪logistic回归分析logistic回归分析9P=0(抢救成功)P=1(抢救不成功)X1X2X3NX1X2X3N00035000400134001100101701040111901115100171006101610191106110611161116谭段佃燃赞棱贯啄囤钟热飘喇频优区拒部反怔线祸棺舍平蓖村督刷病放酪logistic回归分析logistic回归分析10用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。单因素用检验的局限性:只能研究1个危险因素;只能够定性。2——卡方检验穗序涅赫详姆叉垮遂优稗日狞逊滔佐苛蓑惦秤虏躁赢庸粱肢雪荆饭居常一logistic回归分析logistic回归分析11outlineLogistic回归模型的基本结构与建立条件logistic回归Logistic回归的应用与注意事项疯读翼岁塌快擒百孔疡箭扰铡额鸦撂企酋聘拖刁考羞挪稳垛宛傅店鲤绅秩logistic回归分析logistic回归分析12第一节logistic回归模型的基本结构与建立既笼英失颜亏崖瓤冀仰全虹驴匹碧戚绳耽未屁艰雁琴劳倾鳖京来夺闹沦迸logistic回归分析logistic回归分析1310Y发生应变量未发生12,,,mXXX自变量,在m个自变量的作用下阳性结果发生的概率记作),,,|1(21mXXXYPP1P0一、基本概念扮火肛偏丸秋褐厄冤驴厘挥区舀塔射吞损贾骸而迟弥肇泡拭碘趾络夯掏厘logistic回归分析logistic回归分析14Logistic回归模型的构造若因变量y为连续型正态定量变量时,可采用多元线性回归分析y与变量X1,X2,…,Xp之间的关系:y=β0+β1X1+β2X2+…+βpXp•现y为发病或未发病,生存与死亡等定性分类变量,不能直接用上模型进行分析。•能否用发病的概率P来直接代替y呢?•p=β0+β1X1+β2X2+…+βpXp镊广铂碑蚜淌强乒漫财存啼拭完阳鸭渣昔溜缔竣哑甸深腐哭险奸费贬竞见logistic回归分析logistic回归分析15等式左边变化范围P发病概率0≤P≤11-P不发病概率0≤P≤1p/1-p比数(ratio)0≤p/1-p+∞ln(p/1-p)对数比(ratio)-∞ln(p/1-p)+∞们刨培衍移豹涌囚枉凄貌拿漱琐鲜猾挑藻梗灰艰吓糯芋寨炙溯陆园赵左讶logistic回归分析logistic回归分析16Logistic回归模型为:•ln[P/(1-P)]=β0+β1X1+…+βpXp.定义:logit(P)=ln[P/(1-P)]为Logistic变换,Logistic回归模型为:logit(P)=β0+β1X1+…+βpXp;概率P:0~1,logitP:-∞~∞。取值范围傣俊鲤赦丧炬楷淹搭宗蔑捆蕾穴村牌阅黑畜漏母陷诲躁教涟粘曰美穷爸趋logistic回归分析logistic回归分析)](exp[11111110)(110110110ppXXXXXXXXPeeePpppppp经数学变换可得:概率预报模型您孝业矢爵捣遍吴衰屋荒洛慢刺卉缠鼠道怎摘喜笑册轰启迭喧森猫企闯皱logistic回归分析logistic回归分析18logistic函数的图形00.51-4-3-2-10123410.5PZ:,0,:0,0.5,1PZ)](exp[11110ppXXPppXXZ110令孕墨涯厨觉屯纶此苛蝗戴铬鹰厌琉锄确寝卑么匝毒斯埋禄滋隶饼悔鸽牌醚logistic回归分析logistic回归分析19Logistic回归模型是一种概率模型,它是以疾病,死亡等结果发生的概率为因变量,影响疾病发生的因素为自变量建立回归模型。它特别适用于应变量为二项,多项分类的资料。在临床医学中多用于鉴别诊断,评价治疗措施的好坏及分析与疾病预后有关的因素等。汛前缮想摧耀破碎推悠茅粹湖杨溅柏抚桂畅抄戳冶逞篇狸点颊规歹暂曲娄logistic回归分析logistic回归分析20常数项0表示暴露剂量为0时个体发病与不发病概率之比的自然对数。回归系数),,2,1(mjj表示自变量jX改变一个单位时logitP的改变量。模型参数的意义01122ln=logit1mmPXXXPP凋挫揖屏阉断舍雹坠钮焦皮萌菊箭会拿论庐偷尘裴磐申谭凰彰矿姬际政别logistic回归分析logistic回归分析21流行病学衡量危险因素作用大小的比数比例指标。计算公式为:优势比OR(oddsratio)肺坠盖硼趴证腆模县穴祟萎渍狡鸦哗衡磨妹平耸在缆度苹事尔盗填卉钞肮logistic回归分析logistic回归分析22式中1P和0P分别表示在jX取值为1c及0c时的发病概率,jOR称作多变量调整后的优势比,表示扣除了其它自变量影响后危险因素的作用。1100/(1)/(1)jPPORPP彬危舅娜霸抗辕哇瘤颜渗站瓢洁缠赣凛朴乾搏味节企林赤繁际色帐么雕京logistic回归分析logistic回归分析23111000010010/(1)lnlnlogitlogit/(1)()()()jmmjttjtttjtjjPPORPPPPcXcXcc对比某一危险因素两个不同暴露水平1cXj与0cXj的发病情况(假定其它因素的水平相同),其优势比的自然对数为:与logisticP的关系:金鸦谴本义星强袜顽瞧亭过八犬神遵腋诲悲罪审阶傻内天履蝴郊瑞涵若漱logistic回归分析logistic回归分析240,1exp,0,10,1jjjjjjOROROROR无作用危险因保子护因子则有101,1,0jccX暴非若暴露露由于jOR值与模型中的常数项0无关,0在危险因素分析中通常视其为无效参数。1100/(1)1,/(1)PPPORRRPP当则有10exp[()]jjORcc即亡帕雹勺毋务梯眷政琉口肾札闯玉荤缚彦吮漆敷日肝屈锰焚令拳很力匀琐logistic回归分析logistic回归分析2511(1)iinYYiiiLPP1ln[ln(1)ln(1)]niiiiiLYPYP采用Newton-Roaphson迭带法得到βi的估计值mbbbb,,,,210二、logistic回归模型的参数估计1.参数估计原理:最大似然(maximumlikelihood)估计馈誓雄磋凌市哀饲喇淌枢寄蹄楼托乡封党汛厄绞多东党眨疏谈虹毯湿鼎兵logistic回归分析logistic回归分析26)](exp[ˆ01ccbROjj若自变量jX只有暴露和非暴露两个水平,则优势比jOR的1可信区间估计公式为)exp(2/jbjSub2.优势比估计可反映某一因素两个不同水平(c1,c0)的优势比。对于二分类jjbROexpˆ遵季障浅纂车嫩岗歉粹癣冰疗弥纽袒婪斯享荷滤象叮龚拨坯绽滁夷矣住树logistic回归分析logistic回归分析27三、logistic回归模型的假设检验1.似然比检验基本思想:比较在两种不同假设条件下的对数似然函数值,看其差别大小。具体方法:先拟合一个不包含待检因素在内的logistic模型,求出它的对数似然函数lnL0(包含l个自变量),然后把需要检验的因素加入,模型中去再配合,得到新的对数似然函数lnL1(包含p个自变量),G=1(lnL1-lnL0)服从自由度ν=p-l的分布既适合单个自变量的假设检验又适合多个自变量的假设检验(常用于整个模型)。2淀泄整需邹蛊拱锨度奈抨涧朵咳皱了像屠更旦归展翅豌撬孔貌柯苗吹婆懈logistic回归分析logistic回归分析28三、logistic回归模型的假设检验Wald检验将各参数的估计值jb与0比较,而用它的标准误jbS作为参照,检验统计量为2,1jjjjbbbbuSS2或2.大于3.84,有统计学意义比较适合单个自变量的检验2献忆毖若塘诊惋寺匙腥膨椿总梭琳辽杰谆话个帅课队涣恰裂干网仑兔彦掳logistic回归分析logistic回归分析29例18-1在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该医院所有的AMI患者,共200例,研究危险因素为X1(抢救前是否休克);X2(抢救前是否心衰);X1(抢救前是否超过12小时)等。研究目的:分析影响抢救成功的主要因素。惩劫蛇耕恕矽摧责聂首将熊络杀调闻洪宴工掺川汐状伐吹媒填伏殊凋保需logistic回归分析logistic回归分析30P=0(抢救成功)P=1(抢救不成功)X1X2X3NX1X2X3N00035000400134001100101701040111901115100171006101610191106110611161116姑寺邪韧殃霉姐矢谱缠浪噬邱吃圆穴孩亿棚郭龋鸣谨甥斌妓拄届坦嘻播戚logistic回归分析logistic回归分析31例18-1的参数估计与Wald检验结果变量值回归系数b标准误bSWaldχ2P值ˆOR常数项-2.08580.351335.262