高级《医学统计学》第十六章logistic回归分析第二节条件logistic回归分析暨南大学医学院医学统计学教研室林汉生1.基本概念为消除混杂因素对研究结果的影响,对每1例病人选择1至数例在混杂因素的暴露水平上相一致的,合乎研究条件的,未患病的人作为对照,共同组成一个匹配组。统计分析按匹配组进行。条件logistic回归分析只估计了表示危险因素作用的j值,表示匹配组效应的常数项0i则被自动地消去了。条件logistic回归的计算见《实习指导》。2.《实习指导》例题1:1配对病例-对照研究。某市调查三种生活因素与胃癌发病的关系,设计时采用配对病例对照的形式,按每一个病例的性别、年龄和居住地选取一个健康对照。调查的三种生活因素取值见表。供调查50例病例与对照。不良饮食习惯X1:0,1,2,3,4喜吃咸食X2:0,1,2,3,4精神状况X3:0表示差,1表示好50对胃癌病例与对照三种生活因素调查结果i病例对照X1X2X3X1X2X3124031023210103300201…………………4820111049121001502010313.变量名称及数值含义AnalyzeSurvivalCoxregressionitimestatusx1x2x3i:配对组号(为分层变量)time:病例为1;对照为2status:病例为1;对照为0(1为完全数据)x1,x2,x3:暴露因素4.SPSS操作选用SPSS过程AnalyzeSurvivalCoxregressionOption:Atlaststep;95%CI;Entry结果胃癌发病的多因素条件logistic回归分析影响因素ORP值OR95%CI不良饮食习惯(X1)2.570.0011.45~4.57喜吃咸食(X2)2.420.0071.28~4.56VariablesintheEquation.945.29410.3551.0012.5721.4474.571.882.3247.4041.0072.4161.2804.560X1X2Step2BSEWalddfSig.Exp(B)LowerUpper95.0%CIforExp(B)应用实例《医学统计学》286-288页例16-3某北方城市研究喉癌发病的危险因素,用1:2配对的病例对照研究方法进行了调查。现选取了6个可能的危险因素并节录25对数据,各因素的赋值说明见表16-6,资料列于表16-7。试作条件logistic逐步回归分析。喉癌的危险因素与赋值说明因素变量名赋值说明咽炎X1无=1,偶尔=2,经常=3吸烟量(支/日)X20=1,14=2,59=3,1020=4,20=5声嘶史X3无=1,偶尔=2,经常=3摄食新鲜蔬菜X4少=1,经常=2,每天=3摄食水果X5很少=1,少量=2,经常=3癌症家族史X6无=0,有=1是否患喉癌Y病例=1,对照=0喉癌1:2配对病例对照调查资料整理表(前3对)配对组号因变量危险因素YX1X2X3X4X5X6113511100111330011133021131130011132001213203114132001513200141320SPSS数据工作表多因素条件logistic回归分析结果可信区间的范围宽吗?说明了什么问题?VariablesintheEquation1.487.5517.2921.0074.4231.50313.0161.917.9444.1191.0426.7981.06843.274-3.7641.8254.2531.039.023.001.8303.6321.8663.7901.05237.793.9761463.898x2x3x4x6Step4BSEWalddfSig.Exp(B)LowerUpper95.0%CIforExp(B)5.非条件与条件logistic回归分析的比较区别应用条件(1)非条件与条件logistic回归的区别非条件:非配对资料。当混杂因素过多时,所估计的参数过多,每个参数从资料中得到的信息相对减少,从而降低了估计的精确度。优点是收集资料方便。条件:配对资料。表示匹配组效应的常数项被自动地消去了,只得到各研究因素的参数估计值。由于需要估计的参数减少,从而提高参数估计的精确性。缺点是收集资料较困难,不能用于预测。(2)应用条件何时应用条件logistic回归分析?病例少,有进行配对研究的可行性控制已知的危险因素或混杂因素(配对因素),研究未知或需要探索的危险因素非条件logistic回归分析的常用原因:配对有时难于实现,而且容易配对过度非条件logistic回归分析可以将配对的因素作为混杂因素或危险因素纳入方程频数配对方便,如病例组和对照组男女性别,年龄大致均衡,然后采用非logistic回归分析。