华西公共卫生学院卫生统计教研室1随访资料的生存分析朱彩蓉华西公共卫生学院卫生统计教研室2120例食管癌手术后生存情况研究结果如下,若观察期间无人失访,请计算1年生存率和2年生存率。100120900123实例华西公共卫生学院卫生统计教研室3根据传统率的概念计算n年生存率:%100 随访病例数 年的患者数活满年生存率=nn华西公共卫生学院卫生统计教研室4120例食管癌手术后生存情况研究结果如下,其中术后1年到2年期间有20例患者失访,请计算1年生存率和2年生存率。100120700123实例华西公共卫生学院卫生统计教研室5•用该方法计算的n年生存率损失了部分信息,不能对生存率作出正确的估计。华西公共卫生学院卫生统计教研室6乳腺癌术后生存率术后年数随访病例数期末生存病例数生存率/125022590.00222116876.02316110665.844966567.71华西公共卫生学院卫生统计教研室7•某医生将22例肺癌患者随机分为两组,分别采用化疗和放化疗联合治疗,从缓解出院日开始随访,22名患者生存时间(月)如下,试比较化疗和放化疗联合治疗肺癌的疗效有无差别。实例华西公共卫生学院卫生统计教研室8化疗组:1,2,3,5,6,9,11,13,16,26,37放化疗联合组:10,11,14,18,22,22,26,32,38,40,42华西公共卫生学院卫生统计教研室9•某医生将22例肺癌患者随机分为两组,分别采用化疗和放化疗联合治疗,从缓解出院日开始随访,22名患者生存时间(月)如下,试比较化疗和放化疗联合治疗肺癌的疗效有无差别。实例华西公共卫生学院卫生统计教研室10化疗组:1,2,3,5,6,9+,11,13,16,26,37+放化疗联合组:10,11+,14,18,22,22,26,32,38,40+,42+注:带“+”号的数据表示患者至少存活了多少个月华西公共卫生学院卫生统计教研室11隐含的研究目的•两组生存率是否有差别•两组生存时间是否有差别华西公共卫生学院卫生统计教研室12•随访资料具有其特殊性,观察对象既有随访结果又有随访时间,不能套用前面所学的统计方法;•当比较不同治疗方案的治疗效果时,仅比较某个时点的生存率,有时可能出现不正确的结论。华西公共卫生学院卫生统计教研室13生存分析(survivalanalysis)•将研究对象的随访结局和随访时间两个因素同时结合起来考虑的一种统计分析方法;•能充分利用所获得的信息,达到较准确、全面地评价和比较随访资料的目的。华西公共卫生学院卫生统计教研室14生存资料的特点•蕴涵有结局和时间两方面信息;•结局为两分类互斥事件;•通过随访收集资料;•常因失访等原因造成生存时间数据不完整,分布类型复杂。华西公共卫生学院卫生统计教研室15例15.1某医师采用手术疗法治疗12例宫颈癌患者,随访时间(月)记录如下:1,2,4,5,7,8+,11,15,18,33+,36,38+。试估计各时点生存率及其标准误、各时点总体生存率的95%可信区间、中位生存时间,并绘制生存曲线。华西公共卫生学院卫生统计教研室16生存分析中的几个基本概念•“死亡”事件——失败事件(failureevent)•生存时间(survivaltime)•死亡概率(mortalityprobability)生存概率(survivalprobability)•生存率(survivalrate)•中位生存时间(mediansurvivaltime)华西公共卫生学院卫生统计教研室17死亡事件(deathevent)•又称失效事件(failureevent)死亡事件是一个广义概念,不单是指通常意义下的生物体死亡,而是泛指标志某种处理措施失败或失效的特征事件。华西公共卫生学院卫生统计教研室18失效事件实例•例15.1宫颈癌患者死亡;•接受健康教育后青少年戒烟一段时间后又吸烟;•投保某种健康险后中途退保。华西公共卫生学院卫生统计教研室19生存时间(survivaltime)•指观察到的存活时间,可用天、周、月、年等时间单位记录,常用符号t表示;•生存时间是一个广义概念,不单是指通常意义下生物体的存活时间,而是泛指研究者所关心的某现象的持续时间。华西公共卫生学院卫生统计教研室20如:•例15.1宫颈癌患者生存的时间;•白血病患者化疗后的缓解时间;•肾移植患者的存活时间;•接受健康教育后青少年的戒烟时间;•投保某种健康险至中途退保的时间等。华西公共卫生学院卫生统计教研室21表15.16例乳腺癌患者手术后的随访记录观察记录患者编号开始日期终止日期结局(死=1,生=0)原因生存天数t102-09-0302-12-290死于肺癌117+202-09-1002-12-081转移死亡89302-09-1402-12-310研究终止108+402-08-2502-11-290失访96+502-10-0102-11-280死于车祸58+602-10-0402-12-281复发死亡85华西公共卫生学院卫生统计教研室22生存时间的两种类型•完全数据(completedata):–指从观察起点到发生死亡事件所经历的时间,如表15.1中2和6号患者对应的生存天数89天和85天。•截尾数据(censoreddata):–简称截尾值(censoredvalue),又称删失值或终检值。习惯上在生存时间右上标注“+”表示。–生存时间观察过程的截止不是由于死亡事件或失效事件,而是由于其他原因引起的,称截尾(censored)。华西公共卫生学院卫生统计教研室23789101112130.01.02.03.04.05.06.07.0++月份(如1998年)生存时间原始记录示意图(+为仍存活,下同)华西公共卫生学院卫生统计教研室2403060901201501800.01.02.03.04.05.06.07.0++3699160天数图2生存时间排序整理数据示意图华西公共卫生学院卫生统计教研室25截尾的主要原因•失访(withdrawal):指失去联系,如信访无回音、电话采访不应答、上门采访找不到人、搬迁没留地址等;•退出:指死于非研究因素或非处理因素而退出研究,如死于车祸等意外事件、死于其它疾病等;•终止:指设计时规定的研究时限已到而终止观察,但研究对象仍然存活。华西公共卫生学院卫生统计教研室26死亡概率与生存概率•死亡概率(mortalityprobability):记为,是指在某单位时段开始时存活的个体在该时段内死亡的可能性大小。•生存概率(survivalprobability):记为,与死亡概率相对立,表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小。qp华西公共卫生学院卫生统计教研室27生存率(survivalrate)•指某个观察对象活过t时刻的概率,常用p(xt)表示;•根据不同随访资料的失败事件,生存率可以是缓解率、某种状态的维持率等。华西公共卫生学院卫生统计教研室28生存曲线(survivalcurve)•将各个时点的生存率在坐标轴上连接在一起的曲线图;•用以描述生存过程。华西公共卫生学院卫生统计教研室29中位生存时间(mediansurvivaltime)•又称半数生存期,指生存率为0.5时对应的生存时间,表示有50%的观察对象可以活这么长时间;•一般采用内插法进行估计。华西公共卫生学院卫生统计教研室30图15.1乘积极限法生存曲线(Kaplan-Meier曲线)华西公共卫生学院卫生统计教研室31生存资料的2种类型•未分组资料•分组资料华西公共卫生学院卫生统计教研室32例15.1某医师采用手术疗法治疗12例宫颈癌患者,随访时间(月)记录如下:1,2,4,5,7,8+,11,15,18,33+,36,38+。试估计各时点生存率及其标准误、各时点总体生存率的95%可信区间、中位生存时间,并绘制生存曲线。华西公共卫生学院卫生统计教研室33表15.2乘积极限法估计生存率及其标准误计算表序号生存时间死亡数期初病例数死亡概率生存概率生存率标准误ktkdknkkqkpˆ()kStˆ()kSESt(1)(2)(3)(4)(5)(6)(7)(8)111121/121-1/120.91670.0798221111/111-1/110.83330.1076341101/101-1/100.75000.125045191/91-1/90.66670.136157181/81-1/80.58330.142368+070/71-0/70.58330.1423711161/61-1/60.48610.1481815151/51-1/50.38890.1470918141/41-1/40.29170.13871033+030/31-0/30.29170.13871136121/21-1/20.14580.12431238+010/11-0/10.14580.1243华西公共卫生学院卫生统计教研室34•例15.2某医师对110例原发性肺癌患者确诊后进行随访,得资料见表15.3第(2)栏~第(4)栏,试估计各时点生存率及其标准误、各时点总体生存率的95%置信区间、中位生存时间,并绘制生存曲线。华西公共卫生学院卫生统计教研室35表15.3寿命表法估计生存率及其标准误计算表序号k(1)确诊后月数kt(2)期内截尾人数kC(3)期内死亡人数kD(4)期初观察人数kL(5)校正人数kN(6)死亡概率kq(7)生存概率kp(8)生存率ˆ()kSt(9)标准误ˆ[()]kSESt(10)10~125110109.50.22830.77170.77170.040121~2218483.00.25300.74700.57650.047532~1306160.50.49590.50410.29060.044143~2183029.00.62070.37930.11020.031154~021010.00.20000.80000.08820.028565~1187.50.13330.86670.07640.027076~0266.00.33330.66670.05100.023387~2043.00.00001.00000.05100.023398~0122.00.50000.50000.02550.0215109~101010.50.00001.00000.02550.0215华西公共卫生学院卫生统计教研室36未分组资料的生存分析未分组资料生存率的估计:主要是用乘积极限法(product-limitestimates),又称Kaplan-Meier法;主要适用于小样本,是一种非参数方法。华西公共卫生学院卫生统计教研室37例15.1某医师采用手术疗法治疗12例宫颈癌患者,随访时间(月)记录如下:1,2,4,5,7,8+,11,15,18,33+,36,38+。试估计各时点生存率及其标准误、各时点总体生存率的95%可信区间、中位生存时间,并绘制生存曲线。华西公共卫生学院卫生统计教研室38表15.2乘积极限法估计生存率及其标准误计算表序号生存时间死亡数期初病例数死亡概率生存概率生存率标准误ktkdknkkqkpˆ()kStˆ()kSESt(1)(2)(3)(4)(5)(6)(7)(8)111121/121-1/120.91670.0798221111/111-1/110.83330.1076341101/101-1/100.75000.125045191/91-1/90.66670.136157181/81-1/80.58330.142368+070/71-0/70.58330.1423711161/61-1/60.48610.1481815151/51-1/50.38890.1470918141/41-1/40.29170.13871033+030/31-0/30.29170.13871136121/21-1/20.14580.12431238+010/11-0/10.14580.1243华西公共卫生学院卫生统计教研室39生存率及其标准误的计算•本