(统计学 第十周)生存分析―李琳琳老师

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

19生存分析举例:某医院泌尿外科医师选择1996-2000年间经手术治疗的膀胱肿瘤患者30例,对可能影响膀胱肿瘤术生存因素进行了调查,结果如下:编号年龄(岁)肿瘤分级肿瘤大小/cm是否复发手术日期终止观察日期结局生存时间/月162I≤3.0002/10/199612/30/2000存活59264I≤3.0003/05/199608/12/2000死于膀胱瘤54352II≤3.0104/09/199612/03/1999失访44460I≤3.0006/06/199610/27/2000死于冠心病53559II>3.0007/20/199606/21/1998死于膀胱瘤23659I>3.0108/19/199609/10/1999死于膀胱瘤37…表19-230例膀胱肿瘤患者生存资料的原始记录表对缺损数据无法处理。Logistic分析的缺陷:只考虑终点事件的出现与否。但在研究中,还需要考察对象到达终点时所经历时间的长短,也就是说研究者对医学事件发生、发展所经历的时间感兴趣。如恶性肿瘤、慢性病等各个观察对象随访各时间点的发生情况,以评价临床疗效和控制的好坏。生存分析生存分析19.1概述19.2生存率的估计19.3生存曲线的比较19.4Cox比例风险回归模型19.1概述主要特点:考虑到了每个研究对象出现某一结局所经历的时间长短。生存分析(survivalanalysis)——将终点事件和出现终点时间所经历的时间结合起来分析的一类统计分析。几个名词:1.终点事件生存时间起始事件⑴疾病确诊死亡痊愈死亡⑵治疗开始复发痊愈⑶症状缓解疾病恶化⑷接触毒物出现毒性反映⑸接触危险因素发病2.生存时间(survivaltime)/失效时间(failuretime):从规定的观察起点到某一给定终点事件出现的时间。3.完全数据~删失数据(截尾数据)完全数据:当观测到某病人明确结局时,该病人提供的时间信息是完整的,称完全数据,用符号“t”表示。。删失数据:由于某种原因未能观察到病人的明确结局,不知道其确切的生存时间,就象病人生存时间在未达到规定的终点就被截尾一样,又称截尾数据,用符号“t+”表示。⑴研究结束时终点事件尚未发生;⑵失访:病人搬迁、失去联系等;⑶患者死于其它原因,或因严重药物反应而终止观察。产生删失的原因:随访研究:患者进入期间事件研究结束时终点事件尚未发生研究截止时点2000/12/30死亡失访死于冠心病死亡死亡删失生存分析的度量单位:——可以是年、月、日、小时等;资料特点:生存时间不服从正态分布,常呈现指数分布,Weibull分布、对数正态分布、对数Logistic分布、Gamma分布或更为复杂的分布,因此需要有能提供这类分布的特殊方法。在处理正偏态分布数据时两种错误的做法:错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间)生存分析的特点:特点:同时考虑生存结局和生存时间可能含有删失数据(censor);生存时间分布不正态—非负且右偏。生存分析生存资料可处理删失数据;可处理生存时间分布不正态的问题。处理删失/截尾数据时两种错误的做法:错误1:只考虑确切数据,丢弃截尾数据(损失信息);错误2:将截尾数据当作确切数据处理(低估了生存时间的平均水平)。生存分析的基本概念:死亡概率(probalityofdeath);生存概率(probalityofsurvival);生存率(survivalrate);中位生存期(mediansurvivaltime);风险函数(hazardfunction):t时刻存活的个体在t时刻的瞬时死亡率。针对单位时间的⑴死亡概率(probabilityofdeath):表示某单位时段开始存活的个体,在该时段内死亡的可能性;如年死亡概率。注意:如果年内有删失,则分母用校正人口数:校正人口数=年初人口数—删失例数/2⑵生存概率(probalityofsurvival):单位时段开始时存活的个体,到该时段结束时仍然存活的可能性。注意:若年内有删失,分母用校正人口数。⑶生存率(survivalrate):0时刻存活的个体经历tk时个单位时间段后仍存活的可能性。若资料中无删失数据时:若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理将分时段的生存概率相乘得到生存率:区分:生存率——生存概率生存概率是针对单位时间而言的;生存率是针对某个较长时段的,是生存概率的累计结果。故生存率又称为累积生存概率(cumulativeprobabilityofsurvival),它是随着时间的变化而变化着的,是关于时间的函数,称为生存函数(survivalfunction)。生存率的标准误:第j个时间段内死亡人数第j个时间段期初人口数【举例】手术治疗50例肺癌病人,术后1,2,3年的死亡数分别为10,10,10例,无截尾数据。试求各年的生存概率和3年生存率。各年生存概率p1=(50–10)/50p2=(40–10)/40p3=(30–10)/303年生存率S(3)=P(T≥3)=(50–30)/50=0.4②生存期的四分位数间距:Q=P75-P25是反映离散程度大小的指标。⑷中位生存期及四分位数间距①中位生存期(mediansurvivaltime):也称半数生存期,是生存时间中位数(M/P50),表示恰有50%的个体存活的时间,即生存率为50%时对应的生存时间,是描述集中趋势的指标。中位生存期越长,表示疾病的预后越好。⑸风险函数(hazardfunction):t时刻存活的个体在t时刻的瞬时死亡率。h(t)近似地等于t时刻存活的个体在此后一个单位时段内的死亡概率。ttTttTtPthtlim0)(19.2生存率的估计生存率估计或称乘积极限法(productlimitmethod)大样本资料:寿命表法小样本资料:kaplan-meier法19.2.1寿命表法(lifetablemethod)例19-2收集374名某恶性肿瘤患者的随访资料,取时间区间均为1年,整理结果见下午表,试估计各年生存率。解析:该生存资料为大样本,生存时间粗略且含有删失数据。方法原理:1.计算期初有效例数,注意删失数据期初有效例数=期初病例数-期内删失数/22.计算死亡概率、生存概率死亡概率=期内死亡数/期初有效例数生存概率=1-死亡概率3.计算生存率。4.作生存曲线。寿命表法寿命表法曲线为折线。该法只估计时段右端点的生存率,省略了时段内的生存率估计。恶性肿瘤患者确诊后5年内生存率下降较快,5年后下降较平缓,说明确诊5年内该恶性肿瘤患者的死亡威胁较大。19.2.2乘积极限法——kaplan-meier法例19-2按下表数据,14例膀胱肿瘤<3.0cm患者和16例膀胱肿瘤≥3.0cm患者的生存时间(月)如下,试估计两组生存率。<3.0cm:14192628293236404244+4553+5459+≥3.0cm:67910111213202325273034374350解析:以“<3.0cm”组为例,n=14,样本含量较小且含删失数据。方法原理:1.将生存时间由小到大依次排列,2.在每个时间区间上,计算死亡人数、删失人数、期初人数、死亡概率、生存概率和生存率。3.作生存曲线。乘积极限法——kaplan-meier法+++Kaplan-Meier法生存曲线为阶梯形曲线。中位生存期19.2.3生存率的区间估计⑵假定标准误近似正态分布,则标准误的1-α置信区间为:⑴Greenwood法求生存率的近似标准误:【电脑实现】—SPSS1.数据录入生存分析—Kaplan-Meier【Group】1:3.0cm;2:3.0cm【dtime】生存时间(月)【Status】0:删失数据1:完全数据(结局事件)2.SPSS过程CaseProcessingSummary1411321.4%16160.0%3027310.0%group3.0cm=3.0cmOverallTotalNNofEventsNPercentCensored3.结果及结果输出:SurvivalTable14.000完全.929.06911319.000完全.857.09421226.000完全.786.11031128.000完全.714.12141029.000完全.643.1285932.000完全.571.1326836.000完全.500.1347740.000完全.429.1328642.000完全.357.1289544.000删失..9445.000完全.268.12310353.000删失..10254.000完全.134.11311159.000删失..1106.000完全.938.0611157.000完全.875.0832149.000完全.813.09831310.000完全.750.10841211.000完全.688.11651112.000完全.625.12161013.000完全.563.1247920.000完全.500.1258823.000完全.438.1249725.000完全.375.12110627.000完全.313.11611530.000完全.250.10812434.000完全.188.09813337.000完全.125.08314243.000完全.063.06115150.000完全.000.000160123456789101112131412345678910111213141516group3.0cm=3.0cmTimeStatusEstimateStd.ErrorCumulativeProportionSurvivingattheTimeNofCumulativeEventsNofRemainingCasesMeansandMediansforSurvivalTime38.1523.74030.82245.48236.0007.48321.33350.66722.3133.41015.62828.99720.00010.000.40039.60029.6802.86024.07535.28528.0002.73922.63233.368group3.0cm=3.0cmOverallEstimateStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalEstimateStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalMeanaMedianEstimationislimitedtothelargestsurvivaltimeifitiscensored.a.Percentiles54.0006.07536.0007.48328.0005.63430.0006.06220.00010.00010.0001.73242.0004.63328.0002.73914.0005.652group3.0cm=3.0cmOverallEstimateStd.ErrorEstimateStd.ErrorEstimateStd.Error25.0%50.0%75.0%19.3生存曲线的比较(Logrank检验)【例19-3】比较上例中膀胱肿瘤<3.0cm患者和肿瘤≥3.0cm患者的生存曲线,就总体而言,两个生存函数是否有差别?检验过程:05.0。,;,211210两总体生存曲线不同:即两总体生存曲线相同:tStSHtStSH时间由小到大排序将两组数据统一按生存.1giiiigigiiTtdndnt上的理论死亡数计算各组在时间。和死亡例数两组合计的期初例数以及和死亡例数上的期初例数分别计算两组在时间.3,.24667.030114iigigindnT组别死亡数未死亡数合计<3.0cm组01414≥3.0cm组11516合计12930患者。患者的生存

1 / 66
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功