第十三章活着--Survival菜单详解(上)对于急性病的疗效考核,一般可以用治愈率、病死率等指标来评价,但对于肿瘤、结核及其他慢性疾病,其预后不是短期内所能明确判断的,这时可以对病人进行长期随访,统计一定期限后的生存和死亡情况以判断疗效,这就是生存分析。生存分析是用于以处理生存时间(survivaltime)为反应变量、含有删失数据一类资料的统计方法。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的病人从发病到死亡或从确诊到死亡所经历的时间。广义地说,“死亡”可定义为某研究目的“结果”的发生,如宫内节育器的失落,疾病的痊愈,女孩月经初潮的到来等(生存分析中往往统指各“死亡”为失效)。此类资料的生存时间变量多不符从正态分布,且常含有删失值,故不适于用传统的数据分析方法如t检验或线性回归进行分析。根据不同的研究目的和资料类型,可采用不同的分析方法,如寿命表、Kaplan-Meier法、Cox回归模型等分析方法进行分析。而这正是下面我将要给大家介绍的主要内容。“喂,你在这里说的都是些什么呀?又是删失、又是Cox的,搞的我一头雾水。”那位给我提意见了。列位看官切莫着急,且听在下慢漫道来。所谓删失值,就是因各种原因对随访对象的随访可能失访或终检(censoring),如研究对象由于其他原因死亡、研究者与病人失去了联系及直到对资料作总结时随访对象还活着但尚未发生所规定的事件。这种数据就叫做删失值,也叫做截尾数据。能处理截尾数据是生存分析的一个优点。Cox回归是一种多变量的生存分析方法。这是本世纪60~70年代发展起来的、应用于生存资料分析的比例分险模型(theproportionalhazardmodel)。1972年,英国统计学家D.R.Cox的研究工作使得比例分险模型的理论和实用性更大地推进了一步。因此许多统计学者就把它称为Cox比例风险或Cox回归。§13.1LifeTables过程LifeTables过程用于:1、制作寿命表。2、绘制各种曲线如生存函数、风险函数曲线等。3、对某一研究因素不同水平的生存时间分布进行比较,控制另一因素后对研究因素不同水平的生存时间分布进行比较,包括从总体上比较和不同水平之间进行两两比较。例13.1某临床试验对20名第Ⅲ或第Ⅳ期黑色素瘤患者进行随访研究,截至研究期结束,记录的生存资料见表1。试计算100周生存率。12.815.624.0+26.429.230.8+39.242.058.4+72.0+77.282.487.2+94.4+97.2+106.0+114.8+117.2+140.0+168.0+注:数据后跟符号“+”表示该数据为删失数据。13.1.1界面说明图1寿命表主对话框【Time】框选入生存时间变量。【DisplayTimeIntervals】框欲输出生存时间范围及组距。在by前面的框内填入生存时间上限,本例填入200(此区间必须包括生存时间的最大值);在by后面的框内填入生存时间的组距,本例填入20,以保证结果列出“100-”的组段。【Status】框选入生存状态变量,并定义终结事件的标记值。选入变量“Status”后,【DefineEvent】钮被激活变黑,击该按钮,弹出定义终结事件标记值的对话框(图1)。对二分类变量,一般以死亡、复发、恶化等表示终结事件。本例以死亡为终结事件,其标记值为1,故在Singlevalue框内填入1。击Continue钮。若生存状态变量取值为一连续型变量,如反应变量为收缩压,则在下面的Rangeofvalues框中输入140through400,此处上限输入400是我随便输入的一个上限,目的是为了定义高血压患者,实际上恐怕没有人的血压能达到400,这样才能保证包括所有的高血压病例,具体情况具体分析。图2定义终结事件标记值的对话框【Factor】框定义第1层因素,即分组因素。【ByFactor】框定义第2层因素,即分层因素。【Options】选项击Options按钮,弹出选项对话框。(图3)图3寿命表选项对话框LifeTable(s):输出寿命表,系统默认。Plot:统计图。Survival:累积生存函数曲线。Hazard:累积风险函数散点图。Oneminussurvival:生存函数被1减后的曲线。Logsurvival:对数累积生存函数曲线。Density:密度函数散点图。CompareLevelsofFirstFactor:对第1层因素不同水平的比较,即主对话框(图1)中的factor框中所选入的因素。None:不做比较。系统默认。Overall:整体比较。Pairwise:两两比较。本例因没有分组因素,故CompareLevelsofFirstFactor选项均不可选。13.1.2结果解释1、寿命表Thissubfilecontains:20observationsLifeTableSurvivalVariableTIMEsurvivaltime(week)说明:20例观察单位,生存变量为“Time”,变量标签为“survivaltime(week)”NumberNumberNumberNumberCumulIntrvlEntrngWdrawnExposdOfPropnPropnPropnProba-StartthisDuringtoTermnlTermi-Sur-SurvbilityHazardTimeIntrvlIntrvlRiskEventsnatingvivingatEndDenstyRate------------------------------------------------------------.020.0.020.02.0.1000.9000.9000.0050.005320.018.02.017.03.0.1765.8235.7412.0079.009740.013.01.012.51.0.0800.9200.6819.0030.004260.011.01.010.51.0.0952.9048.6169.0032.005080.09.03.07.51.0.1333.8667.5347.0041.0071100.05.03.03.5.0.00001.0000.5347.0000.0000120.02.0.02.0.0.00001.0000.5347.0000.0000140.02.01.01.5.0.00001.0000.5347.0000.0000160.01.01.0.5.0.00001.0000.5347.0000.0000Themediansurvivaltimeforthesedatais160.00+SEofSEofIntrvlCumulProba-SEofStartSur-bilityHazardTimevivingDenstyRate-------------------------.0.0671.0034.003720.0.0999.0042.005640.0.1081.0029.004260.0.1157.0031.005080.0.1261.0039.0071100.0.1261.0000.0000120.0.1261.0000.0000140.0.1261.0000.0000160.0.1261.0000.0000IntrvlStartTime:生存时间的组段下限。NumberEntrngthisIntrvl:进入该组段的观察例数。NumberWdrawnDuringIntrval:该组段的删失例数。NumberExposedtoRisk:暴露于危险因素的例数,即有效观察例数。NumberofTermnlEvents:终结事件的例数,即死亡例数。PropnTerminating:终结事件比例,即死亡比例。PropnSurviving:生存比例。CumulPropnSurvatEnd:至本组段上限的累积生存率。ProbabilityDensty:概率密度。HazardRate:风险率。SEofCumulSurviving:累积生存率的标准误。SEofProbabilityDensty:概率密度的标准误。SEofHazardRate:风险率的标准误。Themediansurvivaltimeforthesedatais160.00+:本例的中位生存时间为“160.00+”,从下图的累积生存函数曲线看,曲线与生存率等于0.5的横线不相交,故中位生存时间无法估计。本例的100周生存率为53.47%。2、累积生存函数曲线:图4。图4累积生存函数曲线§13.2Kaplan-Meier过程Kaplan-Meier法用于:1、估计某研究因素不同水平的中位生存时间。2、比较该研究因素不同水平的生存时间有无差异。3、控制一分层因素后对研究因素不同水平的生存时间比较(此时将按分层因素的不同水平对研究因素对生存时间的影响分别进行分析)。怎么样,有点拗口吧?例13.23种疗法治疗66例白血病患者的缓解时间(天)A疗法4,5,9,10,11,12,13,28,28,28,29,31,32,37,41,41,57,62,74,100,139,20+,258+,269,B疗法8,10,10,12,14,20,48,70,75,99,103,162,169,195,220,161+,199+,217+,245+C疗法8,10,11,23,25,28,28,31,31,40,48,89,124,143,12+,159+,190+,196+,197+,205+,219+注:数据后跟符号“+”表示该数据为删失数据。13.2.1界面说明图5Kaplan-Meier法主对话框【Time】框选入生存时间变量。【Status】框选入生存状态变量。【Factor】框选入分组变量。【Strata】框选入分层变量。【LablesCases】框给个体标记。【CompareFactor】选项击CompareFactor按钮,弹出选项对话框。(图6)图6分组因素水平间比较对话框TestStatistics:检验统计量。Logrank:检验生存分布是否相同,各时间点权重一样。Breslow:检验生存分布是否相同,以各时间点的观察例数为权重。Tarone-Ware:检验生存分布是否相同,以各时间点的观察例数的平方根为权重。Lineartrendforfactorlevels:分组因素水平间的线性趋势检验。Pooledoverstrata:水平间的整体比较。系统默认。Foreachstratum:按分层变量,对每一层进行分组因素各水平间的整体比较。Pairwiseoverstrata:分组因素各水平间的两两比较。Pairwiseforeachstratum:按分层变量,对每一层进行分组因素各水平间的两两比较。【Save】选项击Save按钮,弹出SaveNewVariables(保存新变量)对话框(图7)。图7保存新变量对话框Survival:累积生存率估计。Standarderrorofsurvival:累积生存率估计的标准误。Hazard:累积风险函数估计。Cumulativeevents:终结事件的累积频数。在各水平内,按生存时间和生存状态排序。【Options】选项击Options按钮,弹出选项对话框(图8)。图8K-M法选项对话框Statistics:统计量。Survivaltable(s):生存分析表。Meanandmediansurvival:平均生存时间和中位生存时间及其标准误和可信区间。Quartiles:生存时间的第25百分位数、中位生存时间、第75百分位数。Plot:统计图。Survival:累积生存函数曲线。Oneminussurvival:生存函数被1减后的曲线。Hazard:累积风险函数散点图。Logsurvival:对数累积生存函数曲线。操作如下:1.Analyze==Survival==LifeTables2.Time框:选入remissio