09生存分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

生存分析进阶北大医院心脑血管病临床研究平台陶庄2013-11生存与寿命生存分析研究的基本问题•如何对寿命进行正确的估计。–密度函数–分布函数–生存函数–危险函数•如何识别影响寿命的因素–非参数检验–回归对寿命的刻画生存时间原始数据记录示意图生存时间按天数排序示意图两种生存时间——完全数据与不完全数据世界由于有我而不同!两种生存时间•完全数据(CompletedData)•不完全数据(IncompleteData)–删失数据(censoredData)–截断数据(truncatedData)删失的类型•右删失–第一类删失:定时删失–第二类删失:定数删失–第三类删失:随机删失•左删失•区间删失生存数据的描述•对S(t)等函数的估计;•对平均生存时间μ,中位生存期M,生存函数S(t)的方差σ2的描述;•图示:生存曲线,危险率曲线等。基本生存函数的种类•概率密度函数f(t)•概率分布函数F(t)•生存函数S(t)或可靠性函数R(t)•危险(率)函数h(t)•累积危险(率)函数H(t)基本函数(1)ttft)内死亡的概率,一个病人在(tttlim)(0概率密度函数f(t):每时刻死亡的“概率”。分布函数F(t):P(T≤t)tduuftF0)()(两个概率密度与分布函数示意基本函数(2)观察总例数时刻仍存活的例数t)()()(1)(tSduuftFtSt生存函数S(t):P(Tt)个体生存时间大于t的概率。基本函数(3)危险函数h(t):活过某时间后的瞬间死亡“概率”。)()()()(ttttlim)(0)(0tStfthetStthtduuht)内死亡的概率,年的病人在(一个已活过S(t)与h(t)的图示基本函数(4))()(00)()(ln)()(tHduuhteetStSduuhtHt累积危险函数H(t):已知其中之一就能推出其余.)(),(ln)()(,)(,)()()(,)()(1)(,',)()()()(0)(000tHduuhtduuhtteetStSduuhtHetStStfthduuftFtStFtfduuftFtt参数估计与非参数估计•参数估计–指数模型–Weibull分布模型–对数正态分布模型等•非参数估计–寿命表法–Kaplan-Meier估计–Nelson-Aalen估计K-M与N-A两种估计的比较非参数估计的软件实现•寿命表估计与Kaplan-Meier估计–SAS(lifetest)–SPSS–stata(sts)–S-plus/R•Nelson-Aalen估计–SAS9.2–S-plus/R•图形平均生存时间与中位生存期•平均生存时间μ就是生存曲线与坐标轴围成的面积。•中位生存期m,即寿命的中位数(计算方法不同于普通的中位数),表示有且只有50%的个体可以存活的时间。又称半数生存期。•在非参数估计的情况下一般使用内插值法进行估算中位生存期。内插法计算中位时间(1)内插法计算中位时间(2)内插法计算中位时间(3).76.26497.05.0275.0547.023.5.05.00.50.50.50.5MMMLMLUUMULULMtttpttpttppttt本例,则:的概率;则:为大于率,的概为小于的时间;为生存率大于的时间,为生存率小于为中位时间,设两组或多组生存函数的比较基于正态分布的检验.11ˆ,,1211iiiiiijiijDiijjiiijijDiijjiiijijDiijjdYdYYYYYtWYdYdtWZYdYdtWZ不同检验方法的权重检验方式W(ti)对数秩检验1Gehan-WilcoxonYiTarone-WareSqrt(Yi)Peto-PetoS(ti)修正Peto-PetoS(ti)Yi/(Yi+1)Fleming-Harrington随意各种检验方法的选择•当样本来自指数分布的时候,logrank和Cox-mantel要比Peto-Peto和Gehan的广义Wilcoxon检验效用大;•当两个生存函数的的危险率的比随时间变化的话,广义Wilcoxon检验效用大;•两生存曲线平行时选logrank,否则选广义Wilcoxon检验;•广义Wilcoxon检验对早期的差异敏感,而logrank对后期的差异敏感;•如果两曲线交叉,选Tarone-Ware检验较好;•Fleming-Harrington可以按要求调整权重。比较检验的软件实现•SAS可完成上述所有检验(lifetest)•stata可完成上述所有检验(sts)•SPSS可完成logrank,breslow,Tarone-Ware检验•S-plus/R可完成上述所有检验对影响生存函数因素的识别识别因素的两种模型•加速失效时间模型AcceleratedFailureTime(AFT)model•比例风险模型ProportionalHazards(PH)model比例风险模型(PH)比例风险模型(PH))'(000)]([),(),'()(),(),'()(),(xctSxtSxcthxthxcthxthPH模型的一般形式:比例风险假设•假设有两个个体,其协变量的值分别为u,u*,那么其危险率的比是:])(exp[]exp[)(]exp[)()|()|(1*1*010*pkkkkpkkkpkkkuuuthuthuthuthCox模型的应用条件•风险比应该不随时间变化而变化;•样本量不宜过小,一般在40以上,要求样本含量是协变量数的5-20倍;•拟合模型时避免引入极端不显著或变化值不大的变量;•注意极值与多元共线性的问题。RR与Cox模型回归系数的关系.ln,0|1|,0|,1|0100100010RReeeethethxthxthRReethxtheethxthxxx说明不存在,则:说明此因素存在,,设有一因素Cox模型与Logistic模型Cox模型与Logistic模型的区别Cox模型Logistic模型研究设计类型队列研究病例-对照研究参数的意义Exp(b)=RRExp(b)=OR参数的估计方法条件似然法最大似然法或加权最小二乘法数据的要求可以含有右删失数据完全数据应变量原始数据连续型数据(时间)与离散型数据(是否)离散型数据(是否)应变量的率不限不能太小对比例风险假设的评价对比例风险假设的检验——log(H(t))-7-6-5-4-3-2-1Logoftime0123456STRATA:tx=0tx=1对比例危险假设的检验——累积鞅残差含时间相依协变量的Cox模型time-varying,time-dependent含时间相依协变量的Cox模型,expexp|100pkkkTtZthtZthtZth.expexp111DiRjpkkikpkkikittZtZL几种形式•连续型协变量与时间相关,x*log(t);•协变量多次重复测量;•变动的分组。竞争风险模型competingriskmodel竞争风险模型•竞争风险是指,研究对象除了会出现研究者感兴趣的结局,还会出现如车祸等其它意外结局,它的出现会导致感兴趣的事件永远不会发生(这被认为是与右删失数据(right-censorddata)的最大差别),即出现了竞争。•主流观点认为,将竞争风险按右删失处理,将导致生存函数的错估。竞争风险模型.,11kiickiicththtStS竞争风险的累积风险率

1 / 54
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功