统计学教案习题17随访资料的生存分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

163第十七章随访资料的生存分析一、教学大纲要求(一)掌握内容1.生存分析基本概念生存时间、完全数据、截尾数据、死亡率、死亡概率、生存概率、生存率。2.估计生存率的方法:Kaplan-Meier法、寿命表法。(二)熟悉内容1.生存曲线、半数生存期。2.生存资料的基本要求。3.两生存曲线的比较的对数秩检验。(三)了解内容Cox回归模型。二、教学内容精要(一)生存分析中的基本概念1.生存时间(survialtime)指观察到的存活时间,如表11-1中t分别为360,990,1400,1800天。生存时间有两种类型:(1)完全数据(completedata)指从起点至死亡所经历的时间,即死者的存活时间,如表11-1中360,990,1800天。(2)截尾数据(censoreddata)由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。从起点至截尾所经历的时间,称为截尾数据,如表11-1中1400天,习惯上记为1400天。表11-14例鼻咽癌随访记录患者序号性别(男=1)处理组号开始日期终止日期结局(死=1)存活天数10111/29/8011/04/85136021106/13/8206/08/83199031003/02/8312/31/860140040008/04/8304/10/86118002.死亡概率与生存概率(1)死亡概率(mortalityprobability)指死于某时段内的可能性大小,记为q。年死亡概率的计算公式为q=某年年初观察例数某年内死亡数,若年内有截尾,则分母用校正人口数(校正人口数=年164初人口数-21截尾例数)。这里的死亡概率与通常所说的死亡率是有区别的,死亡率的分母常用年平均人口,反映过去一年的死亡频率(年平均水平),而死亡概率则用年初人口,表示往后的一年中死亡机会大小。(2)生存概率(survivalprobability)与死亡概率相对应,记为p,表示在某单位时段开始时存活的个体到该时段结束时仍存活的机会大小。年生存概率的计算公式为qp1某年年初人口数某年活满一年人数,若年内有截尾,也要用校正人口数。(二)生存率的Kaplan-Meier法与寿命表法估计1.生存率(1)生存率(survivalrate)指病人经历kt个单位时间后仍存活的概率,记为)(ktS。若无截尾数据,则)(ktS=)(ktTP观察总例数时刻仍存活的例数kt(11-1)其中T为病人的存活时间。如果含有截尾数据,分母就必须分时段校正,故此式一般不能直接应用。(2)生存率估计的概率乘法原理假定病人在各个时段生存的事件独立,生存概率为kppp,,,21,则应用概率乘法得生存率估计的应用公式为)(ktS=kkppptTP21)((11-2)若式中kppp,,,21用校正人数估计,便可处理截尾数据。生存概率与生存率在意义上差别很大,前者是单个时段的概率,后者是从0至kt多个时段的累积结果。(3)生存曲线(survivalcurve)指将各个时点的生存率连接在一起的曲线图。(4)半数生存期(mediansurvivaltime)表示恰好有50%的个体可活这么长时间。2.生存率的估计方法(1)乘积极限法(product-limitmethod)直接用概率乘法原理估计生存率(不分组),由Kaplan-Meier于1958年提出,因而又称Kaplan-Meier法。这是一种非参数法,主要用于小样本,也适用于大样本。其生存曲线是左连续的阶梯形曲线。(2)寿命表法(life-tablemethod)当样本例数足够多时,乘积极限法可按时间分组计算,这就是寿命表法,实际上是乘积极限法的一种近似。其生存曲线呈折线形。(三)两样本生存曲线的比较——对数秩检验对数秩检验(log-ranktest)用于两样本生存曲线的比较,其零假设为两总体生存曲线相同,基本思想是如果零假设成立,根据不同日期两种处理的期初人数和死亡人数,计算各种处理在各个时期的理论死亡数。若零假设成立,则实际死亡数与理论死亡数不会相差太大,否则应认为零假设不可能成立,两条生存率曲线差异有统计学意义。对数秩检验统计量(近似法)为:mkkkkTTA122)(,1m(11-3)其中kA和kT分别是第k组死亡的实际数和理论期望数。在0H成立的条件下,统计量2服从自由度为1m的2分布,m为组数,据2作出是否拒绝0H的决定。(四)Cox回归模型Cox回归是生存分析中最重要的方法之一,其优点是适用范围很广和便于做多因素分析。165Cox回归假定病人的风险函数为)exp()()(22110ppXbXbXbthth(11-4)其中)(th为风险函数,又称风险率或瞬间死亡率,)(0th为基准风险函数,是与时间有关的任意函数,bX,分别是观察变量及其回归系数。英国统计学家CoxDR提出了参数ib的估计和检验方法,故称为Cox回归。三、典型试题分析(一)单项选择题1.生存分析的效应变量是()。A.正态的和方差齐性的B.生存时间和结局变量C.生存时间D.结局变量答案:B[评析]本题考点:生存分析的概念生存分析是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,所以它的应变量有两个,即生存时间和结局。2.随访资料做生存分析的条件为()。A.有一定的例数B.有一定的死亡数C.死亡比例不能过小D.自变量取值不随时间变化答案:B[评析]本题考点:生存资料的基本要求生存资料的基本要求为:①样本由随机抽样方法获得,并有足够数量;②死亡例数不能太少(≧30);③截尾比例不能太大;④生存时间尽可能精确到天数;⑤缺项要尽量补齐。所以最佳答案应选B。3.Cox回归风险率()。A.等于一个常数B.服从某种分布规律C.等于基准函数乘上一个比例因子D.适用于任意肿瘤资料答案:C[评析]本题考点:Cox回归模型的特点及应用首先,用于Cox回归模型分析的资料必须满足生存资料的基本要求,因此任意肿瘤资料不一定满足此要求,排除D。Cox回归风险函数中因)(0th未定义,所以不知道风险在病人与病人之间的差别和风险随时间变化的具体分布,排除A,B。所以正确答案为C,从风险回归函数的定义式也可看出。4.采用log-rank检验分析肺癌发病资料,其中吸烟、慢性支气管炎2个因素都有统计学意义,由此可认为():A.吸烟与肺癌有因果联系B.慢性支气管炎与肺癌有因果联系C.2个因素与肺癌有因果联系D.以上都不对答案:D[评析]本题考点:模型中的变量如何选择取舍选入模型的变量是统计学上的有关变量,不一定都与肺癌有因果关系,其中某些可能只166有伴随关系而已;未选入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代替了它的作用,或因例数不够,或实验中对该因素进行了控制而引起的。所以正确答案选D。5.根据表11-1中的存活时间,试用Kaplan-Meier法估计生存曲线。[评析]本题是考察对乘积极限法的应用情况,此法应用普遍,应熟练掌握。具体解法见表11-2。表11-2乘积极限法估计生存率计算表序号k存活时间(天)tt时刻期初例数nt时刻死亡数d死亡概率ndq生存概率qp1k年生存率)(ktS生存率标准误SE()(ktS)⑴⑵⑶⑷⑸⑹⑺⑻1360414143(43)=0.750.21652990313132(43)(32)=0.500.250031800111110(43)(32)(10)=0.000参照表11-2,计算步骤为:1.列出序号:k=1,2,...(第1列);2.死亡时间排队:将存活时间t(完全数据)从小到大顺序排列,重复数据只列一次,截尾数据(如1400)不列入(第2列);3.求出t时刻期初例数n:即存活时间大于或等于t的例数(含死者)(第3列);4.列出t时刻的死亡数d:即死亡时间为t的例数(第4列);5.求出t时刻的死亡概率:(第5列);6.求出t时刻的生存概率:(第6列);7.分别计算生存率及其标准误;(第7、8列);8.绘制生存曲线。图11.1乘积极限法生存曲线及其半数生存期t/d180012006000S(t)1.0.8.6.4.20.0SurvivalFunctionCensored167四、习题(一)名词解释1.生存分析2.生存时间3.完全数据4.截尾数据5.死亡率6.死亡概率7.生存概率8.生存率(二)单项选择题1.Cox回归的自变量()。A.必须服从正态分布和方差齐性B.必须是计量资料C.可以是计量资料或分类资料D.无任何条件2.生存分析中的生存时间为()。A.出院至失访的时间B.手术至失访的时间C.观察开始至终止的时间D.观察开始至失访的时间3.关于膀胱癌化疗的随访资料做生存分析,可当作截尾值处理的是():A.死于膀胱癌B.死于意外死亡C.死于其它肿瘤D.b,c都是(三)简答题1.在肿瘤预后分析中,死于非肿瘤患者的数据怎样处理?2.生存分析可用于发病资料的分析吗?请举例说明。3.生存时间能计算平均数、标准差吗?4.Cox回归可估计参数,故属于参数方法?(四)计算题1.表11-3第2-4列是296例肝癌患者的生存数据,试作生存分析并绘图示之。2.某院用甲、乙两疗法组治疗急性黄疸性肝炎,随访十年得资料如下:甲疗法组12,25,50,68,70,79,83,91,114,114,乙疗法组1,1,9,17,21,25,37,38,58,72,73比较两疗法的生存期(月)有无差别。五、习题答题要点(一)名词解释1.生存分析:生存分析(survivalanalysis)是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,它不仅可以从事件结局的好坏,如疾病的治愈(成功)和死亡(失败),而且可以从事件的持续时间,如某病经治疗后存活的时间长短进行分析比较,因而能够更全面、更精确地反映该治疗的效果。2.生存时间:生存时间(survivaltime)指观察到的存活时间。3.完全数据:完全数据(completedata)指从起点至死亡所经历的时间,即死者的存活时间。4.截尾数据:由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得168部分病人不能随访到底,称之为截尾。从起点至截尾所经历的时间,称为截尾数据(censoreddata)。5.死亡率:某年内死亡例数与年中观察例数之比称为死亡率(mortalityrate)。6.死亡概率:死亡概率(mortalityprobability)是指某年内死亡例数与年初观察例数之比,若年内有截尾,分母用校正人口数。7.生存率:生存率(survivalrate)指病人经历kt个单位时间后仍存活的概率,即kt时刻仍存活的例数与观察总例数之比。8.生存概率:生存概率(survivalprobability)表示在某单位时段开始时存活的个体到该时段结束时仍存活的机会大小,它是某年活满一年人数与年初观察例数之比,若年内有截尾,分母用校正人口数。(二)单项选择题1.C2.C3.D(三)简答题1.当作截尾数据处理。2.可用于慢性病的发病资料分析。3.如果此资料所包含的数据都是完全数据,可以计算均数和标准差(但可能因资料非正态而没有实际意义),若数据中包含截尾数据,则不可以计算均数和标准差。4.属于半参数模型(因0()ht未定义)。(四)计算题1.参照表11-3,列表计算。表11-3寿命表法估计296例肝癌患者生存率计算表序号k存活时间(月)t期内死亡人数d期内截尾人数c期初观察人数0n校正年初人数0nnc-2c死亡概率ndq生存概率qp1k年生存率)(ktS生存率标准误SE()(ktS)⑴⑵⑶(4)(5)(6)(7)(8)(9)(10)10~9410296291.00.32300.67700.67700.027421~7415192184.50.40110.59890.40550.029432~221010398.00.22450.77550.31440.028543~2267168.00.32350.67650.21270.

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功