新药临床研究中数据管理的主要环节与技术中国人民解放军总医院•军医进修学院医学统计教研室张高魁一、我国新药临床研究的模式模式一:研究者申办方方案设计研究实施分析与报告模式二:研究者研究设计研究实施总结报告统计工作者研究设计数据整理统计分析申办方总体管理与控制具体组织与管理模式三:研究者研究设计研究实施总结报告数据管理者研究设计数据管理统计工作者研究设计统计分析申办方总体管理与控制具体组织与管理模式四:研究者研究设计研究实施总结报告数据管理者研究设计数据管理统计工作者研究设计统计分析专门从事临床研究的机构(CRO)具体的组织与管理申办方总体管理与控制二、数据管理工作者的任务数据,是临床研究的最直接产物,也是进一步分析的基础,因此,保证数据的准确性、可靠性、完整性是临床研究中的一项重要工作。数据管理的目的在于把得自受试者的数据迅速、完整、无误地纳入报告。数据管理工作者的任务就是保证上述目标顺利实现。三、数据管理的主要环节与技术一)数据管理计划作为数据管理的开始,制定一份全面而详细的管理计划,将使整个数据管理过程有章可循、有据可依。数据管理计划的建立应以对研究的分析为前提,包括研究方案、病例报告表、需要使用的资源、研究的时间表,同时还需考虑申办方的一些特殊要求,如数据库结构、变量名称与格式等。数据管理计划将作为整个数据管理过程的指导性文件,之后所有过程均应按照其中定义的时间与方法进行操作。数据管理计划通常包括的内容:1、研究的一般情况,如研究目的、研究的整体设计等。2、数据管理工作的时间表。在此时间表中,每个环节的开始与完成时间都应有所体现,同时,该时间表应与整个研究的大时间表相互协调。3、相关人员与职责4、数据库软件的选择与数据库的创建方式,数据库的主要框架等。5、如何确认数据库6、定义监查员应提交的数据材料,以及如何进行这些材料的移交与管理7、如何进行数据录入与核查8、如何进行数据确认9、疑问表如何产生、解决与管理10、如何进行质量检查,包括质量检查的具体质量标准11、数据审核12、数据锁定及移交13、定义需存档的文件14、数据的安全保障措施15、其它需要特殊说明的问题,如电子数据的传递与管理、数据管理的阶段报告等。数据管理计划还应该具体一定的自我管理功能,如:在创建一份数据管理计划时,定义其适用时间与范围以及进行更新的时间与方法等,以便在必要时及时对计划进行更新以适应研究的需要。二)数据库创建与确认数据库软件病例报告表注释(annotation)数据库的确认(validation)数据库软件的选择选择用于录入数据的软件选择提交进行最终统计分析数据的软件目前较流行的数据库软件:SAS、ORACLE、EPIInfo、MS-Access、SQL-Server病例报告表注释(annotation)在正式创建数据库之前,需对病例报告表进行变量注释,即:定义数据库中将纳入的记录项目及相应的变量名称与变量类型,如:定义身高为height,类型为数值型,宽度为8,不含小数位。这一工作应由申办方与数据管理部门共同完成,以充分适应申办方对其数据库的管理要求,同时尽可能照顾数据管理部门的习惯。如病例报告表之外还有其它内容需要进入数据管理环节,则同样应对其进行注释。数据库的确认(validation)数据库的建立将以以上工作为基础,依据注释、按照数据库软件的规则进行。同时还需为数据录入设计适当的录入界面。在数据库建立之后,还应对其进行确认,确认内容包括:名称是否与注释相一致、录入界面与规则是否方便录入、软件的输出结果是否与录入内容相同等。数据库确认的通常做法是,首先创建一至两份模拟的病例报告表及其它相关材料,然后按录入界面的指示将其录入数据库,然后输出数据库内容,并与原始材料进行比较,通过这一过程检验并最终确认数据库结构、录入界面乃至最终数据库的准确性与合理性。三)数据录入与核查(verify)数据录入员应进行相应的培训独立双份录入原则双份数据库的核对某些场合,单份录入结合手工核对也是可取的四)数据确认与疑问表在基本消除了录入错误后,便可进行数据检查及确认,这一工作通常建立在详细分析病例报告表及录入指南的基础之上。首先需建立有关细节的确认计划,然后编写相应的程序,得到需确认问题的清单,以此清单为基础,必要时结合原始记录的核查,整理产生关于数据的疑问表。疑问表将由临床监查员交研究者进行核查、确认或更正,然后仍由临床监查员返回给数据管理员,根据数据确认的结果对数据库进行修改与更新。此过程循环往复,直至所有疑问均得到明确的答复。在先进的数据库软件平台上,以上过程还可得到简化,如:将可预见的问题设计到录入程序中,这样在录入的同时即可产生疑问表,这种情况在网络背景下由研究者直接录入数据时具有更加明显的优势。五)数据编码试验过程中,一些重要的项目是以文本形式记录的,如不良事件、伴随疾病、合并用药等,为了分析时归纳与总结的方便,常需要对这些部分进行分类与编码。目前,国内在这方面比较欠缺。国际上有成熟的编码系统,国内目前已有部分编码词典的中文版本。但尚缺乏可以正确使用这些系统的专业人员。六)数据质控检查当数据确认与数据库修正工作完成后,即基本排除了数据录入错误及逻辑错误。但正如前面所述,这些工作并不能完全保证数据的准确性,进行进一步的质控检查仍然很有必要。质控检查通常以书面形式,在预先设定的质量标准指导下进行。对关键变量经常需要进行100%的核查,即:将数据库中的关键变量以记录为单位输出,与原始记录(病例报告表及疑问表)进行核对,在相当多的情况下要求关键变量100%正确。对非关键变量,通常不需进行100%核查,而是采用按一定比例抽样的方法进行抽查,对非关键变量,通常允许一定的错误率,如0.5%或0.1%等。质控检查并不仅仅是数据管理部门的任务与责任,同样也有申办方的任务与责任。七)数据审核与锁定在数据质控检查通过后,可基本确认数据准确可用,将在此基础上进行数据审核与锁定,这两项工作均直接为统计分析服务。数据审核的任务是对数据进行最后的检查,一方面确认数据管理的可靠性,另一方面,也是更重要的一方面,是对数据中存在的一些可能影响统计分析结果的数据做出决定。如判断哪些病例符合方案要求,进入符合方案(Per-Protocol,PP)数据集进行分析,哪些进入愿意治疗(Intenttotreat,ITT)数据集进行分析。数据审核通常需召开一次会议,由申办方研究负责人、主要研究者、负责研究项目的统计学家或统计学人员、数据管理员、临床监查员共同参加,所形成的结论也由以上人员共同负责。数据审核过程中,当然还有可能提出一些事先未考虑到的问题,并针对这些问题给出处理意见,如再次发出疑问表、进行约定或根据已有信息做出判断等。在数据审核会议上,还有另外一项重要的工作,就是讨论并最终确定统计分析计划。因为在此之前制定的统计分析计划中可能有部分内容不能被很好地实现,此时必须进行调整。当所有疑问均已解决、对数据的判断全部完成、统计分析计划也已签署后,数据即可锁定,锁定后的数据交统计分析者进行编程分析。原则上,锁定后的数据将不再更改,除非一些非常明确的证据表明数据中存在错误而且将明显影响分析结果。即使如此,锁定后的开锁也应遵循非常严格的认可程序,以防引入人为的偏差。这一点在盲法试验中更为重要。八)数据管理过程的一般性管理没有记录的事情没有发生。出发点:若干年后,仍能将现在的工作过程还原出来,以供可能进行的检查与检讨工作参考。数据管理的所有工作均应有书面材料为据。包括:数据管理计划、数据库确认、病例报告表交接、数据确认细节描述、疑问表交接、质控检查、数据审核与锁定均应有文书为据。谢谢!