数据的质量控制NailaBaigAnsariAgaKhan大学社区卫生科学学院研究员巴勒斯坦卡拉奇xhlbudd(dxy)译作者简介•教育背景•2001年于AgeKhan大学获理学硕士学位(流行病学)研究课题:照料与喂养实践以及它们与居住在卡拉奇无主空房的小孩发育迟缓的关系•1989年于美国弗吉尼亚州威廉斯堡WilliamandMary学院获管理学学士学位学习目标•知道科研研究不同阶段数据质量保证和控制的必需步骤•弄清楚引导试验与预试验的区别•知道设计数据搜集手段的重要性•知道如何使用审计追踪来管理数据以及检查已录入的数据库的方法行为目标•知道质量保证和质量控制的区别以及它们实现的途径•知道引导试验和预试验的目的•知道数据搜集手段如何设计,如何编码•知道用审计追踪来管理数据•能够检查数据库中的错误并纠正它们数据的质量控制•质量保证——在搜集数据之前确保数据质量的行为•质量控制——在研究过程中监控和维持数据质量•数据管理——在研究过程中处使用和处理数据质量保证的步骤•阐明研究假设•阐明研究假设的检测方法的设计,即提出一种研究草案•选择或者准备特定的方法手段•制定数据搜集和处理的程序,即制定操作手册•工作人员的培训以及工作人员素质的保证•素质有保证的工作人员,预试验,引导研究数据搜集以及方法和程序的处理质量保证:程序的标准化•为什么标准化非常重要?——为了使整个研究的数据搜集过程达到最高程度的统一和标准化制订操作手册的准备工作——每个数据搜集手段过程的执行过程的详细描述。(比如说BP)——一个问题接着一个问题的访问方法质量保证:工作人员的培训•目标是让每一位员工熟悉他(她)所负责的问题的程序•工作人员执行特定程序的培训证明质量保证:预试验和引导试验•预试验——包括对一个样品用特定的程序进行评估以检测是否在大问题引导试验——研究过程的正式排练——再现与参与者尽可能相类似的样品的整体操作流程预试验和引导试验的结果•用于评估的问卷预试验——问题的流程——敏感问题的提出——参数的近似分类——让访问者弄清连续发问的程序引导试验——除了上面的内容,还有程序的流程质量保证:数据管理•设计数据搜集方法——列出要问的问题,问题的顺序,问题的措词,问题答案的分类,跳跃性的发问方式——搜集并记录原始数据,而不是经过处理加工的数据(比如说“年龄”)——密码本:问卷与输入电脑的数据的联系代码本范例参数问题号含义代码格式ID问题1问题编号1-750C3性别问题2回应者的性别1为男性1为女性N1.0子女问题3没有子女99表示无回应N2.0体重问题4体重(千克)999表示没有记录N3.1屋顶问题5屋顶类型1RCC2水泥层3锡层4茅草屋顶或其他N2.0质量保证:代码本的使用•变量名——由超过8个的字母或数字组成,第一个字符应当是字母——问题编号与描述结合(如q3age)含义:——变量含义的简洁描述——SPSS软件能够在输出结果中整合变量标记并显示它质量保证:代码本的使用•代码——尝试并运用数字代码预先决定无应答,数值丢失的代码——不方便问的问题或者不适用的问题(比如说怀孕的结果)——问题已经提出但是没有得到应答(比如说工资的问题)——被访问者回答“不知道”质量控制对工作人员明显偏离预定草案的程序和行为进行监测策略包括:——工作人员的密切观察——选择所有的访问并随机抽取一个样本进行回顾——正在进行的研究的领域的监督——在办公室进行编辑(包含编码)——用统计学方法从长远的角度评估每位观察者、访问者和技术人员的表现数据管理:审计追踪研究者必须能够从每一个信息追溯到原始文件——原始文件和数据库中的ID——所有数据的改正必须记录并且加以解释——所有对数据库的修改必须用命令文件加以记录——所有分析结果必须用一个命令文件记录下来审计的目的是:——不至于犯错误,浪费时间和丢失信息——进行外部审计(修正)数据管理:数据的处理•数据的录入•——使用专业的数据录入程序如EpiData•准备•——完成代码本•——检查问卷是否有明显的矛盾或者遗漏数据管理:数据的处理•防止错误•——创建与你的问卷类似的数据录入表•——在录入数据之前定义有效的参数•——由两个不同的操作员输入两套数据•对内容进行对比以找出不同之处(EpiInfo)•对两种文件的错误进行纠正并进行新的比较数据的首次检查,找出错误•使用一个有序的命令为你的数据增加变量和值标志•找寻错误——数据代码本的输出、变量的总体观察、合适数据的简单概率表——将创建的代码本与原始的代码本相比较,观测标志信息是否是正确的。——检查产生的摘要和频率表,看看是否有参数的不合规定或不适当的最小和最大值。(比如说,年龄为250岁,男性怀孕,23岁女子的儿子年龄为19岁)•随机选取10%或者至少40%的问卷并将它们输入到新文件中以计算错误的概率错误纠正——记录•如果发现了错误•——在一个命令文件(SPSS句法文件)中进行纠正,这样能够完整地记录对数据库的改变•如果在双重录入后比较文件时发现错误•——如果你在对两个录入文件进行比较和校正后停止这一步,你就可以对已经录入的数据进行直接改正。错误纠正——记录•将过程分为差别明显且明确阐述的步骤,并且使你一步到另外一步的记录保持连贯•档案•——一旦你对原始数据作了最真实的记录,记得在一个安全的地方作一个备份,而用原来的记录来进行下一步工作。分析•确保你使用了正确的数据库——建议创建一些用于分析的命令文件,这些命令文件的最初几个能够读取数据库•错误和矛盾的后期发现备份和归档•备份——每天都要执行——当数据破坏或者丢失的时候,可以恢复它们——改变你的数据的数据库和命令文件,书面记录如协议,记录本和其他记录信息•归档——在工程进行过程中,进行一次或者几次——目的是在更长的一段时间里保护数据和文档,甚至可能让其他的研究人员得到这些信息