数据质量评估具体要求-2020年修订一、基础数据统计要求说明1、门诊就诊人次:是实际就诊人次。包括:挂号人次、不挂号就诊人次;不包括:查体、健康管理,就诊后来源进行检查、治疗人次。2、住院人次:办理住院手续视为一次住院。不包括:办理住院后取消住院人次3、护理评估数量:按评估单数量计算。一张评估单项目包含多个项目仍然计为一次评估。4、检查检验数量:按照检查、检验单数量计算。一张申请单计为一次检查或检验。5、检查检验报告数量:按照检查、检验报告单数量计算,一张报告单计为一次报告。6、检查检验项目数量:统一按照申请单中的项目数量计算。如检验申请中的申请项目为“五分类血常规检验”作为1项,“生化20项”也作为1项。7、数据质量评估中的各个项目数据统计的时间范围应该一致。二、数据质量评估内容说明1、数据质量考察项目的类别(1)数据一致性项目(2)数据完整性项目(3)数据整合性项目1(4)数据及时性项目2、具体的评价方法(1)数据一致性项目在评价时,考察对应评价项目中关键数据项内容与字典数据内容的一致性。具体方法为根据本表“数据质量考察项目”栏目中“一致性”对应的项目内容,查看医院信息系统中对应记录的项目内容与医院中相应的字典项目能否进行对照。记录中有对照的记录为满足要求的记录,项目内容为空或不能与字典内容进行对照为不符合要求。(2)数据完整性项目在评价时,考察对应项目中必填项、常用项的完整情况。必填项是记录电子病历数据时必须有的内容;常用项是电子病历记录用于临床决策支持、质量管理应用时所需要的内容。具体方法为根据本表“数据质量考察项目”栏目中“完整性”对应的项目内容,查看医院信息系统中对应记录的项目内容是否有有效的值。数据记录相关项目的值为有效值即为满足要求;如项目值为空或未达到标准要求(如字符数不少于某个数量)为不满足要求。(3)数据整合性项目在评价时,考察对应项目中关键项数据与相关项目(或系统)对应项目可否对照或关联。具体方法是根据本表“数据质量考察项目”栏目中“整合性”对应的项目内容,查看信息系统中对应的记录中所要求考察的项目是否能够与相关联(通常是医疗流程上下游相关系统)记录中对应项目可否有对照。数据值有对照为满足要求,否则为不满足要求。2(4)数据及时性项目在评价时,主要察对应项目中时间相关项的完整性、逻辑合理性。具体方法是根据本表“数据质量考察项目”栏目中“及时性”对应的项目内容,查看医院电子病历系统中相关记录的时间项内容是否有记录,按照医疗流程有先后顺序的各个记录中时间值是否符合先后顺序的逻辑关系。符合逻辑关系的为满足要求,否则为不满足要求。3、在进行数据质量指数的计算以最高级别的数据质量评价分数作为计算综合评分的数据质量评分。但在考察高级项目前应评估低级要求的数据质量是否满足标准的要求。每个低级别的数据质量评价分数不应低于0.5。4、数据质量实证材料医院在提供数据质量实证材料报告时,应按照本表中具体要求的项目提供数据项目说明、数据访问语句说明、指定日期范围的数据查询结果,统计方法见“三、数据质量实际统计方法说明”。数据查询结果应该应是从实际运行系统中执行数据访问语句的结果。在现场复查时,这些访问语句、查询结果将用于抽查验证。5、数据质量的考察内容的更新每年将根据质量评价重点进行修订与完善,具体评估项目内容见下面附表。实际评估是根据评估项目表的内容按照《电子病历系统应用水平分级评价标准(试行)》中“电子病历系统数据质量评分”给出的计算方法算出数据质量评价分数。3三、数据质量实际统计方法说明1、数据标准化与一致性要求:考察对应评价项目中关键数据项内容与字典数据内容的一致性。计算方法:以数据字典项目为基准内容值,考察实际数据记录中与基准一致内容所占的比例。一致性系数=数据记录对应的项目中与字典内容一致的记录数/数据记录项的总记录数。具体处理过程:(1)列出标准中各个项目要求考察的数据项目清单,统计项目数n。(2)列出标准要求的信息系统中对应的数据项数据记录的时间项,用于筛选提取数据的时间范围数据记录的项目,用于提取考察数据内容数据字典的项目,用于确定数据项的数据基准(3)处理过程:按记录时间范围提取数据项:统计每个项目的数据总记录数(Ti),统计与字典数据记录能够进行对应的记录数(Ci);计算每个项目的一致性比例:Ui=Ci/Ti计算各个项目一致性比例的算数平均值作为该项的一致性系数一致性系数=∑Ui/n4案例:(仅供参考)病房检查申请项目3级的数据质量要求一致性的项目包括患者性别、标本名称、检验项目名称。数据质量分析所需的具体数据内容与来源列表如下:要求项目申请时间申请时间患者性别标本名称医院项目检验时间检验时间性别标本项名数据库表与字段名LABAPP_MASTER.TEST_TIMELABAPP_DETAIL.TEST_TIMELABAPP_MASTER.SEXLABAPP_MASTER.SPECIMENLABAPP_DETAIL.TEST_ITEMDICT_SEX.SEX_NAMEDICT_SPECIMAN.ITEM_NAMEDICT_TEST.ITEM_NAME数据字典表与字段名检验项目名称检验项名统计时间范围为2018-1-1至2018-3-31共三个月的数据(实际统计时间为近三个月)。n=3(1)患者性别:字典中有3项(男、女、未说明)检验申请主记录中共有5000条记录,详细情况如下:性别男女MF空值合计T1=5000C1=1200+1420=2620记录数1200142025030018305000字典对照有有无无无5数据库查询(ORACLE):T1:SELECTCOUNT(*)FROMLABAPP_MASTERWHERETEST_TIMEBETWEENTO_DATE(‘2018-01-01’,’YYYY-MM-DD’)ANDTO_DATE(‘2018-3-3123:59:59’,’YYYY-MM-DDHH:MI:SS’);C1:SELECTCOUNT(*)FROMLABAPP_MASTERA,DICT_SEXBWHEREA.SEX=B.SEX_NAMEANDA.TEST_TIMEBETWEENTO_DATE(‘2018-01-01’,’YYYY-MM-DD’)ANDTO_DATE(‘2018-3-3123:59:59’,’YYYY-MM-DDHH:MI:SS’);(2)标本名称字典中有45项(如:静脉血、末梢血、脑脊液、尿、便、动脉血、……)检验申请主记录中共有5000条记录,详细情况如下:标本项名静脉血末梢血尿便空值BLOOD脑脊液合计T2=5000C2=1100+2020+600+173=3893记录数11002020100060010251735000字典对照有有有有无无有数据库查询(ORACLE):T2:SELECTCOUNT(*)FROMLABAPP_MASTERWHERETEST_TIMEBETWEENTO_DATE(‘2018-01-01’,’YYYY-MM-DD’)AND6TO_DATE(‘2018-3-3123:59:59’,’YYYY-MM-DDHH:MI:SS’);C2:SELECTCOUNT(*)FROMLABAPP_MASTERA,DICT_SPECIMANBWHEREA.SPECIMEN=B.ITEM_NAMEANDA.TEST_TIMEBETWEENTO_DATE(‘2018-01-01’,’YYYY-MM-DD’)ANDTO_DATE(‘2018-3-3123:59:59’,’YYYY-MM-DDHH:MI:SS’);标本项名血常规尿常规钾离子钠离子氯离子甘油三脂……AAA合计记录数150008020100060070252026000字典对照有有有有有有有无(3)检验项目名称字典中有328项(如:血常规、尿常规、钾离子、钠离子、氯离子、甘油三脂、……)检验申请明细记录中共有26000条记录,详细情况如下:T3=26000C3=15000+8020+1000+600+702+5+……=25980数据库查询(ORACLE):T3:SELECTCOUNT(*)FROMLABAPP_DETAILWHERETEST_TIMEBETWEENTO_DATE(‘2018-01-01’,’YYYY-MM-DD’)ANDTO_DATE(‘2018-3-3123:59:59’,’YYYY-MM-DDHH:MI:SS’);C3:7SELECTCOUNT(*)FROMLABAPP_DETAILA,DICT_TESTBWHEREA.TEST_ITEM=B.ITEM_NAMEANDA.TEST_TIMEBETWEENTO_DATE(‘2018-01-01’,’YYYY-MM-DD’)ANDTO_DATE(‘2018-3-3123:59:59’,’YYYY-MM-DDHH:MI:SS’);(4)数据质量一致性系数=(C1/T1+C2/T2+C3/T3)/n=(2620/5000+3893/5000+25980/26000)/3=(0.524+0.7786+0.99923)/3=0.767276666662、数据完整性要求:考察对应项目中必填项数据的完整情况、常用项数据的完整情况。必填项是记录电子病历数据时必须有的内容。常用项是电子病历记录用于临床决策支持、质量管理应用时所需要的内容。计算方法:以评价项目列出的具体项目清单为基准,考察项目清单所列实际数据记录中完整项所占的比例。完整性系数=完整项目记录数/项目总记录数对于结构化数据,直接用数据项目的内容进行判断;对于文件数据,可使用文件内容字符数、特定的结构化标记要求内容进行判断。具体处理过程:(1)列出标准中各个项目要求考察的数据项目清单,统计项目数n。(2)列出标准要求的信息系统中对应的数据项数据记录的时间项,用于筛选提取数据的时间范围8数据记录的项目,用于提取考察数据内容(3)处理方法:按记录时间范围提取数据项:统计每个项目的数据总记录数(Ti)、项目值为完整的记录数(Ni),即项目值为非空(不为空格、字符数设定字数等)的;计算每个项目的完整性比例:Wi=Ni/Ti计算各个项目的完整性比例的算数平均值作为该项的完整性系数完整性系数=∑Wi/n案例:(仅供参考)病房医嘱处理项目4级的数据质量要求内容完整性的项目包括:患者标识、医嘱号、医嘱分类、医嘱项目编码、医嘱项目名称。数据质量分析所需的具体数据内容与来源列表如下:要求项目医嘱开始时间患者标识医嘱号医嘱分类医嘱项目编码医嘱项目名称医院项目医嘱时间住院号医嘱序号医嘱类别医嘱代码医嘱名称数据库表与字段名ORDERS.START_TIMEORDERS.INP_NOORDERS.ORDER_NOORDERS.ORDER_CLASSORDERS.ORDER_CODEORDERS.ORDER_NAME统计时间范围为2018-1-1至2018-3-31共三个月的数据(实际统计时间为近三个月)。n=5医嘱记录中有258260条记录,实际各个项目情况如下表:9序号12345医院项目住院号医嘱序号医嘱类别医嘱代码医嘱名称记录总数T不完整记录N258260258260258260258260258260160078055459100完整记录数258100258260180205212350258260完整性比例W0.9993810.697770.822231完整性系数=(0.99938+1+0.69777+0.82223+1)/5=0.903876数据库查询(ORACLE):T1~T5:SELECTCOUNT(*)FROMORDERSWHERESTART_TIMEBETWEENTO_DATE(‘2018-01-01’,’YYYY-MM-DD’)ANDTO_DATE(‘2018-3-3123:59:59’,’YYYY-MM-DDHH:MI:SS’);N1:SELECTCOUNT(*)FROMORDERSWHEREINP_NOISNOTNULLANDSTART_TIMEBETWEENTO_DATE(‘201