EpiData数据库使用方法简介及其在健康教育工作中的应用……选择合适的数据管理软件是保证数据质量的重要方面主要内容EpiData基本情况简介EpiData使用流程建立调查表及数据文件生成添加字段控制录入数据和数据转出一、简介(Introduction)EpiData是一个免费的数据录入和数据管理软件。(一)EpiData的特点直观方便简单易学实用性强对计算机要求不高数据录入功能强(有良好的逻辑检错功能)(二)如何获取Epi-Data软件搜索其它下载网站当前最高版本3.1可不必安装,直接copy并运行安装目录下epidata.exe(三)在数据管理方面的优点规则简单数据文件生成与录入界面设计方便具备双份录入核查功能具有多种常用数据库的输出接口Free(四)应用方面的局限性变量名不能为中文记录数最好不超过300000条录入界面不超过999行(五)EpiData的三种文件类型QES文件(调查表文件):定义调查表(问卷)的结构;REC文件(数据文件):存放数据以及已经定义好的编码;CHK文件(核查文件):定义了数据输入时字段的有效性规则。数据管理流程直观方便EpiData的屏幕具有标准的视窗形式,包括一行菜单和两行工具条;“工作过程工具条”可以指导用户从“1.定义数据”到“6.数据导出”工作过程工具条界面(一)EpiData使用流程最简单的使用流程是:1)创建调查表文件(*.qes);2)在调查表文件的基础上建立数据库(*.rec);3)在数据库(*.rec)中录入数据。数据定义是基础性工作,也是关键性的工作;在EpiData中表现为建成QES文件(二).Qes文件的建立2.直接复制、粘贴word调查表1.建立途径操作步骤-1按shift键+#字段编辑器:方便实现对变量类型和长度的定义操作步骤-2使用制表符@,只会改变变量录入框在表格中的位置,而不会对变量或REC数据库产生其它不良影响。在变量编码前插入@,可以将这个变量对齐到下一个制表位置。注意:插入的@与变量编码间不能有空格文件→选择项→Showdataform→Tabs/Indents→Tabstopindataformeverypixels中进行设置,默认值为40家庭住址{shi}@__________地市{xian}@__________县区{xiang}@______________乡(镇、街办){cun}@______________村(小区){hao}@__________组(楼、号)操作步骤-3•默认值200与40的差别.Qes文件的建立和注意事项编辑→字段清单(ctrl+q)→字段选取清单→日期存在bug(程序缺陷)早期版本:不能计算当前版本:记录存在缺失时,导出数据库会出问题(错位)建议:暂时不要用此种格式本次采用的格式。由于问卷中只设计了年月,调查者应将日调查清楚并填写注意事项数值型变量:####,最长允许14个字符字符型变量:_____,最长允许80个字符,一个中文字占2个字符日期型变量:mm/dd/yyyydd/mm/yyyyyyyy/mm/dd注意其他变量:自动生成ID号IDNUM逻辑是否Y注意事项数值型变量允许录入数字、减号和小数点。在QES文件中和数据录入过程中,你可以用圆点(.)或逗号(,)来表示小数点。一个变量中只允许输入一个小数点,这意味着不能用逗号作为千位的分隔符(例如:1,000,000)。字符“#”的数目表示变量的长度,小数点占一位字符。变量最长允许18个字符。如何生成字段名?在EpiData表现为生成.REC文件本文件基于QES文件而生成产生REC文件前可输入文件标记警惕:覆盖文件操作一定要慎重!(二)创建数据库注意:.qes和.rec可同名、可不同名建议:同名创建数据库修改数据库非常重要三.chk文件的建立和常用语法CHECK的文件建立:必须与数据库的文件名相同,唯一不同的就是扩展名;打开需要检查的数据库.chk文件的建立和常用语法常用语法Range:允许范围,允许值例:4-5,1,2,-inf-5(=5),0-inf(=0)Jump:跳转功能例:age变量1v23,2v40,3end,4writeMustEnter:必须录入Repeat:重复输入Valuelabel:添加数值标签例:labelsex1male2female更多的check设置忽略缺失值(IGNOREMISSING)V4BEFOREENTRYIGNOREMISSINGV4=V1+V2+V3END使用运算符号和函数Let命令:例1:V1letfield5=field2/field3end例2:birthmm/dd/yyyytodaytoday-mdyletage=round((today-birth)/365.25)添加字段控制可以使数据输入过程按给定的一些规则和算法完成,是EpiData功能强大的体现添加输入控制的指令以文件形式单独保存,该文件后缀为CHK程序运行时,自动寻找与扩展名REC相同文件的CHK文件添加字段控制—5项基本功限定特定值(数值范围,合法值)指定输入的顺序(跳转)某些字段不得缺项,必须输入重复上一条记录的某字段值标签:给出各数字对应的描述性文本(二)添加字段控制—1项高级功相当于在CHK文件中进行编程需掌握各种checkcommands:----if…then…endif、mustenter、relate…需熟悉各种operators和functions:----arithmetic、string、date、time…四、输入数据点击“数据录入”,给定数据文件,即显示数据录入界面注意事项无键入内容,仅按回车,以缺失值论字段填满,光标自动跳到下一个字段任何时候要退出录入,按F10键即可数据库中查找记录查找→定位记录:用于已知记录号时查找→查找记录:用于不知记录号时四、数据库的管理1、修改数据库:增加、删除变量;改变变量类型,变量名字2、数据库的追加、合并3、双录入和核查4、数据的输出和输入对已输入的数据库进行系列操作修改数据库(ReviseDataFile)在不丢失数据的前提下,修改一个已经录入了的数据库的结构。已经录入的数据会被拷贝到新数据库中相同名字的变量下,这个变量的格式有可能是修改了的格式。也可以增加变量、修改变量的定义、或者删除变量。然后,先关闭所有的文件,点击菜单Tools→ReviseDataFile,完成数据库的修改。修改数据库(ReviseDataFile)修改步骤1打开调查表文件(*.qes)进行修改;如果没有现成的调查表文件,可以用已有的数据库(*.rec)反过来创建一个新的调查表文件,即选择菜单Tools→QESFilefromRECFile(根据数据文件产生调查表);编辑、修改调查表文件(*.qes),例如增加新变量、删除变量、改变变量类型等;保存修改后的调查表文件,然后关闭该文件;选择Tools→ReviseDataFile(更新数据文件);选择修改好的调查表文件(*.qes)和准备修改的数据库(*.rec)。操作步骤更改变量名方式如果删除或者修改了变量名,会丢失一些数据。请认真检查修改了的数据库,避免错误操作。即使操作失误,原来的数据库还是可以恢复的,它现在已被存为另外一个数据库(仍在相同的文件夹里),文件名为FILENAME.OLD.RECEpiData中有两种方式生成变量名改变命名方式,有可能会修改变量名,进而丢失数据。在修改数据库时,程序会先检查原始数据库创建时使用变量名定义方法,如果不同于现在的Options中的设置,程序会自动弹出一个警告框,建议你使用相同的变量名定义方法。修改原始数据库中的变量类型。所有变量类型都可以修改为字符型变量或大写字母的字符型变量。数值型变量可以修改为有相同或更多小数位数的数值型变量。如果修改后的小数位数变少了,程序会弹出警告框,提醒这样修改可能会丢失数据。慎重!!更改变量名工具→字段更名→选择文件名→出现文件名在弹出的窗口中,第一列是原有的变量名,第二列是标签。如果要修改变量名,请将光标放在第三列相应的变量行上,键入新的变量名。修改完毕后,点击Saveandclose,保存并关闭窗口。旧的数据库会被另存为Filename.old.rec,以备需要的时候恢复。.Qes文件的保存保存路径数据库的追加、合并Append/Merge追加(append)是将两个数据结构完全一样或基本上一样的数据库纵向连起来。如:几个不同人分录数据的合并横向连接(Merge)可使两个数据库结构不同的文件横向连接,前提是两个文件中有相同的关键变量如:基本情况库,实验室信息库,流调数据库的合并数据库的管理以A库结构为准,B库中多余的变量将被忽略两库中相同名称的变量,则新创建数据库对应的变量类型将以数据库A为准新库中包括A库和B库中的所有变量合并以A库结构为准,只合并标识变量在两个数据库中完全匹配的记录•两库共有标识变量,唯一不重复•可同时选择1-3个变量•不一定要设置KEY或keyunique合并两个数据库中的所有记录双录入和核查注意!!数据的输出数据库的输出/输入输出选项:可选择部分变量和记录变量个数的限制输出到dBaseIII,最多128个变量,且变量标签、数值标签无法同时转出Excel不同版本的行、列数均有限制,且变量标签、数值标签无法同时转出Spss文件syntax语句要删除注释部分输出到epidata:可创建一个新库,含部分记录或部分变量Options设置小结Qes中要尽量与原始问卷结构相同,以减少数据录入中的失误Chk中多设置数值标签,导出时Chk文件要在同一文件夹中在进行大量录入前,数据库建立者要自己录入10-20份左右,以发现存在的问题数据转出时,特别是较大数据库转出时,可试用几种格式(如.xls,.sps,.txt),注意每种转出格式局限性关联数据库:能不用就不用配套文件:数据录入说明…谢谢