APP下载

EpiData软件在数据库合并和质控中的应用

2023-08-22王瑞平李斌

上海医药 2023年15期
关键词:对话框一致性问卷

王瑞平 李斌

(上海市皮肤病医院临床研究与创新转化中心 上海 200443)

EpiData 软件是丹麦欧登塞的一个非盈利组织开发并推广,是一款免费的数据管理软件[1]。在应用EpiData软件完成数据库建立后,研究者就可以使用这个数据库进行数据录入。考虑到有些调查研究的样本量比较大,因此在数据录入时须要邀请多名数据录入员完成纸质版数据的录入;另外,有些研究的数据来源多样,有时则须要把不同来源的数据合并在一起。遇到这些情况时,就须要应用到数据的“纵向合并”和“横向合并”功能。此外,为了提高数据录入的质量并能够检测出录入错误,许多情况下须要将纸质问卷数据信息进行双人双遍录入,将双录入的结果进行一致性核对,便可以发现录入不一致的地方,这时便会用到EpiData 软件的“一致性检验”功能。本文基于前期数据库已完成建立的基础上,介绍EpiData 软件在数据库合并和一致性检验中的应用方法和须注意的细节。

1 数据库纵向合并

数据的纵向合并是指用于连接数据结构相同或相似的2 个数据文件,操作过程中2 个文件不发生任何变化,只是把2 个数据文件的“合集”内容中的数据合并在一起,增加数据的份数[2]。例如,仍以《上海医药》2023 年第44 卷第13 期“临床研究规范”栏目发表的《应用EpiData 软件创建临床研究电子数据库》一文中建立的“流动人口特应性皮炎患者现况调查”数据库(图1)为例[3],在后续的研究中邀请A、B、C 等3 名数据录入员进行数据库录入。其中,A 录入员完成800 份问卷,B 录入员完成1 000 份问卷,C 录入员完成700 份问卷,通过数据库的纵向合并,最后得到包含共计2 500(即800 +1 000 +700)份记录的数据库。数据库纵向合并的操作方法:打开EpiData 软件菜单列中“数据导入/导出”的次级菜单,点击“纵向追加记录和横行添加字段”打开对话框(图2),然后打开要合并的数据库记录(record,REC)文件A(崔亮亮.rec)和REC 文件B(马兵成.rec)后,点击“确定”打开新的对话框,根据提示选择纵向连接“追加”的类型,把合并后的目标文件保存在“REC 数据文件C”(须自行指定保存位置,并自行定义合并后的文件名称,如“合并1”),单击“追加/Append”,完成操作。后续,重复上述操作,将“合并1.rec”和“谢荣恒.rec”合并,直到把全部数据库合并为一个完整的数据库为止。

图1 EpiData数据库录入界面

图2 EpiData软件数据纵向合并方法示意图

2 数据库横向合并

数据的横向合并是2 个数据库中结构不同的文件横向连接,但前提是2 个文件中必须有相同的标示变量或关键变量,为了提高连接的成功率,用户最多可以指定3 个指示变量,指示变量不一定是在核对文件中指定为key 或key unique,但必须保证其在2 个文件中都存在,同时指示变量在数据文件中不能有重复。为了便于操作,建议指定key unique 变量为指示变量。例如,在先前建立的“流动人口特应性皮炎患者现况调查”数据库中,如果一般人口学特征信息为数据库A,共2 500 份记录,而实验室检测指标为数据集B,同样是2 500 份记录。如果要把数据库A 和数据库B 中每一个人的信息合并在一起,就会用到数据库的横向合并,最后得到一个有2 500 份同时包含A、B 数据库信息的记录的数据库。数据库横向合并的具体操作方法为,打开EpiData 软件菜单列中“数据导入/导出”的次级菜单,点击“纵向追加记录和横向添加字段”打开对话框(图3),然后打开要合并的REC 文件A 和REC 文件B 后,点击“确定”打开新的对话框,根据提示选择纵向连接“合并”的类型,选择合并所必需的匹配字段,把合并后的目标文件保存在“REC 数据文件C”(自行指定的保存位置),单击“合并/Merge”,完成操作。

图3 EpiData软件数据横向合并方法示意图

3 数据库一致性检验

数据库的一致性检验是将同一个研究中的纸质问卷内容进行双遍录入后,进行一致性检验,其目的是对录入的数据进行质量控制(以下简称质控),进而提高数据库的正确性[4-5]。以“江西省萍乡市一起集体发热疫情”数据库为例,该调查共采集98 名发热并伴有呼吸道症状患者。该调查应用EpiData 软件建立数据库,然后将98名发热病人的信息进行了双人双遍录入,最后应用一致性检验对数据录入质量进行质控。应用EpiData 软件开展一致性检验的步骤如下:在EpiData 软件过程工具条中选择“5 数据处理”,打开次级菜单“一致性检验”对话框。如图4 所示,在第1 个REC 文件A 中选择第一遍录入的数据库,在第2 个REC 文件B 中选择第二遍录入的数据库,然后点击“确定”打开新的对话框,根据提示选择匹配字段(key unique 变量),根据研究需要进行勾选(如勾选“不考虑已被删除的字段”“不考虑文本字段”“报告字段类型的区别”等选择项)。最后,点击“确定”,打开一致性检验报告,完成操作即可。

图4 EpiData软件对双遍录入数据的一致性检验

为使双录入后的一致性检验操作更便捷,首先,研究人员须保证双遍录入的数据库中至少有一份数据库的录入顺序是从编号为“0001”的第一份问卷开始依次录入的,这样在后续根据一致性检验报告修改数据库时方便查阅原始数据,且利于查找数据库中的每一份记录。其次,在根据一致性检验报告修改调整录入的数据库时,建议由3 个人组成一个数据库修改质控小组。质控小组成员A 负责第一遍录入的数据,成员B 负责第二遍录入的数据,成员C 负责一致性检验报告和查阅原始数据。质控开始时,质控小组成员C 查看一致性检验报告,找出两遍录入不一致的问卷编号及报告提示的每一个不一致的变量,然后翻阅原始记录,核对该变量正确的选项,如果是第一遍录入出错,则告知质控小组成员A 修改;如果是第二遍录入出错,则告知质控小组成员B 修改;如果第一遍和第二遍录入的结果都不正确,质控小组成员C 将同时告知质控小组成员A 和质控小组成员B 修改。由此,根据上面的规则,完成一致性检验报告中所有错误信息的质控核对。最后,将修正后的第一遍数据库和第二遍数据库再次进行一致性检验,如果还有错误则继续修改;如果没有错误,便是完成了这项工作。

完成数据库一致性检验后,最后一步工作便是将数据库导出,随后应用常用的统计分析软件进行数据分析并撰写报告。目前,EpiData 数据库支持导出的格式包括TXT 文件(文本文件)、DBF 文件(dBase Ⅲ文件)、XLS 文件(Excel 文件)、DTA 文件(Stata 文件)、SPS文件(SPSS 文件)和SAS 文件(SAS 文件),研究者可以根据自己的需要选择具体的导出格式。操作步骤如图5 所示:在EpiData 软件过程工具条中选择“6 数据导出”,选择导出格式,然后打开需要导出的数据库,打开新的对话框,然后点击“确定”即可。

图5 应用EpiData软件导出数据库

猜你喜欢

对话框一致性问卷
关注减污降碳协同的一致性和整体性
注重教、学、评一致性 提高一轮复习效率
IOl-master 700和Pentacam测量Kappa角一致性分析
正常恢复虚拟机
Bootlace Worms’Secret etc.
What Is Beauty?
问卷网
浅谈VB的通用对话框《CommonDialog》控件的使用
基于事件触发的多智能体输入饱和一致性控制
问卷大调查