多中心临床数据采集系统REDCap权限设置与管理
2018-03-06耿辉贺海蓉郑婕马茂王亚军曾宪涛吕军
耿辉,贺海蓉,郑婕,马茂,王亚军,曾宪涛,吕军
临床研究项目越来越离不开网络程序的支持,传统手工录入正在被现代化的电子问卷所取代,临床数据采集系统REDCap系统的应用,使这一转变提速。REDCap由范德堡大学(Vanderbilt University)的保罗·哈里斯(Paul Harris)教授团队于2004年无偿开发,供全球研究机构免费用于非商业化目的的研究,为转化医学研究提供了一种方便数据标准化传播的工具[1,2]。由于REDCap系统是网络化多中心在线系统,因而合理的配置使用者权限,是系统稳定安全运行的关键。
1 REDCap系统项目应用简介
为开展方便、高效、标准化的临床研究,使用支持多中心临床研究项目的REDCap系统,可以避免多中心研究采集数据时出现的数据杂乱无序、整理数据易出错、后期实现实时平行研究难度大等问题。
REDCap是一种临床试验远程电子数据采集系统(EDC),它具备EDC系统全部的优势和特点,能提供完善的CRF模板,可以实现在线数据录入和外部数据载入,电子签名、数据可导出成多种格式的数据(如SPSS、EXCEL等)并进行分析[3]。更重要的是,REDCap支持安装移动端App(Mobile Application)、开发工具包(Software Development Kit,SDK)和应用编程接口(Application Programming Interface,API),支持Python、R、PHP等多种语言开发各种数据分析脚本,已成为多中心临床研究不可或缺的标准软件。REDCap系统免费使用,能够最大范围的扩大其影响力,自2005年起REDCap用户自发形成联盟(Consortium),且该联盟不断从美国国内逐渐扩展至全世界其他国家[4]。
REDCap是建立在线调查和数据库基础上的临床研究工具。本文内容采用的是linux服务器平台,搭建Apache环境,在配置mysql的基础上搭建REDCap系统。设计初衷是为了简单、便捷的收集和管理几乎任何类型的数据,因此所有基于REDCap系统的项目均可自动内建网页,随时随地使用任何接入互联网的设备输入数据。
REDCap系统项目首先需创建项目标题、目的、初始化数据收集工具的具体内容。新建的临床研究项目如果没有设计问卷或病例报告表,可以使用系统自带模板帮助创建项目。项目创建成功后会被自动打开,界面包含项目菜单、标题和主要工作区。默认情况下,项目创建后会立即显示“项目设置”选项卡。需要注意的是,新项目状态为“测试”(Development)时,意味着该项目正处在测试模式阶段。
测试模式阶段包括数据输入、导入、导出及正在运行的搜索分析等阶段,对下一阶段实际应用中数据的完整性和合理性至关重要,否则实际应用中数据结构出现问题,是不可挽回的。测试模式下所有更改会立即生效。
开始收集临床研究数据时,项目状态从“测试”调整为“正式录入”(Production)。测试模式与正式录入模式的最大区别在于后者具有额外的数据保护功能。在正式录入模式中,管理员或设计者对项目的内容进行更改后,REDCap系统会自动检查更改是否影响已保存的数据,防止数据意外丢失。
“项目设计”(Design your data collection instruments)选项卡引导项目开发过程,项目开发通常侧重于建立数据收集工具。设计带有入口网页的数据采集器是利用REDCap系统开发项目的核心,数据采集器使用在线设计器和数据字典构建。项目开发者设计采集器的结构,定义在网页何处捕获数据及以何种数据方式存储和显示,如:电话号码定义为数字格式,姓名定义为文本等,如1所示。
图1 设计者用项目设计器设计问卷
REDCap系统在项目设计完成后会用自动生成的网页采集临床数据,还可生成二维码,通过扫二维码开始数据输入。
2 工作流系统权限配置的重要性
应用型信息系统用户权限配置对信息资源的利用程度至关重要,涉及安全性、可靠性、伦理性等问题,为不同的用户角色配置相应的软件使用权限,用于访问和控制已产生的信息资源。在多中心临床研究网络中,用户权限的管理及角色的分工会有更高要求。
目前最流行的用户权限管理模式是工作流系统管理模式,REDCap系统就是工作流系统。该模式下用户没有级别区分,权限根据组织机构和工作任务来设置[5,6]。组织机构和权限管理这两部分组成工作流系统的基础,工作流程权限分配依靠组织机构和权限中的角色来完成。例:问卷提交给受试者回答,完成的问卷提交给项目分管员审核,审核完毕提交给系统管理员审核存入数据库等。以上不仅需要组织机构的支持,而且需要逐级权限提升,实际情况更为复杂,需对实际流程进行抽象和归纳,以满足工作需要。
上面的例子是以用户角色来对用户进行分类。目的是为了处理问卷,因此用户权限分配管理也与相应的工作流程有关。分配权限过程在实际应用中,要灵活方便才能满足工作流中自动流转提交等业务节点活动的办理,但又不能过于放松,如:系统管理员拥有导出数据库权限,这一权限专人掌管,不能将其用户名和密码随意借用他人;项目分管员的角色权限在于审核问卷,对不严谨的问卷进行剔除或联系受试者重新填写问卷,如果这一环节松懈,可能出现大量的问题问卷,导致后期导出数据无法使用;项目分管员亦可发现受试者在填写问卷时出现的问题,及时反馈给系统管理员或设计者,以便重新修订问卷。
在工作流系统运行过程中,每个业务流程中的节点均对应一项应完成的工作,不完成则无法进行下一项,同时该业务结点对应特定岗位。这样的设计就把组织机构岗位、相应业务工作和职责权限相对应,只需将每个工作流系统业务节点的职责权限对应分配给某个岗位或某些用户即可,避免了出现一个用户同时拥有执行众多工作节点的权限而不加限制的情况,只有分配到了某节点权限的用户才能执行本节点流程,即使相同岗位的人员,若没有分配权限就不能执行该节点业务工作[7-11]。
3 安全配置Redcap系统用户权限
写一份协议“Electronic End-User License Agreement”,通过审核后即可成为REDCap联盟成员,可以免费获取软件和帮助资源。REDCap是多中心临床研究的工作流系统,因此合理的配置用户权限,是保证系统项目安全稳定运行的第一要素。我们以建立的队列研究过程详细说明如何设置管理员和项目分管员权限。
完成建立临床研究项目后,需要进行阶段性测试,测试是项目开发的重要组成部分。数据采集器通常会因为收到实际受试者的生活习惯、接受问卷程度等更改问答方式。项目设计通过测试阶段后,将转入正式录入模式,如图2所示。
图2 项目测试完成进入正式录入模式
进入正式录入阶段的项目,即可通过“项目设置”选项卡访问“用户权限”工具(REDCap界面左上角菜单部分)。该工具可帮助管理项目数据和分配用户权限,以控制用户对项目的访问。合理的用户权限设置将有助于研究团队,甚至其他中心机构同事,建立和完成研究项目。系统管理员能完全控制每个用户可以看到的功能和数据,并分配其他中心团队的用户权限(图3)。
图3 管理员权限分配用户使用权限
图3 很好的说明了REDCap可以为每个用户的工作流节点分配不同的权限。严格控制用户访问权限非常重要,权限设置能使管理员准确地定义每个用户能做什么、不能做什么。项目权限设置完成后,将进入正式录入阶段的项目生成在线网页,进行受试者的问卷调查,生成公共调查网址的界面(图4)。
图4 公共调查网址生成界面
REDCap系统项目应用的过程中具有完整的审计跟踪机制,管理员可以查看每个用户的活动。日志记录工具会自动记录每个用户的每项操作,使得项目无论在测试模式还是开展中,都能发现数据错误并及时通知设计者进行更正(图5)。
REDCap系统主要是一个电子化的数据收集工具。因此管理员及项目管理者拥有的“数据导出”工具可对数据集进行简单的搜索和基本分析,且可随时保存数据副本,避免数据库出现问题时数据崩溃无法找回。因此这一权限是研究项目的核心权限,只有拥有最高权限的管理员才能使用“数据导出”功能,生成excel格式数据(图6)。
图5 管理员检查问卷状态
图6 项目管理员导出数据界面
4 结语
本文基于工作流系统权限配置模型,从REDCap系统应用于临床研究实践出发,详细阐述了系统的权限设置过程,旨在为多中心临床研究数据采集及应用过程提供工作流系统工作方式的权限配置方案,减少使用者和受试者在工作流中时间和空间的浪费,减少临床研究项目管理员的工作量,大大提高了多中心临床研究项目的可操作性和数据安全性。
[1]Kuo BJ. A prospective neurosurgical registry evaluating the clinical care of traumatic brain injury patients presenting to Mulago National Referral Hospital in Uganda[J]. PLoS One,2017,12(10):e0182285.
[2]Hossmann S. Data management of clinical trials during an outbreak of Ebola virus disease[J]. J Biomed Inform,Vaccine,2017,23.
[3]Cauane Blumenberg. Electronic Data Collection in Epidemiological Research The Use of REDCap in the Pelotas Birth Cohorts[J]. Appl Clin Inform,2016,7(3):672-81.
[4]Jonatan Eriksson. Merging clinical chemistry biomarker data with a COPD database-building a clinical infrastructure for proteomic studies[J]. Published online,2017,21.
[5]李学俊,徐佳,王福田,等. 云工作流系统中能耗感知的任务调度算法[J]. 模式识别与人工智能,2016,29(9):790-6.
[6]陈晓亮,蒋忠远,叶剑虹,等. 工作流网的混或检测和预防策略[J].西安电子科技大学学报(自然科学版),2015,(2):77-83.
[7]卢科帆,胡海洋,胡华,等. 一种面向概率工作流的相似性度量方法[J]. 计算机集成制造系统,2016,22(2):353-62.
[8]余阳,王颍,刘醒梅,等. 基于社会关系的工作流任务分派策略研究[J]. 软件学报,2015,26(3):562-73.
[9]郑长友,刘晓明,姚奕,等. 基于Petri网的面向测试的工作流系统建模方法[J]. 电子科技大学学报,2014,(1):119-24.
[10]李学俊,徐佳,朱二周,等. 任务调度算法中新的自适应惯性权重计算方法[J]. 计算机研究与发展,2016,53(9):1990-9.
[11]高健,薛巍,杨广文,等. 气候系统模式不确定分析工作流执行平台[J]. 计算机工程与应用,2017,53(6):46-50,56.