临床科研服务平台源数据管理及应用研究
2020-08-17冯克谜FENGKemi梁远波LIANGYuanbo郑景伟ZHENGJingwei
□ 冯克谜 FENG Ke-mi 梁远波 LIANG Yuan-bo 郑景伟 ZHENG Jing-wei
开展临床科研工作需要医生投入很多的时间和精力,目前各大医院的普遍做法是分别引进临床医生和科研人员从事研究,很多临床方面的问题对于处于医疗第一线的医生来说比较容易发现,而专职科研人员的关注点往往有所偏差,导致科研成果不能很好地与临床需要解决的问题相契合。为解决上述问题,医院于2013年3月中旬成立了临床科研中心(简称中心),配备了先进的临床仪器设备以及研究助理、统计师等科研人员。临床医生的科研重点是给出方案或者思路,临床科研中心相关人员协助医生开展研究,这种临床科研服务平台极大地提高了科研水平。本文就科研服务平台中源数据管理进行讨论。
源数据管理
对于临床科研来说,研究数据的可溯源性非常重要。临床科研服务平台致力于为临床医生的科研工作提供服务,因涉及的课题多、受试者多、仪器设备也多,研究数据的可溯源性面临着诸多挑战:(1)少数仪器设备不存在纸质或电子版数据(如身高体重测量仪)。(2)部分仪器设备的存储量较小,不能满足大量源数据的存储,需要不定期地转储数据。(3)大量的课题同时开展,对数据需求的负荷增大,硬件及软件发生故障的情况时有发生,存在数据丢失的可能性。
在平台投入使用初期,因仪器设备主板损坏、软件故障、数据未知原因乱码等问题引发的源数据错误、丢失造成人力、物力的浪费,且丢失源数据造成的后果严重,挽回损失的可能性低。为了应对这种情况,中心合理安排人力资源,对仪器设备源数据加强管理,保证数据及时存储和备份。
利用品管圈对源数据管理进行改进
品管圈是日本管理学大师石川馨提出的一种发现问题并追踪其根本原因,以及针对原因找出对策的系统分析方法[1],适合发现并分析源数据管理中出现的问题。PDCA (计划(Plan)、执行(Do)、检查(Check)、处理(Act))循环是由美国质量管理专家戴明博士首先提出,是全面质量管理所应该遵循的一个科学程序和循环[2],适合作为源数据管理的持续改进方法。
在提供临床科研服务的过程中,研究助理在发现仪器设备出现故障,质控以及项目管理过程中发现仪器设备源数据异常时,负责将数据生成、统计分析和数据管理工作中的各项问题交由品管圈讨论。参与品管圈的成员由四部分人员组成。
1.中层及以上干部参加品管圈。传统品管圈参与人员一般是基层人员,中层及以上干部很少参加[3]。而对于仪器设备源数据的品管圈活动则需要在经验丰富、有话语权的成员领导下,才能有效并高效地进行。其原因有二:第一,错误的管理方案可能导致数据因人为因素而丢失,需要经验丰富的人员来对方案的科学性进行判断。第二,对仪器设备的源数据管理涉及相关硬件和软件的购买和使用,需要有话语权的人员对管理方案的可行性进行判断。
2.灵活运用PDCA。仪器设备源数据的品管圈活动相对于普通品管圈有所不同,在P (计划)阶段,选题、设定目标是明确的,而对仪器设备源数据存储及备份进行管理,是临床科研工作的重要保障;传统的现状调查是收集历史数据,对于源数据来说,仪器发生故障与及时反馈是保障科研服务平台源数据存储与备份的关键。为了实现对仪器设备源数据更加安全、有效的管理,需要对数据存储、备份的方法及软件、硬件等技术发展进行持续跟进。因此,PDCA的A (处理)阶段更合适的说法应该是“探索与更新”,如图1。
图1 源数据管理PDCA框架
仪器设备源数据管理的措施
1.手动双备份
1.1 问题的反馈及原因分析。在临床科研服务平台投入使用初期,采购设备时需要向生产厂家声明该设备用于科研,对数据的安全存储等问题需要进行深入沟通。工程师明确表示仪器自带软件,可以进行数据的备份,发生故障时,可以对数据进行恢复。事实是硬件和软件的故障会发生意料之外的情况,原始数据和备份数据存储在一个硬件中会造成数据完全不可恢复、备份文件出现乱码等问题,失去未能及时备份的数据。涉及仪器设备源数据丢失各种问题的分析见图2。
图2 源数据丢失问题分析
1.2 制定对策及实施。针对具体原因,运用头脑风暴法制定切实可行的对策并加以实施。(1)申购大容量移动硬盘。(2)与相关仪器设备厂家的工程师确认仪器设备源数据存储、备份及可应用于数据恢复的文件夹所在路径。(3)根据仪器设备源数据文件夹备份所需时间平均分配进行备份。(4)备份时间为每天受试者完成数据采集之后。(5)由数据管理人员第二天随机抽样检查并确认数据备份完成情况。
1.3 检查效果。实施人工手动双备份之后,仪器设备源数据大量丢失的情况不再出现。在仪器设备发生故障及数据不可恢复的情况下,人工手动备份的数据保证了当天之前的数据可以直接读取。存储于仪器设备与硬盘中的数据同时不可用的情况没有发生。双备份同时出现故障并不可恢复事件为小概率事件,人工双备份的方法可以保障仪器设备源数据的安全。
2.自动双备份。PDCA应用于仪器设备源数据管理时,探索、更新和新阶段的问题反馈、分析原因同时进行。在实施人工手动双备份之后,要保证源数据的绝对安全,必须做到实时备份。要进行实时备份需要具备几个条件:实时备份软件、存储用硬件(硬盘、电脑、服务器)、网络连接方式(局域网、互联网)。
2.1 制定对策并加以实施。根据具体情况制定数据存储、备份新方式并加以实施。(1)收集可以进行实时备份的软件信息并初步筛选出适用软件(图3)。(2)由统计分析与数据管理部门领导根据名单从实用性、安全性、可行性方面与组圈成员分析并讨论决定采用NAS服务器进行存储、备份。实用性分析:阿里云和NAS有成熟的团队指导软件的搭建及使用,阿里云不需要自备硬件,NAS有配套硬件。安全性分析:阿里云需要联网,而NAS只需要内网即可,相对而言,使用内网的安全性更高。可行性分析:NAS软件及服务器搭建费用在部门预算经费可接受的范围内。(3)申购、搭建NAS服务器并投入使用。
2.2 检查效果。使用NAS进行仪器设备源数据实时自动双备份后,实现了数据的实时双备份,不再发生数据丢失的情况。在仪器发生故障且数据不可恢复的情况下,可以从NAS服务器直接读取可使用或应用于恢复的数据。
图3 初步筛选后适用的双备份软件
3.探索仪器设备源数据更好的存储及使用方式。研究者要将仪器设备源数据转化为可供分析的数据集、数据库,需要在相应的仪器设备中查询自己课题的患者资料,再进行人工数据录入,这样费时费力且不能保证数据完全正确。对仪器设备源数据的管理进行第二阶段的品管圈管理后,临床科研服务平台的所有仪器设备源数据同时双备份在NAS服务器中,如果能直接导出完整的数据,就可以解决上述问题。要实现这个想法面临两个问题:(1) 仪器设备生成的图像报告需要在相应的软件中才能显示。(2)图像报告不能直接导出为可用的数据集。问题的解决需要熟悉医学仪器设备的相关信息公司配合解决。统计分析与数据管理部门与工程师共同进行讨论、制定对策并加以实施。(1)无接口、无标准的仪器(如身高体重测量仪),采用移动平板电脑进行实时数据终端数据录入。(2)有接口、无标准的仪器,由工程师提取电子打印信号、采集电子报告的方式实现数据转化。(3)有接口、有标准的仪器,按DICOM标准接入和采集数据。实现对无接口、无标准的仪器设备源数据进行有效的存储及备份,对有接口的仪器设备准确地提取可直接应用于统计分析的数据,并生成标准化的数据库,准确且实时地存储在NAS服务器中。
20世纪后期,科研数据管理在世界范围内被广泛提出,其重要程度日益增加。在科研数据管理中,“共享数据”的思想深入人心[4]。而“共享数据”的前提条件之一是标准数据库,利用临床科研服务平台是否能在医院内实现“共享数据”是接下来的努力的方向之一。临床科研服务平台能帮助临床医生更方便地进行临床科学研究,在提供便利的同时,需要切实保障研究数据的安全及准确,品管圈模式在改进临床科研数据管理质量方面切实可行。