基于云架构的慢病患者随访穿戴设备数据采集平台的构建
2023-11-10王登
王登
长沙砝码柯数据科技有限责任公司
郑园园
长沙砝码柯数据科技有限责任公司
陈露露
长沙都正生物科技股份有限公司
复杂基质样本生物分析湖南省重点实验室
朱伟明
长沙砝码柯数据科技有限责任公司
李晓晖*
长沙砝码柯数据科技有限责任公司
长沙都正生物科技股份有限公司
复杂基质样本生物分析湖南省重点实验室
真实世界数据是产生真实世界证据的直接来源,后者是药物有效性和安全性评价证据链的重要组成部分,能够以多种形式支持药物研发和监管决策[1]。真实世界数据的收集是真实世界研究的关键环节,在真实世界证据的形成中发挥重要作用[2]。
我国真实世界数据的来源主要包括卫生健康信息数据、医疗保险支付数据、疾病登记数据、公共卫生监测(如不良事件监测、死亡信息登记、院外健康监测)数据等[1]。近年来,伴随远程诊疗和“互联网+慢病管理”模式的普及[3-4],利用远程监测、咨询和居家身体检查(如血糖测量、视网膜扫描、足部检查、血压测量)技术进行慢病诊断和真实世界研究,在一定程度上可避免慢病患者院内随访依从性不足而导致的数据缺失问题,可提供真实可靠的多维、横向及纵向相结合的真实世界研究数据。
2021 年4 月,国家药监局药审中心发布的《用于产生真实世界证据的真实世界数据指导原则(试行)》指出,目前真实世界数据在数据的记录、采集、存储等流程普遍存在缺乏严格的质量控制等问题,严重影响数据的可追溯性,对真实世界数据的有效使用造成障碍[1]。早在2018 年,美国食品药品监督管理局(FDA)就要求数据收集方需明确数据收集方法和流程,并要求关键分析数据能够追溯至源数据,建议通过电子化平台保障数据的可追溯性[5]。
电子化数据采集平台的优势在于数据库的结构化程度较高,数据易于挖掘和治理,且电子化系统能为研究全过程提供透明、精准的数据管理,数据从产生到导出全过程留痕,有助于保证数据的真实可靠[6]。
因此,有必要完善我国真实世界数据采集信息化平台,提高真实世界研究的数据质量。笔者团队结合实际业务需要,开发了一款基于云架构的真实世界数据电子采集平台,并取得初步成效。
1 基于云架构的真实世界数据电子采集平台原理及架构介绍
笔者团队按照去中心化的“数字医疗”概念进行设计,融入真实世界研究方法,构建了一种基于院外随访数据的自动化电子数据采集平台。该平台可实现慢病患者居家监测设备与电子数据采集(electronic data capture,EDC)系统实时对接,避免人工录入数据,提高真实世界数据质量和工作效率。该平台主要由监测设备、手机应用程序(application,APP)和EDC系统组成。真实世界数据电子采集平台整体架构见图1。
图1 真实世界数据电子采集平台整体架构
1.1 监测设备
监测设备记录的慢病患者数据是EDC 数据库中的源数据。源数据通过设备接口被直接上传至云端,与EDC 系统对接,EDC系统可实时在线存储患者健康数据。监测设备包括但不限于血糖仪、血压仪、便携式尿酸仪、睡眠监测仪等。监测设备需要有数据传输端口,目前监测设备的数据主要通过以下几种方式对外传输:①蓝牙,该方式对监测设备与数据接收方的距离有要求,理论上蓝牙5.0 的标准最远传输距离只有300m,故使用不便;②无线传输,该方式没有距离上的限制,可实现数据实时传输,对网络要求较高,但存在数据安全问题;③硬盘,该方式无法实现数据实时传输。
借助无线传感技术设备,监测设备数据可通过无线加密传输实时在线对接EDC 系统。
1.2 手机应用程序
真实世界数据电子采集平台APP 包括患者客户端和健康照护师客户端。其中,患者客户端需与患者身份进行绑定,可输入患者用药后的感受数据,也可记录患者用药情况;同时,APP 可根据患者的监测数据智慧化提出治疗建议,如提醒患者调整饮食、作息、用药等,并对异常检查数据进行预警。
健康照护师是2020 年2 月获国家批准的新职业,是指具备生活照料与医学护理复合技能的高素质健康照护人才,能够在家庭、社区、医院等场所为具有不同层次需求的老年人、残疾人、慢病患者、术后康复患者、婴幼儿和孕产妇提供健康照护服务[7]。平台中的健康照护师均经过专业培训和考核,不仅熟悉慢病患者护理工作,还知晓平台数据录入的基本要求,能够保障录入至系统的真实世界数据真实、准确、完整、可溯源、合规。健康照护师客户端由健康照护师操作,可实时补充完善患者基础数据(如并发症、合并疾病及其他信息等),还可通过远程医疗建议为患者提供智慧化护理。
1.3 电子数据采集系统
EDC 系统是整个真实世界数据电子采集平台的核心,结构化设计的EDC 数据库可直接对接监测设备数据。此外,EDC 系统中开通了不同的权限角色,可对数据进行录入、修改、清理和电子签名,且上述过程中所有操作轨迹均将留痕,从而实现数据的可溯源性。
2 基于云架构的真实世界数据电子采集平台业务功能的实现
2.1 院外数据采集
真实世界数据电子采集平台可用于全面采集患者的居家监测数据,数据范围渗透到患者居家生活的方方面面,能够全面反映患者的真实诊疗环境。数据采集来源主要有3 种:①通过智能或传统型居家监测设备及其他可穿戴设备采集;②用户自我报告,包括饮食、体重、运动、血压、睡眠、药物、情绪等信息;③健康照护师床旁评估、随访数据、患者居家生活数据。
多维度院外数据采集可为真实世界研究提供更全面、有说服力的证据(图2)。
图2 多维度院外数据采集模式
2.2 源数据对接
本平台通过对居家监测设备(如睡眠监测仪)的集成,借助无线传感技术,实现数据自动获取并将其上传到EDC 系统云平台的功能,同时支持人工输入。被上传到云端的数据在经过格式化、可视化处理后,供数据分析团队调取查看。
2.3 信息交互
监测设备与患者交互方面,监测设备可根据患者数据进行及时反馈。当患者在居家监测时出现异常情况,如睡眠呼吸暂停等,设备可通过自动反馈机制告知用户并提供简单的应对方法提示。
患者客户端与患者交互方面,患者通过客户端进行身份绑定后,可通过客户端提交基础数据,如饮食、体重、运动、情绪、睡眠、药物等相关数据;系统发现异常值时进行预警提醒;对于符合计划的操作,自动实时反馈鼓励信息和统计信息;对于不符合计划的操作,如漏服药物,患者客户端会根据预先设定的规则提醒患者按时用药,防止患者漏服;对于可能发生的药物不良反应,系统会提前预警。
健康照护师客户端与患者交互方面,健康照护师在客户端注册后可与患者进行用户绑定,通过客户端完善患者评估数据和随访信息;可通过客户端查看需要随访的事件并提醒患者相关信息;可基于客户端直接拨打患者电话,或直接进行语音、文字沟通,发送图片、文字、问卷等内容;可通过小程序提交工作日志,修改服务状态。
患者、监测设备、患者客户端、健康照护师之间的信息交互如图3 所示。
图3 信息交互模式
2.4 数据治理
采集的真实世界数据经治理后可成为满足临床研究目的的分析数据,是使用真实世界数据形成真实世界证据以支持药物监管决策的关键[1]。从数据来源看,相较于随机对照临床试验(randomized controlled trial,RCT)数据,真实世界数据的记录、采集、存储等流程在大多数情况下缺乏严格质量控制,数据存储分散、数据标准不一致、数据横向整合困难,这些局限极大影响了后续的数据治理和应用。
笔者团队研发的真实世界数据电子采集平台能够基于结构化的电子病例报告表(electronic case report form,eCRF)和数据标准前瞻性收录指定来源数据,且源数据可直接对接系统,极大降低了后续数据治理的难度。该平台采用临床数据交换标准协会(clinical data interchange standards consortium,CDISC)标准处理数据,对于医学术语统一使用监管活动医学词典(medical dictionary for regulatory activities,MedDRA)进行线上编码,数据经治理易于产生真实世界证据。真实世界数据治理包括数据链接、数据提取、数据核查、数据清理4 个步骤[8],常用方法和处理手段及基本要求见表1。
表1 常用的真实世界数据治理方法和处理手段及基本要求[8-9]
2.5 数据安全
医疗数据作为相关企业的无形核心资产,数据本身及业务安全性至关重要。近年来,《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规相继出台施行[10],强调依法、合规地进行数据采集、处理、存储和应用,特别是多元、复杂的患者隐私数据保护[11]。真实世界数据电子采集平台采取了必要的安全保护措施,以确保数据安全。数据安全保护范围包括数据采集、数据传输、数据存储、数据交换、数据销毁等在内的整个生命周期(表2)。
表2 真实世界数据电子采集平台全生命周期数据安全保护
3 真实世界数据电子采集平台的应用
目前,真实世界数据电子采集平台已应用于睡眠障碍患者,初步实现睡眠监测仪数据与EDC系统的对接(图4)。
图4 睡眠监测仪数据与EDC 系统对接
可穿戴睡眠监测仪可实时监测患者呼吸、脉率、血氧、体动等生命体征数据,为睡眠呼吸疾病临床诊断和预防提供重要依据。同时,睡眠监测仪可对在床及离床状态、睡眠分期趋势、睡眠体动、睡眠呼吸暂停进行监测,设备可超负荷连续不间断监测生命体征和展示历史数据。所有的海量数据在云端存储共享,实现远程数据管理,并可通过人工智能(artificial intelligence,AI)技术完成自动分析和自动生成报告。
在一项评价基于毫米波雷达技术的睡眠呼吸监测系统的有效性和安全性的临床试验中,睡眠监测仪用于采集、记录、存储、分析患者睡眠时的生理参数(包括呼吸、心跳、血氧、全身微动等特征),协助医生分辨患者不同的睡眠时相,辅助医生进行睡眠障碍疾病临床诊断。该临床试验计划招募150 例患者接受睡眠监测,研究时长为6 个月。研究通过临床研究病例报告表(case report form,CRF)构建结构化的EDC 系统,满足睡眠监测仪的数据标准,并实时对接无线传输设备。睡眠监测数据电子采集平台进行数据采集,目的是针对鼾症等患者和健康人群进行整晚睡眠监测,验证睡眠呼吸监测系统用于睡眠呼吸监测和睡眠障碍疾病辅助诊断的有效性和安全性。目前,笔者团队已完成EDC数据库的构建、部分数据的收集和对接,且随着临床试验的开展,还将逐步完善相关数据收集和数据治理,为后续睡眠监测仪的安全性、有效性研究积累数据。
4 真实世界数据电子采集平台的优势与价值
4.1 保障真实世界数据电子采集平台安全和合规
针对本平台部署的云架构采取安全加密措施,服务器底层使用经国家密码管理局检测认证的硬件密码机,通过虚拟化技术,帮助用户满足数据安全方面的监管合规要求,保护云上业务数据的隐私和机密。借助加密服务,用户能够对密钥进行安全可靠的管理,也能使用多种加密算法对数据进行可靠的加解密运算。为充分保护患者的安全和权益,涉及伦理和患者隐私的问题均经过伦理委员会审核批准和脱敏处理,参与真实世界数据收集、传输、治理、存储的健康照护师均经过相关培训,严格遵守相关法律法规要求。
4.2 推动慢病患者医疗服务可及
对于农村偏远地区患者以及行动不便的老年和残疾患者而言,接触医学专家的机会有限,连贯医疗服务的缺乏和无效的患者教育将会大大增加其相关并发症发生的风险。本平台可为慢病患者居家自行开展医疗服务提供便利,不需要预约医学专家见面,即可实时监测相关体征,如体温、体重、血压、血糖等。
4.3 提高真实世界数据质量
真实世界数据电子采集平台为慢病患者居家自行监测数据的传输和存储提供了方便、有效、安全的解决方案:可实时记录数据,避免人工录入数据,提高了数据录入的效率和质量,也提升了数据采集效能;通过数据集成网关将获取的所有数据进行整合,实现了数据流的统一;数据的产生、记录、导出过程实现自动化,不需要人工参与,且全过程留痕,保证数据真实、可溯源,为后续的数据治理、真实世界证据的生成提供保障。综上,真实世界数据电子采集平台的建设,有助于解决真实世界研究中的“卡脖子”问题。
4.4 推动真实世界研究信息化发展,完善真实世界证据链条
真实世界数据电子采集平台可自动对接设备,实现源数据电子化、自动化,为真实世界数据交换提供了可能,从而打破数据孤岛,推动真实世界研究信息化发展。
此外,该平台还有效解决了慢病患者长期院内随访依从性不足的问题。可穿戴设备、智能设备的广泛应用使得真实世界研究能够更便捷地收集患者日常监测的生命体征数据,与院内数据衔接形成更为完整的真实世界数据。
4.5 平台扩展性强,应用潜力巨大
开发团队基于已有经验,为系统预留了AI 算法研究、更多检测项扩展等接口,为后续慢病患者居家监测的真实世界研究提供了更为广阔的思路。
5 关于真实世界研究信息化平台建设的思考
尽管笔者团队构建的真实世界数据电子采集平台已经在睡眠监测领域取得了初步成效,但仍有诸多问题有待探索。只有不断完善真实世界研究信息化平台,真正让数据说话,才能更好地发挥真实世界数据的价值,指导临床医疗实践。基于行业现状与未来发展,笔者在真实世界数据电子采集平台建设方面提出以下3点思考和建议。
5.1 解决数据共享问题,提高平台兼容性和可扩展性
个人健康监测数据可通过移动设备(如智能手机、可穿戴设备)实时采集。一方面,目前该类数据通常存储于可穿戴设备企业、医疗机构数据库以及商业保险公司数据系统等[1],数据归属尚不明确,很多设备厂商的数据共享意愿度较低,不愿开放设备端口。另一方面,由于采集设备数据接口和协议不统一、不兼容,整个真实世界数据电子采集平台的兼容性和可扩展性较差。
为解决设备厂商的数据共享问题,一方面需要相关政策出台予以引导,同时注重数据隐私保护;另一方面也需要数据收集方和设备厂商积极协商,明确利益分配和权责划分。同时,在数据接口设计方面,需要预先设置规范、统一、稳定的数据协议和接口,对可能接入的其他品牌和类型的监测设备提供尽可能的兼容性,同时保持松耦合结构以保证平台的可扩展性。
5.2 规范真实世界数据标准,打破数据孤岛
目前,我国真实世界数据库尚缺乏顶层设计,信息化建设标准有待统一,数据交互难度仍较大。同时,由于原始病例资料数据量庞大,且分散在各级医院不同的业务系统中,虽然已经形成电子病历系统,但数据库之间的数据对接难以实现,导致形成数据孤岛,难以进行精准归类[20]。此外,不同数据库的采集能力和采集模式也存在差异,导致数据质量差异大、解读和清洗的难度也较大。
为打破数据孤岛,解决数据交换问题,建议在真实世界数据库建设顶层设计上统一标准,加强健康医疗大数据标准与安全规范建设,推进统一权威、互联互通的真实世界数据电子采集平台设计,进一步提升真实世界数据联通共享水平。
5.3 多学科交叉融合,先进技术赋能真实世界数据挖掘
多学科交叉融合在真实世界研究中非常重要。真实世界的问题往往是复杂多样的,需要从不同学科的角度进行综合分析和解决。临床医生、临床药理学家、统计学专家、生物信息学专家和信息化技术团队协同开展工作,往往可以提供更广阔、全面的视角,帮助深入了解真实世界研究的各个层面,并找到有效解决路径,获得有价值的研究成果。
伴随大数据与AI 等技术的发展,高新技术正加速渗透到人们生活和工作的方方面面。在真实世界研究领域,AI 技术也正逐渐展现出重要的应用价值。未来,人们有望运用AI 手段进行真实世界数据挖掘、构建医疗知识图谱、辅助诊疗,从而实现个体化精准用药[21-23]。
6 结论
在快速发展的数字医疗技术以及更加协作、开放的监管环境的助力下,真实世界数据收集逐步走向自动化、智能化,真实世界数据电子采集平台的构建符合我国在真实世界研究方面的政策导向,能有效解决真实世界数据在收集、记录、存储过程中无法溯源的问题,对于提高真实世界数据质量具有重要意义。虽然目前真实世界数据共享方面仍存在一些不足,但相信随着政策与技术的日益完善,真实世界数据共享和利用程度将越来越高,应用信息化技术开展真实世界研究已成为必然趋势。