基于真实世界数据特点构建中医临床信息采集模式的对策
2023-03-08李传朋董兴鲁冯路达
李传朋 董兴鲁 冯路达 高 颖
(1 北京中医药大学东直门医院,北京,100700; 2 北京中医药大学中医脑病研究院,北京,100700)
随着医疗信息化的发展,影像报告、临床病历记录、穿戴设备监测等数据不断被记录存储。这些真实世界数据不仅来源途径广泛,还具有数据体量大、数据类型多以及增长速度快的特点。它们既包含结构化的临床病历字符信息,又包含非结构化的图像、音频及视频等资料[1-2]。而计算机软件设备的丰富和文本语言挖掘能力的提升,进一步加强医疗健康数据的可利用性,给中医真实世界研究既带来了机遇,又带来了巨大的挑战。一方面,在这海量增长的数据资源里,潜藏着有价值的临床规律等待被挖掘。但另一方面,大量数据源源不断产生,对医师或研究者来说如同置身于数据海洋中,疲于对数据的管理,冗杂的数据难以被其所利用[3]。此外,还存在相同的医疗数据被存储于多个数据库,数据的反复采集造成人力资源的浪费以及数据的非标准化使其难以被共享等问题[4-6]。并且现有研究以项目研究为中心,强调在项目期内的数据采集的完整性和有效性,缺乏对远期的管理和评价及发病前基线的采集和评估[7]。这些问题的核心在于数据管理不完善和使用不充分,而数据管理不完善和使用不充分的关键在于前期临床信息采集模式的局限,其制约着中医临床研究的发展。基于此,本团队梳理了现有采集的问题,并基于真实世界数据的特点提出了中医临床信息的采集模式,以期为中医临床研究提供一定的参考和借鉴。
1 现有临床研究信息采集存在的不足
1.1 临床数据的来源场景较局限 真实世界研究更加关注患者在真实诊疗和生活环境下的健康相关数据,这些数据常产生于多种场景。但是目前基于电子病例报告表的采集,多数围绕医院环境,对于患者在其他场景的健康数据采集仍具有一些局限,无法充分反映患者诊疗和疾病变化的全过程。主要表现在,一是从个体的生活场景来看,患者的活动场所包括了医疗机构、社区、家庭,而现有临床数据的采集侧重于患者在医疗机构发生诊疗的数据,研究数据常常来源于医院的研究型科室,仅仅当患者进入医院参与研究以后,才开始定期跟踪采集患者的数据,而患者在社区及家庭发生的诊疗及病症变化情况则少有涉及。二是从患者入院经过的场景来看,涉及疾病突发现场、救护车、门诊、病房等,数据在门诊及病房的数据采集较为密集,而在疾病现场、救护车等场景产生的数据采集有所不足。三是从医疗机构来看,数据采集常发生在三级医院的科室,而一二级的医院、社康中心及诊所的数据来源不足,不同级别的医疗机构患者人群和种类不一样,造成患者的代表性不够。总之,数据场景的局限造成临床只能获得有限区域的数据,导致传统的中医四诊信息采集多数只能在患者随访或复诊时获得,无法连续获得患者在家庭社区环境里的四诊变化信息,进而影响中医干预效果的评估。
1.2 临床数据采集的角色较单一 现有临床研究数据采集往往发生于研究者对入院患者的检查、诊断及研究报告表的填写,这样获得的数据常常是研究者面向患者单一维度的数据采集,而缺少其他维度的数据,如患者的自我报告数据,患者自我报告反映了患者对于自身状态和他们对于未来健康与疾病的认识[8],缺少了这部分数据,难以了解患者自身视角下的疾病对生理和心理社会性的影响程度以及干预方式对其生命质量的改善效果。此外,临床医师常忙于医疗工作,无法很好地顾及临床不断增加的科研数据的录入[9],由于现有场景临床数据采集角色偏少,缺少人员替代医师完成患者某些基本健康信息的采集录入,给临床医师造成了巨大的工作负担,同时也导致临床数据采集质量和效率的低下。
1.3 数据的丰富性和客观性较欠缺 除了数据场景和采集角色较局限外,现有场景下数据的丰富性和客观性仍然有所欠缺。虽然在目前医疗数据的井喷式增长情况下,表面看似医疗数据具有较大的规模,但由于医疗数据的量级在不同维度的分布具有差异性,研究某一方面问题数据仍可能缺乏足够的丰富性。另外,研究者往往采集其关注和其认为重要的信息,而对于其有所忽略或难以人工获得的信息则少有采集,缺乏相应的采集工具能代替或辅助医师采集到这部分数据。当患者在无专人跟踪和自我监测不足的情况下,院外的健康数据处于相对缺乏的状态,即使研究者在患者入院后进行回顾性问诊,得到的信息也是零散和主观的,造成这些场景下获得的数据的丰富性和客观性有所欠缺。此外,数据缺失也是真实世界数据面临的重大问题之一,如以医院管理信息系统(Hospital Information System,HIS)来说,由于医务工作者日常的工作重心在于收治患者,当临床医师忙于医疗事务,对患者在院内外发生的诊断治疗、药物使用以及患者的结局指标关注和记录不够及时,进而造成这种事务型医疗获得的真实世界数据常常出现许多数据项目的缺失[10]。
1.4 跨场景的医疗健康数据的连贯性和共享性较差 当患者的数据产生于不同的场景时,由于缺乏对接和交互机制,不同场景下的医疗健康数据之间缺少共同的数据定义、结构和交换标准,数据之间的连贯和共享受到了严重的影响[11]。一方面,患者在不同医疗场所下发生的诊疗数据,由于不同医疗机构之间数据缺乏互联互通及个体诊疗数据融合的途径,各医疗单位成了一座座信息孤岛,对患者数据前后的连贯形成了巨大的阻隔[12]。此外,即使是在同一医疗机构,个体医疗数据逐渐趋于立体性,患者在整个医疗过程中涵盖门诊、住院、检查、监护等各个环节,各个环节的医疗健康数据并没有形成连贯的融汇整合方法,难以被临床科研有效利用[13-14]。另一方面,可穿戴设备和互联网技术的普及应用,使得个人生活健康数据和互联网数据获得了极大的增长,但是这些数据并没有和临床医疗数据形成很好的链接,这就导致临床医疗数据与患者的日常生活起居的健康数据处于相对分割的状态,不能被很好整合利用[15-16]。不同场景下的医疗健康数据之间的不连贯,使得临床研究难以获得连续性数据。
1.5 个体健康数据采集的时间范围较短 随着健康观念从“以治病为中心”向“以健康为中心”的转变,对个体生命健康范围的全程化关注可为疾病的预防和康复的研究提供数据支持[17-18]。过去大多数临床研究以一个项目或一次诊疗为核心,重点关注患者在疾病阶段或者项目阶段的健康数据。而当项目或诊疗结束以后,研究者常缺乏对患者的连续追踪和远期随访,造成疾病治疗与后期康复数据的不连续。此外,在患者发病之前,也同样存在着对患者的亚健康和健康的生命健康数据关注不够,无法对个体从健康到疾病的演变全过程规律进行充分的研究。
2 基于真实世界数据的特点构建中医临床信息的采集模式
中医真实世界临床信息采集以人为核心,一是围绕采集对象的数据产生场景,从对象居住的家庭,工作娱乐的地方到数据对象发生诊疗关系的医院,对数据产生的场景进行全覆盖,打通医疗场所和生活场所数据采集的无缝对接。二是在数据采集的角色上,构建医师、研究者、科研助理、科研护士、患者自我报告及医疗设备自主采集等多种角色的采集模式。三是在数据采集的工具上,充分利用现有的诊疗设备、随身穿戴设备、智能家居设备及运动健身设备,扩展真实世界数据采集的工具。四是在时间维度上,整合从健康、亚健康、疾病到终点结局的生命健康周期的数据采集,进而构建出可融入真实世界数据特点的多场景、多角色、全时空的中医临床信息的采集模式。
2.1 扩展数据采集的来源场景 建立多场景化的数据采集,可充分利用健康数据管理软件和物联网技术,打通多场景数据源通道,以患者为核心,有效利用互联网资源及大数据管理,以共享数据链为目标,构建患者“医院-社区-居家”多场景联动的数据连续采集共享模式。当患者在医疗机构进行医疗诊治或救护时,可充分运用移动监测设备和物联网技术采集患者在救护车、门诊、普通病房、重症监护室等不同场景下流转的各项诊疗数据和医疗设备的监护和诊疗数据,并将其关联统一上传至同一数据管理平台[19-20]。对于医疗机构本身来说,可扩展到患者在不同级别的医疗机构的诊疗场景,保证患者数据来源具有代表性。当患者在社区时,可运用物联网和互联网等技术,搭建健康数据管理平台,充分运用平台记录社区内个体的基本资料,包括个人健康档案、家庭档案、年度体检、生活能力评估等信息,方便研究者对患者开展有效的健康数据管理[21]。借助云端平台将患者日常疾病管理评估信息进行上传,以便患者在医院就诊时进行数据共享[22]。当患者居家时,可基于智慧家居物联网系统,在居民授权下,围绕居民的健康管理需求,以人工智能、电子数据和互联网为支撑,为居民提供医养、康复、居家监护等协同一体化的健康数据管理[23-24]。通过智能家居设备记录患者在家庭的饮食情况,如五味偏嗜、饮食情况、胃口等信息,监测日常起居的睡眠情况,如入睡时间、睡眠长度、睡眠深浅等与生命健康相关的数据。在干预、康复、随访、保健等健康服务过程中使患者在家庭也可获得连续性的健康数据监测。
2.2 增加数据采集的角色 从数据采集角色来说,过去主要是医师面对患者的单一维度,这样就造成临床数据采集的类型和质量主要由医师决定,会不可避免地造成采集数据具有一定的片面性,所以扩展信息报告角色对于丰富数据的维度具有十分重要的作用。一是探索设置更多科研助理和科研护士,科研护士可从医嘱执行者的角度协助医师采集数据,可弥补医师采集数据视角的不足,提高数据采集的质量和效率。二是将患者纳入数据采集的角色,可从患者自身角度了解疾病对生理和心理社会性的影响程度以及检验干预方式对其生命质量的影响,体现循证医学所倡导的充分考虑患者自身感受即以人为本的思想。三是将医疗设备、大健康设备纳入数据采集的角色,它们的优势在于没有主观倾向性,采集的数据相对客观,作为人采集数据的重要补充,医疗设备可将患者在医院的检查和治疗后的生命体征数据进行采集,而以穿戴仪器为主的大健康仪器可将患者日常的生理病理指标参数进行有效的记录。总而言之,通过扩展科研助理、科研护士、患者、医疗仪器、大健康仪器等数据采集角色,尽可能多地纳入多源数据,保证数据的丰富性[25]。
2.3 丰富数据采集的工具 近年来穿戴手环仪器、生物传感器等多种数据记录采集仪器的出现为采集多源信息提供了契机。体外穿戴仪器如智能手环、智能眼镜、智能胸带得到了广泛应用[26]。此外,随着医疗技术的发展,医疗植入仪器如脑起搏器、人工心脏等也获得临床的使用。传统医疗检查设备如计算机断层扫描术(Computer Tomography,CT)、磁共振成像、胃肠内窥镜等也早已实现了数据采集和上传的功能。这些设备都可作为临床数据采集扩展的端口。在家庭和社区的场景下,可利用智能手环、智能手表等穿戴仪器对患者的心率、血压、脉律等进行监测,在突发心肌梗死时可及时上传危机数据并预警[27]。而脑机接口、脑起搏器等不仅可以作为诊疗的医疗仪器,还可监测人体平时的脑电波,可作为医疗和健康监测数据采集的两用医疗设备[28-29]。同样,利用人工心脏等医疗植入仪器替代相应脏器功能的同时还可监测体内局部血流、血压及温度等信息,也可作为数据采集的端口[30-31]。此外,通过社区健身房中的运动设备可记录个体的运动强度、体能耐力等健康信息。而在医院场景下,可通过磁共振成像、CT、内窥镜结合计算机设备等在检查的同时进行健康信息的采集和上传。智能手机软件作为数据的上传和采集、存储中转站,也可记录个体的运动、外卖餐饮情况等生活健康相关信息[32]。信息采集端口的多元化大大增加了数据采集的便利性,它不受场合、时间的限制,保证了数据采集的成功率。从信息科学的角度来看,多源头的采集大大增加了信息的冗余性,不同来源的采集端口数据可以相互核对,保证了数据的准确性。
2.4 建立个体健康信息的全生命周期采集 前沿数字技术和智能设备的兴起,为构建从健康到疾病的全生命周期的数据采集提供了技术支撑,在人群健康与疾病之间建立有序数据采集的衔接,可解决现有临床研究采集时段较局限的问题,打通生活健康数据与疾病诊疗数据之间的壁垒,将为更好地研究疾病的发病过程及早期干预提供数据支撑。一方面,从生命个体的健康-疾病状态角度,将个体的健康、亚健康、疾病、终点结局全部纳入数据采集的范畴。在居民授权后,建立居民数字健康档案,在居民健康期,采集健康生理参数,如血压、血脂、血糖、脉象等指标,以此建立人体正常水平的基线值,可用于与疾病病理参数的对照。在亚健康期,采集人体机体的相关指标,以此建立人体的亚健康模型。而在疾病期,采集患者的诊疗信息及疾病证候变化过程。对终点结局的数据记录,将为疾病的发病特点和预后转归的研究提供数据支持。另一方面,从居民个体的健康数据类型来看,统筹纳入体质监测数据(如中医体质类型、身高、体质量等)、健康检测数据(如血压、血糖、脉律等)、饮食生活数据(如五味饮食偏好、吸烟、饮酒、睡眠情况)、基因蛋白组学数据(如基因测序)、诊疗档案数据(疾病诊断、药物使用等)等多种数据,建立生命个体的全方位数据采集。总而言之,基于从健康到疾病的全生命周期的数据采集,可从生命健康信息的时间维度获取全面、全程的个体数据。
3 中医临床信息采集模式的构建可服务于中医多方向的临床研究
中医辨证论治、整体观及个体化诊疗的思维特点决定了中医诊治患者的过程具有较强的动态性。并且患者所处场景不固定,涉及到家庭-社区-医院多种场景的流转,而望闻问切等四诊合参的诊治方式所产生的数据也具有多种多样的类型,这些问题导致现有临床信息采集模式难以满足中医临床研究的需要。而中医真实世界临床信息采集模式的建立,可满足中医真实世界数据采集的需要,服务于中医临床研究多方向的探索。一是服务于疾病发病与发病节气及地域气候之间的关系研究,通过采集患者在不同地域、不同时间的健康数据,探究不同节气和地域因素对疾病证候的影响。二是服务于中医疾病证型转变规律的研究,通过连续采集患者发病前、发病后的治疗及转归的全生命周期数据,可充分阐明疾病证型的演变规律,为中医在疾病不同阶段的干预措施提供理论依据。三是服务于中医药干预措施的临床评价,在其指导下全面采集患者在真实诊疗情况下中医诊断及处方信息,收集中医药干预的有效性及安全性相关信息,可为中医药干预措施的疗效评价及药物经济学效益提供依据。在有效性评价方面,可在评价原有适应证的基础上,进一步明确并优化中药临床用药的最佳剂量和疗程。此外,基于真实世界研究,全面监测药品偶发、迟发、长期合并用药的不良反应,可为药物的安全性评价提供支持[33]。另一方面,中医多维度、全时空的信息采集,也可为患者的健康饮食、健康运动、健康心理、健康睡眠、健康生活方式以及康复的全方位研究提供丰富的数据支撑。
4 小结
本文基于中医临床信息采集中存在的数据的来源场景较局限、数据采集的角色较单一、数据的丰富性和客观性较欠缺、跨场景的医疗健康数据的连贯性和共享性较差、个体健康数据采集的时间范围较短等问题,提出了构建中医临床信息采集模式的对策,主要从扩展数据采集的来源场景、增加数据采集的角色、丰富数据采集的工具、建立个体健康信息的全生命周期采集4个角度详细阐述了构建中医临床信息采集模式的对策,并探讨了利用此模式可服务于中医临床研究的潜在方向,为真实世界研究的数据采集提供了一些方法学参考。
5 讨论
真实世界数据产生的场景广泛及原有采集模式的局限,造成了临床获得的数据分布散乱,数据结构不一致,给数据的管理和应用带来了巨大的障碍。而信息采集是临床数据进入系统的第一阶段,是解决数据管理和应用难题的关键。因此,本团队基于真实世界数据的特点从数据场景、采集角色、采集工具及个体生命周期4个维度构建了中医临床信息的采集模式。它不仅为中医真实世界研究提供工具支持和临床服务,也能通过多维度的信息采集提高临床数据的客观真实性和数据翔实程度,提升现有临床研究的质量。此外,它还能提高后期随访数据采集的便利性,为研究项目结束后的延续性研究提供支持。本团队设计的真实世界临床信息采集模式也面临着一些局限性,首先是仍然过多地依赖主观数据,现有智能工具不能较好地完成所有数据的精准采集,人工采集数据所占比例仍然较大。其次,对现有数据的利用,涉及非结构化到结构化的转换,目前的数据系统还无法完全实现自动转化,未来解决这个问题有赖于标准化和信息化数据的进一步发展。另外,对现有多媒体数据进行优化分析时,在数据转化分析和高维数据压缩的过程中还存在着数据噪声以及数据合并造成信息丢失的问题,未来有赖于数据统计分析方法的发展和信息处理方式的进步。总之,真实世界数据的采集模式若要进一步优化提升,一方面有赖于采集工具的进步,如依赖脑机接口技术和电子皮肤等技术工具的成熟,便于精准收集脑电波、人体体表温度等生理病理的连续数据;另一方面,也有赖于数据标准化和结构化的创新,以便于对不同来源的海量多维度数据进行更好的处理和存储分析。综上所述,中医临床数据采集模式的建立和优化,将给中医真实世界研究提供一个有力的工具支撑。
利益冲突声明:本研究所有作者不涉及相关利益冲突。