APP下载

医疗大数据在心血管疾病中的应用:潜力与挑战

2022-08-08张远林谭思远李远杉徐泽全卢熙徐旭李俊峰唐毅彭建强郑昭芬李艳红

心血管病学进展 2022年7期
关键词:表型医疗保健心血管

张远林 谭思远 李远杉 徐泽全 卢熙 徐旭 李俊峰 唐毅 彭建强 郑昭芬 李艳红

(1.湖南省人民医院信息中心 湖南师范大学附属第一医院,湖南 长沙 410005; 2.湖南师范大学附属第一医院,湖南 长沙 410005; 3.湖南省人民医院心血管内科 湖南省心力衰竭临床医学研究中心 湖南师范大学附属第一医院,湖南 长沙 410005; 4.湖南省人民医院 湖南师范大学附属第一医院,湖南 长沙 410005)

大数据是指需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产,每个人每天都在不断地产生大量的数据。同样越来越多的医疗机构通过电子健康档案、组学、医学影像资料以及可穿戴设备等作为健康和疾病相关的电子记录,从而拥有了自己数字形式的医疗大数据,并进一步将这些记录数据用于医学研究[1]。将医学实践作为证据的基于数据和精准医疗的新时代正在到来。通过对大量数据进行整合分析,识别危险因素与疾病的相关性,并进行风险预测,最终改善疾病的治疗和预后[2-3]。现就医疗大数据的特性及来源、大数据分析的技术、大数据在心血管疾病研究中的优势以及面临的挑战做一综述。

1 医疗大数据的特征及来源

由于技术的进步和医疗记录的数字化,医疗卫生行业正在产生大量的医疗数据[4]。其具有容量大、种类多、获取速度快、来源渠道多和应用价值高等特征。

医疗数据是分散的,具有多种来源,如临床数据、基因数据、智能监测数据和日常数据等[5-6]。表1总结了各种医疗数据分类及具体来源。研究者可通过使用适当的分析工具和技术,综合各种来源的数据,分析健康相关信息,从而协助医疗决策[7-8]。

表1 医疗数据的各种来源

2 大数据分析的技术

传统数据主要依靠数据分析师使用传统技术和数据仓库进行存储、处理和管理。然而,医疗保健领域的大规模数据革命无法使用传统的数据库系统、工具和技术。许多具有高计算能力和存储容量的先进技术已被开发来解决传统系统性能低和难度大的问题,如机器学习、数据挖掘、神经网络、模式识别和神经学习等[9-11]。因此,大数据技术被称为具有高计算能力和分析能力的先进技术,能处理从各种来源收集的大量数据,并从中进行分析。表2展示了大数据分析的技术。

表2 大数据分析的技术

3 大数据的应用框架

与传统数据库系统相比,医疗大数据系统可存储和处理各种各样的医疗数据,无论是结构化、半结构化还是非结构化的数据,比如患者的电子健康档案、实验室数据、临床试验报告和保险数据[5]。通过对这些医疗原始数据进行数据转换,利用大数据分析技术对数据进行分析,从而实现大数据在心血管领域的应用[1,12](见图1)。其应用主要包括以下几个方面。

图1 大数据的应用框架

4 大数据在心血管疾病研究中的优势

大数据分析可通过建立预测模型,识别高危人群,提供个性化的医疗推荐,协助验证药物靶标和发现药物副作用,协助分析及监测疾病流行病学,发现疾病表型数据等方式在心血管疾病应用中发挥巨大作用,最终让医生和患者均能获益。

4.1 建立预测模型和识别高危人群

在医疗卫生系统中,鉴别潜在患病人群或高风险人群的预测模型有助于提高临床医生实施治疗决策的效率[13]。尽管目前大数据分析在人群管理中的应用尚处于起步阶段,但大数据分析在健康医疗领域中已显示出其优越性[14]。例如在电子病历系统中,应用自然语言处理、机器学习和数据挖掘等方法,可寻找潜在心血管疾病的高危人群,并对已诊断有心血管疾病患者的疾病进展进行监控[1,15]。Shameer等[16]基于电子医疗记录的特征选择方法和机器学习构建预测模型并用于预测心力衰竭的发生及辅助心力衰竭的诊断。其对1 068例患者进行了评估,结果表明经过训练和测试的预测模型曲线下面积为0.78,准确度为83.19%。Parkes等[17]检索了1980—1999年的电子数据库并对行植入型心律转复除颤器患者的心电图进行分析,构建了一种可用于协助诊断心律失常发生的应用模型。Evangelou等[18]通过对血压特征(收缩压、舒张压和脉压差)的遗传关联研究,发现了535个新的血压基因位点,这些基因位点不仅为血压调节提供了新的生物学见解,而且还强调了血压和生活方式暴露之间的密切关联,从而可帮助临床医生更好地识别高危人群。

4.2 提供个性化的医疗推荐

心血管疾病中存在诸多疾病种类,不同疾病的临床表现可能相似,而相同疾病的临床表现也可能存在较大的差异。大数据可通过分析各项数据来区别各类疾病之间的异同,进而通过机器学习和自然语言等分析处理工具,实现“表型图谱”的绘制和对患者的个性化分析,根据个人当前的健康状况和病史开发个性化的系统,为其提供精确和个性化的医疗推荐[19-20]。Serial等提出了一种基于大数据分析的健康管理系统,利用大数据模型构建健康信息搜索,同时利用基于传感器的智能信息系统实时远程追踪患者生命体征,当患者生命体征出现异常时发出警报,并根据预测结果提供个性化的治疗方案,从而帮助医生快速获取患者的信息,针对患者制定个性化的治疗方案[21]。

4.3 协助验证药物靶标和发现药物副作用

心血管疾病的预防和治疗需要不断的探索和发现新型药物。在药物发现、基因组药物靶标验证、标志物验证和药物再利用的过程中,电子健康档案的建立发挥越来越重要的作用。识别哪些疾病表型与药物相关的遗传变异有关并系统评估各类药物在未经试验疾病的潜在作用,需从整体的大数据中整合各类疾病及疾病发生机制,并进行大数据分析,从而协助明确各类药物在未经试验疾病的潜在作用或已批准的药物确定新的疾病适应证。例如西地那非和β受体阻滞剂等药物已成功用于治疗新的疾病[22]。托珠单抗是被用于治疗风湿性关节炎的药物,由于白介素-6与心肌梗死之间存在因果关系的发现使其应用于心肌梗死存在可能[23]。

药物临床试验是识别不良反应的第一道防线,但它们在识别罕见不良反应及对多种药物同时使用时的相互作用的能力仍存在一定局限性。利用大数据分析可对药物的罕见不良反应及药物之间的相互作用进行识别及分析。Wang等[24]通过对950万份临床记录以及先前的用药知识和已知的不良反应作为数据来源对药物不良反应进行大数据分析,从而识别可能的药物不良反应。Noor等[25]基于医疗大数据构建数据驱动的医疗决策框架用于识别潜在的药物副作用,通过富集分析确定药物-药物相互作用机制,该医疗决策框架表现出较好的预测能力,其准确度为85.5%。

4.4 协助分析及监测疾病流行病学

大数据分析可对心血管疾病的流行病学进行分析及监测。大数据分析能将医疗数据进行分析并发布公共卫生信息,协助公共卫生管理机构开展活动,提高人群对疾病的防治意识,从而减少心血管疾病的危险因素[26-27]。研究人员利用丹麦人口电子健康登记处的数据,将620万例患者的14.9年登记数据转化为1 171个重要轨迹,发现痛风和慢性阻塞性肺疾病等疾病在许多轨迹的交点上,提示痛风与慢性阻塞性肺疾病可能存在关联[28]。Morley等[29]回顾性分析了1998—2010年英国30岁以上患者的电子健康数据并开发了一种表型算法,对心房颤动的发生进行识别及预测。结果表明,结合多个数据源并整合有关治疗和合并症的信息可显著提高对心房颤动发生的识别准确度,并实现对心房颤动的监测。

4.5 发现疾病表型数据

心血管疾病在发生和发展的过程中会经过多种潜在的病理生理过程,涉及许多不同的表型(如炎症、血栓形成、钙化形成和纤维化等)。大数据分析可对心血管疾病基因型和表型之间的关系进行分析,提高临床医师对心血管疾病的诊治能力[30]。如通过鉴定具有高外显性致病突变的个体(如遗传性肺动脉高压和肥厚型心肌病),可证明基因修饰的存在[31]。Ghiassian等[32]基于HuGE Navigator基因库构建内表型网络模型,利用蛋白质组学数据探索巨噬细胞活化参与炎症过程和反应,并建立了炎症、血栓和纤维化相互作用的亚网络,这些内表型与心血管危险因素相关的差异表达基因密切相关,他们认为通过大数据构建的网络模型研究区域内蛋白质及其相互作用可用于研究特定疾病的分子机制及疾病表型。Roque等[33]借助大数据工具对电子健康档案进行分析,通过文本挖掘丰富现有结构化的患者数据,实现大数据模型对疾病的危险分层并识别和研究疾病并发症。

5 大数据在心血管领域中应用的限制

尽管大数据在心血管疾病中的应用能产生诸多获益,但目前大数据分析在心血管领域中尚未进一步深入,主要聚焦在概念和大数据的潜在作用以及大数据分析工具的应用等方面,同时大数据也存在固有的缺陷,如数据标准化与管理、数据安全、如何与临床整合、专业性及方法学差异等,限制了它的进一步应用[1,34]。

5.1 大数据分析的数据标准化和管理

随着医疗保健行业开始向数据分析逐步发展,数据管理是一个重大挑战。由于大数据分析是基于大量但并不完整的数据源,因此患病人群的抽样误差、无法估计的混杂因素以及治疗选择偏倚都会影响大数据分析工具的应用[35]。在医学领域中,由于缺乏统一的数据标准以及数据源中医学用词的不一致性,可能会妨碍对某些研究问题的有效推断,因此需对数据进行标准化和管理。可通过建立统一标准的国际疾病分类(international classification of diseases,ICD)编码(ICD-9-CM、ICD-9和ICD-10),在同一个人中交叉引用多个数据源会显示不同来源定义的病例的阳性预测值,允许开发和共享表型算法等方法来实现数据标准化与管理[36]。

目前,国际上许多国家建立了全国性的电子健康档案数据标准集[37-38],并且在心血管疾病中的应用有了很多高质量的研究成果,如Nanjo等[39]基于英国的电子健康档案来调查无家可归者心血管疾病的流行率和发病率,发现无家可归的人群比有家室的人群心血管疾病的发病率更高,并且更容易有心血管疾病的危险因素。中国目前心血管大数据建设起点低,数据缺乏标准化和统筹管理,高质量大数据相关心血管研究成果少[40-42]。因此,中国未来若想在心血管大数据上有所突破,建立符合中国国情的心血管大数据标准体系至关重要。

5.2 大数据分析的数据安全

数据安全是医疗保健领域最重要和最具挑战性的任务之一。由于医疗信息涉及到个人隐私和公共信息安全,信息的所有权难以界定,中国一直对信息的公开使用持谨慎态度,需充分考虑患者隐私及意愿、数据安全性以及其他与电子病历相关的法律问题。在医疗领域应用大数据分析,法律和监督管理问题可能成为潜在的障碍,包括患者私人信息的泄露、非法使用患者信息,甚至用这些数据分类患者,有差别地提供医疗服务或医疗资源[43-44]。在大数据时代,医疗保健数据是高度敏感的数据,因此医疗保健数据的隐私问题必须得到认真考虑,必须对其进行保护,防止未经授权的使用,使其无法公开可用,而且还要防止不法者借此进行医疗保健欺诈。因此需在伦理道德及法律法规的监控下使用数据。

5.3 大数据分析的数据与临床实际整合

将大数据分析预测模型与临床实际相整合,是大数据在临床上成功应用的关键。已有的心血管风险预测模型和评分很少应用到常规临床实践中,而且已有模型在改善患者预后方面的作用十分有限。与传统风险模型相比,大数据分析工具的数据规模更大,种类更多,在预测方面更加精确,可借助大数据分析技术将资源整合到临床治疗决策实施中,进而产生临床效用。但由于大数据分析存在重复计算的风险,这种情况下该预测模型的临床实用性可能较差,因此提升大数据分析的临床效能还需开发新型工具[45]。

5.4 专业人员数量匮乏

信息学和大数据库的建立需要较高的信息学专业知识,而大数据分析结果应用于临床则需专业的临床知识进行判断。然而从事临床和卫生保健的专业人员很少接受过信息学、编码、软件开发或其他相关的技能方面的正式培训。加强从事医疗的专业技术人员对信息学的学习可能比较重要,或可通过组建多学科团队从而满足医疗大数据库的建设,包括将医疗人员、基因组学、基础生物学、数学、计算机科学、统计学和工程学等专业人员的整合[46]。

5.5 大数据分析的方法学

在临床治疗过程中,即使经过多重验证,大数据分析工具的表现仍然会有差异,包括数据缺失、预测模型过度匹配、多重比较和出现假阳性的风险等。因此在使用大数据分析工具之前必须进行再验证[47]。

6 总结

通过整合和有效地使用医疗保健领域的大数据分析工具和技术有可能获得巨大收益,如帮助患者在正确的时间作出正确的决定,在降低医疗保健成本的同时改善患者的健康状况,节约临床不必要的花费。医疗保健数据支持研究人员和科学家通过更精确和适当的治疗来加强医疗保健服务。医疗数据还有助于评估健康风险和分析疾病发展趋势,以加强公共卫生监测。还可通过利用这些数据提高对心血管疾病病因和发病机制的理解,从而改善心血管疾病患者的健康和医疗保健。但在充分地发挥这些数据潜力的同时,同样会面对更大的挑战。

猜你喜欢

表型医疗保健心血管
基于电子病历的表型分析方法及应用综述
“心血管权威发布”公众号简介
“心血管权威发布”公众号简介
“心血管权威发布”公众号简介
快速行动并治愈一切:医疗保健是如何演变成消费品的
基于衰老相关分泌表型理论探讨老年慢性阻塞性肺疾病患者衰弱发生机制
COVID-19心血管并发症的研究进展
高通量植物表型平台综述
医疗保健和技术:数字医学的开端
作物表型组学和高通量表型技术最新进展(2020.2.2 Plant Biotechnology Journal)