医疗大数据在心脑血管疾病中的应用研究∗
2021-11-21
(青岛科技大学 青岛 266061)
1 引言
心脑血管疾病患者伴发症较多,起因复杂,免疫力、耐受力较低,复发几率较高,治疗以控制为主,极难治愈。所以心脑血管疾病一直为慢性病主要研究的对象之一[1]。《中国循环杂志》一篇报告的调研数据表明,当前中国心脑血管疾病患病率及死亡率仍处于上升阶段,且患病率与年龄成正比。截止于2018年,心脑血管患病人数为2.9亿人,其中患者年龄构成中老年人占比约为60%[2]。
将大数据技术应用于医疗领域,给心脑血管疾病的诊疗提供了新的突破契机。伴随生命科学、信息化和大数据的高速发展,医学数据出现了爆炸式增长,为疾病研究、个性化诊疗、医疗卫生统计决策、流行病预警和趋势预测等提供数据支撑[3]。但数据增长过快的同时,出现了数据关联性强、周期性长、隐私性敏感和冗余度大等问题,导致数据计算强度增大。基于传统医疗大数据的分析处理方式将迎来巨大挑战。
医疗大数据是一种对大量数据运用数据挖掘、云计算、人工智能等方式,找寻其中隐藏的、具有应用价值的、解决实际相关问题的技术。数据主要来源于临床试验、医药分析、诊断治疗、健康体检等医疗业务所产生的大量的、模糊的、不规范的、有噪声的、不可预测的数据。其中以心脑血管疾病的诊疗为目的产生的数据,为心脑血管疾病大数据。
文章分析了医疗大数据的相关概念,总结心脑血管疾病大数据所具有的特征。阐述了目前心脑血管疾病大数据的应用方向,分析并提出其研究所面临的问题和展望。
2 心脑血管疾病大数据特征
通过采集心脑血管疾病大数据发现,除具有一般大数据的5V特征外(Volume、Variety、Velocity、Value、Veracity)[4~5],还具有关联性强、周期性长、隐私性敏感的特征。
关联性:心脑血管疾病具有“发病率高、致残率高、死亡率高、复发率高、并发症多”的特点[6]。患者体内的醇类和脂类物质无法正常代谢,导致沉淀累积并引发血管、血压、血液发生异常。通过心脑血管疾病大数据分析,症状之间具有显著的关联规则。如麻木、虚弱、肢体感觉障碍等症状,主要与脑血管疾病相关;阵发性呼吸困难、心悸、胸闷等症状,主要与心血管疾病相关。心脑血管疾病大数据的关联性为解决疾病研究提供了方法依据。
周期性:心脑血管疾病是一种复发性强的慢性疾病,需要患者长期按规律检查。伴随检查所生成的数据是一组时间序列,数据指标随治疗情况的走势进行变化,具有一定的周期性。在治疗过程中,患者不同病症时期所产生的数据信息,对后续治疗手段的选择有一定的影响。因治疗时间长,出现未知事件概率也就越大,如若导致数据的重采集,则会进一步拉长治疗周期。
隐私性:心脑血管疾病患者在进行多次医疗检测时,期间所涉及的数据都为患者的个人隐私,尤其部分数据是涉及个人生活、安全、财产信息的敏感数据。Latanya Sweeney教授指出,通过邮编、出生日期、性别而确定一个人的概率为87%,具有严重数据泄露危险[7]。数据泄露状态下,患者数据会在未授权和不知情的情况下被重复、全面甚至卖给第三方利用,患者对自己隐私的掌控权利大大减弱[8]。在确保数据处理质量的同时,也会对隐私安全策略的构建造成一定的影响[9]。可见,患者隐私安全问题,为心脑血管疾病大数据应用所具有的独特问题做铺垫。
综上,心脑血管疾病大数据所呈现出的特征,与疾病的诊疗模式具有一定的因果关系。把握心脑血管疾病大数据具体特征,有利于其在心脑血管疾病方面的研究与应用。
3 心脑血管疾病大数据研究进展
医疗大数据被广泛地应用在心脑血管疾病的研究中,从医疗数据存储系统中提取患者的诊断、检查、检验、体征等信息进行分析,对患者、医师、科研人员都具有极大的帮助。心脑血管疾病大数据蕴藏大量有价值的信息,可应用在如下几个方面中。
3.1 心脑血管疾病药物作用分析
心脑血管疾病大数据的一个重要应用是进行药物作用分析,根据疾病具体症状,科学选择用药。古人云“是药三分毒”,如何高效用药,避免药物不良反应,是医疗过程中需要着重对待的问题。据文献统计,门诊病人药物不良反应的发生率为0.3%~0.5%,而住院患者达10%~20%[10]。尤其目前治疗的主要方案是依靠药物控制病情,进行患者用药情况数据分析,对促进药物效果的改进,保障医疗用药安全有重大意义。
冯变玲等利用患者用药后出现不良反应案例数据,得出心脑血管疾病常用药物不良反应症状,为使用此类药物患者提供用药安全分析[11];除此之外,McDowell SE等通过心脑血管药物应用文献数据分析得出,不良反应与不同种族人群具有一定的关联,为药物的适用人群提供了风险分析[12]。
3.2 心脑血管疾病关联分析应用
心脑血管疾病患者并发症多,症状与疾病之间存在一定的关联规则,导致研究人员多采用关联分析法进行分析。找寻数据之间存在的关联关系,可以为患者的诊疗和防治带来便利。分析数据之间的异常值,确定相关病症诱发因子,做好病理关系分析,为心脑血管疾病的诊疗手段提供重要数据参考。
宁峰等通过对青岛市常住居民血糖检测数据进行分析,发现糖尿病患者会增加患冠心病和脑卒中的死亡风险[13];张艳芳等通过内蒙古常驻居民身体状况数据,阐述了代谢综合征与心脑血管疾病及死亡的关联性[14];除使用患者症状数据之外,胡媛通过对基因数据进行关联分析,发现缺血性心脑血管疾病的发生与MTHFR基因多态性有着密切的联系[15]。
3.3 心脑血管疾病风险预警
医疗大数据对心脑血管疾病的研究具有前瞻性。不仅局限于诊疗过程中的应用,对疾病防备策略的制定同样有帮助。李吉庆等通过大量人群数据进行构建风险预测模型,实现高准确度的心脑血管疾病风险预测,达到疾病的早期干预目的[16]。陈金宏在博士论文中分析,利用心脑血管疾病大数据搭建人工神经网络,对心脑血管疾病预测构建模型,为精准医疗的实现提供了参考依据[17]。
由此可得,医疗大数据可以更深层次地研究心脑血管疾病潜在的问题,Vcelak提出将原始和挖掘的数据提供给医生[18],可在临床决策、辅助诊断、风险预测等方面提供全面的数据支持。
4 心脑血管疾病大数据面临的问题和挑战
医疗大数据已经广泛应用在心脑血管疾病的诊治过程中,对病症指导提供有价值的信息。但是要更广泛高效地开发大数据,还需要面临诸多的挑战及问题。
4.1 数据周期长
周期问题为心脑血管疾病大数据的采集带来了长期的挑战。心脑血管疾病大数据所具有的周期性长的特征,致使数据的收集需要投入更多的时间和精力。为进行一项数据收集,需要持久保持与数据源交流。导致在保证数据低失访率的同时,还要维持数据的基础量级,就需要提升医疗成本。
4.2 数据难共享
共享问题给数据的存储方式带来关键的挑战。心脑血管疾病的治疗周期长、易复发。若造成患者转诊情况的发生,将导致数据失访,降低数据质量。因隐私安全问题,目前医疗机构之间无法实现数据共享。共享问题的存在容易造成数据孤岛,数据分散存储无法进行高质量分析,也就无法获取高价值信息。
4.3 数据分析
分析问题给心脑血管疾病大数据带来核心的挑战。心脑血管疾病大数据具有极强的关联性,导致在进行数据分析时需要进行关联计算。同时数据中存在较多的冗余数据,数据量大,计算时间长,很难实现实时计算。数据量的增长速度要快于数据分析技术的更新速度,需要科研人员进一步研究分析策略。
4.4 数据隐私安全
保障数据隐私安全是心脑血管疾病大数据应用的基础挑战。心脑血管疾病的“四高一多”特点,会促使患者数据被频繁采集,因目前安全系统未达到绝对安全,对数据的操控依然含有人工元素的参与,存在数据的隐私泄露、非法交易等隐患。
5 结语
心脑血管疾病大数据的特征分析,为其应用奠定了基础。大数据技术的发展,给心脑血管疾病的突破带来了新的机遇。但是迎来机遇的同时,还需要面对诸多的挑战,尤其是目前国内医疗大数据的应用研究水平与西方国家相比,仍有较大的差距。国内大数据发展所面临的问题,使得应用发展存在很多限制,无法进行更具有价值的医学研究。为此需要科研人员进一步完成问题攻关,实现医疗大数据的高效应用。