大数据技术在医疗领域的发展与应用
2018-09-12宫立恒张晓苟吉祥
宫立恒 张晓 苟吉祥
摘 要 近年“大数据概念”正刮起一阵强劲飓风,大数据在各行各业都有广泛前景,尤其医疗领域这种数据量大,数据种类多,数据来源复杂的状况,更具有得天独厚的优势。本文首先概述基于云计算的医疗大数据技术,然后分析医疗大数据的共享及遇到的挑战,最后综述大数据在医疗领域的相关应用,以期为进一步研究提供参考。
关键词 大数据 医疗 开发 利用
中图分类号:TP311.1 文献标识码:A DOI:10.16400/j.cnki.kjdkx.2018.06.022
Abstract In recent years, the "big data concept" is spurring a strong hurricane. Big data has a wide range of prospects in all walks of life. In particular, this type of data in the medical field has a large amount of data, a variety of data, and a complex data source, which is uniquely advantageous. This article first summarizes the medical big data technology based on cloud computing, and then analyzes the sharing of medical big data and the challenges encountered. Finally, it reviews the related applications of big data in the medical field in order to provide reference for further research.
Keywords big data; medical; development; use
隨着信息科学技术的发展,大数据已成为热点话题。早在1980年,未来学家阿尔文 托夫勒在其代表作《第三次浪潮》中预言大数据的光辉未来。在2011年5月,以云计算著称的EMC公司在“云计算相遇大数据”的年会上抛出大数据的概念。国际顶级学术期刊Nature和Science均出专刊探讨大数据。大数据在医疗领域的作用正受到越来越多的关注。
1 医疗大数据
国际数据公司(International Data Corporation,简称IDC),对大数据如下定义:大数据是一种数据形式,一般会涉及到两种或两种以上。它要收集高速、实时数据流,超过100TB的数据;或者从小数据开始,但是数据每年会增长高于60%。由此可总结出大数据的四大特征:数据规模大;数据种类多;数据要求处理速度快;数据价值密度比较低。[1]
2 基于云计算的医疗大数据开发管理技术
基于云计算的医疗数据挖掘模式是一种分布式并行模式,这种模式采用的是云计算模式,同一个算法可分布在多个节点上,多个算法之间是并行的,多个节点间资源实行按需分配,是解决大量的数据挖掘任务时的行之有效的方法。可采用如下算法:
(1)关联规则。关联规则能够发现医疗数据中隐藏的关联模型。其目的就是在医药数据库中发现能够满足指定的最小支持度和最小可信度的关联规则。在做这项工作的时候,引入了一项搜索约束,从而达到发现在医学上有意义的关联规则的目的。
(2)决策树方法。决策树和流程图的树结构很相似,是一种十分典型的分类方法。先通过对数据的处理,通过归纳算法生成可读的规则和决策树,再用决策对新数据进行分析。常用的决策树算法有:ID3算法、C4.5算法,应用到医药数据处理中。这些算法可以用来处理高维的医药数据,也可以用来处理海量的医疗数据,并且速度也很快。
(3)人工神经网络。人工神经网络是由大量简单处理单元连接而成的自适应动力学系统,可对非线性、不精确的数据进行智能处理,具有并行性,分布式存储,自适应学习等功能。因为人体和疾病具有复杂性、不可预测性的特点,所以在获取数据和信息的分析与决策等方面都存在复杂的非线性联系,这种特点适合应用人工神经网络。
3 大数据的共享
3.1 现状
在医疗领域,大数据还处在起步阶段。数据的采集直接关系到后续的挖掘,因此采集工作至关重要。就目前状况而言,在此阶段遇到的极大挑战,将从两方面进行分析。
首先,从医疗机构角度分析。我国仍有大部分医疗机构对患者病例、资料进行书面记录,有的医疗机构即使推行使用电子病历,但这些医疗机构也没有一套统一的电子病历系统,使得现阶段各医疗机构之间无法进行数据和信息的流通。高质量的电子病例系统是获取优质大数据的根本基础,然而目前医院信息孤岛问题严重,这在很大程度上制约了大数据功能的发挥,长期的数据割裂导致我国医院信息系统共享水平较低。
其次,从生物医学科研角度分析。我国的生物医学研究机构中存储的大量科研数据不会在社会和同行之间公开,因为其自身的利益,各研究机构对自己积累的大量医学科研数据往往会持保守态度,致使在医学科研界无法完全实现数据共享。
3.2 实施中的挑战
(1)医护人员缺乏意识:医疗信息技术运用一般需要外力进行驱使,如刺激计划或监管要求。大部分医生,尤其资历较深、年龄较长者,习惯了传统诊疗的手写记录方法,并且未能意识到这些系统的意义,导致他们疏于学习这些新生事物,因此信息系统上线困难。
(2)信息孤岛普遍存在:大数据用户在医疗领域使用范围很广,比如医院、区域医疗中心、医疗保险公司等,[2]相应的数据资源分散在不同的数据池中,彼此之间并没有太多联系。
(3)标准化难以实施:如果要建立一体化协同的医院集成信息平台,其关键是整合数据,并要降低共享数据的技术门槛。集成难的根本原因之一是缺乏标准,[3]虽然近几年医疗卫生信息标准化工作无论是对方法学的认识还是标准的制定都有所发展,但总体上仍处在学习和模仿阶段,制定的一些标准落地困难。
3.3 建议
在以大数据为焦点的信息化时代,容易出现低水平重复建设这一问题,所以,顶层设计极其重要。在国家层面需大力推进数据信息标准化,为电子病历等信息系统厂商制定法规,并对其实施规范化管理。在保障数据安全和保护个人隐私的前提下,将所有信息通过云计算物联网联系起来,对数据进行数据存储和数据挖掘。并且制定相应政策和措施,建立开放共享的机制,实现生物医学科研机构与医疗机构之间的数据共享,在生物医学科研、国民健康档案与医药信息之间成立大数据平台。同时,建立第三方评价机构,对数据质量控制:建立人才队伍激励机制。
4 大数据在医疗领域的应用
(1)支持临床决策。对于临床中遇到的一些疑难病症,由于缺乏经验,专家会很难做出正确的诊断和治疗。据研究显示,目前国际误诊率达到30%,而我国的临床误诊率已达到27.8%。专家对病情的误诊不仅会带来患者家庭的经济负担,更会加重医患矛盾。然而,大数据在医疗领域的应用,通过临床决策支持系统给出最准确的诊断和最佳治疗方案,将医护人员的诊断经验与大数据的优势高效结合起来。[4]在美国Metropolitan儿科重症病房的研究过程中,临床决策支持系统避免了40%的药品不良反应事件。
(2)研发药品。通过大数据技术分析互联网上的公众疾病药品需求趋势,可以在医药研究开发部门或公司的新药研发阶段,从而对有限的资源进行更有效的配置。一般来说,新药从研发到推向市场的时间为13年,而使用数据分析技术进行预测可以帮助医药研发部门或企业将新药推向市场的时间缩短。
(3)个人健康管理新模式。随着互联网的普及和可穿戴智能产品的广泛应用,健康管理领域已逐渐形成“量化自我运动”与个人健康管理的全新模式。目前,全民健康领域最值得关注与解决的困难是:及时地发现自身健康状况的异常变化以及一些重大疾病,传统的年度体检时间周期长,具有一定的局限性。然而可穿戴智能设备可以及时发现自身身体出现的异常状况,运用大数据技术对设备收集的身体情况与体格指数等数据进行大数据分析,是用户不仅可以对自己的健康风险指数一目了然,而且能接收到相关医疗建议以改善健康状况。同时,设备会根据用户的实际情况进行调整,一旦数据异常,就会加大检测密度,反之会加长检测间隔,随时进行动态调整。[5]
(4)公共卫生监管。大数据挖掘可改善公众健康监控。公共卫生部门通过广泛的数据采集技术,以此对卫生状况进行数字化的整合分析,快速检测出传染病,对疫情全面监测,防止疫情爆发,从而达到降低传染病发病和节约医疗支出的目的。
(5)远程医疗。远程医疗指利用现代通信技术实现对远地对象的医疗服务。传统远程医疗用点对点方式进行,侧重于技术和设备,投入大但是利用率低且不灵活。大数据时代可利用物联网、云计算等来打破点对点的远程医疗束缚,形成基于移动通信及物联网的服务模式,在这种模式下能够发挥个体的作用,决策快,数据全面,灵活性强,关联能力强。
(6)大数据预测医学中的应用。在医学健康领域运用大数据兴起了一项强大技术即预测医学,此技术能同时对患者的健康状况和遗传信息进行深入解析,让医生能跟准确的预测出某些疾病在特定个体上的发生情况,同时预测出患者在一些特定的治疗方式过程中的病理反应。
5 结语
总之,大数据已成为一种新型战略资源,无疑对医疗卫生领域产生巨大影响和推动,它能帮助医生优化治疗方案、削减医院开支。通过数据开放,改变患者在医疗机构的被动位置模式,患者住院期间的医疗信息会直接传送给患者。未来大数据在医疗领域的运用,将会使更多的患者参与到对自己健康的管理中,未来会给人类带来更大的价值。
参考文献
[1] 李红艳,刘蓉.MOOC与大数据技术在大学计算机基础教学中的应用[J].教育现代化,2017.4(10):85-86.
[2] 史紫薇.布局“点”与“面”大数据落地医疗行业[N].中国计算机报,2013-04-15(22).
[3] 数据标准化将是未来医疗大数据融合的基础[J].医学信息学杂志,2013.6:96.
[4] 姜奇平,冯海超,古福.數据业务主营化大趋势[J].互联网周刊,2013(7):26-46.
[5] 邹北骥.大数据分析及其在医疗领域中的应用[J].计算机教育,2014.7:24-29.