APP下载

大数据在医疗卫生领域中的解决方案

2017-06-21曹阳

科技资讯 2017年13期
关键词:医疗卫生解决方案大数据

曹阳

摘 要:计算机信息技术快速的发展及医疗信息数据海量的增长,医疗卫生领域已经真正进入了“大数据时代”。数以万计的数据被保存下来,但一个棘手的问题出现了,如何利用这些海量的数据为我们提供具有价值的信息服务?该文旨在结合处理大数据的方法,分析大数据在医疗信息服务管理方面的应用前景并提出解决相应的问题解决方案。

关键词:医疗卫生 大数据 解决方案

中图分类号:R195 文献标识码:A 文章编号:1672-3791(2017)05(a)-0008-03

近年来,社会正处在一个“大数据时代”,在国家财政部及卫生部门的领导下,大型医疗机构及乡镇医疗服务医院都先后建立了先进的电子档案系统(数字信息系统)传统的看病模式已经发生了改变,过去的纸质病历、诊断书、临床检验报告、影像检验数据等都已经实现了电子化,这些数据也出现了快速增长及快速发展的趋势。但当出现了云计算技术的应用与推广时,各大医疗服务机构中大规模的医疗信息系统与大数据中心相继建立,大量的数据将被保存下来,高效地分析这些数据为我们提供有价值的服务,利用计算模型或者是存储模型来分析这些数据破解医疗卫生上大数据难题,设计一套处理数据系统,并且能够应用于各大医疗服务机构中,已迫在眉睫。

1 资料背景

1.1 大数据概述

随着云计算、物联网、移动互联网等新技术的出现及技术水平的提高,各行各业所累计的数据已经呈现指数级的增长,“大数据”时代已经出现,根据相关机构表明,对于大数据的处理需要一种新的模式和更高的决策能力来进行优化。大数据具有实用性强,商业价值有很大的实用空间等。目前,大数据已在很多的领域得到了广泛的应用。比如:金融、交通、气象、医院、铁路、教育等。

1.2 我国医疗数据资源现状

1.2.1 医疗数据源的多样性

医疗数据的采集已经与过去有了很大的不同,现在所采用的数据不再局限于某一个单一的医疗机构,主要来自于不同的医疗场所,有私人卫生所、实验室检验中心、乡政卫生院。随着物联网(Internet Of Things)新技术的出现,个人的医疗数据可以来自于任何的场所。

1.2.2 医疗数据的高度集中

基于区域的医疗信息系统(RHIS Regional Health Information System)将取代基于传统的医疗信息系统。并且,它的覆盖面更加广泛的分布在一个区域的所有医疗机构中。对一个普通的医疗患者来说,居民个人的数据源将全周期的保存在区域的数据信息中心。医疗信息系统中所有的数据不再是为某一家医疗机构所独享的资源,而是为整个地区的所有医疗机构共享,如果是更加广泛的还可以实现给上级医疗机构或者甚至是区域级、省级、国家级的医疗机构中实现数据的共享与利用。

1.2.3 医疗信息系统到医疗信息服务

医疗信息系统从区域性逐步建立将更加丰富和完善现有的医疗信息系统,同时也更加进一步完善先进的医疗信息系统的设计与开发,使医疗服务变得更加优化与便捷。这些主要体现在:公共卫生事件的预测、慢性病的管理与预测、流行病的控制、临床数据的决策与支撑、个性化的健康与服务、日常卫生的保健等。这些信息服务必须建立在大数据的分析与大数据的集中的基础上。提供的服务也将使社会上所有群众得到收益。

2 医疗卫生大数据分析

2.1 医疗数据是持续的、大增长的海量数据

据有关计算统计表明,在我国一个中等城市(一般以人口为1 000万)来计算,50年所积累的数据将达到10 PB级。并且,当业务系统的不断更新换代与时间的推移,医疗服务所积累的大数据将在数据的完整性与数据的一致性无法得到保证,并且每当有数据模式有更改的情况下,新的数据模式将更加灵活、写入的操作也将更多,对数据的存储能力和数据的扩展也会有新的要求。

2.2 医疗数据是复杂的、大增长的数据

医疗数据是多种数据类型的汇总,数据相互间的关系也非常复杂。例如:一个医疗机构所提供的实验室检查出的数据,必须记录这条数据所在医疗信息系统中所代表的编码值(系统中所对应的编码、检验单位、检测时间、索引号、就诊科室、就诊医生的标识号、检验结果的正常参考值等)通常一条检验将在多个实体之间进行不同层次、不同程度的关联与联系在一起。医疗数据的多样性为各种医疗信息系统所提供服务。提供了多角度度、多层次分析数据的可能性,也为分析这些数据带来了很大的挑战。主要是我们无法做到为每一种数据的信息服务提供一种优化的数据模式,也无法做到列举每一条数据所存在的信息服务,这就要求医生能为医疗数据的存储提供多变的、多维的分析与统计的需求分析。

2.3 医疗数据是广泛的、语义性的数据

为了使数据能够在不同的数据平台上进行应用分析、重用及共享进行多维的框架设计,通常将数据的语义定义为:多台机器(Machines)要能读懂维基百科(Wikipedia),数据的语义包含了数据定义的条目及各条目之间的关系。若数据采用这些条目之间多定义的组织内容,那么机器将能准确的理解这些数据的语义,并且能理解也能翻译出各种语义所包含的知识等,所有语义网络的关键手段就是能如何制作出一本类似百科全书(Ontology)的信息服务。

3 医疗大数据的解决方案

利用大数据来为医疗卫生服务行业提供服务的主要难题时,这些数据所涉及到的数据存储及采用的挖掘技术,如图2所示,通过大量的实验研究与分析,给出了一种利用大数据来解决医疗卫生服务中所存在的难题的基本框架,在这个框架中,所有的医疗卫生机构将患者的个人数据源传送到数据平台上进行数据处理,大数据平台将利用Hadoop技术进行数据存储与数据的挖掘,从而为医疗服务提供技术支持。基于Hadoop生态的信息系统所采用的是构建的云数据中心,用以解决数据的扩展与数据的存储。利用MapReduce能进行数据的批量处理事务能力,从多个数据源(主要是从医疗机构中的各个业务系统中提取所需要的关键数据)将数据的格式进行转换并导入基于HBase的数据存储模型中。在数据的存储模型与设计上,我们将充分借鉴在数据仓库中多维的数据模型设计思想,在数据存储模型的设计上,创建的数据格式是星型模式和数据立方等概念,在考虑数据的应用需求上,利用的是HBase的键值(中行键、列键)。主要因为是HBase的键值具有设计的灵活性和多样性,将多维的医疗数据能有效的结合在一起。在索引的关键技术上,我们将采用成熟的RDBMS技术,用以提高HBase的查询性能。对于数据的更新,HBase特有的多种版本能进行共存同时解决了问题的关键所在。

为了保留医疗数据大量的语义关系,我们所采用的数据结构是结构化的数据+XML文档混合存储方式。在数据导入的同时,将在XML文档中提取特定的数据源((比如:主治医生、患者的索引信息、就诊的科室等),并将XML文档根据不同的粒度分散成大小不一的不同子文档。对于不同的粒度所进行的查询条件,信息系统将自动的选择相对应的子文档进行一一的信息解析,从而避免为了提取少量的信息而进行大量的XML文档的问题。数据存储的接口采用的是用Hive类查询SQL的查詢方式。这样更加有利于数据分析人员进行分析和设计相关的算法。同时也为医疗信息服务系统嵌入的多种数据挖掘技术提供挖掘算法,以方便提供给数据分析师使用。

4 结语

通过以上的设计与分析,要解决医疗云的大数据分析问题,我们必须利用RDBMS和NOSQL的优势,医疗卫生行业所需要的利用相关的大数据技术,将借签国外先进的经验,设计与开发出医疗卫生信息系统,挖掘医疗卫生大数据所存在的价值,创造“大时代”的智慧医疗。采用的数据格式是结构化的和非结构化的混合存储模式,相互弥补设计缺陷,已达到最高的设计原则与最灵活的设计规则。该论文所设计的基于医疗云的大数据平台,也将扩展到其他各行业。特别是应用到如电信、能源、物联网等公共事业等。

参考文献

[1] 孙玉玲.大数据时代数字出版产业的发展趋势[J].出版发行研究,2014(4):5-8.

[2] 王文超,石海明,曾华锋.大数据时代的国家信息安全[J].国防科技,2015(2):1-5.

[3] 肖飞.大数据时代基于物联网和云计算的地质信息化研究[M].吉林大学出版设,2016.

[4] 周枫.大数据时代档案馆的特征及发展策略[J].档案与建设,2016(8):6-9.

猜你喜欢

医疗卫生解决方案大数据
解决方案和折中方案
一种端口故障的解决方案
基于数据仓库的数据倾斜解决方案研究
基层医疗卫生机构绩效管理的对策
国家两部门联合推进居家医疗服务
2016中国大数据·最佳解决方案奖
基于大数据背景下的智慧城市建设研究
浅谈我国医疗卫生资源的短缺