医院信息化的大数据应用进展*
2018-07-12周莲茹焦雄飞
翟 曦 周莲茹 焦雄飞
随着信息技术的发展和普及,结合医院数据特点,医院信息化建设逐渐成为提高医院核心竞争力的关键战略措施。借助云计算技术与大数据来提高医院信息数据处理效率,发挥出数据信息资源优势,完善医院经营管理结构体系,进而促进医院信息化建设,实现医院经营管理水平的提升[1]。对此,医院高层管理者需重视大数据价值,结合医院海量数据特点,应用大数据技术,塑造“智慧医院”,提高医院核心竞争力,为医院谋求更为广阔的发展空间。以往医院信息系统只是技术支撑和运维工具,而未来医院信息系统将成为医院的核心竞争力,医院最终会成为基于数据的医疗服务企业[2]。在这样的环境背景下,探究医院信息化的大数据应用价值具有非常重要的现实意义。
1 国内外医疗大数据的研究
1.1 国际研究与应用状况
近年来,国际上许多国家已纷纷认识到大数据在医院信息化建设中的重要性,并加速其建设。美国是医疗信息化的起源地,早在2007年美国国会通过了《美国食品与药品管理修改法案》(Food and Drug Administration Amendments Act,FDAAA),授权食品药品监督管理局(Food and Drug Administration,FDA)利用医疗信息电子数据库建立药品主动监测系统,该套主动监测系统应用大数据实现了分散数据资源的整合,主动发起药品安全研究,目前在药品监测上取得了极大的成功[3]。在实现部分区域卫生信息共享的基础下,欧盟开始了探索国家层面上共享卫生信息大数据模式的规划,2000年以后,欧盟开始进行战略卫生信息化网络工程,为了共享各医院信息,英国、法国、意大利及德国等国许多公司都参与该项工程,在分布式数据库系统和开放网工程方面已做大量工作。英国国家卫生服务战略的目标是建立每个人的终生电子健康记录,国家的临床医生均可从网上得到患者记录和最佳临床治疗方面的支持;建立一个国家卫生电子图书馆,使医生、护士和其他临床技术人员及时得到最新临床研究成果和实践应用技术[4-5]。
1.2 我国医院基于大数据的信息化建设现状
目前,我国医院信息建设的现状中许多医院都已经建设成了自己的数据信息管理系统,在大数据以及大数据处理技术上的应用也得到较大的发展,尤其表现在对医院的经营管理、物资采购管理等方面取得了较大的进步。但是,在对信息进行管理的过程中,面临着数据数量急剧增长、数据就绪时间在不断增加、数据结构不再单一性和数据储存的方式更加分散的4个方面问题,并且在区域医疗信息共享上仍然没有长足进展,各个医院还在数据孤岛上继续摸索前行[6-7]。
2016年,国务院发布的《“健康中国2030”规划纲要》中明确指出,要大力推进健康医疗大数据的开放共享、深度挖掘和广泛应用。医院信息化建设应参照如健康等级7(health level seven,HL7)等国际医疗界公认的医疗卫生数据编码标准、数据交换标准和其他信息技术标准规范,逐步探索建立统一的医院信息化建设标准和规范体系,实现医疗机构内部以及跨机构、跨区域、跨领域的医疗信息资源共享与利用[8-9]。
2 医院信息数据特点
2.1 数据来源复杂
医院数据具有来源复杂的特点,其数据来源主要有以下方面。
(1)社会化媒体和互联网中产生的数据信息,这些数据信息由于互联网自身特点,使得数据杂而量大,形成庞大的网络数据库,其中蕴藏大量的信息价值,等待挖掘。
(2)传感器网络、智能终端以及实时监控系统所形成的信息,这些信息主要应用在医院内部经营管理中,为各个管理决策提供信息依据,进而提高管理效率。
(3)以医院信息系统(hospital information system,HIS)或电子病历系统为核心的各个医疗系统所组成、所采集的患者临床信息数据,即由这些患者临床信息数据所产生的对于临床诊断,医疗行为的支持,是医院核心数据处理平台,其应用价值汇集成医院核心竞争优势,促进医院的可持续健康发展[10]。
2.2 数据结构多样
纵观医院医疗管理活动中形成的全部数据,其数据结构多样复杂,在进行数据结构分析中应以多维角度进行解析:①医院数据结构可分为结构化、半结构化和非结构化,其中非结构化数据和半结构化数据占总数据的75%~85%;②将医院数据结构分为内部数据和外部数据,兼备医院的公共数据和私密数据的双重属性,外部数据具备公共特征,而内部数据直接关系到医院商业机密与行业标准,具备私密性特点[11];③医院数据结构呈现多维性,除传统纸质文件及信函等内容外,还拥有大量电子信息、音频信息以及网络信息等内容,其数据格式互不兼容而具备随机性,进而给数据应用带来困难。
2.3 数据关系复杂分类困难
医疗数据不仅是来源复杂,其数据之间的关系也十分复杂,例如,一个原发性肝癌患者的医疗信息,可能会涉及到其所就诊的多家医院,会涉及到患者的疾病史、就诊史和服药史以及其他同类病患的相关信息等。医疗数据之间的关系既有横向的对比,又包含纵向的延续医院在提供医疗服务的时候,需要提取相关患者的全部数据,又要按照就诊记录、疾病史等因素进行分类,方能帮助医生实现对患者的全方位救助[12]。
3 医院大数据应用体系结构
3.1 大数据外部构架
医院大数据外部构架针对医院外部数据,将医院公共数据和私密数据有效隔离开,将医院数据处理能力与基础设施资源从内部应用延伸至外部应用,构建基础设施资源软件应用结构,借助虚拟化技术将医院现有设备资源有效整合在一起,结合医疗服务需求开展动态化管理,进而实现医院各项设备资源的合理分配[13]。在医院大数据外部构架中,医院可以结合自身医疗服务需求和内部管理需求结合信息化产品外部资源的运用,做好开发测试工作,并以此调整系统运行模式,包括医学逻辑模型和其管理系统,使得医院医务人员和患者可以根据规则制定自定义资源需求,促进医院信息化建设。
3.2 大数据内部构架
在医院大数据内部构架中,以服务为核心,构建3层服务模式。
(1)SaaS软件服务层。将服务软件统一部署在云端,用户利用互联网获取相应服务程序,便于系统后期维护和管理,同时用户可以结合自身信息需求,以服务类型、时间及价格等节点进行划分,提高医院信息化服务水平,节省医院经营成本,进而提高医院信息化建设的可靠性和经济性[14]。
(2)Paas平台服务层。将开发环境和服务器平台视为一种服务,为用户提供软件应用环境,借助互联网连接医院云端,提高软件开发质量,并对软件运行状态进行实时监控,构建医院管理系统,提高内部管理水平。
(3)IaaS基础服务层。以硬件资源为核心,借助互联网进行服务器部署,提高各个系统的计算能力与数据储存能力,挖掘医院数据的核心价值,为医院医疗技术的提高提供真实有效的信息依据,同时有利于医院日常基础设施的护理工作,降低医院信息化投入成本,进而加快医院信息化建设进程[15]。
3.3 大数据技术实现
(1)建立统一数据的大数据平台。由于医院信息数据的复杂性与结构多样性,各个医疗系统产生了大量的接口,导致了医院在实际的医疗行为中会出现同一数据由于接口原因导致延迟或调用失败等问题。建立统一数据的大数据平台,数据接入层采用分布式日志系统,实现推拉模式的各种主流方式,并可按需升级为统一数据接入平台,不仅支持日志及页面源码数据,还可以实现各类接口数据的无缝可视化接入,如关系型和非关系型数据、各种主流非结构化数据等[16]。
(2)海量数据管理技术。在实际应用中,海量数据管理技术主要应用于医院大规模数据处理中,其安全性需求不高,服务于医院外部数据管理[17]。由于医院在实际经营管理中会产生大量的数据信息,大量数据的管理是医院管理工作中的重要内容,可以生成管理反馈,为医院管理工作各项决策提供信息依据。基于此,凸显出以集中化数据管理模式为核心海量数据管理价值,其高效性和高容错性可以强化系统运行性能,包含数据缓存、索引以及数据分区,使得数据处理工作中服务器集群中实现任务分工,提高了数据管理效率,保证最佳管理效果。
(3)虚拟化技术。在进行医院信息化建设中,虚拟化技术是大数据应用系统的核心技术,可以将各系统中的储存数据资源进行整合和利用,将系统软件应用与低层硬件有效的隔离,既要将各系统收集到的数据资源转化为多个虚拟资源,即为分裂模式,又要将各系统中收集到的数据资源整合为一个虚拟资源,即为聚合模式[18]。在医院大数据应用系统运行中,虚拟化技术要将储存、技术以及网络进行虚拟化处理,将系统中的数据资源进行逻辑抽象与统一标示,协助系统服务运作,进而提高医院大数据应用系统的运行效率和运行质量,实现医院信息化建设。对此,借助虚拟化技术可以有效降低大数据应用系统整体能耗,将各个虚拟计算节点整合成一个物理节点,实现数据资源利用的最大化,促进物理节点的动态漂移和负载平衡,形成可靠的计算机运行环境,提高医院数据处理的综合质量水平。
4 医院大数据平台建设应用方案
海量的数据量增长,多厂商信息系统数据的不一致性,成为目前医疗大数据的主要问题。为了解决目前医疗大数据存在的问题,业界逐渐形成了建设医疗大数据平台的共识,通过医疗大数据平台,将各类医疗数据整合起来。
4.1 建立患者主索引
建立医疗大数据平台的最终目标是无论住院还是门诊,所有相关诊疗信息都能存入数据库伴随患者终身。而建设临床数据库(clinical data repository,CDR)的关键是集成单个患者所有的临床数据,通过建立患者主索引,可将患者在门诊、住院和体检的历史诊疗数据关联起来,自动完成三级索引关系:主索引-就诊索引-单据索引。
通过患者唯一索引标识号,将患者在医院历次门诊、住院和体检的详细信息完整展现出来,内容涵盖临床上的所有治疗信息,包括病案首页、医嘱(处方)、病历记录、辅助检查报告及体检报告等,使医护人员快速高效掌握患者既往诊疗情况,可以为治疗提供参考帮助。CDR后期的数据分析挖掘,也是基于个体连续完整的诊疗信息集之上,因此患者主索引显得尤为重要[19]。
4.2 建立CDR
CDR是指一种临床信息整合与分析系统,能够实时的整合不同临床信息的数据源,为单一患者提供完整的临床信息视图。CDR的建设和应用被认为是电子病历建设的一个新阶段,是目前我国医院信息化发展趋势,也为实现各级卫生部门区域信息共享及分级诊疗的互联互通奠定了基础。
建立CDR的目的是为了将不同厂商或者系统内复杂数据源的数据、异构的数据和非标准的数据通过数据中心进行关联和整合,并涉及到对数据的清洗、关联、标准化、整合及校验等过程。通过CDR的建设,将区域化的所有医疗机构与医疗相关的数据全部整合在一起。在以后的医疗主管部门的查询分析和统计,以及进一步临床或者运营方面的科研分析,均可基于该数据中心的数据进行查询(如图1所示)。
图1 临床数据中心拓扑图
4.3 建立医疗大数据平台
利用互联网+大数据技术,基于临床数据中心,建立医疗大数据平台。医疗大数据平台应用Hadoop技术,对数据进行存储和挖掘。在目前主流的医疗人工智能方面,使用人工智能学习模型进行训练,机器学习的成果可通过医疗大数据平台进行验证和预测。
医疗大数据平台的医疗相关数据来源于CDR,对于其他领域的数据,可以通过CDR平台对接其他的数据中心,使医疗大数据平台拥有最广泛的数据以供数据挖掘和分析[20](如图2所示)。
图2 医疗大数据平台应用场景示图
5 展望
目前,对比发达国家现阶段医疗信息化的进展,我国医疗领域的大数据应用还属于起步阶段,面临的共享壁垒、标准统一等问题,制约着大数据在医疗信息化的发展。在阐述大数据在医院信息化发展中存在的主要问题的同时,提出部分技术实现解决方法。在分析医院大数据应用体系结构后,提出通过分布式储存技术、海量数据管理技术以及虚拟化技术的综合应用,构建医院大数据应用体系。相信在政策推动和信息科学技术不断发展的前提下,未来基于大数据的医疗信息化体系将实现医疗及管理等工作的智能化[21];借助互联网+技术真正颠覆传统的医患行为交互模式,最终促进医院的可持续健康发展,并且在区域医疗体系的完善过程中发挥作用。