云存储在医疗数字化建设中的应用研究
2014-07-27李法军
李法军
(郑州大学第三附属医院,河南 郑州 450052)
云存储在医疗数字化建设中的应用研究
李法军
(郑州大学第三附属医院,河南 郑州 450052)
首先介绍云存储的系统框架,分析医院数字数据的存储需求,提出云存储系统满足医院海量数据存储、异地容灾备份等需求,并且分析了云技术应用于医疗数字数据存储的优势,给出了区域医疗数字化管理的云存储平台,最后指出下一步研究方向为具体的区域医疗私有云存储系统的构建方法。
云存储;数字医疗;海量数据管理;异地备份
1 引言
数字医疗即医疗服务的数字化、网络化、信息化,是指通过计算机科学和现代网络通信技术及数据库技术,为医院所属各部门提供病人信息和管理信息的收集、存储、处理、提取和数据交换,并满足所有授权用户的功能需求[1]。目前国内的很多医院已经建立了功能完善的HIS、PACS、RIS以及LIS等,因此而产生的数据量巨大,并且数量增长速度快。例如,2008年河南省人民医院的门诊系统上线以来,医院每年新增的数据量达到28TB,这些数据来源于医院HIS、PACS、电子病历等系统,随着医院集团化运作后,数据量会更加庞大[2]。为了能够安全高效存储和管理这些数字数据,并且做到容灾备份,大中型医院会持续投入大量资金在软件和硬件的建设中。对于资金不足的小型医院则希望能够用尽量少的费用解决数字数据管理问题。因此,在更高的区域层次建立云存储共享平台能够为各类医院在保证平稳运营的基础上节省存储开支,降低医疗成本。
云存储将网络中海量存储设备通过应用软件集合起来协同工作,形成一个安全的数据存储和访问的系统,满足不同规模企事业单位以及个人的电子文件资料存储、备份、归档等一系列需求。本文通过分析云存储技术和安全方面的特点及其应用案例,探索云存储在医院数字化管理进程中的应用。
2 云存储介绍
云存储不是某个具体的存储设备,而是由网络连接设备、存储设备、服务器、客户端、应用软件和公共网络接口共同组成的存储平台,将网络中大量各种不同类型的存储设备集合起来,共同提供数据存储和业务访问功能,形成一个云状结构存储系统。云状存储系统中的所有设备对使用者来讲都是完全透明的,任何地方的任何一个经过授权的使用者都可以通过一根接入线缆与云存储连接,对云存储进行数据访问。
云存储系统通过统一管理分布松散的存储资源组成一个虚拟的容量超大的存储设备,它侧重于设备的协同工作和数据共享。它虽然对数据进行集中存储,但是并不对用户实行集中管理,强调“需求驱动,按需服务”。总的来说,云存储的特点有:一是超大规模和虚拟化。二是使用简单。三是价格低廉。用户使用云存储服务无前期资本投入,只需要按需支付所购买的服务。
3 医院数字数据的存储需求分析
从数据量上来看,医院的数字数据95%以上是PACS系统产生的影像数据。当前的PACS支持医学图像的全数字获取、转换、解释、存储、传输和查阅。首先,PACS系统的影像图像主要是多媒体文档,并发访问量小,根据不同影像科室的特点,有的文件比较大,例如核磁阵列,有的文件比较小,例如CT等。同时,医疗PACS系统中的数据保存量大,数据量增长速度快,由于病人自身的情况,通常在前几个月医院会频繁调阅病人的医疗影像,后期很少会调阅,但作为临床教学研究的一手资料这些数据都是需要长期保存的,因此,部分数据将作为归档数据,需要安全保存和随时方便的调用,可采用在线、近线、离线的三级存储架构。其次,为了提高病人对医院服务的满意度,长时间的等待调阅图像的时间是无法忍耐的,客户端调用在线图像时对检索速度的要求越来越高,甚至达到秒级,因此,许多医院采用以光纤为主干的存储局域网得到非常高的传输速率。
医院的HIS、LIS等系统要对门诊、收费、医生护士工作站、药房管理、化验检验和办公自动化等系统提供服务,对存储空间的需求并不是很大,但是对存储系统的性能和稳定性有着较高要求。
综上所述,医院内部的数字数据均是由各类计算机系统产生的。从生存周期的角度上看,数字数据自系统产生后经过活跃期最终到达归档期。处于活跃期的数字数据一般包括门诊病人和当前住院病人的电子病历、化验报告以及PACS影像,各类财务数据、各类医嘱、药房出入库记录和办公文件等,对于这类数据提供稳定可靠的存储系统以保证医院的业务连续性。处于归档期的数字数据包括已出院病人各项资料以及往年的各类信息,这类数据占全部数据量的90%以上,是存储资源的主要耗费者,那么可以向云存储SSP支付低廉的费用来保证这些数据的安全可靠存储以及方便调用。
同时还需要说明的是医院归档数据格式一般为各种类型的办公文档和文本、化验检验报告、XML格式的电子病历、各类报表、PACS图像等,相对于能够使用二维表结构来逻辑表达实现的结构化数据而言,这些数据统称为非结构化的数据,而云存储特别适合于大规模非结构化数据的存储。它针对非结构化数据的特点,通过标准协议利用互联网络将存储资源虚拟化管理和整合,结合数据管理技术,为用户提供高效能、高可靠性的在线存储、查询、备份和归档等服务。
4 利用云存储医院数字数据的优势和面临的挑战
4.1 透明的物理层
使用传统的存储方式时,例如目前许多大中型医院选择存储局域网SAN保证各项医疗业务流畅进行,用户的重心放在了解存储设备的型号、容量、设备支持的协议、设备的传输速度等等,同时还需要建立相应的容灾系统和异地备份中心。云存储服务提供商利用云存储管理系统完成资源的统一定位,用户无需关心物理接口层的各种参数、操作以及硬件故障,只需要将所要存储的数字数据交给云存储管理系统,便可将数字数据存放在由云存储管理系统统一调配的存储设备上。因此物理层对于用户而言是透明的。
4.2 支持海量存储和动态扩展
目前大多数医院在面临数字资源越来越庞大这个问题时,常常采用块数据存储方式,支付大量资金购买硬盘扩展已有的存储系统空间,同时中断医疗业务来配置新增存储设备。由于云存储的重点是在利用管理算法来统一管理物理层设备及文件存储系统,因此,允许存储服务器和存储节点同时增加,进行并行扩容。存储空间扩展时不会遇到硬件兼容问题,存储性能随着节点增加而无缝增长。
总之,云存储具有海量存储、高安全、低成本、便于管理利用、易于扩展等诸多优势,发展潜力巨大,是解决医院大规模数字数据存储问题的有效途径。
5 区域医疗数字化管理的云存储平台
5.1 总体规划
用户使用云存储时,可以选择公有云、私有云或混合云。公有云服务是由第三方云存储SSP针对个人用户和企业用户提供网络磁盘、空间租赁、远程备份和容灾服务,用户可以通过互联网访问服务,按需使用,按使用支付费用。私有云是在企业和组织内部搭建的云存储环境,面向内部用户或者外部客户提供存储服务,企业和组织拥有整个存储环境的自主权,并可基于自己的需求改进服务。混合云是把公有云和私有云结合在一起,在需要临时配置存储容量的时候,从公有云上划出一部分容量用作私有云存储,能够保持用户所用的存储是独立的。
因此,在国家区域层面可以由领导部门统一管理指导,使用云存储技术,构建国家级医疗私有云存储平台。就目前各种规模医院已建成的存储系统现状而言,在省级、地/市级区域范围内的医院联合使用云存储的标准和技术建立一个数据存储中心,再通过专门的光纤网络将分布在全国各地数据存储中心连接在一起,每个数据中心除了把活跃期的数字数据存放在本地的网络存储设备中,也同时将归档期的数据存储在“云”中,各中心互相连接,形成全国医疗私有云存储系统。
处于该系统中的某省级或地市级的大中型医院在建设医院内部存储系统时会考虑持续存储需求,购置大容量存储设备,这些设备可以作为在云状磁盘中一份子,这类医院既是云存储的资源提供者,又是资源使用者;对于县级医院或更小的卫生院来说,可以向医疗私有云管理方交纳少量的费用享用存储资源,当然医疗系统也可以有一定的优惠政策让其免费使用。
5.2 医疗云存储系统的数据管理层
云存储系统之所以使用方便、易于扩展,得益于其数据管理层各项技术,包括分布式存储技术、对等网存储技术,例如,目前常用的SAN、IP SAN等,这些技术对物理层存储设备进行组合以及负载平衡,云存储更重要的是数据的组织管理模式。图1给出了数字数据云存储管理模式[4]。
图 1 医院数字资源云存储管理模式
在医疗私有云存储架构平台中的数据管理层提供了数字数据存储的管理策略,这种虚拟化的元数据存储模式使得用户能够快速准确查询和利用海量的数字数据。医疗私有云存储管理系统包括三个层次:一是客户端。客户端能够为客户提供各种应用服务,最主要的是提供医疗私有云存储系统的应用界面,使用户能够方便进入云存储系统。二是元数据服务器。医疗私有云存储系统的元数据服务器管理着整个系统的元数据和医疗数字数据的布局信息,负责整个系统的存储资源分配和网络虚拟磁盘的物理地址和逻辑地址之间的映射。三是存储节点。每个存储节点都是独立的存储设备,负责数字数据的物理存储、备份、迁移和恢复。
6 结语
云存储的出现,将数据存储与备份带入了一个低成本、海量存储的时代,为医疗数字数据的异地备份提供了一个崭新的方式。目前,这一服务尚处在探索和发展阶段,还需要在实践中不断进行检验。我们应当清晰了解、充分掌握各种云存储服务的实质、特征、属性和价值,有选择地将其引入医疗数字数据存储领域,下一步的研究目标是具体的医疗私有云存储系统构建方法。
[1]王纪奎.成就存储专家之路——存储从入门到精通[M].北京:清华大学出版社(北京).2009:152-156.
[2]郭涛.区域医疗更离不开持续数据保护[N].中国计算机报.2011.10.31(A31).
[3]匡胜徽,李勃.云计算体系结构及应用实例分析[J].计算机与数字工程.2010(3):60-63,91.
[4]鲁晓明,冯持.云存储在企业电子文件管理中的应用研究[J].兰台世界.2011(9)340:34.
[5]冯幼乐.分布式文件系统元数据管理技术研究与实现[D].合肥:中国科学技术大学.2010.
R197:TP311
A
1671-0037(2014)07-42-2
李法军(1977.1-)男,硕士研究生,助研,研究方向:档案管理。