医院信息技术运维管理的分析与研究*
2013-09-12刘道践顾风军周渝霞
李 源 刘道践* 顾风军 温 斌 周渝霞
随着医疗卫生体制改革进程的深入,“十二五”规划不断推进医疗卫生信息化进程,各医疗机构大力发展医疗信息系统及卫生信息标准的建设,信息技术(information technology,IT)网络的规模和数量在不断的扩大、增加或更新,运行的管理系统和业务系统也在不断增多。医疗业务越来越多的在信息系统中运行,对各种IT资源的依赖性也越来越强,运维人员将大部分时间花在重复性的工作中,而面对日益庞大的IT资源,其运维管理的重要性及其暴露的问题也凸现出来[1]。
1 医院IT运维现状及问题分析
1.1 运维现状
当前医院普遍运行的医疗系统架构复杂,且众多信息化建设项目从建设期转为运维期,医院业务信息系统的建设又具备整体进展速度加快、覆盖面广、信息量大、安全性、稳定性和可靠性要求极高的特点,对系统运维工作水平和能力提出了更高的要求[2-3]。
1.2 问题分析
(1)IT资源无法集中监控。目前,医院的信息系统及其底层硬件种类繁多,并非一个技术人员能掌握其所有技术,当系统出现问题时值班人员无法兼顾所有信息系统的监控,导致重大故障的突发出现。而安全运维管理的核心目标则是实现对所有安全技术和产品的统一、高效管理,缺少集中的自动预警监控平台是问题的根本[4-5]。
(2)运维流程及指标存在缺陷。医院不断增加的计算机、打印机及网络系统产生的运维压力越来越大,维修人员数量有限,无法同时应对大量的报修,需要适应医院的运维流程高效利用有限的运维资源。而目前基本的运维流程及指标缺乏明确性、可衡量性、可达性、现实性和及时性,影响医疗业务的正常运转,待修科室满意度下降,久而久之产生恶性循环[6]。
(3)IT故障无法跟踪及展示。电话故障报修是目前医院的主要方式,值班人员手工记录的方式无法跟踪故障的解决进度,报修科室也无法了解到信息系统软硬件的状态,导致科室重复电话催问值班员,值班员重复催问维修员,浪费运维资源。
(4)运维知识无法共享。大量的问题及故障处理的方法是经过实践总结出来的,但是未能形成系统的解决方案,知识无法共享及转移,遇到相同故障或问题不能采用标准化解决方案,新的运维人员无法快速入手[7]。为此,应建立事件智能多层分析、建立关联以过滤冗余事件、提炼主要问题信息[8]。
(5)运维质量无法跟踪。缺少运维服务质量的评价体系,运维人员的服务质量、用户反馈及重复维修等缺少跟踪。所有的运维质量评价均集中于负责运维的IT部门,无法区分运维人员的服务质量,逐步造成运维质量下降、改进意识减退及用户满意度下降等现象[9]。
现有的运维管理体系已经难以满足医院未来业务高速发展的要求,信息服务运维管理已经成为医院可持续发展的瓶颈。为改变目前的运维管理局面,从整体上提高网络资源的运行合协性、安全性和资源共享性,必须构建一套全面、科学及规范化的IT运维管理体系[10-11]。
2 基于信息技术基础设施库(information technology infrastructure library,ITIL)的运维管理系统设计
2.1 ITIL简介
图1 运维系统功能框架
ITIL是英国商务部(office government commerce,OGC)20世纪80年代末期发布的一套IT部门的最优实践指南,用来提升政府业务效率,其目的是建立有效的方法来提高IT运维服务质量,同时为企业和客户创造更多的商业价值。ITIL目前的核心流程和模块主要包括:服务战略、服务设计、服务运营和持续改进[12]。
2.2 运维管理系统设计
根据医院的需求,运维管理系统主要包括:集中监控层、运维服务层以及综合展现层3部分,整个功能框架的概要设计如图1所示。
(1)集中监控层。实现对各种信息服务运维有关IT设备和资源的监控,根据医院的业务运转实际情况,监控层重点包括:①机房环境监控,实现对IT机房的区域、机柜与设备位置、通信状态、空调、UPS、安全视频、电力、火警以及气溶胶释放等对象的统一监控报警管理与展现,采用组态方式、中间构件和模块化结构,主界面要求采用3D画面,实现对各类信息流(包括各种实时采集数据、视频流、语音流等)的实时监控和管理;②网络设备监控,网络的连通性和稳定性直接影响所有信息系统的正常运转,网络监控要实现动态搜索整个网络内的所有子网和网段,全面呈现网络的拓扑结构,对网络设备的连接、链路、板卡及端口状态,以及链路连通性和性能指标越界等故障告警,提供事件关联生成器,按照多样性事件关联定制;③服务器监控,服务器是信息系统的核心设备,实时对服务器硬件信息进行展示,对故障进行监控,对所产生的数据进行阈值或信号量告警设置,对主机的状态、网卡状态、进程状态及性能指标越界等相关内容进行监控,一旦发生异常系统会迅速进行报警;④数据库监控,主要包括各重要应用系统中使用的各类数据库,能够监视数据库系统的运行状况和性能情况,支持各种主流数据库,包括Sybase、DB2、Oracle,Informix等数据库;⑤应用系统监控,以重要业务系统为中心,提供系统的拓扑图,显示从服务器到前置到客户端的业务服务视图。当系统资源(如服务器、网络等)发生故障时,能快速定位受影响的业务区域。
对上述IT资源进行监控管理,在目标发生故障或数据超出设定范围时,通过手机短信、电话、监控终端屏幕及报警声等提醒管理员,并通过统一的系统平台接口,将不同医疗系统的软硬件资源进行监控[13]。
(2)运维服务层。实现流程、事件、问题、变更、配置及知识库巡检管理等等功能的管理。充分参考ITIL的理念及标准,同时考虑医院运维实际情况,对ITIL流程、事件及问题等进行调整以满足实际工作的需要。随着用户环境、业务及组织的发展,流程管理等能够快速相应变化,以适应业务逻辑流程的不断变化。管理流程的定制应方便、快速,而且对现有的运行环境不产生任何负面影响。同时,知识库管理是对知识经验的总结、维护和共享,是提高管理员运维技能水平的重要手段,也是将宝贵的经验教训沉淀、固化和积累的重要方式。
(3)综合展现层。通过多块电视屏幕,对信息服务运维相关的数据进行统计分析和综合展现、提交。将所有数据综合到展示平台,实现运维管理人员对IT资源故障报警、运维进度及系统监控等多方面情况进行实时掌握。
3 结语
基于ITIL规范的IT运维管理在中国很多领域已经开始应用,但是在实际应用过程中还存在诸多问题:①中国IT运维管理的行业标准和方法还在探索阶段,缺少大规模用户的使用,许多流程照搬国外模式,并不适用我国一些行业的环境[14-15];②各行各业的运维需求不尽相同,通用的IT运维管理系统软件和解决方案无法满足全部行业的需求,针对IT运维系统的个性化建设还有待进一步完善。对于医院而言,IT运维更加突出实时性的特点,尤其对于大中型医院更为明显,短短数分钟的系统故障,足以造成大量的患者堆积。医院的IT运维管理系统解决的重点,应该以快速实时地监控报警、故障报修及问题处理为主。
本研究设计以ITIL为基础的运维管理系统,同时去除了一些繁琐的步骤,使得医院的运维管理流程变得更加简捷,运维系统操作更加快速。根据ITIL管理标准,结合医院自身特点,对医院整体信息化建设的后期运维进行规划,制定相应的运维管理流程,将医院信息化管理融入到运维系统中,切实解决信息部门在运维管理过程中遇到的问题,减轻运维压力,更加合理的分配运维资源,确保医院信息系统安全稳定的运行。
[1]Forbes Gibb,Steven Buchanan,Shah S.An integrated approach to process and service management[J].International Journal of Information Management,2006(26):44-58.
[2]陈晓红,宁艳文.医院IT运维服务托管模式的探讨[J].信息技术,2012(2):20-26.
[3]陈晓红.ITIL管理标准在医院IT运维服务管理中的实践探讨[J].价值工程,2012,31(6):308-309.
[4]刘海峰,连一峰.基于ITIL的网络安全运营管理体系研究[J].计算机工程与应用,2007,43(9):193-197.
[5]胡小兰,田君鹏,胡立勇.我院医疗设备“运维”管理系统的应用[J].中国医疗设备,2012,27(4):70-71.
[6]Peter Brooks.IT服务管理指标[M].北京:清华大学出版社,2008:36.
[7]郭宝贤,张玲玲.IT系统运维中的知识转移研究[J].科学管理研究,2009,27(1):63-64.
[8]董朝阳,陈珂,葛新.基于CMDB的ITIL决策支持研究[J].机械设计与制造,2011(9):266-268.
[9]沈宏,孙晋,李悦.ITIL理念在数字化服务质量管理平台中的应用[J].煤炭技术,2010,29(9):156-158.
[10]肖革新,张睿,马家奇.中国疾控中心IT运维管理平台设计思路[J].医学信息学杂志,2011,32(8):16-19.
[11]肖革新,周立平,张睿,等.公共卫生数据中心运维服务和管理[J].中国数字医学,2011,6(7):13-15.
[12]Jan van Bon.IT管理框架[M].北京:清华大学出版社,2009:202-203.
[13]沈思,韩普,苏新宁.基于ITIL模型的动态信任管理研究[J].计算机科学,2012,39(5):75-79.
[14]陈锐,魏津瑜.基于ITIL的IT服务管理模型研究[J].情报杂志,2008,27(9):23-26.
[15]吕妍昱,苗峰.基于ITIL标准的计算中心管理初探[J].中国现代教育装备,2007(9):11-12.