基于ITIL的高校校园网运维管理模式的研究
2011-10-20张珂
张珂
(陕西师范大学 网络信息中心,陕西 西安 710062)
基于ITIL的高校校园网运维管理模式的研究
张珂
(陕西师范大学 网络信息中心,陕西 西安 710062)
本文探讨了基于ITIL的校园网运维管理模式,有效地将各种监控系统结合起来,最大效能地发挥各个监控系统的作用,为校园网用户提供优质的服务。
ITIL;服务台;知识库;运维管理
一、高校运维服务的现状
随着高校信息化建设的不断推进,电子邮件、OA(办公自动化)、VPN(虚拟专用网络)、视频点播、人事系统、科研系统、教务系统等等各种各样的应用系统应运而生。用户在使用过程中遇到问题的时候,绝大多数首先想到的是电话求助,而众多的应用系统在网络中心内部由不同的工程师负责。工作流程混乱,出现问题不知道该找谁负责。还有一种情况,一个大型的校园网拥有几十台甚至上百台服务器、上千台交换机,这些设备任何一台出了故障,网络中心都无法第一时间知晓并作出快速响应。
针对以上问题,高校校园网需要寻求一个系统,能够有效地管理好网络中的各个结点以及所有服务器。在网络发生故障时,能够第一时间准确地将信息传达给相关责任人;在设备即将发生故障时能够提前作出预警,而不是被动地等待电话。
目前市场上已经有很多基于SNMP(简单网络管理协议)的网管软件,能够实时监控网络中设备的运行情况,通过短信平台便可以第一时间将网络故障反馈给管理员。但是就如前面所提到的,短信能够发出去,可是发给谁呢?短信如何准确地发送给相应的管理员呢?本文探讨了基于SNMP网络管理平台结合ITIL运维管理理念的一种运维管理模式。
二、ITIL简介
ITIL(IT Infrastructure Library,信息技术基础架构库)是CCTA(英国国家计算机和电信局,现在已经并入英国商务部OGC)于20世纪80年代末开发的一套IT服务管理标准库。 ITIL最初是为提高英国政府部门IT服务质量而开发的,但它很快在英国的各个企业中得到了广泛地应用和认可。目前已经成为业界通用的事实标准,是目前业界普遍采用的一系列IT服务管理的实际标准及最佳实践指南,包含着如何管理IT基础设施的流程描述;它以流程为向导、以客户为中心,通过整合IT服务与企业服务,提高企业的IT服务提供和服务支持的能力和水平。ITIL可以引导组织高效和有效地使用技术,让既有的信息化资源发挥更大的效能。
ITIL的核心模块是“服务管理”,这个模块一共包括了10个流程和一项职能,这些流程和职能又被归结为两大流程组,即“服务提供”流程组和“服务支持”流程组。其中服务支持流程组归纳了与IT管理相关的一项管理职能及5个运营级流程,即事故管理、问题管理、配置管理、变更管理和发布管理,如图1所示。
服务台有时也称帮助台,即通常人们所指呼叫中心或客户服务中心,它不是一个服务管理过程,而是履行服务职能。服务台经常与事件管理紧密结合,用来连接其他的服务管理流程,逐渐被称为一线服务支持的代名词。
事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事故管理的目的是在尽可能最小地影响客户和用户业务的情况下使IT系统恢复到服务级别协议所定义的服务级别。
问题管理是指通过调查和分析IT基础架构的薄弱环节、查明事故产生的潜在原因,并制定解决事故的方案和防止事故再次发生的措施,将由于问题和事故对业务产生的负面影响减小到最低的服务管理流程。与事故管理强调事故恢复的速度不同,问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防止其再次发生的预防措施。
配置管理是识别和确认系统的配置项,记录和报告配置项状态和变更请求,检验配置项的正确性和完整性等活动构成的过程,其目的是提供IT基础架构的逻辑模型,支持其他服务管理流程特别是变更管理和发布管理的运作。
变更管理是指为在最短的中断时间内完成基础架构或服务的任一方面的变更而对其进行控制的服务管理流程。变更管理的目标是确保在变更实施过程中使用标准的方法和步骤,尽快地实施变更,以将由变更所导致的业务中断对业务的影响减小到最低。
发布管理是指对经过测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。发布管理以前又称为软件控制与分发,它由变更管理流程控制。
三、基于ITIL的运维管理
随着高校各种应用的不断增加,各种各样的监控系统平台逐渐搭建起来,如:机房监控、主机监控、应用监控等。面对各种各样的监控系统,技术人员如何面对,如何分工呢?这些监控系统如果和ITIL结合起来,便形成了我们要讨论的基于ITIL的运维管理系统,如图2所示。
ITIL为事件的处理提供了一套标准化的流程,即:事故管理→问题管理→变更管理→发布管理,如图3所示。
每一个问题的出现都会按照标准的流程来处理。如:服务台接到了一个故障申诉电话,或者监控系统捕捉到一个故障事件,服务台接到了故障申诉之后,首先要将其递交给“事故管理”流程,故障处理完成后,问题是否解决了呢?如果解决了,事故管理会将解决方案反馈给服务台,由服务台来将其生成“知识”存放于“知识库”,以便于下次遇到类似的问题时能够快速地找到解决方案。如果问题未得到解决,便进入下一个流程,即“问题管理”,会将这个故障升级成为一个“问题”,下次开会时便会讨论看该如何解决这个故障。如果讨论出了解决办法,便会进入下一个流程即“变更管理”,变更管理需要做出变更处理:解决这个问题是否需要变更,如果不需要则直接反馈给服务台,生成“知识库”,如果需要变更,如:“配置变更”、“设备升级”等,则会产生一个变更的记录,便于日后查询。在“变更管理”中产生的变更,是否需要发布。有些变更需要大家都能够看到,如“配置变更”。如果需要发布,便进入下一个流程“发布变更”,将产生的变更发布出去,这样系统里的每一个技术人员都能看到,从“变更发布”中可以准确地得知 “这台设备于何时,做了哪些变更?”,这样在遇到问题时有助于问题的分析解决。
ITIL流程的每一个环节都有各自的流程,我们重点研究“事故管理”这一环节。如图4所示,为ITIL中“事故管理”流程。
高校网络信息中心人员的构成主要有:主任、副主任、部门负责人、技术工程师、临时工、学生网管等。结合高校的实际运营环境,可以将学生网管定义为一线人员、临时工定义为二线人员、技术工程师定义为三线人员。这样,通过电话,或者监控系统捕捉到的故障事件,由服务台工作人员手动或监控系统自动地放入“请求池”,请求池中的事件所有的一线人员都能够看到,根据各自的分工,各自处理各自的相关故障。如果问题无法得到解决,则将问题升级到“二线”,如果“二线”无法解决则升级到“三线”,如果仍然无法解决,或者超越权限,等待批示,则转入“问题管理”环节。
四、在高校中实施基于ITIL运维管理模式的意义
1.面向用户,服务相对集中
在高校中,各种应用系统五花八门。用户的信息化水平良莠不齐,在使用中遇到的问题也是方方面面。而用户不需要区分这些问题,可将这些问题一次反映给“服务台”,“服务台”为用户提供集中式的服务。这样就避免了找不到负责人的问题,大大提升了服务质量。
2.业务流程规范
对于每一个事件或者故障,“服务台”会进行跟踪记录,将问题提交给“后台处理”,直至问题得以解决。解决问题的整个流程,可复制、跟踪、查询。
3.服务效率较高
“知识库”中保存着以往故障处理的经验和数据。服务台工作人员可以通过查询“知识库”对问题做出准确的判断和处理,大大地提高了服务的效率。另外各个监控系统和ITIL服务台结合起来,能够对各监控系统产生的“事件”第一时间做出反应,而不是被动地等待投诉电话。
4.责任分工明确,工作量考核方便
由于数据库中会记录每次事件处理的整个流程与结果,在每次进行工作量考核的时候,便可以对每个工作人员进行量的考核,进一步刺激了员工的工作积极性。
[1]Service on the Front Line:The IT Help Desk in Higher Education.Online available in http://www.educause.edu/ers0708/1507.
[2]赵春,任友群.“IT服务台”对国内高校IT部门的启示[J].中国教育信息化,2009(1):62-64.
[3]孙永杰.提高IT运维能力实现业务服务管理[J].华南金融电脑,2010(3).
[4]周宇洁.IT运维管理的最佳实践[J].洛阳理工学院学报(自然科学版),2009(2).
(编辑:杨馥红)
TP393.07
A
1673-8454(2011)05-0024-03