浅谈ITIL在ROO石油公司的应用
2017-04-05尹鹏
尹 鹏
(中国石油中东公司 鲁迈拉项目部 IT部)
信息化应用
浅谈ITIL在ROO石油公司的应用
尹 鹏
(中国石油中东公司 鲁迈拉项目部 IT部)
目前,IT技术正在迅速改变石油企业传统的管理和运营模式。2009年, BP、中石油与伊拉克南方石油公司(SOC)及销售公司SOMO共同组建联合作业体Rumalia Operating Organization (以下简称:ROO)进行鲁迈拉油田的开发生产。管理上,ROO各部门沿用BP的管理模式。本文结合五年来在鲁迈拉油田工作的亲身经历与感受,就BP在ITIL在ROO石油公司应用的一些经验与做法进行了总结,希望BP的管理经验能够对国内油企在信息化建设与如何提升IT服务管理水平等方向提供些许参考与借鉴。
BP; IT;ITIL;管理流程;服务
1 前言
鲁迈拉油田位于伊拉克南部城市巴士拉以西50公里,是伊拉克储量第一,世界储量第六的巨型油田。截止2016年底,鲁迈拉油田原油日产突破150万桶,占伊拉克国家原油产量的60%,是伊拉克国家经济的重要支柱。
ROO成立前期,受伊拉克战争影响,巴士拉地区局势仍极不稳定,油田生产尚未大规模展开,ROO维持低产量运行,公司业务对IT服务的需求也相对较少。2011年,随着当地安保形势的好转及ROO总部营地的建成,大批外籍雇员开始到鲁迈拉现场工作。人员的急剧增加要求IT部门尽快提供现场工作所需的各种IT服务。自2011年下半年起,ROO进入了IT建设的高峰期。
随着IT服务逐项交付使用及ROO员工的飞速增加,IT部门开始面对新的挑战:IT服务需求爆炸式增长,常有用户的IT需求被遗忘,造成用户满意度下降、IT与用户部门关系紧张;技术故障重复发生;IT的运维作业干扰了用户的正常使用;Internet频繁中断;用户数据文件损坏,无法修复等。
如何提升IT服务管理水平,提高用户满意度,使IT服务对公司业务的平稳高效运行提供更好的技术保障?这是当时摆在IT部门面前的新问题。在BP的倡导下,ROO IT开始采用BP全球统一推广使用的ITIL作为IT服务管理的参考依据。
ITIL,信息技术基础架构库,Information Technology Infrastructure Library(ITIL)的简称,是由英国政府部门CCTA(后并入英国政府商务办公室)在上世纪80年代整理发布的系列IT服务管理流程、程序、清单集。ITIL旨在为企业的IT服务管理提供了一个客观、严谨、可量化的标准和规范,企业的IT部门和最终用户可以根据自己的能力和需求定义自己所要求的不同服务水平,参考ITIL来规划和制定其IT基础架构及服务管理,从而确保IT服务管理能为企业的业务运营提供更好的支持。对企业来说,实施ITIL的最大意义在于把IT与业务紧密地结合起来,让企业的IT投资回报最大化。
ITIL自出现以来在欧美发达国家的企业、组织和政府部门得到了广泛推广,尤其在大型企业和组织中得到了深度应用。BP的IT服务管理流程便是将ITIL与公司实际业务相结合的产物,并且在BP总部及所有项目统一作为IT部门服务管理的主要参考依据进行推广。除BP外,壳牌、埃克森美孚等西方石油公司的IT服务管理流程也多源于ITIL。
ITIL归纳总结了IT服务管理的5个生命周期及26个管理流程。简而言之,ITIL将宏观的IT服务管理体系分解成服务战略、服务设计、服务转换、服务运营和服务的持续改进五个生命周期,并就每个生命周期中涉及的IT服务,进一步细化为服务台管理、事件管理、变更管理等26个具体的业务管理流程。每个流程都是ITIL基于IT业界的最佳管理实践进行的总结与提炼,对企业在IT服务管理方面具有极高的参考价值。
以下就以BP在ROO IT服务管理中四个具有代表性的管理流程为例,介绍BP的具体做法及其对国内油企在提高IT服务管理方面的借鉴意义。
2 管理(Helpdesk或Service Desk)流程
2.1服务台 管理
服务台是一个企业IT部门和用户之间的单一联系点。服务台的主要目标是协调用户和IT部门之间的联系,为IT服务运作提供支持,从而提高客户的满意度。也就是说:服务台是存在于IT部门技术人员与用户之间的桥梁。
BP很重视服务台在其IT部门中的作用。在ROO,服务台作为IT部下属的一个独立部门,直接向IT部门经理负责。服务台的工单完成率也是BP IT的一项重要KPI(key performance indicators,关键绩效指标)指标。
BP的服务台管理主要包括以下三方面内容:一级技术支持、用户沟通、工单管理。
2.1.1一级技术支持
BP的IT技术支持共分三级管理:
(1)一级技术支持:由服务台完成,主要针对简单用户需求及问题提供技术支持。例如:用户账号创建、密码服务、软件安装、打印机故障等。理想的服务台可以解决70%以上的用户需求。
(2)二级技术支持:对超出服务台能力之外的用户需求,服务台可通过工单系统将需求分派给二级技术支持。二级技术支持资源包括IT部门的各技术组,如:网络组、服务器组、应用系统组、通讯组等。各技术组的工作范围分别针对IT服务的某一领域,提供较服务台更为全面和深入的技术支持。一、二级技术支持理论上可解决企业95%以上的用户需求。
(3)三级技术支持:BP的三级技术支持一般由系统制造原厂商、服务提供商、专业技术咨询机构等组成。例如:思科的付费技术支持服务、摩托罗拉远程支持中心等。三级技术支持提供远程支持、咨询等服务,并通过二级技术支持在现场负责解决问题。
ROO IT服务台目前一级技术支持用户IT需求完成率已达78%,并在2013年获得BP全球最佳服务台荣誉。
2.1.2用户沟通
用户沟通是服务台管理的又一项重要内容。当一项IT服务投入运行后,IT技术人员对服务的任何变动都可能会对最终用户的使用产生影响,从而影响到用户体验。通过计划、提前、及时、跟进的用户沟通,提前告知用户可能受到的影响,可以增进理解,消除误会,提高用户满意度。
BP的用户沟通主要是通过电子邮件形式来完成,沟通类型主要包括计划变更通知(变更管理流程)和突发事件通知(事件管理流程)两种:
(1)计划变更通知:计划变更通知是指对IT部门计划内的对IT服务会产生干扰的工作提前通知受影响的用户群以便用户提前安排工作,避免干扰。IT人员在通知的时间窗口内完成工作。此类通知一般提前三天提醒用户注意,在工作完成后不再对用户更新。
(2)突发事件通知:突发事件通知是指对IT服务的突发故障,服务台会在第一时间通知受影响的用户群,告知用户发生了什么、对用户造成的影响、用户需要采取的措施等等。通知的同时,IT技术人员尽快排除故障、恢复服务。此类通知会随时更新用户事件的进展,直至故障排除。
通过快速、高效的用户沟通,排除了因沟通问题带来的误解与困扰,使用户时刻掌握事态进展,提升了用户满意度,也缓和了因服务中断造成的用户部门与IT部门的紧张。
2.1.3工单(Ticket)管理
在小型企业或组织中,IT人员少,用户有需求时可以直接联系IT人员解决问题。但当企业或组织变得庞大,为确保大量的用户需求都能被IT部门登记、跟进、处理、解决而不被遗漏,此时便需要IT工单系统。
工单对应着用户提交的每一个IT服务需求。工单管理旨在确保用户提交每一个服务需求均能得到及时妥善的处理直至关闭。基于工单系统的工单管理是服务台的第三个重要职责。
在ROO,BP采用的工单系统LanDesk是严格基于ITIL服务台管理流程开发的IT服务工单管理系统。当用户需求被提交时,以下信息将被登记:①工单号(唯一、系统自动生成);②用户信息;③需求描述;④工单分配信息;④工单状态⑤附件。
工单生成后如服务台团队可以解决,则如“一级技术支持”部分描述的那样,由服务台直接提供服务;否则由服务台按照需求分类的不同在系统中将任务分派给二级技术支持。IT的各技术支持组通过工单系统获取、处理、完成用户需求。同时,用户也可通过工单系统获知需求的完成进度,从而很好地实现了IT部门和最终用户间的良好沟通。
此外,工单系统还具有强大的报表功能,可以统计工单的完成情况、各技术组的工单负载情况、服务水平协议(SLA)的执行情况等,给IT部门运维和管理提供重要的参数依据。
2.2事件(Incident)管理
IT服务管理中的事件是指非计划内的对IT服务水平和质量的影响。事件管理流程负责鉴别、分析、解决事件并监督整个处理过程直至事件的解决和关闭。事件管理的目标是在不影响业务的情况下,尽可能快速恢复服务,从而保证最佳的效率和服务的可持续性。
BP的事件管理流程按事件重要程度的不同而有不同的处理方式。按照事件影响范围的大小、对公司业务影响的轻重、紧急程度的不同,ROO IT将事件由重到轻分为P(Priority,重要性)1-P4四种级别。
P1、P2事件:是指影响范围广(如:P1-整个油田;P2-整个南部或北部地区)、对公司业务影响较大且相对紧急的事件,由事件管理团队负责跟进处理。事件管理团队由各技术组组长构成,其主要职责是在事件发生后采取紧急响应,根据事件重要性的不同,采取不同策略应对处理直至事件解决。
P3、P4事件:是指影响范围相对较小、对业务影响不大、紧急程度不高的事件,此类事件可通过服务台的工单系统进行管理。
通过事件管理流程,确保每次事件发生后都有跟踪,事件原因都能得到充分分析并对潜在的隐患问题进行处理,避免类似事件的再次发生。同时,事后的归档总结可为今后类似事件的再次发生提供参考依据,减少同类事件的重发率,进而提升IT服务的整体水平。
作为预防性措施,BP在ROO的事件管理中还按照鲁迈拉的现状进行了扩展,增加了安全例检、风险登记和故障登记三个流程。这三种管理形式,有效降低了隐患、故障发生的几率。作为事件管理在ROO的一种新的尝试,在实际应用中证实了其管理价值。
2.3变更管理
变更管理是ITIL服务管理中极为重要的一个环节,贯穿整个服务转换过程。成功的变更管理就是优化风险;减少影响和破坏程度,其目的是用标准化的方法和程序有效快速处理变更。
IT部门对已投产交付服务的任何变更都存在着对最终用户的影响和使现有服务中断的风险。但出于IT日常运维的需要,变更是IT部门极为常见的一种工作。只有将变更合理有效地管理好,才能将因变更而对服务和用户造成的潜在影响降到最低。
BP的变更管理完全沿用ITIL标准。当IT人员要对现有运行的系统进行变更操作时,需先提交变更申请(Request For Change,简称RFC)。RFC的内容包括:变更描述、变更类别、执行人、执行时间窗口、执行计划、回滚计划、测试计划、资源需求、对数据中心的影响、对用户的影响、是否需要用户通知等信息。ROO IT每周召开变更咨询委员会(Change Advisory Board,简称CAB)会议两次,讨论所有提交的变更申请。CAB由IT部门的各技术组组长组成,各组分别就提交的变更是否与其分管业务及负责的服务存在冲突、从各自专业角度出发是否预见变更中可能存在的风险、是否与本组其他变更存在冲突等方面综合评估,只有CAB成员全体通过,变更中所有潜在的风险均被充分评估后,变更才可执行。变更管理流程确保每个变更在实施前计划详细周到,将变更可能带来的风险和影响降到最低。变更要在CAB批准的RFC规定的时间窗口之内完成,且执行步骤严格按照RFC的执行计划,如果变更失败,则必须按照RFC的回滚计划将服务还原。
按照ITIL的定义,BP的变更管理类型分为标准变更、普通变更和紧急变更三种:
(1)标准变更。标准变更是指周期性发生、执行程序不变、风险较低的IT日常变更操作。对标准变更,RFC只需提交一次,无需每次报批。标准变更在BP的IT变更管理中又称正常营业(Business As Usual,简称BAU)。
(2)普通变更。一般的变更都属于普通变更,普通变更多指一次性需求,不具有重复性。上述变更管理流程描述的就是普通变更管理。
(3)紧急变更。紧急变更是指针对突发事件而采取紧急措施,无法等到常规CAB会议批准而必须立刻执行的变更。紧急变更程序与普通变更类似,只是在RFC中的变更类型处选择紧急变更,并由轮值CAB主席批准即可。
变更常与服务台的用户沟通流程同时使用,确保及时通知用户IT变更对其可能产生的影响。
变更管理流程的采用大大降低了因对变更过程考虑不周、变更不当引起的服务中断和延缓时间,是IT服务管理中极为重要的管理手段。
变更管理的目的绝非要将IT管理复杂化,也并非所有IT工作均需纳入变更管理流程。只有对已交付运行的IT服务和运行中的生产系统可能产生影响或存在潜在风险的操作才属于变更管理流程处理的范围。对尚未交付,与生产系统隔绝的操作,如:未交付的且与生产系统分离的新系统、新项目,对其变更操作就无需执行变更管理。
3 实施效果
ITIL在ROO的引入至今已有近七年时间。七年间,ITIL对ROO IT服务管理水平的提升带来的巨大变化。据统计,ITIL的投用使ROO IT部门的平均运维效率提高25%-30%,事故重发率由30%降至4%,因不当变更引起的延误时间减少73%。此外,ITIL对国内油企在提升IT服务管理水平方面也有一定的借鉴意义。
(1)提升企业整体的IT服务管理水平。确保IT流程支撑业务流程,整体上提高了业务运营的质量;通过事故管理流程、变更管理流程和服务台等提供了更可靠的业务支持;客户对IT有更合理的期望,并更加清楚为达到这些期望他们所需要付出的成本;提高了客户和业务人员的生产率;提供更加及时有效的业务持续性服务;客户和IT服务提供者之间建立更加融洽的工作关系;提高了客户满意度。
(2)提供一种国际化的标准IT服务管理语言,促进中石油的IT队伍与国际接轨。ITIL目前已成为西方石油公司IT服务管理的通用语言。正如英语是国际合作中的通用工作语言一样,IT服务管理同样需要一个国际标准,而中石油走出去的国际战略,势必要求我们自己的队伍尽快掌握专业化的行业语言,ITIL所提供的正是在IT服务管理方面的国际化语言。对ITIL的了解与掌握,可以更快促进中方队伍与他国同行尤其是以西方石油公司同行的同步,促进中石油IT队伍与国际接轨。
(3)提供统一、完整的IT管理与信息化建设思路。管理方法的多样对于一个小型企业或组织来说是可行的,但对大型企业来说,管理方法的多样势必造成管理的混乱和管理成本的增加。以中石油的海外业务来说,地区公司、各海外项目的IT服务管理如果各行其道,势必造成管理指令上传下达的不统一,且在人员项目间轮换时因管理方式的不同,员工每到一个项目便需要重新学习熟悉,造成管理成本的无谓增加。