ISO20000和CMMI融合的生产运维体系研究和应用
2014-02-25何婕
【摘 要】
业界目前只有单独针对项目的CMMI管理平台或单独针对ISO20000的管理平台。某移动通信公司的IT服务支撑部门早期通过了CMMI认证,在近年实施的ISO20000认证咨询项目中,充分结合自身特点,将CMMI运用到生产运维的缺陷改造和新业务开发过程中,使CMMI和ISO20000互相融合,并据此打造了一套高效的综合运维管理平台,实现了业界生产运维、项目研发共同管理方法的突破。
【关键词】
ISO20000 CMMI 生产运维 体系融合
1 ISO20000和CMMI体系介绍
IT服务管理(ITSM)是为企业提供一套对IT系统实行有效管理的方法,主要包含IT系统的规划、研发、实施和运营等。它是一种以流程为导向、以客户为中心的方法,通过整合IT服务与组织业务,提高了组织IT服务提供和服务支持的能力及水平[1]。ISO/IEC20000是一个关于ITSM体系要求的国际标准,它帮助识别和管理IT服务的关键过程,保证提供有效的IT服务满足客户和业务的需求[2]。ISO20000规定了IT组织对客户提供IT服务和支持的全部活动过程,展现了一套完整的ITSM流程,帮助IT组织识别并管理IT服务的关键过程,保证向客户提供高质量的IT服务[3]。
CMMI(Capability Maturity Model Integration,软件能力成熟度模型集成)是美国国防部与卡内基-梅隆大学和美国国防工业协会共同开发和研制的,其目的是帮助软件企业对软件工程过程进行管理,增强开发与改进能力,从而能按时、不超预算地开发出高质量的软件[4]。
2 ISO20000和CMMI 3体系融合的研究
某移动通信公司的IT服务支撑部门在2010年通过了CMMI 3级认证,建立了自己的CMMI项目过程体系,项目质量有明显提升。而在生产维护方面,部门有自己的工单系统,作为IT服务日常支撑的平台。两套系统各自独立运行,没有交集。
2012年,部门决定引入ISO20000体系,打造综合运维管理平台,使部门的IT服务管理能够更上一层,全面提升IT运维效率和服务质量。在生产运维中,事件、问题、变更等核心流程都可以直接应用ISO20000体系的流程框架,但生产运维中还涉及到生产缺陷的修改、新业务的开发、生产流程优化等需要开发改造的问题,如一普通事件出现,经运维人员分析需要修改程序,走开发测试流程,然后再上线。这部分流程在ISO20000体系里并未涉及,怎样打造IT运维中的开发测试流程,使之与ISO20000其它流程无缝融合,是本次系统建设的重点工作。
CMMI体系实际就是为项目研发服务的,而项目管理中的开发测试流程占据了项目的绝大部分生命周期。将CMMI的思想引入生产维护中的开发测试,既能打造先进的开发测试生产流程,又能使ISO20000和CMMI融合,充分利用了部门资源,实现了项目管理、需求管理、测试案例管理、缺陷管理、开发测试任务管理等基于软件开发全生命周期的产品管理,开创了先进的生产运维模式。
ISO20000的核心流程和CMMI各级的过程域如图1所示[5]。本次综合运维管理平台建设保留独立的ISO20000核心流程:事件、问题、变更、配置管理流程。在ISO20000的另一核心流程即发布管理里引入开发测试流程,在开发测试管理流程里融入CMMI 3级斜体字所标识的过程域,实现在一张工单里,从事件提出到问题处理,到项目评估、需求分析、设计、开发、测试,到最后变更上线,完成整个事件的处理。
图1 ISO20000和CMMI 3融合过程域图
3 融合体系的落地应用
3.1 系统整体架构
综合运维管理平台系统架构如图2所示。
(1)数据层:整个系统构架于操作系统、数据库之上,数据的来源主要从关系数据库、CMDB和文件系统取得。
(2)基础服务层:基础服务层提供一系列标准服务,包括权限服务、系统配置、数据备份、用户管理、系统流程异常情况恢复及维护工具等,属于系统管理层面。
(3)功能层:包括ISO20000流程模块、运维管理模块、综合管理模块等。考核管理与质量管理主要为上述这些流程服务,它架构在所有功能模块的下面;报表分析与指标统计从纵向对各个流程的数据进行收集与分析,并最终在表现层进行展现。
(4)展现层:用户个人工作台及用户定制的个性化界面、部门公告、论坛,针对不同用户工作的数据展示和个性化定制、工作提醒(界面、短信)等,作为系统功能具体表现的前台展现层。
3.2 技术架构
(1)开发环境
◆系统模式:B/S、C/S
◆客户端系统:Windows 98/2000/XP操作系统、IE5.5以上浏览器、Office
◆服务器系统:Windows 2003企业版操作系统
◆开发工具和使用的语言:Remedy
Administrator、HTML 4.0、JavaScript
◆组网方式:局域网(LAN)
(2)关键技术
◆使用Remedy工具进行开发
◆Java门户技术
◆Ajax技术
4 核心流程介绍
系统核心流程包括:事件管理、问题管理、变更管理、发布管理、配置管理。
4.1 事件管理
事件管理流程主要包括创建与记录、事件分派、事件处理、事件审核、事件关闭、事件监视六大活动,各活动之间的关系如图3所示。
事件来源主要包括系统自动告警产生、运维人员自己提出以及业务人员提出的申告。事件单的信息项包括影响度、紧急度、优先级、处理时限、处理状态、关闭代码等。其中,优先级由影响度和紧急度决定,处理时限由优先级决定。endprint
4.2 问题管理
问题管理主要处理重复发生的事件或比较深层的问题,主要包括问题登记、问题派单、问题处理、关闭确认、关闭后确认、问题监视六大活动,各活动之间的关系如图4所示。
问题单的信息项包括影响度、重复发生率、优先级、问题来源、处理状态。其中,问题的优先级由影响度和重复发生率决定。
4.3 变更管理
变更管理流程主要包括变更登记、变更派单、变更计划、计划审批、变更实施、变更审核、关闭后确认、变更监视八大活动,各活动之间的关系如图5所示。
变更单的信息项包括紧急度、影响度、优先级、处理状态。其中,变更计划和回退方案是变更的必填内容。
4.4 发布管理
生产运维和开发的融合在发布管理中进行。该流程里融合了开发测试流程,它包括了软件开发除上线外的整个生命周期,由一系列管理活动和开发测试活动组成,包括开发任务的工作量评估、开发、内部测试和验收测试等,直到验收完成预上线,最后的上线活动则由变更流程完成。发布管理流程主要包括发布登记、评估分派、发布评估、评估审核、评估汇总、发布分派、需求分析、版本开发、测试准备、测试验收、预上线、发布监视十二大活动,各活动之间的关系如图6所示。
发布单的信息项包括紧急度、规模、处理状态、发布来源、发布任务类型。一个事件发生从登记到修改代码到上线经历的工单(跟踪矩阵)为:事件单→问题单→评估单→开发测试任务单→验收单→预上线单→上线单。
4.5 配置管理
配置管理流程主要包括配置管理规划、配置项识别、配置项更新三大活动,各活动之间的关系如图7所示。
在事件单、变更单处理完成后,需关联对应的CI项。配置管理员定期对新的CI信息进行识别和收集,更新《配置管理规划方案》。否则,应完成CI记录的创建,并更新属性和状态。配置管理员每半年进行一次配置审计。
4.6 外网辅助模块
除了上述主要流程模块外,系统还包括个人服务台、运维管理、考核管理、综合事务管理、知识库、报表、开发测试管理等辅助模块,有效地支撑整个综合运维平台的日常运作,提升维护效率。
5 结束语
综合运维管理平台提供了对部门日常维护事务的全方位IT服务支持,包括一线监控告警管理、办公维护、投诉申告、业务协调、变更管理等。2012年处理事件、问题、变更18 068个,提供了对缺陷、新业务开发过程全生命周期的支持;处理开发任务1 132项,积累测试案例数达84 062个,减少了开发、维护的沟通协调次数,以及对产品/业务需求理解的歧义,真正实现了高效运维。
参考文献:
[1] IT服务管理[EB/OL]. (2013-04-17). http://baike.baidu.com/view/76356.htm.
[2] ISO20000[EB/OL]. (2011-08-05). http://www.itzl.org/hdwiki/index.php?doc-view-3.html.
[3] ISO20000[EB/OL]. (2013-05-21). http://baike.baidu.com/view/953381.htm.
[4] CMMI[EB/OL]. (2013-03-01). http://baike.baidu.com/view/23524.htm.
[5] CMMI[EB/OL]. (2012-04-07). http://www.baike.com/wiki/CMMI.
作者简介
何婕:工程师,硕士,现任职于中国移动(深圳)有限公司,从事移动漫游清算计费工作,主要研究领域为质量管理。endprint
4.2 问题管理
问题管理主要处理重复发生的事件或比较深层的问题,主要包括问题登记、问题派单、问题处理、关闭确认、关闭后确认、问题监视六大活动,各活动之间的关系如图4所示。
问题单的信息项包括影响度、重复发生率、优先级、问题来源、处理状态。其中,问题的优先级由影响度和重复发生率决定。
4.3 变更管理
变更管理流程主要包括变更登记、变更派单、变更计划、计划审批、变更实施、变更审核、关闭后确认、变更监视八大活动,各活动之间的关系如图5所示。
变更单的信息项包括紧急度、影响度、优先级、处理状态。其中,变更计划和回退方案是变更的必填内容。
4.4 发布管理
生产运维和开发的融合在发布管理中进行。该流程里融合了开发测试流程,它包括了软件开发除上线外的整个生命周期,由一系列管理活动和开发测试活动组成,包括开发任务的工作量评估、开发、内部测试和验收测试等,直到验收完成预上线,最后的上线活动则由变更流程完成。发布管理流程主要包括发布登记、评估分派、发布评估、评估审核、评估汇总、发布分派、需求分析、版本开发、测试准备、测试验收、预上线、发布监视十二大活动,各活动之间的关系如图6所示。
发布单的信息项包括紧急度、规模、处理状态、发布来源、发布任务类型。一个事件发生从登记到修改代码到上线经历的工单(跟踪矩阵)为:事件单→问题单→评估单→开发测试任务单→验收单→预上线单→上线单。
4.5 配置管理
配置管理流程主要包括配置管理规划、配置项识别、配置项更新三大活动,各活动之间的关系如图7所示。
在事件单、变更单处理完成后,需关联对应的CI项。配置管理员定期对新的CI信息进行识别和收集,更新《配置管理规划方案》。否则,应完成CI记录的创建,并更新属性和状态。配置管理员每半年进行一次配置审计。
4.6 外网辅助模块
除了上述主要流程模块外,系统还包括个人服务台、运维管理、考核管理、综合事务管理、知识库、报表、开发测试管理等辅助模块,有效地支撑整个综合运维平台的日常运作,提升维护效率。
5 结束语
综合运维管理平台提供了对部门日常维护事务的全方位IT服务支持,包括一线监控告警管理、办公维护、投诉申告、业务协调、变更管理等。2012年处理事件、问题、变更18 068个,提供了对缺陷、新业务开发过程全生命周期的支持;处理开发任务1 132项,积累测试案例数达84 062个,减少了开发、维护的沟通协调次数,以及对产品/业务需求理解的歧义,真正实现了高效运维。
参考文献:
[1] IT服务管理[EB/OL]. (2013-04-17). http://baike.baidu.com/view/76356.htm.
[2] ISO20000[EB/OL]. (2011-08-05). http://www.itzl.org/hdwiki/index.php?doc-view-3.html.
[3] ISO20000[EB/OL]. (2013-05-21). http://baike.baidu.com/view/953381.htm.
[4] CMMI[EB/OL]. (2013-03-01). http://baike.baidu.com/view/23524.htm.
[5] CMMI[EB/OL]. (2012-04-07). http://www.baike.com/wiki/CMMI.
作者简介
何婕:工程师,硕士,现任职于中国移动(深圳)有限公司,从事移动漫游清算计费工作,主要研究领域为质量管理。endprint
4.2 问题管理
问题管理主要处理重复发生的事件或比较深层的问题,主要包括问题登记、问题派单、问题处理、关闭确认、关闭后确认、问题监视六大活动,各活动之间的关系如图4所示。
问题单的信息项包括影响度、重复发生率、优先级、问题来源、处理状态。其中,问题的优先级由影响度和重复发生率决定。
4.3 变更管理
变更管理流程主要包括变更登记、变更派单、变更计划、计划审批、变更实施、变更审核、关闭后确认、变更监视八大活动,各活动之间的关系如图5所示。
变更单的信息项包括紧急度、影响度、优先级、处理状态。其中,变更计划和回退方案是变更的必填内容。
4.4 发布管理
生产运维和开发的融合在发布管理中进行。该流程里融合了开发测试流程,它包括了软件开发除上线外的整个生命周期,由一系列管理活动和开发测试活动组成,包括开发任务的工作量评估、开发、内部测试和验收测试等,直到验收完成预上线,最后的上线活动则由变更流程完成。发布管理流程主要包括发布登记、评估分派、发布评估、评估审核、评估汇总、发布分派、需求分析、版本开发、测试准备、测试验收、预上线、发布监视十二大活动,各活动之间的关系如图6所示。
发布单的信息项包括紧急度、规模、处理状态、发布来源、发布任务类型。一个事件发生从登记到修改代码到上线经历的工单(跟踪矩阵)为:事件单→问题单→评估单→开发测试任务单→验收单→预上线单→上线单。
4.5 配置管理
配置管理流程主要包括配置管理规划、配置项识别、配置项更新三大活动,各活动之间的关系如图7所示。
在事件单、变更单处理完成后,需关联对应的CI项。配置管理员定期对新的CI信息进行识别和收集,更新《配置管理规划方案》。否则,应完成CI记录的创建,并更新属性和状态。配置管理员每半年进行一次配置审计。
4.6 外网辅助模块
除了上述主要流程模块外,系统还包括个人服务台、运维管理、考核管理、综合事务管理、知识库、报表、开发测试管理等辅助模块,有效地支撑整个综合运维平台的日常运作,提升维护效率。
5 结束语
综合运维管理平台提供了对部门日常维护事务的全方位IT服务支持,包括一线监控告警管理、办公维护、投诉申告、业务协调、变更管理等。2012年处理事件、问题、变更18 068个,提供了对缺陷、新业务开发过程全生命周期的支持;处理开发任务1 132项,积累测试案例数达84 062个,减少了开发、维护的沟通协调次数,以及对产品/业务需求理解的歧义,真正实现了高效运维。
参考文献:
[1] IT服务管理[EB/OL]. (2013-04-17). http://baike.baidu.com/view/76356.htm.
[2] ISO20000[EB/OL]. (2011-08-05). http://www.itzl.org/hdwiki/index.php?doc-view-3.html.
[3] ISO20000[EB/OL]. (2013-05-21). http://baike.baidu.com/view/953381.htm.
[4] CMMI[EB/OL]. (2013-03-01). http://baike.baidu.com/view/23524.htm.
[5] CMMI[EB/OL]. (2012-04-07). http://www.baike.com/wiki/CMMI.
作者简介
何婕:工程师,硕士,现任职于中国移动(深圳)有限公司,从事移动漫游清算计费工作,主要研究领域为质量管理。endprint