APP下载

构建市级集约化网络监控维护体系

2013-02-28谢泽奇

电信科学 2013年2期
关键词:河源工单网管

谢泽奇

(中国电信股份有限公司河源分公司 河源 517000)

1 引言

中国电信股份有限公司河源分公司(以下简称河源电信)网络监控维护中心(以下简称市NOC)负责全市传输、交换、数据、移动等全专业网络实时监控、运行保障、维护支撑、数据制作等工作,河源市NOC成立之初,仅负责骨干网络的监控工作,无法实施市县网络的统一监控;系统支撑不足,故障监控及工单管控繁杂;专业网管存在大量无效告警,无法精确监控。监控维护工作不能适应企业战略转型需要,实施网络监控维护集约化推进迫在眉睫,河源电信领导审时度势,组织网络运营部、市NOC分析形势,查找问题根源,制定了加快实施集约化网络监控维护的工作目标。

通过两年多的不懈努力,河源电信网络监控维护集约化工作在网管告警规则优化、网管告警清理、系统优化支撑、管理手段创新、工作效率提升等方面形成了有效的经验和方法,走出了一条成功的、可推广的网络监控维护集约化创新路子。

2 构建市级集约化网络监控维护体系

2.1 总体思路

以“网络集约化运营”思想为指导,以实现网络“集中监控、集中维护、集中管理”为抓手,以提高工作效率、提升客户感知为目标,围绕网络监控维护工作的特点和问题,实施网络监控维护工作管理突破与创新,从系统优化、系统支撑、管理创新、细化考核、能力提升5个方面构建集约化高效网络监控体系:

·优化网络监控系统,为网络监控打造“精兵利器”;

·强化IT系统支撑,完善、建设监控管控平台;

·管理规范化、工作流程化;

·细化工作考核,发挥KPI考核和激励作用;

·通过多种形式的培训、学习,提升全市网络监控维护人员的综合维护能力。

2.2 五大举措推动网络监控维护深度集约

2.2.1 优化监控系统,为网络监控打造“精兵利器”

(1)网管告警收敛优化

针对网管设备多、告警量大、无效告警多等问题,网络运营部组织市NOC、接入中心、政支中心、各县客响部实施了网管告警收敛优化工作,先后对20套网管系统实施优化,清理网管系统积压告警10 000多条,并精简了告警输出,压缩了告警量,提高了告警的准确性和有效性。告警量的收敛不但缓解了无效告警对监控工作的干扰,同时也大大减轻了值班人员的工作量,故障派单准确性大幅提升。

(2)集中告警系统的优化和应用

·大力推进集中告警系统的使用,将优化后的20套专业网管系统全部接入集中告警系统,实现各专业网管告警“一台终端、一个界面”综合化集中监控。

·利用集中告警系统实施告警的二次过滤、优化,共设定告警过滤规则1 000多条,并规范内容告警格式,使告警呈现简洁、明了,提高了告警处理效率。

·利用集中告警系统实现重要政企客户电路的重点、主动监控。将河源电信42家重要政企客户信息录入系统,通过大客户网管系统功能实现告警与客户电路信息关联呈现,并设定告警自动派发故障工单,实现告警及时、主动发现,故障快速响应和处理。

(3)KVM系统的辅助应用

在网络监控维护工作中,故障预处理经常需要在不同网管系统上进行操作,由于网管系统众多(共25套),操作不方便、耗时长。利用KVM系统,可实现网管终端远程快速切换,5 s内即可完成切换,值班人员无需走动,在值班工位1m2范围内便可完成所有日常监控操作,工作效率大大提升,实现了“1 m2工作区域”。

2.2.2 强化IT系统支撑,完善、建设监控管控平台

(1)深化电子运维系统的应用

充分挖掘电子运维系统的各项功能,深化系统功能应用,提高故障工单管控的有效性,实现网络监控工作的质量和效率进一步提升。

·故障工单管控的规范化和流程化。组织全市维护人员讨论并制定了《电子运维系统故障工单填写规范》、《电子运维系统故障工单管控实施细则》等规范,使故障工单管控过程规范化、流程化。

·网络及业务保障划分标准化。全面梳理电子运维系统故障种类、等级、时限等,结合客户感知和维护人员实际情况,进行规范和优化,故障划分标准更清晰、合理。

·推广电子运维系统移动工单的使用。优化电子运维移动工单功能,实现手机短信、外网网页方式快速签单、反馈,故障管控方式更灵活、方便。

(2)建设全网指挥调度系统

河源电信自行开发建成全网指挥调度系统,它是为电子运维系统量身打造的简单、易用的“支撑工具”。

·系统整合了全市各维护单位的维护人员实时信息,信息的更新职责落到责任维护单位上,值班人员能快速、便捷查询故障处理值班人员与电话,精确掌握维护信息。

·故障升级制度与人员融入系统,值班人员能及时了解每个专业故障的升级渠道与升级人员,故障升级界定清晰明了,便于执行。

·指挥调度流程清晰、明确,责任到人,监控值班人员能方便快捷地实现全网故障、消防、网点发电等维护工作的有效管控及快速指挥调度,故障指挥调度时间压缩将近一半。

图1为发电管控过程实例。

(3)打造网络监控“信息交互平台”

河源电信开发了网络监控维护信息交互平台,如图2所示,构建了全市IT化管理核心平台。平台根据日常网络监控工作内容及工作特性,按模块化设计,包含监控管理、监控支撑、规章制度、故障预处理、绩效管理、事务管理等各方面内容。

图1 发电管控过程实例

图2 信息交互平台界面

2.2.3 管理规范化、工作流程化

·结合本地网实际,制定了《河源分公司专业网管告警派单规范》、《电子运维系统超长工单管控流程》、《全专业故障预处理指导书》等各种规范、流程、预处理指导书,作为日常监控维护工作的准则和指南,使工作方法规范、统一、高效。

·针对告警巡视、故障受理、故障工单管控、指挥调度等网络监控维护工作各个环节,执行每天检查、每周汇总考核,结合电话录音系统实施工作服务质量评价,建立全面的监控维护工作质量监督、考核体系,全面提升了网络监控维护工作质量。

2.2.4 细化工作考核,发挥KPI考核和激励作用

·对各级维护单位的工作考核:编制周、月度监控维护工作通报,通报各维护单位的网络监控、工单处理情况,每月根据超时单数考核维护部门;定期通报各专业网管积压告警,定义责任部门,并安排跟进处理,如未按要求完成则纳入组织绩效考核。

·市NOC内部员工考核:将告警巡视、工单规范、故障管控等作为监控值班员工KPI考核指标;鼓励值班人员在日常工作中“挖雷”,对合理化建议给予KPI加分奖励,持续完善系统、流程等。

2.2.5 通过多种形式的培训、学习,提升全市网络监控维护人员的综合维护能力

·编制学习文档:结合中心监控工作开展,组织人员编制故障、业务技术支撑文档,文档编制要求简洁易懂、操作性强,文档上传“信息交互平台”,方便员工下载学习。

·维护规范培训:为确保制定的各项监控维护规范在各级维护单位间高效执行,网络运营部组织开展了4期维护规范培训,培训讲师由市NOC的规范制定主笔人担任,通过手把手的指导培训,维护人员理解了强化集约管理的需要,领会了管控要领,掌握了操作规范,奠定了全市普及的基础。

·网络监控维护技术培训:河源电信先后制定了《河源分公司专业网管告警派单规范》、《电子运维系统超长工单管控流程》、《全专业故障预处理指导书》等技术手册,通过多期的集中培训,提高了各维护单位的监控维护人员的维护能力。

·内部强化提升:市NOC每月制定中心内部培训计划,安排进行1~2次的内部培训。不断提升员工故障判断和定位、指挥调度等相关维护技能和综合处理能力。

·搭建测试环境:在市NOC搭建监控维护测试环境,通过组织模拟练习及考核,帮助各县值班人员提高操作水平。

2.3 完成构建市级网络监控维护集约化体系

(1)实现综合化集中监控,网络监控操作高效、快捷

各专业网管告警通过集中告警系统实现了“一台终端、一个界面”综合化集中监控,监控人员能在值班工位的“1 m2空间”内完成日常监控操作。

(2)实现重要客户电路端到端主动监控,提升客户感知

通过集中告警系统,将重要客户电路信息与网管告警进行关联呈现。当客户电路出现故障性,能快速发现,主动告知客户并及时处理,切实提升客户感知。

(3)网管告警精确有效、派单准确,节省人力资源成本

通过监控系统优化,网管系统积压告警量从原来的10 000多条,减少到现在的1 000多条,积压告警清除率达85%;通过告警的精简优化,减少无效告警对监控值班的干扰,减轻值班人员工作压力,同时网管告警精确有效,值班人员实现派单准确,2011-2012年故障工单量在广东电信粤北5市基本保持最低水平,日平均工单量为30单左右,大大减轻了监控和维护人员的工作量,节省了监控及维护人力资源成本。

(4)实现故障及维护高效管控,从容指挥

故障通过电子运维工单实施管控,使得管控过程规范化、流程化。在故障指挥调度方面,维护人员相关信息能够通过全网指挥调度系统快速查询,故障处理责任明确到人。故障指挥调度时间压缩将近一半,现在大部分故障的指挥调度能在5 min内完成,故障平均历时逐年减少,2009年 平 均883 min,2010年 平 均759 min,2011年 平 均662 min。通过全网指挥调度系统 实现了全市390多个网点发电、消防等维护工作的有效管控及快速指挥调度,解决了网点多、人员时常变动等管控难题。

(5)管理规范、高质高效

通过“信息交互平台”,网络监控各项工作实现了集中化、IT化、规范化管理,工作实现有效传达及承接;通过建立全面的工作质量监督、考核体系,使各项工作形成闭环管理。

(6)员工工作能力明显提升

通过各种形式的培训、学习、实操,全市网络监控维护人员的专业知识更扎实,工作技能更娴熟,工作能力得到明显提升。全市网络监控岗80%以上的员工具备全专业综合化监控能力。

3 经验总结及下一步提升计划

到2012年初,河源电信初步完成了网络监控维护集约化实施工作,建立了全市一体化的集约化高效网络监控维护体系,网络监控维护集约化实施成果得到了广东电信的充分肯定,并进行了全省推广。

河源电信下辖5个县,目前东源县已撤销了7×24 h网络监控,全部网络监控维护工作纳入市一级监控维护体系管理,其他4个县的网络监控、维护工作也已经逐步纳入市级管控,仍保留部分消防监控、发电管理等工作,下阶段河源电信将继续深化市县一体化监控维护体系,逐步充实市NOC人员力量,彻底取消5个县的7×24 h值班,进一步解放县分公司的维护人员力量,支撑县分公司业务发展。

4 结束语

随着广东电信网络集约化运营深入推进,河源电信在网络监控维护集约化方面进行了卓有实效的探讨实践,建立了全市一体化集约高效网络监控维护体系,成为河源网络集约化运营历程重要的里程碑,同时将引领未来2~3年河源电信网络集约化运营工作的深入推进和科学发展。

猜你喜欢

河源工单网管
客服工单监控技术的开发与研究
基于量化考核的基层班组管理系统的设计与应用
山西岚河源省级湿地公园湿地恢复技术措施
SL流量计在特殊河段的应用——以河源水文站为例
为一条河命名——在白河源
给水网管的优化布置研究
基于HANA的工单备件采购联合报表的研究与实现
广东河源万绿湖库区的“双音话”
电力95598热线全业务集中后的工单预警机制
“五制配套”加强网管