集约化运营下智能网管体系规划研究
2014-02-28周平利王燕川阳志明
周平利,王燕川,阳志明
(1.中国电信股份有限公司广东研究院 广州510630;2.中国电信股份有限公司网络运行维护事业部 北京100075)
1 引言
随着中国电信企业转型和全业务运营的深化,支撑系统层面的一些问题逐渐浮出水面,在前几年大力发展BSS(业务支撑系统)和OSS(运营支撑系统)之后,网管领域明显成了一个短板。这一方面是由于企业的主要精力放在业务的运营层面,对于网络质量的保障以及对网络维护高效方面的要求不是很急迫;另一方面是由于OSS域的软件企业在网管领域的积累相对较少,面对多厂商、多专业、多类型网络下的第三方综合性网管系统建设,技术储备不足。现在,中国电信集团公司(以下简称中国电信)正在实施集约化运营的企业战略,要求实现维护工作向省分公司和集团公司集中,实现网络监控、操作、分析的集中化、高效化目标,现有网管体系难以支撑集约化维护的企业战略,急需对中国电信网管体系进行全面和长远的规划。本文主要探讨了如何在集约化运营的企业战略下规划中国电信未来的网管体系。
2 中国电信网管现状及分析
(1)“三分网管”的现状
中国电信的网络管理主要依靠按网络专业划分的专业网管,这些网管系统伴随着中国电信的网络发展不断完善,为中国电信网络的稳定运行提供了重要支撑。为适应中国电信运维管理体制的需要,网管系统从架构上一般分为本地网网管、省分公司网管和集团公司网管三级[1];根据网络层次的维护需要,网管又被分为接入网网管、城域网网管、骨干网网管等;根据网络专业化管理需要,网管按专业被划分为交换网管、传输网管、数据网管、移动网管、业务平台网管、动环网管等。这种依据行政分级、网络分段、专业分工等进行网管建设和维护管理的模型形成了“三分网管”的现状。
(2)3层网管体系
从网管管理范围及本身的层次来看,目前可以把中国电信的网管分为3层。
·第一层:设备厂商网管,即设备厂商自带的只管理本厂商设备的各类网管系统,如EMS、OMC等。
·第二层:专业网管,即设备厂商之外的第三方厂商开发的对某个专业网络进行管理的网管,如IP网管、移动网管等。
·第三层:综合性网管,即除基于前两层之上建设的、支撑特定领域或跨专业应用的网管,如综合告警、分析系统、大客户网管等[2]。
这3层网管系统全网数量多达9 000余套,厂商网管主要用于对网络的操作和控制;专业网管主要用于对专业内网络较为全面的配置管理、监控和分析;综合性网管主要用于某个特定专题的应用。
(3)主要问题
过去一段时间,“三分网管”体制下的管理维护手段也曾经是中国电信运维的核心竞争力之一,基本满足了中国电信网络的运行维护需求。但在近些年网络越来越复杂,而业务支撑要求和客户服务要求越来越高、全网维护人员和维护成本又不断减少的情况下,这种多级、多段、专业分隔的网管体系暴露出网管数量众多、关系松散、网络综合分析控制能力不足等问题。不仅难以全面实时地掌握网络和业务的整体运行情况,影响运维效率,甚至逐渐成为集约化运维的掣肘和客户服务的短板。比较突出的问题表现如下。
·业务响应速度慢,客户感知和体验较差,无法适应越来越高的客服要求和业务支撑要求。
·网管数据分散,数据的来源和用途缺乏清晰的规划,无法对全网的运营管理提供高效的支撑。
·网管自动化、智能化程度不高,无法缓解维护人员面临的多专业综合维护压力。
·网管层级太多,网管的南向接口薄弱,越上层的网管越不具备对设备的操作能力[2],制约了集约化维护中集中操作的实现。
3 网管规划的思路
3.1 未来网管规划的主要驱动力
(1)集约化运营的要求
中国电信集约化运营的企业战略要求网络维护从“运维”管理向“运营”管理发展,从三级维护体制向集团公司和省分公司两级集中的模式演进,要加强对网络、业务、产品和客户的整体运营支撑,这就要求必须转换传统网管只重网络维护的思路,不仅要在横向上考虑全专业融合,还要在纵向上考虑网络、业务、产品和客户的融合。通过规划新的网管体系、制订统一的规划和规范、增加自动化等支撑手段,提升全业务维护服务支撑水平和运维体系的整体保障能力。
(2)网络发展的要求
网管的发展首先要适应网络发展的需要,随着网络扁平化、融合化、IP化、简单化、业务复杂化和终端智能化的发展,新型的网管规划要与之相适应,也应该是构架扁平化、专业融合化、接口协议IP化和操作简单化,且要适应复杂的新型业务和网络,还要面对软件定义网络(SDN)和终端智能化的发展对网管智能化的要求。另外,传感网技术的出现及发展,为智能网管对网络的自动识别、数据自动采集提供了良好的条件。
(3)IT技术发展的要求
当前IT技术的创新和突破为网管的发展提供了良好的条件,特别是云计算技术的发展,为建设大规模的网管系统提供了很好的处理能力、存储容量以及可靠性、可扩展性。同时面向服务的架构(SOA)的应用以及大数据技术的日益成熟,便于快速构建和复用各类网管能力,实时、灵活处理网络运行数据以及实现集团网管与省网管之间、网管和外部IT系统之间的能力共享和业务协同[3,4]。服务能力经标准化封装后形成可在各智能网管之间复用的组件,不仅降低了软件厂商的研发成本,也促进了运维工作的标准化。服务能力的对外开放,可以考虑采用按服务调用次数进行计费的新模式来真正扩展软件应用的价值。
(4)行业趋势发展的要求
实现跨厂商网管的整合[5]一直以来都是运营商希望达到的目标,国内外大的电信运营商都在探索和实践跨厂商、跨平台的网管系统的新思路和新方案,在网管整合等方面取得了一定的进展,如德国电信、沃达丰、英国电信、荷兰电信、中国移动等;另一方面,TMN、TOM、eTOM、NGOSS等标准对各运营商的系统建设也产生了实质性的影响。总体来看,整个电信运营支撑系统都呈现出一种“横向整合、纵向集中”的网管融合化、扁平化的发展趋势。中国电信的BSS目前正准备向全网集中进行整合,OSS将也很快要启动整合,“One IT”是中国电信ITSP 3.0确定的发展方向。
(5)“去电信化”的要求
根据中国电信“去电信化”的要求,将来网管也可以考虑使用开源技术和平台,引入互联网公司IT系统的发展思路,结合网管领域的需求特点和处理要求,将开源的产品/架构与传统技术架构结合,形成一种混搭使用的模式,以达到架构灵活、应用丰富、响应快速的效果。
3.2 网管规划新理念
(1)重点支撑集约化维护的工作目标
集约化维护是中国电信集约化运营企业战略对网络运营的要求,要求未来3年内实现各专业网络的监控维护向省分公司上收,尽量减少现场维护的工作量。根据集约化维护的要求,未来的网管体系不仅要实现对全专业网络端到端全程的监控维护管理,更要实现对业务的端到端监控、测试、分析等能力[6,7],不仅要实现全专业网管融合化管理,更要实现对业务的灵活和快速支撑。网管架构的扁平化和集中化、管理范围的融合化、管理能力的服务化,是支撑集约化维护的重要方向。
(2)要从多个视角看问题,关键是提升客户感知
未来网管的规划,不能仅考虑网络维护和运维管理的问题,更要从多个视角看它需要解决的问题。新的网管体系,应该从后端视角和前端视角以及一体化运营视角来看问题,应该从省分公司视角和集团公司视角以及全局视角来看问题,应该从运维视角和管理视角以及整体视角来看问题,不仅要面对产品、客户和网络,也要满足集约化、精益运营和“一去二化”等企业战略的要求。要通过提高网络质量、业务质量以及故障发现和解决的及时性、客户服务的主动性等能力[8],让客户真正地感受到先进的网络运营支撑系统带来的便捷和优质服务。
(3)按照“一张网络,一个网管”构想
虽然在管理上一般将网络按专业分层次和分区域地进行管理,但站在客户的角度看,中国电信提供的是一张“综合信息服务网络”;站在电信内部看,这张网络是由“智能管道+业务平台+应用”组成的客户感知良好、运营管理便捷、业务开通灵活、可提供差异化服务的客户首选网络。面对这一张网络,理应由一个网管来管理;站在业务的角度看,这是一个完整的、支撑“一张网络”端到端运营管理的融合网管系统;站在使用者角度看,这是一个具有对网络智能感知、智能控制、智能管理、智能分析和对业务智能运营支撑能力的网管,这种未来的网管被称为“智能网管”。
(4)智能网管概念解析
智能网管是融合现有各网管的能力实现跨专业网络统一监控、集中操作和综合分析的具有统一技术架构的智能化网管系统。智能网管要基于云化部署,具备智能化、融合化、便捷化和服务化的特征,可提高网管自动化操作水平、整合全专业网络管理以及建立网络与产品、客户的关联,并能够通过网管服务能力封装及开放来快速部署新应用和支撑新业务,通过部署传感网络自动识别网络运行情况并采集数据来提高系统的智能化,利用对大数据(如大量日志信息的处理和不同网元、网络日志的关联)的处理结果来提供决策依据(包括维护和应急的决策)。
从业务视角来看,智能网管是实现“面向客户的业务和服务的全程端到端支撑”、“网络运行全数据集中运营”、“全专业集约化管理”的网管系统;从技术视角来看,智能网管是采用分层解耦、SOA、云化、大数据处理等技术手段打造的可灵活扩展的、多专业融合的集中网管平台;从功能视角来看,智能网管是具备网络的“智能感知、智能控制、智能管理、智能分析”以及业务的“智能运营支撑”五大核心能力的网管系统。
4 智能网管规划蓝图设计
4.1 系统功能蓝图设计
智能网管要适应运维体制,向集团公司和省分公司两级集中,要融合各专业网络管理需求,实现网络和业务的端到端监控、管理与分析,适应集约化要求。为了满足这些要求,采用“自顶向下”的设计思路,规划了智能网管未来将要具备的功能体系,将智能网管分为4层,分别为场景/应用层、网管核心能力层、网络运营数据层和网元适配层,如图1所示。
场景/应用层:具有直接与用户交互的所有功能,可系统地使用界面和视图,可快速、灵活定制,满足各种维护场景和维护人员的需要,并具备网管统一门户功能。场景应用视图可以分为网络监控维护类视图、网络运营管理类视图、客户服务支撑类视图以及网络运营分析类视图。
网管核心能力层:具有丰富的原子能力和组装能力,可实现对网络的智能感知、智能控制、智能管理、智能分析及对业务运营的智能支撑,标准化的能力组件注册到网管服务总线后供场景/应用层灵活调用,各类不同软件厂商研发的应用可以调用相同的基础公共能力。
网络运营数据层:实现海量网络运行数据的集中存储、集中管理和集中应用,支撑企业决策层集中掌握全网整体运行情况,是智能网管的数据核心。存储的数据包括实际运行的网络性能数据、告警数据、配置(资源)数据、流量数据、信令数据、日志数据和话单数据以及用于资源与业务关联的统一网元库和用于分析的历史数据库,同时还有支撑智能化决策和控制的专家库和策略库数据。另外,基础数据包括从其他系统获取的用户、产品等企业基础数据,用于关联分析。
网元适配层:具备强大的多专业、多技术接口的数据采集适配和数据转换能力以及对网元操作指令的快速翻译能力,可分布式部署,具备灵活的扩展能力,是网络管理的基础。
4.2 技术可行性
为了满足智能网管的功能要求,智能网管各层都需要使用目前较为先进的IT技术来实现,各项IT技术的日益成熟,也为智能网管的实现提供了可行的条件。
在场景应用层,可以使用Portal、Mashup等技术进行页面聚合和场景界面定制,提供PC客户端和移动客户端对系统的统一登录认证(SSO);采用REST、WS等各种技术封装网管核心能力层操作,然后再提供给上层模块使用。
在网管核心能力层可以使用基于J2Eel的软件开发框架,该层可以搭建在IaaS云平台上,不同的厂商可以共享同一个平台,并通过负载均衡技术对网管核心能力层进行横向扩展,以适应业务增长需求。
在网络运营数据层可以使用关系型数据库、基于Hadoop的大数据处理平台以及分布式数据库混合的模式,以满足不同种类数据和不同处理类型的需求。对于告警数据,可以引入流式计算和内存数据库技术来提高数据的实时性;采用Hadoop负责处理入库实时性要求不高的大数据,如话单查询、用户行为分析等,为后续OLAP/BI分析挖掘提供基础数据;分布式数据库MPP负责处理需要多表关联查询的大数据[8]。数据中心可以搭建在IaaS云平台上,实现海量数据处理、容灾及灵活的横向扩展能力。
统一网元适配层,可以使用通过接入各类网元、网元网管及业务平台,实现对各类数据的格式解析、数据标准化等预处理工作,并通过基于插件技术的协议适配引擎和协议插件库对协议进行有效的管理,实现新型网元的快速接入。对于专业网管接入告警数据可采用消息队列方式实现,配置、性能、使用记录等数据采可用FTP以文件方式传送数据。
为了实现智能网管内部各部分之间的集成及与外部系统的集成,可使用基于SOA的整体技术架构,网管核心能力层将各种标准化后的能力注册到服务总线,供上层应用和外部系统调用。集成接口可采用中立的方式进行定义,应该独立于实现服务的硬件平台、操作系统和编程语言,这使得构建在各种各样的系统中的服务可以使用一种统一和通用的方式进行交互[9]。
4.3 系统集成设计
在智能网管体系内部,可以通过服务总线将省级节点与集团节点之间有效集成,也可以将智能网管系统与过渡阶段的现有网管系统进行集成,实现能力调用和数据共享。
在智能网管外部,也可以通过网管服务总线将其他IT系统与智能网管进行集成,包括OSS域、BSS域、EDA域系统,实现与外部系统之间的能力开放和数据共享,形成端到端故障处理流程、业务测试流程和网络生命周期管理流程等。
5 智能网管的演进
智能网管的演进,不仅要考虑现状、网络发展、技术条件等因素,还得与集约化维护发展的工作要求相适应,一方面是集约化维护促进智能网管的发展,另一方面智能网管的演进又要满足集约化阶段目标。同时,还要兼顾IT系统本身的集约化发展,尽量缩减网管整体投资,提高系统使用效果。
智能网管的演进宜采用“两手抓、同步走、渐融合”的平滑过渡演进策略,即智能网管架构搭建和现有各网管升级改造“两手抓”,同步进行,在建设新应用的同时,逐步迁移现有各专业网管。
对于现有网管向智能网管的演进方式,可以用门户集成、采集共享、数据融合和能力融合等几种演进路径,根据各省的实际情况和现有网管的特点采用不同的方式进行演进。
在演进路径方面,应根据集约化运维需求及专业网管特性,按照网络管理集中化、各网管能力融合化和核心能力智能化等演进路径向智能网管架构演进。
6 结束语
中国电信经过两年多的研究,明确提出把未来的网管规划确定为智能网管,智能网管不仅是一个系统,也是一个体系,是中国电信未来网管发展的方向,建成后将对中国电信网络运营具有划时代的意义。目前,中国电信智能网管的规划已经下发,全网对于智能网管的建设才刚刚开始,要实现智能网管规划的宏伟目标,还有很多困难需要解决,只有一步一步地落地实施,才能将它的价值真正体现出来。
1 中国电信集团公司.中国电信移动网管建设指导意见,2010
2 孔令萍,易学明,王燕川等.第三代移动通信网络管理.北京:人民邮电出版社,2010
3 TU-T M.3050.4.Enhanced Telecom Operations Map(eTOM)-B2B Integration:Using B2B Inter-Enterprise Integration with the eTOM,2007
4 Bieberstein N.执行SOA:SOA实践指南.王海鹏译.北京:机械工业出版社,2009
5 ITU-T M.3170.0.MTNM-Introduction and Supporting Documentation,2007
6 ITU-T M.3050.1.Enhanced Telecom Operations Map(eTOM)-The Business Process Framework,2007
7 ITU-T M.3050.2.Enhanced Telecom Operations Map(eTOM)-Process Decompositions and Descriptions,2007
8 ITU-T M.3050.3.Enhanced Telecom Operations Map(eTOM)-Representative Process Flows,2007
9 周宝曜,刘伟,范承工.大数据:战略·技术·实践.北京:电子工业出版社,2013