一种基于智能适配技术的全专业通信管控平台研究
2022-07-16吕永庆
[吕永庆]
1 引言
我国当前正处在“两个百年”奋斗目标的历史交汇期,“十四五”规划编制专题会议中明确提出经济社会发展的关键任务中就包括推动高质量发展,改革创新破解发展难题等任务。这就对工业和信息化事业发展提出了更高要求,由网络大国向网络强国进行迈进。
由于通信网络的高速建设发展,网络的规模不断扩大,技术复杂性逐渐增加,需要通信提供的业务范围越来越多,通信服务质量的要求也越来越高,从而使通信网络管理能力和技术不断面临新的挑战,专业网管系统现已成为各运营商和电力通信中最重要的组成部分,其对于网络的运营、维护以及可靠性都有着千丝万缕的影响,网络运行维护支撑能力已经成为企业的核心竞争力之一。如何通过网络运维支撑系统的建设提高网络运维的质量是网络运行维护支撑能力中的重要环节。为此,笔者所带领的研发团队经过不断总结,提出了全专业网管采集的创新想法,对各通信专业网管的采集、分析工作进行全面信息化支撑,提高通信运维工作效率。
本文主要阐述如何构建一个有效的全专业网管采集平台设计与实现过程,通过在通信网络中对象实体(就是通信设备及其设备上的板卡、端口、各种状态指示灯等),通过逻辑关系将这些对象实现和通信网络相关联,实现网管系统对通信网络运行状态的分析和管理通过对象化将网元及各网元之间的关系集中存储在数据库中,由对象和对象之间的关系组成数据化的网络,利用对象数据和对象之间的关系,根据网管提供多种数据处理的应用程序分析,对通信网络进行智能化管理并提高告警分析、定位等管理功能。
本文主要研究的问题:(1)基于通信领域几大主要通信企业的网络结构和运维体制,分析了现有网络管理的体系结构和管理方式;(2)从多个层面对全专业网管采集平台的要求和目的进行了分析,并给出了本平台的主要研究内容;(3)详细阐述了全专业网管采集平台的功能实现方式;(4)结合已有的技术平台和资源能力,对现有的研究基础进行了分析:本文是在结合网络管理技术研究和网络管理运维的实际基础上总结出来的全专业网管采集平台设计与实现方案,对于通信综合网管的建设具有较好的指导作用。
2 现状和难点分析
(1)行业现状分析
国外研究现状:通信领域早期都是由国外几大跨国通信企业把持,例如思科JUNIPER 等,因此以思科、IBM、HP 等公司为代表很早就介入通信网管的研究并推出成熟网管产品,但是受知识产品保护等多种因素影响,这些厂家主要还是集中在专业网管这一层级进行各自专业领域的通信设备管理。而且国外网管长期与国内脱节,在综合网管领域无法和国内技术相提并论。
国内研究现状:国内网管分3 层,第一层设备厂家网管即设备厂家自带的只管理本厂设备的各类网管,比如大唐、华为、瑞斯康达、烽火等;第二层专业综合网管,即设备厂家之外的第三方对某个专业网络进行管理的网管,如移动网管、IP 网管;第三层即综合性网管,在上两层之上建设的、支撑特定领域的、或跨专业应用的网管,如综合告警、分析等。厂家网管用于对网络的操作和控制,专业网管用于对专业网络较为全面的配置、监控和分析,综合性网管用于某个特定专题应用,如集中告警的监控分析等。
(2)技术现状分析
在通信运营商网管管理领域网管技术应用较为成熟,运营商都要求通过一个控制台能对多个互联的网络进行管理,只有建立起多厂商的、多技术领域的综合网管体系,才能符合运营商的业务运营需要,因此相关电信运营商在2010 年前后对综合网管管理模式进行了探索和实践,在2014 年前后完成了综合网管、综合资源、综合运维的系统改造工作,而CORBA(公共对象请求代理体系结构),SNMP(简单网络管理协议),CMIP(公共管理信息协议)相结合,屏蔽编程语言、网络协议和操作系统的差异性,成为基于CORBA 的网络管理系统是当前技术研究和实现的主要方向。
(3)最新发展趋势
目前通信管控平台系统内部管理体系非常复杂,专业网管采集平台从原先的仅需关注通信网络自身的维护管理向所承载业务的服务管理方面发展,即更加关注承载业务应用及业务应用和通信网络之间的关联。与此同时,通信管控体系正朝着标准化和智能化的方向发展,从当前的专业分散管理,人工维护操作管理转变为对全专业网络的集中采集、集中告警,统一调度管理,通过对全网的实时运行情况数据进行控制,逐渐做到少人值守或智能值守,实现全程全网的统一通信管控支撑,来支持更高的实时性、更快的响应性、更安全的网络保障、更稳定的业务应用服务。
3 研发目标
通过对各大运营商和通信运维管理企业的网管现状的调研和分析,网络作为企业业务应用的重要基础支撑设施,已经逐渐从后端走向业务前端,做好全专业网管采集平台的总体规划,需要将网管放到战略的高度来考虑,不能仅从以前的“配套设施”角度来考虑。围绕客户的网络和业务发展主线,紧密跟随网络的发展步伐,通过对各专业网管进行整合集中、创新突破,集中高效、支撑网络转型,精确智能、运维优异等目标,实现一体化网络及网管运维管理能力。
作为对通信服务网络的支撑系统来说,全专业网管采集平台在用户对网管统一的维护体制下,不再根据传统的分段、分级、分专业维护模式进行支撑,而是建立在统一规划、统一标准、统一的信息模型之上,有统一网管标准化的服务能力的“一个网管”平台,这个网管的核心是集约化、智能化,所以我们将它称为“全专业网管”。
站在业务的角度看,全专业网管提供的是一个完整的、支撑“一张网络”端到端的运维管理融合网管系统,站在使用者的角度看,全专业网管平台具有统一的界面感知,具有更加智能的、更加灵活的综合支撑能力,它具备对网络的统一感知、统一控制、统一管理、统一分析和对业务的统一支撑等支撑能力。
本质上,全专业网管采集平台是网管领域内“实现网络运维数据的集中管理与共享、网管能力的标准封装与网管服务的对外开发、新网管新应用的灵活构建、网络控制的智能决策与联动”的高度集中的网管系统或网管体系,它是实施现有网络系统整合的平台,也是进行跨专业网管创新的应用平台。
4 研发内容分析
研究通过统一访问控制、异构网络的统一资源模型、统一采集适配平台,异地容灾方案。采用基于微服务架构,构建安全可靠,弹性可扩展的网管统一采集调度平台;通过自动化服务目录实现服务能力开放。
主要包括:(1)统一采集适配平台
采用微服务架构及分布式消息队列实现对传输、交换、数据、动环、视讯等异构网络进行实时告警采集、资源发现及性能采集分析。研究分布式的实时告警采集分析处理框架、性能采集任务管理框架及。
(2)统一告警分析处理
统一告警信息格式,实现跨专业的告警规则分析及跨专业的告警关联分析。
(3)统一的访问安全控制
基于微服务架构,实现统一服务入口、统一数据加密传输及访问控制。
(4)异地容灾方案
实现系统级的主用和备用异地容灾方案。研究主用系统和备用系统的对外统一接入访问方案,实现主用系统和备用系统的热备,实现主用系统到备用系统实时数据同步。考虑到厂商网管也采用主、备用的异地容灾方案。实现采集适配平台到到厂商主、备网管的实时切换。
采用最新成熟的分布式服务架构,实现安全可靠、高可用、易扩展的综合管控平台,为业务运营决策以及各种智慧化应用提供支撑,最大化挖掘和利用数据价值,实现企业数据的价值升级。
5 技术研究分析
(1)结合微服务架构研发实现平台功能
PaaS(平台即服务)组件化开发,将通用组件(如流程引擎、短信通知、日志、缓存)等抽象成独立的一层,极具通用性;同时采用业界最主流的开源技术路线(前端React Native+后端微服务),充分考虑产品的扩展性以及高并发支持。
(2)多专业网管统一采集框架
不同厂商提供的性能采集接口差异很大。有些采用任务方式、有些采用实时方式。实时方式可转化为任务方式,但反过来不成立。所以采用任务方式才能提供统一的性能采集服务接口,如图1 所示。
图1 采集任务流程图
(3)实时数据处理及数据采集适配标准化
对网管采集的配置数据、性能数据以及告警数据进行规范化处理,同时制定平台的接入规范,对后续入网厂家和设备实施强制标准,减少平台对接工作量。采用实时处理框架,实现告警从厂商EMS 网管发出,到展示层采用实时推送技术,能达到从采集层接收告警到页面展示层的秒级响应。如图2 所示。
图2 数据实时标准化处理
(4)根告警分析-因果关联规则
告警实时分析引擎:静态告警相关性分析往往不能满足实时分析应用的要求,需设计告警相关性分析引擎系统,实现相关性分析,如图3 所示,并通过友好的可视化界面实现分析规则的配置调用。
图3 相关性告警分析
6 现有研究开发基础
(1)基于微服务架构的传输网网管平台,已经传输网网管告警采集、告警压缩、告警确认、告警采集配置、拓扑展示功能,可以作为本系统框架和功能的基础平台使用。
(2)传输子网拓扑管理系统,作为本系统多层架构传输拓扑展示参考。
(3)资源管理系统已经采集传输网资源数据(传输网管、综资系统、数据网管),作为数据分析的基础。
(4)基于activity 流程引擎的资源业务平台,作为本系统流程框架基础。
7 结束语
针对目前工作的难点:如何对通信网络分级管理、分段维护、分专业管理的各网管进行统一采集,促使从网络层面实现一体化的、全程全网的网管支撑,更高的实时性、更快的协同性、一点申告全网保障、一处故障全程管控、网络质量端到端的监控与分析,本项目通过管理思路和技术手段的相结合的方式解决了这个难题,并在某省级电网用户的实际工作中取得了一些成绩。
伴随着网络业务的综合发展,新业务网络的逐渐增加,例如物联网、5G 网络在业务中的普遍应用,全专业网管采集平台通过提供更多样化的数据接口对接能力,提供统一的标准框架和部署环境,未来可简单扩展就能够支撑外部系统、无线公网平台、物联网网管、智能设备终端的接入,相信本平台会有良好市场应用前景。