APP下载

电力光传输系统自动巡检工具的设计与实现

2022-11-07曾小辉陈小惠朱庆李明娟杜沐恩

湖南电力 2022年5期
关键词:光路网元网管

曾小辉,陈小惠,朱庆,李明娟,杜沐恩

(国网湖南省电力有限公司信息通信分公司,湖南 长沙 410004)

0 引言

电力光传输系统承载电网安全生产和发展运营等业务通道,是电网安全稳定运行的基础。随着国民经济的不断发展和电网规模的不断扩大,一方面电力光传输系统组网日趋复杂,系统运行故障处置复杂度增加;另一方面,电力光传输系统承载的电网业务日益增长,系统运行故障的影响范围增大,对电力光传输系统的运维方式方法提出了挑战。

传统电力光传输系统主要采用设备厂商专业网管系统进行运维管理,该类网管架构主要参照电信管理网的分层管理结构,从上到下包含网络管理层、网元管理层和网元层[1],其强大的操作维护管理功能是通过SDH网元之间的嵌入控制通道(Embedded Control Channel,ECC)协议来传递其丰富的D1-D12再生段和复用段开销字节,包括带内和带外两种数据通信通道(Data Communication Channel,DCC)物理通道[2]。设备厂商专业网管系统主要用户仍为设备厂商技术支持人员和电力光传输系统运维的高级维护人员,对电力光传输系统的智能运维支持程度不高。另一方面,电力光传输系统运维人员也只能使用设备厂商专业网管系统进行实时告警监控,缺乏对系统性能的预警,难以支持系统运维从被动故障抢修转变为主动预警处置。

电力光传输系统设备公共核心板件多采用主备冗余配置,因此主要影响业务的系统故障和缺陷为光路中断。除采用设备厂商专业网管系统实现光路性能实时告警的监视外,另一种具备提前预警效果的智能运维方法为光缆在线监测系统的应用[3]。为尽量减小对在线业务造成的影响,光缆在线监测系统通常对光缆的剩余纤芯进行性能监测[4],继而对光缆上承载的光传输系统光路等性能进行一定程度的监视和预警。然而,光缆在线监测系统通常以光缆为监测主体,辅助光传输系统性能分析存在以下问题:一是光缆在线监测系统监测纤芯的性能数值未与光传输系统光路基础数据进行映射绑定,运维人员需要从光缆在线监测系统中获取监测数据后,采用线下台账比对方式确定应分析的光传输系统光路,智能程度较低;二是光缆在线监测系统监测性能主体为光缆的空闲纤芯,同一条光缆的多根纤芯本身就存在性能差异,难以准确反应光传输系统光路的真实性能;三是大部分光传输系统光路需要由多段光缆的跳接承载,而光缆资源极其宝贵,为光缆在线监测系统分配大量纤芯资料不切实际[5]。此外,光缆在线监测系统设备价格昂贵,难以形成规模应用。

综上分析,传统的电力光传输系统运维方式在光路性能的预警及时性、性能准确性和应用推广等方面存在不足。本文以电力光传输系统主动预警处置为目标,基于专业网管开放接口设计和开发电力光传输系统自动巡检工具,实现电力光传输系统光路性能数据的采集、分析和预警,提升电力光传输系统运维效率。

1 电力光传输系统网管系统架构

通信网管系统除各类别厂商独立的专业网管系统,还有同样基于电信管理网的综合管理系统[6],一般指各行业根据行业需求,基于专业网管的北向开放接口进行定制功能的开发,构建适合行业应用的运维支撑系统。如国家电网有限公司统一开发的电力通信管理系统[7],接入了多厂家的传输、交换、电源、动环等不同类别通信设备的专业网管,有实时监视、资源管理、运行管理和专业管理四大功能模块,其采集体系结构如图1所示[8]。

图1 综合网管系统采集体系结构

根据上北下南规则,专业网管通过北向接口向上提供数据调用接口,综合网管系统正常运行的基础是数据采集功能。专业网管再通过南向接口直接连接到网关网元进而与网元设备交互[8],从而采集网元的告警、配置、性能等数据信息,以提供告警展示和性能查询、业务配置等功能。

由于厂商专业网管面向多行业的专业运维工程师,通常不支持定制功能开发,涉及产品专利等方面的要求,第三方也难以对专业网管进行升级开发。而电力综合管理系统为统一开发的系统,面向全国“总部分地”多层级单位,定制化需求开发时间长。因而本文借鉴综合网管的开发方式,基于专业网管的北向开放接口对自动巡检工具进行开发。

2 巡检性能参数需求及接口选择

2.1 巡检性能参数需求

对电力光传输系统的光路性能进行巡检,如图2所示,一条光路的完整信息包括传输段名称、源宿网元名称、光板槽位端口、收发光功率值、光模块类型。

图2 光路组成示意图

光模块主要用于获取光功率门限值,因为北向接口不直接提供读取门限值。光路两端使用的模块类型是必须从专业网管中采集的参数,原因是光模块包含传输速率、波长、适用距离等关键参数,即使传输速率相同,其光路的性能阈值也存在较大差异,以某一2.5G光模块为例,见表1。

表1 2.5G光模块的光功率阈值

其中光接收灵敏度和最小过载点为俗称的收端光功率的下门限值和上门限值。

2.2 采集接口选择

从图1可见,厂商传送域专业网管通过北向接口为运行支撑系统(Operation Support Systems,OSS)提供丰富的告警、性能、存量等网络监控信息,同时支持配置、测试诊断等网络管理、控制分析功能,如电力通信管理系统采集专业网管的告警、配置和性能等数据[9]。其中存量包含网元、槽位、单板端口、交叉、路径等物理和逻辑存量信息;告警包含告警查询和确认等功能;配置表示对业务通道进行创建、删除、修改等操作;性能包含当前和历史的收发光功率、工作温度、误码等性能参数数据。

为满足不同的OSS系统集成需求,专业网管的北向接口通常分为公共对象请求代理体系结构(Common Object Request Broker Architecture,CORBA)、可扩展标记语言(Extensible Markup Language,XML)、简单网络 管 理 协议(Simple Network Management Protocol,SNMP)、文件传输协议(File Transfer Protocol,FTP)和描述性状态迁移(Representational State Transfer,REST)。

CORBA是由国际标准组织对象管理组(Object Management Group,OMG)定义的一种标准的面向对象的标准化建模接口,因其开放性、平台和语言的无关性可实现网络管理系统与不同网元管理系统的通信,广泛应用在传输网北向接口中,此时采用的是TMF814协议[10]。

XML是一种可以自描述的标记语言,因其固有的灵活性和可扩展性,被广泛应用于跨系统跨平台的数据存储和数据共享[11],XML接口适合综合网管系统。

SNMP是管理进程和代理进程之间的通信协议,是一种应用层协议,能管理支持代理进程的网络设备[12]。在此,管理进程特指综合网管系统,代理进程指专业网管。

FTP协议是TCP/IP协议组的协议之一,采集程序以定期轮询方式通过FTP协议登陆网管服务器采集数据,不满足数据采集实时性要求[13]。

REST描述了一个架构样式的网络系统,使用REST架构的服务被称为RESTful服务,建立在HTTP协议基础上,数据传输采用明文方式,数据安全性不能完全保证[9],是目前主流的一种Web服务交互方案。

除接口性能、参考标准的不同,各种接口开放数据类型方面也存在一定差异,某传送域的各北向接口开放的数据类型对比见表2。其中,RESTful仅支持OTN和WDM设备的存量查询、配置管理功能。

表2 北向接口开放数据

综合巡检工具开发目的及对设备厂商北向接口文档的对比,选择CORBA和XML两类采集接口,其中CORBA接口采集传输段、源端和宿端的传输网元、传输网元端口、收发光功率等性能数据;而XML接口采集端口光模块类型,用于光路性能阈值的准确匹配。

3 巡检工具功能模块设计

电力光传输系统自动巡检工具包含4个模块,分别为权限管理模块、数据采集模块、性能分析模块和输出展示模块。

3.1 权限管理模块

为减少部署成本,光传输系统的专业网管多采用集中化部署,即多级多域设备均采用同一套专业网管进行维护管理,其中级包含总部、分部、省、地四级,域包括SDH、PTN、OTN。如湖南地区电力NCE光传输网管共管辖了湖南省和所有地市的SDH、PTN和OTN网络。由于各级传输设备的运维主体不同,集中部署模式要求自动巡检工具具备分权分域的设计,与设备的运维主体保持一致,不同运维主体应分配不同的管理权限,保证用户数据的安全性。

3.2 数据采集模块

数据采集模块除简单地从北向接口采集巡检所需字段信息,还包括数据加工,如按照适配协议进行数据解析和根据开发目的设计合并数据对象[13]。由于传输段名称包含源宿端网元和端口信息,以传输段为中心遍历所有传输段,解析出所有源宿两端的网元名称和端口,并将网元名称和端口绑定,进而采集该端口的收发光功率性能参数和光模块类型,并根据厂家模块工具书定义该端口的收发光上下门限值。最后以传输段为维度,将传输段、速率、源宿两端的网元、端口、性能数据、门限关联成一个完整的光路对象数据,如图3所示。

图3 数据采集处理流程

3.3 性能分析模块

性能分析模块是巡检工具的核心,主要通过光路劣化规则来判断光路状态,以及异常严重程度、持续周期。其中劣化规则包括收端光功率与门限值和设定值的判断、收端光功率与上一周期的巡检结果对比,比设备厂商专业网管的只与门限值判断更精准;光路状态包括光路中断、光路异常、光路正常;严重程度包括严重、一般;更精准多周期地衡量光路性能,具体如图4所示。超出门限值,或在门限设定值内但连续与上一周期光功率浮动超过2 dBm,都被判定为严重的光路异常。只有当收端光功率处于门限设定值内,且与上一周期的光功率浮动未超过2 dBm,才认为是光路正常。

图4 光路性能分析流程

其中根据运维经验,设定值为“+3/-5”[14],即下门限加3 dBm,上门限减5 dBm,也是工程实施对光功率余量需满足“高3低5”的原则。

3.4 输出展示模块

将光路对象数据中的网元、传输段、收发光功率和分析结果中的光路状态、异常严重程度、持续周期合并为一条光路的完整输出信息。并根据异常严重程度显示为不同颜色,代表需干预的紧急程度,“严重”显示为红色,“一般”为“黄色”,分别督促运维人员立即和尽快处理来实现自动预警,化被动消缺为主动进行隐患治理。

4 巡检工具的开发实现

开发工具类程序主流的开发语言有Java、C++、Python等。Java是一门面向对象的编程语言,因其优越的跨平台可移植性,在Web开发中是主流语言,且简单易用、语法规范、开源软件多。C++是一种最广泛支持范式的编程语言,擅长面向对象程序设计的同时,还可以进行基于过程的程序设计。Python是动态形的灵活的解释性语言,从软件开发到Web开发,Python都有被使用,因其解释性,适合轻量级开发。

根据本项目需求综合分析,采用Java语言开发,使用springboot框架,重点介绍数据采集模块的实现。

4.1 数据采集模块的实现

4.1.1 CORBA采集接口的实现

CORBA接口开发通常采用对象请求代理(Object Request Broker,ORB)实现,商业ORB主要包 括Orbix、VisiBroker,开 源ORB主 要 包 括JacORB、TAO。考虑实现工具较为简单,开源ORB即可支持,选择JacORB作为中间件进行开发。利用JacORB对专业网管的接口描述语言(Interface description language,IDL)进行编译,形成了Java编程语言可使用的库文件,各参数获取方法如下:

1)获取网元列表,用ManagedElementMgr_I数据接口类的getAllManagedElements方法;

2)获取网元命名,用ManagedElementMgr_I数据接口类的getAllManagedElementNames方法;

3)获取网元端口信息,调用ManagedElement Mgr_I数据接口类的getAllPTPNames方法;

4)获取光路拓扑列表,调用EMSMgr_I数据接口类的getAllTopologicalLinks方法;

5)获取光路拓扑具体名称,调用EMSMgr_I接口类的getAllTopLevelSubnetworkNames方法;

6)获取光路所在端口的性能信息,调用PerformanceManagementMgr_I数据接 口 类 的getAll CurrentPMData方法。

4.1.2 XML接口的实现

XML接口开发通常采用简单对象访问协议(Simple Object Access Protocol,SOAP)中间件实现,商 业ORB主 要 包 括IBM Websphere、IBM Weblogic,开 源ORB主 要 包 括Apache CXF、Apache AXIS。考虑实现工具较为简单,开源SOAP即可支持,选择Apache CXF中间件进行开发。利用Apache CXF对专业网管的Web服务描述语言(Web Services Description Language,WSDL)进行编译,形成了Java编程语言可使用的库文件,并通过调用EquipmentInventoryRetrievalRPC数据接口类的getAllEquipment方法来获取端口光模块类型。

4.2 展示效果

利用该工具对省网某SDH光传输系统所有光路进行自动巡检,部分光路段的巡检结果见表3。

表3 SDH光传输系统部分光路段巡检结果

表3中,SW-黔城#15-1至SW-飞山#14-1速率为STM4的光路,源宿两端收入光功率分别是-23.5 dBm和-25.7 dBm,虽然都在门限(上门限-5,下门限+3,即-13/-5 dBm,-34/+3 dBm)以内,但由于宿端SW-飞山#14-1的收光功率比上一巡检周期的结果降低了2.5 dBm,因而光路状态是异常,因为是第一次出现,所以是黄色预警。

而SW-紫霞2#12-1至SW-瑶都#8-1段速率为STM16的光路,源宿两端收入光功率分别是-18.1 dBm和-23.8 dBm,虽然都在设定门限以内(上门限-5,下门限+3,即-9/-5 dBm,-28/+3 dBm)以内,但由于宿端SW-瑶都#8-1的收光功率比上一巡检周期的结果降低了5.7 dBm,因而光路状态是异常;且第二次收光功率降低超过2 dBm,即持续恶化,是红色预警。

监控人员复核专业网管的当前收光功率值和历史记录的收光功率值,发现巡检工具的分析结果正确,及时通知运维人员进行处理,发现故障原因是SW-紫霞2#12-1至SW-瑶都#8-1光路所经过的光缆段在紫霞站内受鼠咬导致部分纤芯受损,将有鼠泛的光缆提前进行业务迂回;而SW-黔城#15-1至SW-飞山#14-1所承载的光缆纤芯是因为某次检修调整时未将飞山侧纤芯擦拭干净。

5 结语

通过分析电力光传输系统现有运维方式的不足,基于专业网管北向接口和光路异常预判规则设计电力光传输系统自动巡检工具,并应用到实际生产运行的电力光传输系统。实用效果表明该工具能够准确高效地巡检光路性能而降低人工巡检的成本,并依据实际运维要求进行合理分析预警,避免电力光传输系统光路的非计划中断,提升自主化运维水平。

猜你喜欢

光路网元网管
一种全网时钟同步管理方法
给水网管的优化布置研究
通天之光路
整体反射式无影灯的LED改造
“五制配套”加强网管
Java EE平台在综合网元管理系统中的应用研究
网管支撑系统运行质量管控的研究与实现
S1字节和SDH网络时钟保护倒换原理
从网管系统到网管云:论网管集约化的建设思路
激光切割中反射镜曲率对光路优化的应用