统一接口平台在中国电信WDM综合网络管理系统中的应用
2013-08-09梁颐涵王井龙
梁颐涵 ,周 函 ,王井龙 ,李 飞
(1.中国电信集团公司网络运行维护事业部 北京 100010;2.中通服软件科技有限公司 上海 200127)
1 引言
中国电信WDM综合网络管理系统 (以下简称WDM综合网管)是建立在各传输设备的网元管理系统(EMS)或子网管理系统(SNMS)上的网络管理系统(NMS),能够在统一的平台上实现对多厂商、多制式DWDM设备的集中监控和性能分析,从网络层和面向维护的角度对众多厂商的传输设备进行统一的管理,提高网络的运行质量和效率。WDM综合网管的管理范围包括阿尔卡特、朗讯、NEC、北电、西门子、华为技术、中兴通讯、烽火通信和爱立信等众多厂商的不同制式的DWDM系统,随着网络系统的不断升级,所管理的对象也从始建时主要集中在骨干DWDM传输网(以下简称一级干线)不断深化到几乎全国所有省份的省内DWDM传输网(以下简称二级干线)。
随着3G的发展,4GLTE的推进,底层的数据传输网目前正处于大发展时期,一方面从传统的2.5Gbit/s、10 Gbit/s DWDM波分设备向着容量更大的40 Gbit/s、100 Gbit/s方向发展,另一方面向着具备光/点交叉能力、调度配置能力更强的OTN、ASON方向发展。
2 现有北向接口模式的问题
WDM综合网管作为一种多厂商网管系统,并不是厂商网管系统功能的简单重复,而是通过厂商网管系统的北向接口,对管理信息进行过滤、抽象与整理,掌握整个传输网的全局信息,从而实现对全网的管理。而现实中,在北向接口问题上,设备厂商和运维人员的立场相差颇远。在厂商方面,网管功能的开发落后于设备的研发,向上网管接口的开发又滞后于网管功能的开发,并且很不完善。部分厂商的网管功能改进依赖于运维人员的要求。厂商面向设备做的网管功能开发是厂商的专长,其通用性好,可以面向全世界的用户,而要求厂商面向一个用户开发的北向接口,则成本问题就比较突出。以前解决接口标准化有两条途径:其一是按国际标准执行;其二是由用户提标准,由厂商实施。随着WDM综合网管的不断深化,在中国电信集团公司的指导和支持下,各厂商均对EMS北向接口做了符合某类规范(如TMF规范)的研发工作,在一定程度上缓解了成本、开发周期以及向上适配的问题,但并没有从根本上解决网络设备不断升级甚至厂商网管版本经常升级所带来的上述矛盾。例如,某厂商的不同版本网管之间的配置数据方面存在差异或者某条新建干线引入了新制式的设备,虽然这些升级后的EMS仍然符合某种规范(如TMF规范),但对上层综合网管却带来了适配困难,这部分涉及双方的开发、流程的协调,导致设备不能及时纳入管理,已管理的设备不能正常监控,此类冲突的存在最终带来的是网络升级和新设备引入后的管理难题。
3 统一接口平台的提出
为了缓解并逐步消除如上所述的矛盾,由中国电信主导,中通服软件科技有限公司(以下简称中通服软件)和各主要设备厂商共同研究制定WDM系统统一接口平台,在功能上规范各厂商北向接口的协议和模型,消除厂商版本差异。接口规范的实施将有效减少版本频繁变动带来的调整工作,按照统一的接口规范要求,不同厂商的北向接口可以更好地发挥WDM综合网管的优势,省去综合网管厂商对于各个厂商接口的适配开发以及接口符合性验证测试工作,加快新建网络设备纳入WDM综合网管集中监控的进度。
在已有TMF 814标准的基础上,总结电信网内传输各设备厂商北向接口的差异,继承和吸收了对WDM监控管理的经验成果,涵盖公共管理、告警管理、配置管理和性能管理4个重要模块,并充分考虑了OTN/ASON等新技术网络的引入,完成包括以TMF 814为蓝本的北向接口扩充规范的制定,并最终完成一套为全网络多厂商多制式的WDM综合网管提供强有力支撑的统一接口平台。
如图1所示,中国电信一级干线和大部分二级干线通过各设备厂商的EMS/SNMS提供的接口,对一级/二级干线及部分本地DWDM传输设备进行统一的管理或者监控(图1中的接口1位置)。部分省份已经将本省内的各厂商EMS/SNMS纳入本地网综合监控系统,则可以直接将省级的综合监控系统接入集团WDM综合网管,以减轻设备厂商的压力,提高综合网管系统的使用价值(图1中的接口2位置)。另外综合网管系统可以与横向的综合资源系统、综合监控系统、电子工单系统建立接口(图1中的接口3位置)。本文的统一接口平台主要是规范接口1和接口2。
图1 中国电信WDM网络管理结构
4 统一接口平台的特点
以下将统称WDM综合网管系统为网管系统,统称设备厂商的EMS/SNMS或者省级的WDM综合监控系统为被管系统。网管系统与被管系统之间将实现公共管理、故障管理、配置管理、性能管理四大功能模块,如图2所示。
图2 总体功能示意
4.1 强化对厂商EMS的监控
为了使上层网管系统更好地了解下层设备网管的连接和上报情况,被管系统应支持网管系统的心跳监测功能,以实时了解整个网络管理器的状态,同时要求上报Heartbeat(心跳事件)作为另一监控途径。
在强化通知上报的功能中,要求被管系统向网管系统上报如下类型的通知事件。
·与配置管理相关的事件:对象创建事件、对象删除事件、对象状态改变事件和对象属性值的改变事件。
·与故障管理相关的事件:设备告警事件、环境告警事件、通信告警事件、处理错误告警事件、服务质量告警事件等所有设备或EMS可检测到的故障。
· 与性能管理相关的事件:性能越限(TCA)事件。
·心跳上报事件:心跳上报事件,按一定的频率上报心跳,可表示事件上报的通道连接正常。
4.2 统一配置模型
配置管理功能模块主要提供网络配置资源的存量查询功能,是故障定位和性能数据采集的基础。主要的配置对象包括:网元、机架、机框、槽道、插盘、端口、子端口CTP、拓扑连接、内部交叉以及保护组等对象。统一接口平台要求各厂商的北向接口在提供配置数据时具备模型统一性和信息完备性,即使遇到厂商设备、北向接口升级,只要保证配置模型的一致性,该平台都可以轻松地进行统一管理。配置模型的要求主要体现在以下几个方面。
· 同一被管网管上的网元名称不能重复,此网元名称指的是将通过北向接口的nativeEMSName上报的名称;被管系统上报的网元名称要与其在本身界面上显示的名称保持一致(即使大小写也需一致);在未经允许和批准的情况下不能修改此名称。网元名称和设备的内部ID一起构成了网元对象的唯一性约束。
· 被管系统支持网管系统查询机框配置信息,被管系统上报的机框信息中,必须精确描述设备机框在设备子架的具体位置,比如设备机框shelf=2表示在设备机架rack=1的第二个位置,那么shelf对象EquipmentHolder的值必须为rack=1/shelf=2(对于机框在机架的排列顺序与被管网管的表述一致即可),如果不符合此规则,必须在上报机框的附加信息additionInfo中提供Sequence属性,其取值为1/2(或者 2)。
· 被管系统支持网管系统查询槽道配置信息,一方面上报对象名称(name)中的取值 slot=[1,…,n]的 n,表示槽道在机框中的顺序号;另一方面可以通过槽道对象中additionInfo.Seqence的取值为槽道编号。
· 插盘上与光纤连接的实体,必须作为端口上报,并且有相应的类型,针对业务类型分为OTS、OMS、OCH、SCH、OSC和OP;对于把同一方向的收发一对端口作为一个端口上报的,在告警上报事件中处于线路侧放大器上的告警,必须在附加信息additionInfo 中添加 name=“Location”,而取值 value=“IN”或者“OUT”。
·被管网管支持子端口CTP的查询,对于无法与光纤一一相对应的端口,或者是物理端口的子端口,或插盘内部为内部交叉而配置的逻辑端口,都作为CTP上报。
· 被管系统支持网管系统查询保护组信息,附加信息additionInfo属性中增加对详细保护类型的描述,定义的name=“DetailPGType”,取值value为具体的保护类型,如 BLSR、MSP、SNCP。
·被管系统应支持网管系统查询各种类型的连接信息,连接信息分成两大类——网元之间或者盘间的光纤连接、盘内的交叉连接。
4.3 统一性能模型
统一接口平台性能模型将从性能检测、性能数据上报、历史性能数据采集和性能门限管理4个方面进行规范化,具体要求主要体现在如下几点。
(1)统一映射性能参数,对于运营商的操作维护人员来说,只需要掌握规范后的统一性能参数,而不是数量繁多,随不同设备类型、不同厂商有不同含义的厂商性能参数。
(2)对于无效的性能参数值,不是通过一个过大或者过小数值表示,而是通过下列方式表达。
· 在性能项 unit填写 “Maximum”、“Minimum”、“Invalid”等标识符号;
· 在性能值value填写“65 535”或者“—”;
· 在性能项intervalStatus的取值为“Valid”才有效,其他的情况都视为无效。
(3)性能上报的时间以24 h制北京时间为准,格式为“20121221235828.0”——表示2012年12月21日23点58分28秒。
(4)被管系统支持网管系统对任意指定的设备和端口进行性能监测,支持监测的性能参数设置,这样可以细化到确定端口给定参数的历史性能数据采集,既可以减轻设备网管的负载,也可以降低网络负载,从而提高用户获取信息的效率。
(5)被管系统回送准备好的历史数据有两种方式:一种是通过查询操作即时响应数据;另一种是通过批量数据传送FTP以文件的方式返回。
4.4 统一故障模型
统一故障模型的最大特点在于根据最新TMF规范进一步统一映射厂商告警信息,屏蔽各设备厂商的告警差异性。同时,除了要求被管系统具备主动向网管系统上报告警的功能外,还对告警上报做了如下的规范。
·每个被管系统的告警名称要规范,不能同样类型的大小写不一样。
·告警上报的数量应该与设备网管上的数量一致,不能漏报,上报的信息应有日志记录。
·告警上报时间以24 h制北京时间为准,与前文所说的性能要求一致。
统一故障模型的另一特点在于强化告警同步功能,即网管系统获取被管系统中当前所有的活动告警,可适用于但不限于以下情况:
·当网管系统与被管系统建立管理连接时;
·当网管系统与被管系统出现通信失败并且恢复后;
·当网管系统出现系统故障并且恢复后;
·当主用网管系统与备用网管系统发生倒换时;
·当用户对网管系统显示的告警与被管系统的告警状态有疑问时。
被管系统应至少支持按EMS和ME两种粒度同步,且网管上已经结束的告警系统同步时不应再次上报。
5 统一接口平台的应用
统一接口平台实施后,改变了目前接口开发的一对多模式,由综合网管根据各厂商接口的不同,逐个通过适配的模式进行接口开发,不但周期长,而且因为需要各设备厂商的配合才能完成升级,导致不必要的工程成本。统一接口平台的推出,接口开发模式将变为多对一,各设备厂商在新建干线或者升级干线版本的开发基于统一接口规范实现其接口,实现配置、告警、性能模块的全部功能,并根据统一接口规范的信息模型和数据模型完成配置、告警、性能的统一映射,完成内部的单元测试和集成测试。统一接口平台推出的最终目标促进了干线网传输设备厂商北向接口在TMF基本标准基础上全面规范和统一。
平台的实现使得不但可以快速接入设备进行监控,并且接口的数量快速下降,将来不需要再新增接口,前后对比如表1所示。
表1 统一接口实现前后维护情况对比
在中国电信WDM综合网管工程中已经进一步就统一接口平台进行强化应用,所有满足和符合统一接口规范的厂商EMS北向接口在提供必要的接口描述文件 (一般是Corba平台所要的IOR文件)后,可视为即插即用,直接可纳入上层综合网管进行监控和管理。在被管网管EMS北向接口提供配置、告警、性能模块的前提下,相关信息可通畅地被WDM综合网管获取,从而保障中国电信维护人员快速高效地监控整个中国电信WDM系统的网络运行情况。
1 TMFWhite Papers.http://www.tm forum.org
2 Kartalopoulos S V.DWDM:Networks,Devices,and Technology.Hoboken:Wiley-IEEE Press,2003
3 黄璘.国际电信标准组关注传输综合网管建设.电信网技术,2004(14)
4 郑晖,刘京京.传输综合网管的建设思路.电信科学,2004(5)
5 易武.传输网管系统设计及采集适配层南向接口实现.北京邮电大学硕士学位论文,2012
6 郑永哲.传输网管的现状和发展趋势研究.企业技术开发,2011(11)