APP下载

SDH光传输网常见告警分析在空管中的应用研究

2023-12-23

数字通信世界 2023年10期
关键词:航管单板网管

包 励

(华东空管局,上海 200000)

1 研究背景

1.1 SDH应用现状

上海浦东华为SDH光环网(简称“本场光环网”)是由华东空管局独立投资建设的本场通信骨干基础网络,投产于2015年,是空管行业华东地区首套光传输网络,在2018年之后进行了升级扩容,目前的网络主体采用了四环相交结构,主要承载雷达、甚高频、导航、气象、航行情报、语音等信号传输。本场光环网采用具有智能特性的NG-SDH设备OptiX OSN系列,共配置44个节点。

1.2 告警情况

2021年至今,本场光环网网管共上报2 245个告警,其中紧急告警973个、重要告警1 157个、次要告警115个,告警日志统计分析如下:在紧急告警中,告警数量排名前四的节点依次为航管楼、HGL-500M、HGL-500S、点对点-航管楼;在重要告警中,告警数量排名前四的节点依次为航管楼、大终端、浦东三甲港雷达、大终端辅助环;在次要告警中,告警数量排名前四的节点依次为大终端、东场监、航管楼、R5南航向。可以看出告警主要集中在大终端、航管楼的节点设备,这与这些地点需要大量业务开通操作、业务引接有关,从侧面反映出这些节点设备的活跃程度,应在今后运维中着重关注。

2 告警分析及处理

2.1 告警梳理

本场光环网系统在建成投入之初由于配置不完整导致产生大量告警,我们进行了存量告警专项清理工作,在对网管告警详细信息进行梳理归类之后,可得出。

(1)紧急告警全部为ETH_LOS,网口连接丢失。

(2)重要告警主要为I N_PW R_A BN,输入功率异常;APS_INDI,复用段保护协议状态指示告警;MS_A PS_I N DI_EX,复用段倒换指示扩展;T_ALOS,E1/T1接口模拟信号丢失;POWER_ABNORNAL,电源丢失和LCAS_FOPR、LCAS接收方向协议失效。

(3)次要告警主要为PORTMODE_MISMATCH,远端FE端口工作模式不匹配告警;UP_E1_AIS,上行方向2M信号告警指示;DOWN_E1_AIS,下行方向2M信号告警指示,CLK_NO_TRACE_MODE,时钟进入非跟踪工作模式。

告警总量共计122条,其中紧急告警4条、重要告警51条、次要告警67条。告警涉及本场光环网核心环、主环、环带链以及点对点传输形式,涵盖网元节点多,其中包括场外12个网元节点,场内4个网元节点。部分告警级别设置不突出、层次不分明。综上所述,网管告警呈现数量多、类型杂、涉及广、告警信息级别设置不恰当等特点。

2.2 告警处理

通过对告警情况的梳理,制定了告警处理四原则:先主环后核心环、先外场后内场、先无业务后有业务、先非停机后停机。以安全运行保障为前提,先易后难、先小后大、先外后内,进行专项告警清理工作。以下为展开主要告警类型的排查过程。

(1)IN_PWR_ABN,输入功率异常告警,此类告警共计6条,涉及5个节点,包括大终端、航管楼、西场监、R3北下滑及核心辅助环的二塔台节点。我们秉持四原则,分批进行光纤中继链路优化。

①二塔台辅助环节点为本场光环网核心辅助环网节点,该环网无在用重要业务,前往二塔台进行光纤中继链路优化调整,更换光纤链路(二塔台—二次雷达迁—终端进线间—大终端);②西场监节点停机维护,进行核心环航管楼节点OSN 3500至西场监雷达节点OSN 500其中一条光纤中继链路优化调整,更换光纤链路(航管楼—R1南下滑—西场监雷达);③大终端节点停机维护,进行主环A上大终端节点OSN 3500至浦东培训楼节点OSN 1500光纤中继优化调整,更换光纤链路(大终端—终端进线间—浦东培训楼1楼—浦东培训楼6楼);④大终端节点停机维护,进行核心环大终端节点OSN 3500至航管楼节点OSN 3500光纤中继链路优化调整,在大终端节点光接收口添加光衰减器;⑤R3北下滑节点停机维护,进行主环A上R3北下滑节点OSN 1500至R1北近台节点OSN 500其中一条光纤中继链路优化调整,更换光纤链路(R3北下滑—R1北下滑—R1北航向—R1北近台)。

历经4次停机维护,通过光纤中继链路优化调整,链路输入光功率正常,共计消除异常告警6条,分别为输入光功率过低5条,涉及大终端节点、西场监节点、R3北下滑节点、大终端辅助环节点、二塔台辅助环节点;输入光功率过高1条,涉及大终端节点。

(2)POWER_ABNORNAL,电源丢失告警,此类告警共计1条。告警发生点为核心辅助环的二塔台节点,前往二塔台,发现整流模块其中一路空开未启用,在打开空开后电源接入正常,告警消除1条。

(3)APS_INDI,复用段保护协议状态指示告警、MS_APS_INDI_EX,复用段倒换指示扩展[1],此两类告警共计4条。该告警提示核心环航管楼节点曾经发生过交叉板主备倒换。查看网管配置,航管楼节点至西场监雷达节点采用线性复用段1+1保护,且倒换方式为单端非恢复式。在进行核心环航管楼节点至西场监雷达节点其中一条光纤中继链路的优化调整后,更改配置为双端恢复式,与环网其他采用线性复用段1+1保护的节点保持配置一致,主备倒换状态显示正常,清除告警4条。

(4)ETH_LOS,网口连接丢失告警,此类告警共计4条,查看业务配置资料表及网管配置后可将其分为以下两种情况。

一是以太网单板端口业务已配置,端口开启。查看现场发现未接入用户侧信号,根据业务配置资料表与用户沟通,确认业务是否接入使用。若没有接入需求,立即删除端口业务配置,释放端口资源;若后期有接入需求,则进行告警反转操作,并在业务配置资料表中记录标注。二是以太网单板端口业务已删除,端口开启。根据业务配置资料表进行设备现场核对,关闭未在用端口。我们将ETH_LOS的告警级别由紧急告警调整为重要告警。这样能够区别过去的紧急告警,有助于告警级别的及时分辨,提升全员对其他类型紧急告警的敏感度。

(5)T_ALOS,E1/T1接口模拟信号丢失,此类告警共计39条。查看网管E1单板端口业务配置及资料,结合现场排查和用户沟通,明确告警涉及的业务主要分为两类:一是用户已不再使用;二是预留配置,用户暂时未接入使用,之后会接入使用。对于第一类告警,进行删除配置、释放端口资源操作。对于第二类告警,进行网管SDH路径去激活(仅网管侧删除业务)操作,在业务配置资料表中记录标注,待用户确认使用后,重新激活。

(6)PORTMODE_MISMATCH,远端FE端口工作模式不匹配告警[2],此类告警共计3条。查看网管以太网单板端口业务配置及资料,与用户沟通明确该业务端口工作模式的诉求,将两端配置匹配起来,告警清除。

(7)LCAS_FOPR,LCAS接收方向协议失效告警,此类告警共计1条。在网管上通过告警定位,确定两端节点LCAS协议功能开启或关闭是否一致,根据需求修改为一致,告警清除。

(8)UP_E1_AIS,上行方向2M信号告警指示,此类告警共计24条。在网管上查看该告警,确定产生告警的单板,经排查分析,产生原因分为四类:一是与本端支路单板对接的支路单板存在TU_LOP、TU_AIS、DOWN_E1_AIS等告警;二是对接端接入2 Mbps信号的支路单板存在T_ALOS告警;三是与本端支路单板对接的支路单板存在PLL_FAIL、CHIP_FAIL等硬件故障告警;四是对端E1端口设置了内环回。通过网管告警信息分析得出24条UP_E1_AIS告警分别属于一类和二类,皆可采取T_ALOS告警处置方式,告警清除。

(9)DOWN_E1_AIS,下行方向2M信号告警指示,此类告警共计25条。在网管上查看该告警,确定产生告警的单板,经排查分析,产生原因分为两类:一是本端有高级别告警R_LOS、R_LOF、MS_AIS等存在;二是对端支路单板存在UP_E1_AIS、T_ALOS等告警。同样皆可采取T_ALOS告警处置方式。

(10)CLK_NO_TRACE_NODE,时钟进入非跟踪工作模式,此类告警共计5条。该告警为网元节点未配置时钟优先级别,其中涉及点对点大终端节点至航管楼节点、点对点航管楼节点至Thales雷达节点、核心辅助环三个节点。在配置各节点时钟优先级后,告警消除。由于点对点和核心辅助环网SDH设备暂未接入外部时钟信号,后期还需进一步优化。

经过4次停机,10人次前往机场飞行区,清除共计122条网管侧存量告警,包括紧急告警4条、重要告警51条、次要告警67条;涉及核心环、主环、环带链以及点对点拓扑;包括场外12个网元节点、场内4个网元节点。

2.3 告警处置指引

网管告警遵循“收端检测、收端上报”“高级别告警会引起低级别告警、高级别告警会抑制低级别告警上报”。通过多次的告警清理实践,我们对于特定告警类型结合实践形成了以下比较标准化的处置步骤。

(1)对于出现IN_PWR_ABN,输入功率异常告警的处置步骤:①告警定位,确认告警源,查询本节点光功率;②停机维护中,对于输入光功率过低,首先清洁本节点尾纤和线路板接收光口,确认光纤连接正常;③检查尾纤弯曲半径,重新布放尾纤;④使用OTDR仪器进行逐段光路测试,对于异常进行调整;⑤对于输入光功率过高,在接收光口添加合适光衰减器。需要格外注意的是,断开两节点设备光纤中继链路时一端先断开,避免出现由于资料错误导致的鸳鸯线,使得两节点中继全部中断,尤其对于点对点节点更为关键。同时需要注意调整过程中双芯光纤AB线,进行标识及记录。光功率异常需要引起相关人员重视,因为这会影响业务传输性能,严重会导致业务中断[3]。

(2)对于出现T_ALOS,E1/T1接口模拟信号丢失告警的处置步骤:①查看该通道是否设置告警反转;②用户业务是否接入;③电缆是否脱落或松动;④电缆是否故障;⑤E1/T1单板是否故障。

(3)对于出现R_LOS,接收线路侧信号丢失告警的处置步骤:①检查本节点单板光接口尾纤连接情况;②检查对端节点单板激光器开关情况;③检查传输线路光纤情况;④检查传输线路衰减情况;⑤检查对端节点单板发送部分情况;⑥检查本节点接收部分情况。

R_LOS属于最高级别告警,在告警发生时必须要高度重视,根据网管告警功能准确定位、详细分析、快速处理。

3 结束语

光传输在空管通信中占有重要地位,日常的运行维护更为重中之重,从业务开通,到与用户持续跟进、优化业务配置,网管的深化工作等任重而道远,我们将持续加强与用户沟通、排查梳理、进行针对性配置,灵活运用故障告警分析方法,实施有效的运行维护管理,深入挖掘发挥好网管等各种工具,向数字化运维转型。■

猜你喜欢

航管单板网管
摄影作品
浅谈军民航航管的融合发展
单板U型场地滑雪关键技术动作及训练方法
传输设备速率对于航管雷达融合处理的影响研究
航管应答机退敏和恢复的设计研究
单板层积材带来的内部生产模式
封面人物 单板滑雪凌空飞燕蔡雪桐
“五制配套”加强网管
发射机房网管系统的设计原则及功能
网管支撑系统运行质量管控的研究与实现