APP下载

CMTS网络故障排查的思路探索和研究

2014-04-29徐永

电子世界 2014年15期
关键词:网络故障管理对策

徐永

【摘要】CMTS是HFC双向广电网络的核心节点设备,本文重点研究了CMTS网络的运行方式和故障排查方式,特别对于CMTS网络的故障管理和检修管理思路提出了对策建议。本文认为,通过合理的网络排查流程和故障管理对策,CMTS的运行可以满足目前市场对于网络稳定性的要求。

【关键词】CMTS;网络故障;管理对策

CMTS是基于双向交换的CATV网络的升级版HFC网络关键设备,起到桥接HFC网络和公共数据交换网的关键作用。采用光纤网络取代CATV的干线网络,使用双向放大器取代CATV网络末端同轴线路的单向放大器,即可使得在原CATV介质环境下实现双向HFC网络。采用了CMTS设备的双向HFC网络虽然实现了较高速度的双向数据传输,但其带宽已经逐渐无法满足目前百兆家庭网络的接入需要。但目前家庭宽带市场中4M网络和8M网络仍然占到相当的组成部分,所以,如何在当前市场环境中维护好CMTS设备及相关的链路沿线硬件,是本文研究的主要问题。

1.从CMTS设备特点分析其故障点

1.1 网络故障

CMTS需要在HFC一侧布置高通滤波器和低通滤波器将同轴中的上行数据信号,下行数据信号,电视信号分离开。因为同轴电缆线缆较硬,连接器件往往采用手动压接,压接工艺质量难以得到保证,所以,HFC一侧的硬件故障绝大多数来自系统虚接、短路、开路引起的故障。特别是滤波器之前的硬件故障,因为虚接或者线缆之间的相互干扰,可能造成系统带宽出现明显的下降,甚至出现无效数据包的现象。

而CMTS在ROUTER一侧的连接线一般采用千兆以太网或者百兆以太网的形式实现。因为虽然每一路HFC的带宽都较小,只有50Mbps左右,但每个CMTS通过刀片式的布局,需要更高的背板带宽连接ROUTER。

图1 CMTS核心设备布置图

1.2 软件故障

CMTS要与CM进行通讯,其配置内容较为复杂,每一项配置内容出现问题,都可能造成系统的通讯错误:

电平及频率控制是HFC网络中物理层控制的主要内容,在CMTS的配置功能中,可以直接通过命令行界面控制下行频率,上行频率,下行电平,上行电平等信息,在一个独立的HFC网络中,所有的CMTS和CM设备的物理层配置必须一致,否则这些设备无法进行相应的通讯。

同时,在对CMTS级联口的配置中,需要对CMTS的IP地址、主机名、DHCP、TFTP进行配置,以确保CMTS与ROUTER之间的通讯正常。CMTS的实质是HFC网络的交换机设备。

1.3 硬件故障

当输入电压不稳定、运行温度和湿度不符合要求时,CMTS会同其他网络设备一样出现硬件故障,故障原因来自其内部器件(电容器、电感器、电阻器、基于PN结的电子设备等)出现非线性的特性改变。

长时间处于以上较恶劣的运行环境中,CMTS同样会出现内部器件的疲劳和烧毁。往往CMTS采用刀片式布局,而背板系统的故障概率远小于刀片系统。在背板系统中,较容易损坏的电源模块往往也设计为可以热插拔的2~4组。所以,CMTS在出现故障时,需要及时判断故障是否来自硬件本身,进一步选择并列解方案。

2.常见故障的定位及排除方式

2.1 HFC端网络故障

HFC网络的主要故障源来自网络噪声,网络噪声除了谐波干扰之外,主要来自以下三个方面:

首先,使用同轴测线仪可以測量同轴线路的连通性,以确定同轴线路是否中间出现了折断。另外,电阻式同轴测距仪可以测量同轴的距离,以确定其中间是否发生了击穿和漏电的现象。

其次,通过SMNP网络管理协议,可以测试终端机和其他试验性接入点与其他关键节点之间的联通关系。同时,可以得到各个关键点之间的网络联通健康程度的报告。

最后,通过对于关键节点的重点维修,插拔,重新压制连接点,可以有效排除因为网络连接点虚接造成的故障。对于电缆传进穿出麻花管或者其他管道的接口处、电缆跨越繁忙道路的高架处等较容易出现故障的地点,都可能出现电缆的磨损和断路。通过对这些地点的排查,可以较快速的找到网络的故障地点。

2.2 ROUTER端网络故障

CMTS的ROUTER端网络较为简单,一般视ROUTER后的网络进行管理,基于CMTS的ROUTER一般为双口ROUTER维护较为简单。目前,往往将ROUTER的下行口配置成HFC的网段地址,而上行口配置成干线回路的地址。广电网络的干线回路地址往往采用公网IP实现,也有部分区域为了管理方便,按照10.0.0.0网段进行配置。而HFC进入住户CM之后,往往住户还会部署家庭中心路由器进行管理,可以再度划分网段。

CMTS的ROUTER端的主要问题来自ROUTER的配置和上行交换机的配置,这些配置必须适应HFC网络的复杂性,在多路由网络的管理中,保证每一跳转均可以真实有效。

CMTS到ROUTER之间的连接线一般采用单模光纤实现,单模光纤的连接卡扣也存在松动、灰尘污染等现象。也可能在机柜维修中误碰电缆造成的线缆中部折断。所以,采用激光功率计测试CMTS到ROUTER之间的光纤激光衰减可以有效防止出现CMTS到ROUTER之间的光纤损坏问题。如果CMTS部署量较大,可能存在CMTS和ROUTER不同柜的现象,这给激光线路的排查带来困难,采用OTDR可以直接断定CMTS和ROUTER之间的光纤是否出现断纤或者过度弯折。

2.3 硬件故障

如果出现电源指示灯、系统运行指示灯不正当闪烁,信号指示灯闪烁不正常,都标志着CMTS设备本身的运行出现了问题,首先应该启用备用刀片将线路迅速跳接到故障刀片上,观察备用刀片的运行状态,如果可以恢复正常,则切除故障刀片进行维修,如果切换到备用刀片仍然无法正常运行,就要考虑重新启动设备或者启用备用设备。如果仍然不奏效,再考虑排查因为线路问题造成设备运行部正常的状态。防止出现首先进行复杂的线路检修而错过快速处理故障的窗口机会。如果设备出现严重的电流杂音、焦糊气味、异常噪音或震动等现象,应该立即启用备用设备,完成线路跳接,切除故障设备,防止事故的扩大化。

如果高通滤波器、低通滤波器、PDU、UPS等配合设备出现运行故障时,也应该根据应急预案,及时启动备用设备或者采用替代运行方案进行处理,确保断线时间控制在最短。

3.思路及对策

3.1 先抢修后追责

因为网络通讯的抢修必须注重抢修响应时间和修复时间的时间点控制,所以,在发生事故的时候,首先应该最快的响应速度执行抢修预案,确保检修人员和机房管理人员在第一时间到达问题CMTS及HFC网络的各抢修检测点。抢修用设备及工具需要随车携带,防止出现现场缺少工具导致部分检测无法执行的衍生事故。

在事故抢修完成后,不管抢修是否顺利,都应该进行事故追责。因为只有完整的事故追责才可以发现现有设备的相关隐患,保证隐患在转化成事故之前得到妥善处理。追责过程分为三部分:

其一是必须详细了解本次事故发生的原因,故障点的特征与既定的故障定性标准进行比对,对故障进行定性。

其二是必须详细了解本次事故发生的机理,如果是客观事故,应该研究避免此客观原因的新工作方法,而如果是责任事故,则应了解责任人的工作能力是否适应本职工作要求,并进行相应的人事对策。对责任人执行人事对策的目的是保护系统的可靠性,而不是针对某人的处罚。

其三通过之前追责的结果,如果是客观事故,应该对所有类似隐患点进行排查,以确定是否存在类似的隐患。如果是责任事故,应该对该责任人的所有责任区进行排查,以发现其他没有转化为事故的故障点。

3.2 预案与冗余同等重视

再严密的管理,再先进的设备,都会出现故障,只要出现故障,就可能演变为事故。所以,事故是客观存在的,其存在方式与概率相關。我们必须对每个设备建立台账,以充分考察及事故概率,以发现该设备需要配备的冗余设备的合理配置。同时,我们应该对设备可能发生的故障建立预案。

其一是定位预案。在发生某条线路的故障时,应该根据故障区域迅速定位可能的故障点,部署中间节点抢修人员和巡线抢修人员。网络工程师应该迅速进入CMTS和ROUTER管理系统进行相应参数的监测。

其二是抢修预案。抢修人员出动需要配备的设备、工具、资料等,需要提前打包,做到快速行动且井然有序。

4.结束语

总之,CMTS在HFC网络中属于中心节点设备,其故障排查的效率对于整个广电网络的稳定性可靠性的影响都是巨大的。本文梳理了CMTS的网络特性和检修方法及管理对策,认为在合理的管理模式下,CMTS的检修工作可以满足HFC网络的运行要求。

参考文献

[1]徐志成.巧用CMTS管理软件进行Cable Modem主动维护[J].中国有线电视,2012(05):151-153.

[2]郭一帆.基于IPDR协议的线缆调制解调器管理系统[J].现代计算机,2013(03):57-59.

[3]刘洋.有线电视HFC终端设备管理系统设计与实现[D].电子科技大学硕士,2011.

猜你喜欢

网络故障管理对策
汽车涂装车间改造中一种网络故障的解决方案
VxWorks网络存储池分析在网络故障排查中的应用
基于信息流的RBC系统外部通信网络故障分析
中学生考试作弊问题分析及其管理对策
国有风险投资发展中所面临的问题研究
浅析电力多经企业的现状及其管理对策
刍议水利施工企业的财务管理
Wireshark协议解析在网络故障排查中的应用
企业信息化建设与网络故障的识别
通讯网络故障类型研究