网络设备的可靠性测试研究与实例
2014-08-15成都航空职业技术学院
成都航空职业技术学院 王 平
1.引言
可靠性是网络系统永恒的追求。网络系统的可靠性就像自然界的生态平衡,一旦被打破,需要具备自我恢复的能力。而高可靠性的网络设备,是网络系统稳定运行的物质基础。因此,网络设备在投入运行前,需要做严密的可靠性测试。
目前,从硬件设备角度出发,可靠性测试可以分为两类。一类是基于行业标准、国家标准的可靠性测试方法,一类是企业设计的可靠性测试方法,下面分别予以分析。
2.基于行业标准、国家标准的可靠性测试方法
产品在生命周期内必然承受很多外界应力,常见的有业务负荷、温度、湿度、粉尘、气压、机械应力等。各种行业标准、国家标准制定者给出了某类产品在何种应用环境下会存在多大的应力等级,而标准使用者要根据产品的应用环境和对质量的要求选定相应的测试条件即应力等级,这个选定的应力等级实质上就是产品测试规格。
在产品的测试阶段,必须在实验室环境下对足够的测试样本一一施加相应的应力类型和应力等级,考察产品的工作稳定性。对于网络设备而言,常见的测试至少包括电磁兼容测试、安规实验、气候类环境实验和机械环境实验。这些都属于规格符合性测试,实验的目的都是模拟产品在生命周期内承受应力类型和应力等级,考察其工作稳定性。
3.企业设计的可靠性测试方法
由于网络产品的功能千差万别,应用场合可能是各种各样的,而各种行业标准和国家标准并没有指明被测设备在何种工作状态和配置组合下接受测试,因此在测试设计时可能会遗漏某些测试组合。
比如机框式产品,线卡种类、线卡安装位置、报文类型、系统电源配置均可灵活搭配,涉及的测试组合会较多,必然会存在比较极端的测试组合。这就需要我们跳出传统测试规格和测试标准的限制,以产品应用的角度进行测试,保证产品的典型应用组合、满配置组合或者极端测试组合下的每一个硬件特性、硬件功能都充分暴露在各种测试应力下。这个环节的测试保证了,产品的可靠性才能得到保证。下面我们以包处理器外挂缓存的并行总线测试为例进行具体说明。
为了应对网络的突发流量和进行流量管理,网络设备内部的包处理器通常都外挂了各种随机访问存储器(即RAM)用来缓存包。
由于包处理和RAM之间通过高速并行总线互连,一般该并行总线的工作时钟频率可能高达800MHZ,且信号数量众多,拓扑结构复杂,在产品器件密度越来越高的情况下,产品很可能遇到串扰、开关同步噪音等严重的信号质量问题。当IC的驱动器同时开关时,会产生瞬间变化的大电流,在经过回流途径上存在的电感时,形成交流压降,从而产生噪音噪声,会影响信号接收端的信号电平判决。为了验证产品在这种工作条件下是否可靠,必须在被测设备加上一种特殊的测试负荷,即特殊的测试报文。
例如:
如果被测总线为16位宽,要使所有16根信号线同步翻转,报文内容应该为:
FFFF 0000 FFFF 0000
如果被测总线为32位宽,要使所有32根信号线同步翻转,测试报文内容应该为:FFFF FFFF 0000 0000 FFFF FFFF 0000 0000
如果被测总线为64位宽,要使所有64根信号线同步翻转,测试报文内容应该为:FFFF FFFF FFFF FFFF 0000 0000 0000 0000 FFFF FFFF FFFF FFFF 0000 0000 0000 0000
如果报文在设备内部的业务通道同时存在上述位宽的总线,业务测试必须加载上述的报文,开设备在每种报文下是否正常,同时在相应总线上进行信号测试,看信号是否正常。
4.结束语
针对不同的产品形态,硬件可靠性测试项目可能有所差异,但其测试的基本思想是一致的,都是完备分析测试对象可能的应用环境、极限的工作状态,设法让产品的每一个硬件特性、硬件功能都一一暴露在各种极限应力下,全方位测试其可靠性。
[1]林师友.关于自动化设备可靠性测试方法的探讨[J].企业导报,2011(15).
[2]刘涛.数据网网络设备网管接口的测试方法和测试软件设计[J].电信工程技术与标准化,2007(02).