关于互联网接入系统和认证服务故障的分析
2014-11-12魏文哲等
魏文哲等
摘 要:文章主要叙述互联网接入系统与计算机认证故障的现象与分析,特别是网络连接瞬时中断引起认证服务停止,采取更换连接网线,设置ZX AAA Session Service服务启动属性为自动重启,彻底排除系统故障。
关键词:互联网接入;计算机认证;故障分析
1 系统的基本结构
系统由两台DELL Poweredge 2950服务器连接DELL Power Vault MD3000磁盘阵列,连接接入服务器BRAS T600,下联核心交换机ZX-T160到DSLAM接入层,连接用户宽带网关。系统软件为WINDOWS SEVERS2003、MICROSOFT SQL SERVER 2005,AAA应用软件为中兴业务管理系统ISAM。
2 系统基本介绍
接入服务器BRAS T600是宽带城域网中的重要设备之一。BRAS在城域网中的定位和使用使城域网真正得以成为可运营、可管理的智能化网络。BRAS提供大量宽带用户的高速接入,易于快速扩容和增加新功能,可支持ADSL、LAN、无线接入、WLAN等多种接入方式,满足各种不同类型的运营商和服务提供商的需要。具有简单、高效、统一的用户管理模式,提供灵活的多种认证、计费和管理方法。BRAS宽带接入服务器系列定位于对普通接入用户以及集团大用户宽带业务的承载和管理。普通接入用户的承载和管理是指BRAS实现对采用xDSL、WLAN、以太网或者Cable modem等方式接入的宽带接入用户的授权、认证和计费及业务开展;对于集团大用户的承载和管理是指BRAS对于专线、VPN以及虚拟ISP的支持。
T600的主要特色是:采用先进的Crossbar交换结构,支持320Gbps交换网板,集中式控制,分布式处理,整机处理性能优异。采用高性能的网络处理器和专用硬件芯片,充分保证每个插槽的线速处理能力,整机支持8个10G接口线速转发,整机转发性能可高达200Mpps。除了提供oc-192 10G POS和10GE WAN/LAN等高速接口外,还可以提供2.5G POS、622M POS、155M POS、GE、FE、cPOS3/cPOS48、E1/E3等丰富的接口类型,充分满足用户的各种组网需求。T600的 PPP最大并发128K,单板最大PPPoE/IPoE/PPPoE+IPoE用户数32k。热冗余控制引擎,支持无中断切换,并支持基于会话级的可靠性。当软件或硬件失效时,所有的DHCP,PPPoE,PPPoA,L2TP会话仍然维持激活并继续转发流量。软件完全模块化,每个协议是一个单独的进程,一个路由协议的故障不会影响任何其他协议,每个协议都可单独stop和restart,大大增强了系统和网络的可用性。性能优异,优越的组播性能,支持PPPOE组播功能,可针对每用户定制管理,提供允许、禁止、预览三种功能,并可限制用户最大接受组播组数,完善的组播安全控制功能,为IPTV业务的运营提供了坚实的保障。第三方的测试验证BRAS在1个接口卡上同时为10,000接收者线速复制组播流的能力。此外在同一电路上也支持单播及组播的共存。
T600电信级宽带接入服务器就是针对目前中国的宽带网络建设所面临的问题而设计的,可以满足网络运营商对网络更高层次管理的要求,同时可以有效地向用户提供综合型宽带数据业务,从而为运营商提供高度可拓展的面向业务的解决方案,使IP网成为一个可运营、可管理的电信网络。支持多种新的增值业务,包括IPTV业务,BOD业务,VOIP业务,家庭网关业务,企业接入业务,VOD业务,绿色上网业务 。
ZXT160为汇聚层交换机,负责下连各接入层设备,EPON、DSLAM等。
DSLAM为铜线接入设备,用于连接用户MODEM设备。
3 系统故障
认证服务不定时停止,用户无法正常登录,手动启动服务,系统恢复正常,但是没有根本解决问题,故障会反复出现。
4 故障分析
首先登录WINDOWS SERVER,打开事件查看器,有故障记录服务ZX AAA Session Service意外停止,没有报告其停止原因。通过点击管理工具,点击服务,点击ZX AAA Session Service,手工启动服务,系统恢复正常。但是没有查到故障的根本原因,厂家的技术人员采取了很多方法,仍然未能彻底解决问题。经过长期的观察,发现故障不定时出现,没有规律性,在仔细检查服务器网络接口时,发现网线KJ45接头小,有轻微松动现象,由于是随机器提供的成品连线,没有引起厂家技术人员的注意,在服务器工作时产生的微小震动,造成接触不良,网络中断,又很快自动恢复连接,引起ZX AAA Session Service服务停止,造成系统接入认证故障。
5 解决问题
更换连接网线,设置ZX AAA Session Service服务启动属性为自动重启,彻底排除系统故障。
总结;在实施系统建设时,我们一定要仔细连接各个网络设备,以免为以后系统运行时留下隐患。在故障出现时,我们要从系统硬件和软件两个方面进行排查。