WLAN网络维护的一些思考
2014-04-29谢磊
谢磊
摘 要 WLAN作为中国移动网络的有益补充,主要覆盖在学校、工厂等一些用户密集区,适合带宽要求不是很高,但价格要求低廉的消费人群。由于WLAN是移动四网当中最小的一张网络,所以网络质量经常被轻视,但网络虽小,受众面却很集中,同样也是移动公司的大客户,所以,维护好WLAN网络也同样重要。
关键词 WLAN网络 管理制度 常见故障
中图分类号:TP393 文献标识码:A
1 WLAN维护管理概述
1.1 WLAN维护管理的基本任务
要搞好WLAN维护,首先我们要了解需要维护人员做什么,目标明确后才能有的放矢。主要任务有:
(1)保证设备的完好,设备电气性能、机械性能、维护技术指标及各项服务指标符合规范,达到标准;
(2)搞好全网的协作配合,迅速准确地排除各种通信故障,保证全网的运行质量;
(3)确保网络层的维护和网间配合工作,实现业务的可靠性;
(4)搞好网络优化,提高通信质量;
(5)做好网络安全的管理。
1.2 WLAN维护职责
(1)认真贯彻执行有关维护管理的各项管理制度、维护规程和安全措施,完成各项通信任务和质量目标;
(2)组织制定维护作业计划,定期检查和分析设备、网络及系统的运行情况,保证设备完好,系统运行正常;
(3)负责本地AP、AC及辅助设备的各种告警,发现问题积极与相关部门和厂家联系,完成本地故障的检查、定位、测试和修复工作,并积极向(区、市)公司网络部门报告设备情况,事后认真总结,制定防范措施;
(4)负责处理WLAN系统与本地数据网节点的故障,定期检查WLAN系统与本地数据节点间网络连通性,主动和部门协调排除故障;
(5)负责WLAN系统软件版本管理及关键数据的备份,包括:设备软硬版本升级、软硬件技术资料的管理、系统数据库、文件系统的备份等;
(6)负责受理本地业务部门的申告,并及时处理;
(7)负责上报现场维护质量统计报表和数据统计报表。
2 WLAN故障分类
凡线路在承担业务期间,不何种原因造成中断或质量低至用户反映无法使用,称线路故障;凡介入通信的主备用设备,在规定的运行时间内不能正常运行者,称为设备故障;由于管理、联系或操作错误等原因造成通信故障或不良后果的为人为故障;由于WLAN系统服务质量低下,业务无法正常使用而造成大量用户投诉的,称为业务故障。
WLAN系统BRAS、RADIUS或PORTAL服务器宕机导致WLAN业务全阻超过30分钟,以及WLAN认证计费系统与CMNet骨干网IP通路及与七号信令网通路中断导致WLAN业务全阻超过30分钟的现象称全网严重故障。
WLAN认证系统与本省(区、市)IP通路及与七号信令网通路中断导致该省(区、市)WLAN业务全阻超过30分钟的现象称省内严重故障。
其它为一般故障。
3故障处理的传报
(1)严重故障发生后需立即汇报
严重故障在24小时内向上级主管部门书面汇报;当地网络部门应立即查清故障原因,落实防范措施,确定故障性质和责任;当事班组应填写故障报告,由主管领导闹意见,于故障发生后三天内报上级主管部门。
(2)故障处理中的牵头单位和部门
有关中国移动通信计费认证的故障处理由省公司网络部牵头,其他单位和部门配合;与当地GSM网之间故障处理,由基站室负责处理,其他单位和部门配合;中心交换机、汇聚设备、传输设备故障,由交换室负责处理,其他单位和部门配合。
4设备故障统计
WLAN系统的各类设备出现故障,都应做好详细的记录,并定期对故障现象和处理情况进行汇总统计。
(1)设备故障记录内容应包括故障现象、故障类型、故障起始时间、故障修复时间、故障历时、故障原因分析及解决情况、故障处理情况及责任分析、故障处理人等;
(2)汇总统计时应根据故障类型,对各类问题进行汇总,对涉及设备质量方面的问题,应及时向有关部门报告;
(3)全网严重故障应立即上报集团公司。
5 WLAN维护测试软件介绍
Network Stumbler工具是一款使用范围比较广泛的免费版无线网络管理程序,通过该程序我们能很方便、快捷地找到附近的AP,我们可以借助该程序来检测AP在某个位置处的信号发射强度,SSID以及AP的MAC地址等信息,甚至还能识别出一些无线设备生产厂商的信息。
在寻找局域网中的信号点时,我们可以先将Network Stumbler程序下载到一台笔记本电脑中,然后按常规方法安装好Network Stumbler程序。当Network Stumbler程序安装成功后,我们可以直接用鼠标双击系统桌面中的对应程序快捷图标,这样Network Stumbler程序就能自动启动并搜索单位局域网中的无线信号。
6 WLAN常见指标统计分析
目前,统计分析WLAN指标、数据除了在WLAN综合运行支撑系统中从界面上查询统计基本的指标、数据外,还可在省公司SBASE数据库或各本地网的SQL数据库中按脚本统计、查询。网管系统界面统计查询局限性比较大,但相对方便、简单,所以我们界面上实现了一些最基本的统计功能,如果需要更个性化的分析,各本地网可以登录各自本地数据库编写脚本查询。界面上的查询统计方法可参见WLAN支撑运行系统的相关使用说明。下面列举一些常见的指标及数据的数据库查询脚本及分析方法。
(1)WLAN中心机房设备可用率
集团设备可用率定义为每15分钟查看当前告警表wlan-ap-alm一次并每个AP生成1条记录,记录到省公司数据库WLAN-fm表中,表中字段IS-AP-Available为“1“代表可用,“0”代表不可用;字段Snmp-Error为“1“代表可控,“0”代表不可控。
(2)5分钟设备可用率
设备可用比定义为每5分钟查看当前告警表wlan-ap-alm一次并每个区域生成1条记录,记录到数据库ap-kyl表中,表中字段almnum代表统计时刻不可用的设备数,字段sumnum代表设备总数,time代表统计时刻。
(3)设备的可用历时率
设备可用历时率定义为每1小时统计当前告警表wlan-ap-alm和历时告警表wlan-ap-alm-his,计算每个AP这个小时内不可用的总时长,并每个AP生成1条记录到数据库ap-kylsl表中,字段almtime代表统计时段内AP不可用的时长(单位为分钟),字段sumtime代表总时长(默认为60分钟),time代表统计时刻前一小时,即统计的这个小时的开始时刻。
(4)告警恢复及时率
告警恢复及时率是测算系统中AP各类告警的情况,与调派单及时率没有关系。告警恢复及时率是查询历史告警表wlan-ap-alm-his和当前告警表wlan-ap-alm中所有超过时限的告警,A类AP时限为360分钟,B类AP时限为600分钟,C类AP时限为1440分钟来计算告警的及时率。
(5)告警恢复超时清单
告警恢复超时清单是指A类AP告警超过360分钟,B类AP告警超过600分钟,C类AP告警超过1440分钟的告警清单,便于及时率较低时分析原因用的。
总之,只要维护人员用强烈的责任心,掌握熟练的技能,积累丰富的经验,维护好WLAN网络就能够实现。