轻IT基础架构下的集中管理与排错
2014-12-26高峰
高峰
所有对网络故障维护有丰富经验的人都清楚:在早期网络中,大概75%左右的故障来自于网线或物理接口的物理连接。伴随着技术的发展、综合布线理念的贯彻与执行、制造工艺的提升和线缆与接口质量提升,这一故障的比例大幅度的降低了。那么当我们的最后100米实现了无线化之后,我们的网线和物理接口会出现什么样的情况呢?
最后100米带来的改变
■灵活性的大跃进与技术本身的退步
首先,我们应该有一个明确的认识:无线WLAN网络事实上交杂着网络灵活性的提升和网络技术的倒退。从技术角度讲,WLAN相当于从交换式以太网年代退回到共享式以太网年代,倒退了至少5-10年。特别是从物理介质上来看,在当前采用的交换式以太网中,每个用户是独享传输介质的;而无线网络中的所有的用户都共享物理信道,只要用户间相互可见,无论有多少个AP,所有工作在同一频点的用户都可以共享相同的物理介质。这是典型的同轴共享式以太网或基于HUB的共享式以太网的特征。而在共享式以太网里,需要考虑的如物理数据碰撞、网络用户量与数据量规模无法无限扩展等问题也重新归来。因此,对网络维护人员来说,在进行网络排错时需要考虑的因素明显增加了,工作量也随之加大。
■便捷性与管理复杂度的双重提升
相比较以太网,WLAN在提升便捷性的同时,其传输介质发生了明显变化:从几乎绝对可信的铜缆和光纤,变为绝对不可信的频谱资源。因此,相较于管理以太网络,网管人员不仅要有充足的TCP/IP知识,还要在在管理无线网络时对无线网络中的射频知识,如最关键的信噪比、信号强度、发射功率、天线增益、干扰等等概念的拥有深刻的理解;同时还要理解802.11协议的独特特性及重传等概念。这对网管的知识体系提出新的挑战,并且令对接入介质的管理复杂度呈几何级提升。
■从管理“有”到管理“无”
传统以太网是有线网络,所有的连接是可见的,某个终端连接到具体哪个设备是明确的。而无线网络的连接是不可见的,某个终端在整个的接入过程中会不断的发生切换,从一个接入设备切换到另外一个接入设备,在某些极端情况下设置会在两个不同的接入AP之间一分钟之内切换几十甚至上百次,并且这种切换完全由客户端决定。传统网管软件的刷新速率已经完全无法把握这种情况。因此,如何管理“无”的问题,成为无线管理的需要解决的大问题。
自动化部署WLAN
■大规模/对分支机构WLAN管理为何需要自动化部署
目前利用WLAN完成企业最后100米接入已经成为明确的发展趋势。我们势必要在网络部署的简易性方面提升我们部署WLAN的能力,以加快部署时间,降低网络部署成本和及时维护成本,并加快WLAN问题的修复。
例如:在商业环境中例如超市,仓库等环境,更快速的部署意味着更早的使用时间,从而提升企业的盈利能力。在医疗,教育等环境,自动化部署意味着AP设备零配置,在排除网络故障也时无需考虑AP的配置问题,仅需考虑网络的可连接性。若是在硬件损坏的情况下,仅需简单的硬件替换即可完成故障排除,而无需重新对新增设备进行调试。
对于多分支机构或者大型园区而言,由于其网络管理人员的数量极为有限,对于远程的安装需求往往鞭长莫及。如何快速、有效、高质量完成远程站点的部署也是摆在大家面前的一大现实问题。
■自动化部署的关键思想
配置预置 要做到自动配置,那么首先就要做到配置预置,也就是说能够将AP的配置预先配置在控制器里。这里的主要要求是部署时只需要简单的预先配置,而不用对每一个需要部署的AP都进行单独配置。不能做到这一点,就失去了自动化配置的意义。
配置关联 也就是如何将预先完成的配置自动关联到对应的AP设备上。
■自动配置的实现
自动预配置是如何实现的呢?由于一组的AP除MAC和IP地址外配置基本相同,但不具备MAC地址配置,且IP配置可选DHCP方式。当AP通过二层关联或通过DHCP获得IP地址以三层方式,自动关联至控制器时,控制器将根据匹配原则下发至AP设备。
至于AP实体设备与预配置的关联,事实上,对于AP而言也就是与对应Profile的关联。在具体部署时, AP可以通过二层以太网报文方式直接与控制器关联,也可以在获得IP地址后通过UDP方式与控制器关联。举例来说,假设在一个企业网络中,拥有三个楼宇,三个分支机构,那么此时,仅需建立6个AP,并引用对应的SSID/加密/认证安全/服务质量等配置,给楼宇的AP配置相应VLAN,然后将这些通过IP地址段映射到对应的AP上,分支机构甚至无需进行相应VLAN配置。一旦AP连接了控制器,控制器会根据AP所在的IP Subnet(IP子网)将对应Profile的配置分发给对应AP即完成了AP的全部配置,整个过程无需人工干预。
■部署自动化配置需要考虑的要素
显而易见,自动化配置无疑是中大型或者多分支行网络管理员的福音,但是在部署自动化配置时,必须对网络提前进行规划,这要求我们的IP/VLAN/DHCP等规划需要更强的逻辑性。
无线集中故障排查可视化
■无线网络拓扑的可视化
无线网络拓扑与有线网络拓扑差异很大。当我们讨论有线网络拓扑图时,我们只需将客户端简单的连接到接入交换机的物理接口即可。但在无线网络里,同一个AP还需要讨论其ESS/BSS的问题,即其拓扑图应该是客户端接入了哪一个BSS,然后是这个BSS到哪一个ESS。所以,无线网络的拓扑图与有线网络的拓扑图是完全不同的。
■不同的物理状态
在无线领域中,没有明确的线缆连接,只有无线区域的覆盖好坏。而且无线网络的动态特征导致无线区域的覆盖好坏是变化的。因此需要实时热图来监控整个无线网络,使其真正可视起来。
■物理层排错
在物理层排错时,大家普遍认为无线的干扰是网络质量的一个极大罪魁祸首。但事实上,无线网络中的资源利用率和干扰强度的组合才是真正的问题所在,而且干扰不仅仅是WLAN对WLAN的干扰,还包括其他同频干扰,例如微波、2.4GHz无线电遥控射频信号、蓝牙信号等等。因此在物理层排错中,必须对所有的干扰源进行分析,同时对其资源利用率进行监控。仅仅通过某种网上的免费工具事实上并不能够真正的将问题定位。
因此,对整个无线网络的物理层,用户需要实现的是一个完整的可视化呈现,包括各个信道的干扰强度、信道使用率、以及是否有非WLAN的干扰。
■真正了解网络的情况
在传统以太网中,如果用户出现玩游戏频繁“卡”的情况,那么基本上确定一下互联网出口的拥塞程度,看看用户Ping DHCP服务器的响应时间,基本上就可以定位问题了。但是对于无线网络来说,在进行相同的操作后,如果响应较慢,还需要定位是无线慢还是有线慢。如果无线慢,那么还要确认是哪种无线因素导致了网络缓慢:是干扰?冲突?无线网络整体性能不足?还是覆盖不合理的频繁漫游切换导致了这个问题。
故障排查可视化
要求无线网络完全无故障是不现实的,而物流与供应链行业的关键应用出于移动性考虑必须部署在无线网络之上,且任何的无线网络中断都会对整个物流与供应链的关键应用产生较大或者致命的影响。在这样的实际且严苛要求下,无线网络故障排查的高效率是我们必须提供的,特别是将关键应用部署于无线之上的机构。