数据终端局域网通信问题浅析
2016-03-05王正坤
王正坤
摘要:数据终端设备具有数据采集和数据通信功能,对系统架构设计、产品功能模块布局、无线通信射频系统设计及EMI整机系统设计提出了较高的要求。文章针对数据终端在局域网通信间出现的掉线和丢包问题,通过电路分段对比测试和结果分析测试,提出了调整AP组网布局、针对特殊环境定制模块工作模式、改善本机的BMC噪声等办法以彻底解决终端无线通信不稳定的问题,提高了数据终端的局域网通信的稳定性。
关键词:802.11 a/b/g/n;DHCP;漫游;AP搜索;方向性;CCK
数据终端是实现采集数据及向网络层发送数据的设备,终端的数据采集功能包括一维/二维条码识别、LF低频/HF高频/UHF超高频标签读写、图像采集、GPS/北斗定位数据采集、磁头/IC/NFC智能POS、指纹识别,以及光感、加速度、角速度、测温测震等诸多传感功能。网络传输功能则包括:UART/485/USB等有线接口、WAN(2G/3G/4G)和LAN(WiFi/BT/Zigbee)以及红外等无线接口。由于集诸多功能于一身,随之而来的无线通信互扰、EMC超标、RF性能、电源噪声等问题越来越多,处理的难度也越来越大。这类问题往往需要结合多种技术手段,根据终端自身电场环境和网络环境的特点,针对性地给出综合解决方案才能彻底解决。
提供给物流行业使用的数据终端在华南部分区域出现WIFI传输不稳定、数据传输过程中出现连续频繁丢包、长时间无法登录系统界面、货单同步下载过程中断网等现象。以广东XXX物流中心最为突出。通常这类物资站的WIFI网络信号覆盖很好,不应该出现通信不稳定问题。现场使用的802.11b/g网络,2.4G频段信号覆盖强度75dB。因为中转站的AP网络不接外网,周围也没有其他AP,所以网络环境相对干净,可就是不定期地出现问题。现场终端实测返回的信息强度显示,终端在工作区域接收到的信号强度>-75dB,A吓的最高值达到-30dB,没有弱信号盲区,AP间距30~40m,矩阵分布,每个终端都能看到10多个帆问题主要发生在交接班和集中上传下载数据时间段。
1问题判断分析
1.1现象1:数据传输丢包频繁
在现场有50多台终端连网,AP的信号强度在-75dB以上,测试终端在某些特定区域出现不连续但频繁丢包,达到10%的丢包率,说明数据链路不稳定,传输环境恶劣,但链路层可以稳定维持。说明传输回路上的数据信号信噪比低,本机或环境噪声的问题较大。
1.2现象2:数据传输连续快速丢包
测试终端有时在某些特定区域出现连续丢包,持续一段时间后有50%概率恢复,说明网络环境存在带内噪声导致WIFI数据链路受到干扰,接收端收到的数据失真严重,长时间解码不成功导致拼包丢失,数据链路断开,但AP还能看见终端,收到信标和ACK应答,但无法建立和维持数据链路。此现象产生原因除噪声干扰外,还可能有DHCP协议解析、IP分配策略、AP和终端同频干扰等因素。
1.3现象3:WIFI丢线
终端在某些特定区域出现连续丢包,信标和ACK都无法收到,持续一段时间后断网,终端的搜索APN表中已无法找到当前使用AP,说明数据链路和广播信令通道(CCK)全部断开。WIFI通信功能丧失,囊括了所有前面列出的因素。
2通信质量稳定因素
2.1天线方向性
终端上设计的WIFI天线是线极化天线,极化方向的变化会导致收信强度变化,再加上终端机构限制导致天线的方向性强,方向图上显示的方向空间场强会有较大变动,在数据传输期间移动终端,信号会随之产生超过10dB的信号幅度波动,引起模块做出切换传输速率动作(不同速率的调制方式不同),甚至启动漫游机制,向AP发起漫游请求。频繁的速率切换和漫游请求会增加网络链路维护开销导致拼包时间延长,出现丢包甚至断线现象。
特征表现:(1)在同一地点,随着机器的方向的变化信号值发生剧烈波动。(2)正对天线时,信号很好,性能高。但在其他角度的信号值变化大。(3)快速移动机器有丢包加剧甚至断线的现象。
从现场看丢包和断线的区域相对固定,时间则是随机的,而方向性是只要满足条件问题是必现的,现象不一致排除天线方向性影响。方向性的最直接判断方法是将终端在原地自转1周,看其收信强度有无大幅度波动(超过10dB)。
2.2本机噪声
终端内高速数字信号电路因为阻抗失配产生信号失真和反射导致大量的奇次谐波倍频到2.4G,影响WIFI的通信性能。在2.4GHz的工作频段内某些窄带频域形成干扰,表现为收信值下降,拼包速度延长,超时丢包。如果还有同频干扰的话,数据链路中断,甚至直接断线。
特征表现:(1)WIFI性能表现和网络信号强弱有倍速关系。(2)在WIFI进入速率切换和漫游状态时性能急剧下降,甚至断网。(3)在有外噪声的情况下,WIFI性能下降较多。(4)在信号很好时,表现出间歇性性能下降(切换、漫游)。(5)即使强信号下电会出现搜AP慢或者搜不到或者认证获取IP慢。
在现场上述特征表现明显,所以确认相关。判断本机噪声的最直接有效的方法是排除法,就是先用近场探头定位噪声源,然后通过控制噪声源,对比测试WIFI通信质量。本文针对上述EMI噪声问题做如下测试:
关掉终端的LCD,摘除Camera/扫描头/闪光灯/喇叭等功能组件,测试WIFI的性能有明显好转,丢包率由原来的10%降低到0.6%,连续丢包现象偶尔出现,没有出现断线现象。确定本机噪声是引起WIFI通信不稳定的关键原因。
解决问题的手段之一是切断噪声串扰的途径,噪声有2种传播,—种是空间场辐射骚扰,以WIFI天线和RF馈线为突破口,干扰2.4GHz工作频段。另一种是PCB板级串扰,噪声通过PCB的相邻信号线,相邻信号层以及地回路为传输载体,以模块的基带通信接口为突破口,干扰模块的电源、射频地、基带部分。
用EMI探棒在闪光灯附近测出有较强干扰。在400MHz附近空间辐射强度超过45dB。超过55dB的EMI限值10dB。用排除法先去除闪光灯排线,测出的辐射强度小于60dB,再测试改善后的终端,发现WIFI的丢包和断线概率有下降,反映出来的信号强度也较以前高5dB。分析闪光灯电路以及排线,发现闪光灯驱动端有宽频强噪声,该噪声沿着FPC排线向空中辐射,排线长度超过20mm且浮空,对地阻抗大,天线效应明显。另一噪声源在主板屏蔽壳间。噪声在300MHz附近空间辐射强度超过-50dB且有奇次谐波分量,间隔周期100MHz,一直延续到1GHz才衰减到正常范围。这种高频奇次谐波会在WIFI的某个信道产生带内干扰,是造成通信性能下降的潜在因素。通过近场探测定位是屏蔽壳不能有效屏蔽和衰减空间噪声导致的,分析屏蔽效果差的原因:(1)屏蔽壳接地阻抗较大。(2)屏蔽壳与PcB板问间隙引起。通过优化屏蔽壳接地,减小屏蔽壳接地阻抗,将空间噪声导入地平面,封堵屏蔽壳缝隙,切断噪声传播途径。上述方案实施后EMI噪声普遍衰减10dB。达到RF环境允许的环境噪声要求。
现场所有终端在经过本机噪声的处理后,WIFI性能显著提升,丢包率由原来的10%降低到2%,连续丢包现象偶尔出现,没有出现断线现象。下面是终端经EMI处理前后WIFI吞吐量指标的对比,测试参数设置如下:
802.11g 2Mhz定速模式下的点对点吞吐量测试,被测机和AP处于静止状态。设置数据包长度1KB,传输100000个包。测试距离:目视2m。测试环境在公司内搭建,属于复杂强干扰级别(现场终端能看到13台AP,信号强度大于70dB的有5个,测试AP和1台AP存在同频干扰)。
没有EMI处理前测试的吞吐量平均值处于1Mbps。有接近30%数据传输速率受影响。经过EMI工艺优化得到的同环境下最终测得吞吐量平均值处于1.2Mbps。在用户现场优化后的终端丢包率由原来的10%降到2%,连续丢包现象偶尔出现,没有出现断线现象。但还是有偶尔连续丢包现象,个别机器的丢包率甚至达到4%。
2.3组网环境质量
组网环境质量差在终端WIFI性能上的特征表现:(1)在特定区域WIFI性能下降明显。(2)在同一区域的WIFI性能出现概率性变化。(3)普遍有找AP慢,拼包延时长。(4)机器的性能和WIFI性能没有明显关系。(5)WIFI性能和时间、区域、AP有明显相关性。
在现场的某些特定区域丢包和断线的概率明显上升,符合上述特征表现,所以确认网络环境局部有缺陷。发现在配电房和接线箱附近通信性能下降明显,即使网络的强信号值大于-65dBm也存在频繁丢包现象,用频谱仪测试发现这里的空间噪声丰富,频带很宽,几乎覆盖600MHz以下所有频带。离开干扰源2m后通信性能恢复。这种区域在工作场只有2处且影响范围小,提醒客户注意使用时避开即可。
2.4组网资源不合理
组网资源不合理在终端WIFI性能上的特征表现:(1)在多AP组网场合,有超过40%的机器挂在同一AP。(24)机器只在1信道漫游。(3)同一信道存在2个以上强信号AP(>70dg)。(4)机器的性能和WIFI性能没有明显关系。(5)WIFI性能和时间、区域、AP有明显相关性。
在现场上述特征部分表现,所以确认相关。WIFI的AP组网如果存在缺陷,导致严重同频干扰和邻频干扰,网络负载失衡的问题。要避免上述干扰问题首先高清楚AP的工作频段,2.4GWIFI频道划分如图1所示。
布网时为避免同频和邻频干扰,最好相邻AP的工作频段不重叠,根据工作频段合理布网。通常AP信道选择1,6,11信道布网。但是如果布网区域内有较多重复信道的AP使用(特别是1信道),就需要采用其他信道组合。注意通常AP是没有14信道的,所以实际有3组组合供布网选择。因为1信道常作为WIFI的广播信令通道,因此终端在搜索AP是从1信道开始搜索,正常情况下1信道的AP会首先扫描到。因此要充分考虑l信道AP的覆盖面(蜂窝大小),可以加快切换AP的时间。另一个布网要注意的是在保证网络的AP覆盖区没有盲点情况下调整AP的蜂窝A-'J,使得相邻AP的蜂窝重叠区较小,为整个网络负载平衡提供理想网络环境。
2.5 WIFI漫游策略
WIFI漫游策略在终端WIFI性能上的特征表现:(1)在信号值接近漫游值的区域WIFI性能下降明显。(2)模块处于漫游状态的WIFI性能明显变差。(3)改变漫游阀值能够引起WIFI性能变化。(4)在单AP或少AP场合的表现明显好于多AP场合。(5)固定工作场合明显好于移动工作场合。
在现场上述特征不太明显,但不排除:(1)漫游阈值。模块接收的信号强度低于设定阈值,模块启动漫游状态,搜索合适的AP,发出关联申请,等待AP确认关联,切换AP完成漫游。漫游阈值大小决定了终端漫游区域的大小,太大会造成终端频繁启动漫游机制,耗用自身资源和网络资源,通信性能下降。阈值太小AP的漫游区小,造成终端启动漫游过晚,失去AP关联。(2)AP搜索策略。802.11标准中没有定义,所以各厂商都有自己的漫游算法,但都会使用一些输入条件如信号强度(漫游阈值也是参考这一参数)、信号质量、丢失信标数以及冲突和干扰错误。算法会在AP切换速度和切换次数上找到平衡点,同时避免漫游带来的关联丢失,就是通常所说的丢AP断网。终端启动漫游机制后会以扫描方式搜索其他信道的潜在AP,通常是被动侦听有用AP的信标,寻找到合适AP后发起关联申请,有些情况下会主动发出请求帧搜索可用AP(由算法决定)。
合理利用漫游策略,可以让终端在网络中分布更均匀,使网络资源对终端的影响最小,充分发挥网络性能。
2.6漫游异常(AP路由异常)
在终端WIFI长时间失去关联时的特征表现:
终端和AP关联时无法获取IP地址。
在数据链路中断后,无法快速获取IP,始终不能获得有效IP,最终产生一个临时IP。
在确认是AP异常前需要排除本栅IFI RP性能异常,可以通过对比其他终端来判断本卡几WIFI性能是否正常。
AP不分配IP地址给申请关联的终端,原因可能是关联AP的IP动态地址已分配完。在网络负载不平衡的极端网络环境下,大量的终端集中挂在一个AP上。最终就会有终端因为长时间拿不到IP地址,而被迫接收一个临时IP地址,这个地址根本不在工作网段。用这个IP地址是永远不能关联上网的。另一可能是终端的IP地址是静态的,AP因IP地址被占用或者地址段不符等原因无法分配IB这种情况只要将终端的IP地址设置成自动获取即可。
2.7 WlFI模式/速率切换
WIFI模式/速率切换对终端WIFI的工作影响特征表现:(1)各速率点切换时丢包和断线概率增加。(2)频繁出现的b/g模式切换。(3)吞吐量出现急剧下降,严重时断网。(4)WIFI模块的速率切换是保证通信质量的一种手段,模块会根据获得的信号强度、信号质量、丢失信标数以及冲突和干扰错误等信息作出速率切换。理论上速率切换只会对包延时有影响。但实际上模块在不同速率不同频率上的Tx功率和Rx灵敏度是不同的,如果遇到极端情况就会产生丢包和断线。
下面是b/g/n模式下速率切换对应调制方式的变化:
llb DSSS:IM DBPSK/2M DQPSK/5.5&11M CCK
llg OFDM:6M
BPSK/12M QPSK/26M 16QAM/54M64QAM
11n OFDM:MCSO-7*单、双流*HT20/HT40/HT40s
以802.ub为例:当信号强度、信号质量等通信质量信息良好时,会跑在最高速率11M上,此时采用CCK调制方式,当通信质量下降后模块会根据算法作出降速调整,如果从11M降到2M就会产生CCK到DQPSK的调制方式切换。模块本身的速率切换是无缝的,只会对拼包延时有ms级影响,但考虑到和路由之间的同步关联调整,在网络环境恶劣情况下就会产生丢包和断网问题。
通常情况下模块的发射功率和接收灵敏度会随着速率的降低而提高,但如果因为EMI噪声等原因造成模块在某速率上的灵敏度非常差,产生调速陷阱也会造成模块产生丢包和断线问题。WIFI测试中的定速定频测试可以及时发现这种问题并加以改善。
1信道的1M速率模式作为路由关联的广播接入信道是最常用的,模块在这种模式下的灵敏度最高,发射功率最大,抗干扰能力和路由响应速度都是最快的,因此如果网络环境恶劣,满负载,lM的通信速率又可以满足业务传输需求,可以将终端定速1M模式,这样会节省路由维护速率切换的网络链路开销,终端也会因为灵敏度和发射功率的提高而有更好的抗扰度,达到稳定工作的目的。
3问题解决
3.1降低本机EMI噪声
通过近场探头和频谱定位噪声源后,通过阻抗调整减少因为阻抗失配引起的噪声,对剩余的几个噪声点采用屏蔽隔离的方案来阻断噪声传播。优化后的终端丢包率由原来的10%降低到2%,连续丢包现象偶尔出现,没有出现断线现象。但上传和下载速度还不够快,登录时间还嫌长。
3.2组网环境优化
针对登录时间长的问题,我们发现很多终端在初始登陆时注册的AP在以后的大部分场地不会漫游到其他AP,曾经有超过60%的终端关联在同一AP上,导致网络负载不平衡。这种现象后面简称超级关联。整个网络有个别超级关联的AP很拥挤,处于超级关联环境里的终端间同频干扰严重,容易产生网络拥塞,通信质量下降。改进方案是人为降低超级关联路由的发射功率,通过减少超级关联AP的覆盖面来减小AP蜂窝重叠区域,让部分终端更早漫游到相邻A吐,避免超级关联,提高终端通信质量。
3.3通过配置终端通信模式提升通信质量
在有些强干扰环境或者超级关联网络环境情况下,可以考虑通过限定终端的通信速率来保汪通信稳定性。
3.3.1降速提高终端本身的射频性能
通常工作在lM速率上的终端发射功率和灵敏度指标是最高的,这时的终端射频性能最好,当终端工作在恶劣环境经常出现丢包甚至断线的话,不妨通过降速来保证通信质量。
3.3.2限速会节省路由维护速率切换的网络链路开销,缩短网络AP响应时间,减轻处于超级关联状态的AP负担由于终端都被限制在1M速率,超级关联环境下的网络资源可以看作是以单位1M均分的,避免资源分配不均带来的网络资源竞争失败者的通信稳定性问题。
通过上面的综合处理,客户现场出现的WIFI登录等待时间长、经常断线、在集中交付区下载路单漫等现象消失。经过1个月的后期跟踪,整个网络体系运行稳定,问题圆满解决。
如何最大限度地使用成熟WIFI技术来实现复杂恶劣网络环境下的可靠通信,对通信工程人员来说是经常面对并继续解决的问题。文中列出了影响WIFI网络通信质量的7个要素,通过逐点分析和现象验证,可以解决大部分的WIFI网络通信问题。