基于数据挖掘的光纤通信故障检测方法研究
2020-08-19周学军周方圆
周学军,李 江,周方圆
(延安大学 物理与电子信息学院,陕西 延安 716000)
0 引 言
远程和本地电缆通信系统的现代技术基于光纤数据传输系统。光纤通信传输可以提供满足用户要求的高数据速率。传输的最常见问题之一是错误检测和纠正,通常来自两种不同的方面:一是影响传输线的重大干扰,二是通信路径中的故障。由于应用了阻止任何入侵者使用的新技术,第二种情况很少发生,大多数集中在第一种错误上[1]。此前的研究人员设计了许多算法,或使用软件或硬件来执行检测。在这项研究中,提出了一种新的K-means聚类方法来进行光纤通信的故障检测。模型主要用作K均值聚类的输入变量,而失真曲线则用于识别初始聚类的最佳数量。
1 数据挖掘
光纤通信传输包括收集和管理大量信息和数据,因此数百万个地方的数百万人可以在短时间内执行数十或数百笔交易,从而导致记录数十亿个事件。在光纤通信故障检测中,为了处理如此大量的数据,需要使用特殊的检测方法。现阶段,检测方法可以分为两种方法——前向纠错(FEC)和自动重复请求(ARQ)。在FEC中,发送过程发生前,在发送方将一组比特添加到消息中称为纠错码。接收器使用这些纠错码在本地检测和纠正错误,无需重新传输损坏的位。这些技术中的大多数都能成功检测到错误,但无法纠正错误,尤其是当损坏的位数超过两个时[2]。在ARQ中仅提供错误检测功能,而未尝试纠正任何错误接收的数据包。通过在发送方站点上重新传输已损坏的位或数据包,可以进行纠正。
如上所述,尽管传统的光纤通信故障检测提供了详尽的方法,但是当故障数量增加时,将增加内存和计算时间的需求。为了解决这个问题,提出了一种基于数据挖掘的光纤通信故障检测方法。数据挖掘是一种用于对半结构化或非结构化数据集进行分类的方法,是最常见且有效的数据分类方法之一[3],用于减少定位误差。使用对象的先前位置数据迭代地估计对象的位置,并使用新的测量值更新这些估计值。在数学上,数据挖掘以K均值聚类估计线性系统的状态,并最小化估计误差的方差,具有丰富的数据容量、非接触功能、重复能力和耐用性。以数据挖掘实现光纤通信故障检测进行数学分析和实验评估发现,数据挖掘方法所需的数据量仅为传统检测方法所需数据量的1/4。
2 光线通信故障
通过分析光纤网络故障的实际案例可以看出,光纤网络故障主要分为IP连接故障、网络结构故障、物理故障和软件故障4种类型。目前,现有的IP网络故障诊断工具如嗅探器,不具备分析光纤网络故障的能力,不能提供故障原因,而控制网络故障的早期征兆往往与网络级错误混杂在一起。常见的IP网络指标有帧冲突、巨帧、超短帧、循环冗余错误帧、TCP校验错误、分段消息、重传消息、包到达间隔、吞吐量以及包突发等。通过分析网络故障报警情况,这些指标本身并不是唯一的,但大多数商用IP网络诊断工具都没有对它们进行分析[4]。由于普通工具不能完全检测控制网络的故障,只能生成故障网络报警,因此有必要建立新的检测分类和检测方法。
3 远距离光纤通信中传输故障数据挖掘方法
3.1 故障检测准备
远距离光纤通信传输故障数据挖掘中,需要考虑发送的数据包大小、通过其发送数据的协议、控制流协议、噪声速率和数据包准备等。
3.1.1 封包大小
包大小由模拟器的用户确定,需选择要通过帧发送的字节数。系统本地主机通过TCP所允许选择的最大字节数为1 024 Bytes。
3.1.2 本地主机协议
传输控制协议(TCP)是主机环境,帧通过该协议从发送者传输到接收者。要使用它,必须在发送方和接收方定义一个套接字,以定义本地端口和远程端口进行通信。
3.1.3 控制流协议
有许多控制流协议,如停止和等待、滑动窗口、返回N、重复选择以控制发送方和接收方之间的帧流量。工作中使用Go-Back-N协议,接收方检查数据包中是否有错误,会向发送方发送否定确认。
3.1.4 噪声率
噪声率受许多因素影响,如传输中使用的介质类型、电磁场或环境噪声等,因此在传输过程中将其设为可变。为了生成它,使用一个随机数生成器提供一组随机数,并根据其值更改位。
3.1.5 准备数据包
数据包是一组字符,其中字符数由数据包大小确定。生成数据包的字符后,将其转换为二进制流,以便如在实际网络中对其进行处理。一旦完成二进制流,下一步便开始选择检测算法。这里使用数据挖掘算法,将多余的偶数和奇数位添加到帧中的每个字符。
3.1.6 检测程序
发送者和接收者在检测过程中具有一系列明确的角色。发送者从用户或系统读取数据包,并将数据包存储在特定的缓冲区中,以便对其进行操作。数据包分为特定大小的帧,必须与接收器一起容纳。
3.2 故障检测方法
基于数据挖掘的光纤通信故障检测依赖于隐含的假设,即从故障的服务器到另一台运行的服务器的切换任务。因此,对光纤通信中的传输故障数据进行挖掘,其将数据分为K组和E组,每组必须包含至少一个对象。所以,将基于K失败和E接管其任务的情况,解释此切换机制的细节。在无故障情况下,传感器和传感器发送的所有数据包均由K和E两个服务器接收。只有K响应这些数据包,计算必要的控制数据包并将其发送到指定的执行器节点。当E检测到丢失的数据包(表明K发生故障)时,它进入循环以替换不活动的K,并将控制数据包发送到指定的执行器。必须设计在E上运行并用于在故障情况下备份K的控制过程,以适应丢失一个数据包的情况。同样,控制系统必须不易丢失一个控制包。这是为了克服在K和E之间切换时最多丢失一个数据包的可能性。这种情况下,一种简单的解决方案是“保留先前的样本”技术,直到接收到新的控制为止。
3.3 建立故障模型
光纤通信系统发生故障的可能性可以通过3个可能事件来表征,即争用引起的冲突、带宽不可用和信道错误。令pf表示由于上述3个可能事件而导致的失败概率,则:
其中pe表示由于信道引起的错误概率,pc表示由于争用引起的冲突概率,q表示基站(BS)接受带宽请求的概率,Tr表示响应时间或等待时间。通过重新排列,可得:
其中,pu表示带宽不可用的概率,pce表示由于冲突和信道错误引起的概率。然后,pf变为:
通过假设3个事件彼此独立,可以得出(5)中的故障模型。为了提高性能,通过考虑建议的故障模型计算退避因素(如减少碰撞)和响应时间(如减少等待时间)。
4 仿真实验结果
通过Matlab仿真验证针对光纤通信开发的故障模型,在RZ9681型通信实验平台完成远距离光纤通信中故障数据挖掘的实验分析,仿真结果如图1所示。对于此模拟考虑以下数据:帧的持续时间为5 ms,物理帧中用于带宽请求的争用时隙数为16,最小争用窗口为8,由BS设置的等待时间(响应时间)的初始值为5,退避阶段的最大数量为MAC为6。此外,MAC参数是根据1 000条实际传输故障样本数据中给出的标准配置的。通过针对不同的q值(即0.25和0.60)改变竞争站点,可以根据竞争效率和访问延迟进行评估。此外,所有模拟均考虑到系统的易错通道,共划出70个故障区间,其中实际样本传输故障数据和不同传输故障的错误率分别为80%和90%,两组重叠就是判断正确。通过计算得到竞争效率随着站点数量的增加而增加,并达到饱和。对于改良的EIED补偿,此饱和区域的竞争效率介于24.5%~28%,而对于常规EIED补偿的竞争效率介于32.5%~43.8%。如果退避机制在带宽可用性较低的情况下表现良好,则可能是有效的。如果带宽更大,则由于带宽不可用而导致的故障以及由于在同一TxOP上进行传输而引起的冲突不会那么明显。
图1 不同方法光纤故障精度趋势图
5 结 论
提出的远距离光纤通信中传输故障数据挖掘方法的识别与实际情况较为符合,可以显著降低由于带宽差异而造成在同一TxOP上的传输,证明该方法可信度较高。