基于特征选择的光通信网络传输冗余信息辨识方法
2022-05-18刘江平
刘江平
(安徽三联学院 网络中心,安徽 合肥 230601)
如今,智能化设备的种类越来越多,随着技术的不断成熟,各种智能设备的功能更加多样化。与此同时,光通信网络的建设也随着成熟和完善,其功能性也越来越强[1]。传统的光通信网络传输主要以工业以太网交换机为媒介,利用以太网交换技术,以分层组环的方式,快速进行环组网的信息交换,这种网络信息的传输多层次且十分复杂,很容易造成光通信网络的故障[2]。未来的光通信网络传输技术,必须是安全和可靠的,随着智能时代的到来,要承载更多的通信网络[3]。但是光通信网络信息传输过程中,存在海量的冗余信息,不仅对人们的网络环境造成污染,还干扰了人们的网络生活,从而影响了人们的生活节奏。
胡钢等人[4]提出一种基于传输矩阵的网络节点辨识模型,用来分析网络节点在信息传输过程中的重要性,以及网络节点的关联作用。首先,利用传输矩阵原理,构建网络节点辨识模型,通过节点之间的关联关系,获取最优的网络节点传输路径。通过采集最优路径的数目和网络信息传播的能力,构建网络节点重要度矩阵。并根据全局指标的权重信息,根据权重信息判断网络节点的传输信息的重要性。通过仿真分析证明了该方法的可实用性。王留洋等人[5]提出基于共识和分类改善文章聚类的信息识别方法,首先根据共识机制构建信息识别的特征向量矩阵。通过设置相关参数,可以根据性别分类,实现对信息的有效识别。结果表明了该方法可以有效提高对信息的辨识度,整体精度比传统的识别方法提高2.3%。
基于以上研究背景,本研究根据特征选择设计一种光通信网络传输冗余信息辨识方法,从而保证光通信网络传输性能。
1 光通信网络传输冗余信息辨识
1.1 提取光通信网络传输冗余信息特征项
光通信网络传输冗余信息特征项提取的过程中,首先构建光通信网络传输的基本单元,利用特征选择算法对网络传输冗余信息的倾向值提取,结合匹配技术,计算出冗余信息的特征项权重,由此提取出网络传输过程中的冗余信息特征项。
用Sim(CPi)描述冗余信息词汇C与褒义词汇CPi的近似度,冗余信息词汇C与贬义度词汇CNi的近似度为Sim(CNi),可以得到光通信网络传统冗余信息的语义倾向性:
上式中,kp代表冗余信息中褒义词出现的次数,kn代表贬义词出现的次数。
将Gfk(dx)定义为冗余信息特征项tk在光通信网络信息传输过程中出现的次数,当Gfk(dx)的值越大时,说明光通信网络传输的冗余信息dx的数量越多[6],并定义wxk代表特征项tk在光通信网络传输过程中冗余信息dx的权重,则权重的计算公式可以表示为:
上式中,M代表在光通信网络传输过程中冗余信息的总数,Mk代表冗余信息特征项tk在光通信网络传输过程中的文本数,k代表特征项的空间属性。
当把所有的冗余信息数据通过向量空间的方式映射出来时,通过光通信网络信息之间向量矢量的匹配[7],利用特征选择算法求得光通信网络传输冗余信息dx和dy的近似度,公式为:
上式中,W(dy)代表dy的向量,wyk代表特征项tk在光通信网络传输冗余信息dy中的权重,φ代表空间向量倾斜角,φ的值越小,说明通信网络传输过程中冗余信息的近似度较高[8]。
通过将光通信网络传输冗余信息向量空间设置为b维,利用特征选择算法[9],选取冗余信息中共有a个特征项,此时冗余信息的空间维度为b+a,在对光通信网络传输冗余信息特征项提取的过程中,利用特征项tk的归类和空间维数b之间的关联性,获取tk经过过滤后的冗余信息量。因此,为了体现出光通信网络传输过程中冗余信息tk的重要特征项,通过下式计算出光通信网络传输冗余信息特征项的权重信息:
上式中,Gfk'(dx)代表冗余信息特征项tk的关键词t'k在整个信息传输过程中出现的次数,M'代表冗余信息中出现特征项tk以及关键词t'k的次数,β代表光通信网络传输过程中具有冗余信息特征项的权重因子,A代表所占的比例。
根据以上过程,提取出光通信网络传输冗余信息特征项。
1.2 光通信网络传输冗余信息降噪处理
上式中,Y为冗余信息的波动值,g(n)为冗余信息的波动高峰值与低峰值之和。
利用特征选择算法,对光通信网络传输冗余信息进行特征描述,可用方程式的方式描述[10],降噪处理后冗余信息的描述集为M(i,j),计算公式如下:
上式中,N是冗余信息的特征向量,k为特征系数,j是空间维度下的冗余信息,rk为降噪处理后的冗余信息的元素值。
为了保证降噪处理后的冗余信息能够得到及时地修正[11],在整个降噪过程中不会出现失衡的状态,将冗余信息在降噪过程中的偏差值设为MSE,利用云计算得到MSE的计算公式如下:
其中,K是冗余信息均值,D是冗余信息辨识特征维数,A是冗余信息辨识的逻辑系数。
将干扰信息识别降噪处理表达式设为Jz,计算公式为:
其中,In是网络传输冗余信息辨识的向量值,f是冗余信息辨识的速度。
通过定义光通信网络传输冗余信息的空间峰值,利用特征选择算法,描述了冗余信息特征,根据冗余信息在降噪过程中的偏差值,完成光通信网络传输冗余信息的降噪处理。
1.3 光通信网络传输冗余信息辨识
假设冗余信息经过降噪处理后的时域信号为y(i),将时域信号y(i)经过矩阵排列后得到长度为X的序列,对冗余信息的序列进行傅里叶变换[12],可以得到冗余信息的线性频谱Y(n),计算公式如下:
利用频谱能量处理法[13],对得到的冗余信息频谱P(m)进行计算,公式如下:
其中,Gm(n)表示在光通信网络传输冗余信息辨识过程中设置的滤波器传递函数,m表示大于0的常数。
对冗余信息的空间频谱进行归一化处理[14],计算公式如下:
上式中,冗余信息辨识过程中的频谱幅度和密度分别为LP和LQ,网络传输冗余信息的数据长度为X。
根据冗余信息的时域特征,计算出网络传输冗余信息的空间时域,表达式如下:
上式中,‖G(i)‖∞表示光通信网络传输过程中冗余信息的最大幅度值,‖H(i)‖l表示冗余信息的所有幅值之和。
由于冗余信息在光通信网络传输中会面对复杂的网络环境,将瞬时特征参数作为辨识依据[15],计算出冗余信息在辨识过程中的波动幅度,假设冗余信息波动幅度的标准差为x,表达式为:
其中,γ表示冗余信息在辨识过程中的幅值,A(i)表示冗余信息波动幅度。
根据上述计算得到的冗余信息空间时域值,通过光通信网络传输过程中冗余信息的时域信息值对冗余信息进行辨识,则冗余信息辨识计算表达式为:
在lm与lj为常数的前提下,当ψ≤A(i)时,说明冗余信息可以进行辨识决策,能够获取高精度的冗余信息辨识结果;当ψ>A(i)时,证明此次冗余信息辨识结果无效。
根据以上过程,完成光通信网络传输冗余信息辨识算法的设计,实现了光通信网络传输冗余信息的辨识。
2 实验分析
2.1 设置实验参数
为了验证基于特征选择的光通信网络传输冗余信息辨识方法在实际应用中的性能,在MA‑TALB仿真平台上设置了如表1所示的实验参数。
表1 实验参数
2.2 搭建光通信网络拓扑结构
根据表1的实验参数,在光通信网络节点通信范围在1 200*1 200 m的范围内,搭建了如图1所示的光通信网络仿真拓扑结构。
图1 光通信网络仿真拓扑结构
图1的拓扑结构中,Ai为冗余信息,M为光通信网络中的正常信息,R为核心路由器,W为受干扰主机,Bi为对光通信网络产生干扰的信号。
2.3 设置实验与评价指标
由于特征选择能够根据光通信网络传输冗余信息特征,控制冗余信息的辨识能力,通过辨识光通信网络传输冗余信息,删除或修改数据集中的冗余信息,提高光通信网络的传输质量。
为了验证文中方法的性能,利用虚警率和检测率指标衡量文中方法的辨识性能,两个指标的计算公式为:
其中,n表示辨识为冗余无效信息的数量,m表示光通信网络中正常信息总数,N表示有效辨识的冗余信息数量,M表示冗余信息总数。
2.4 结果分析
为了突出文中方法的优越性,引入基于重要度传输矩阵的辨识方法和基于渐进式神经网络的辨识方法作对比,在10次测试中,设置不同的信息丢失率,得到如下实验结果。
三种方法的光通信网络传输冗余信息虚警率测试结果如图2所示。
图2 光通信网络传输冗余信息虚警率测试结果
图2的结果可以看出,在信息丢失率不同的情况下,基于特征选择的光通信网络传输冗余信息辨识方法辨识到的冗余信息虚警率是最低的,而基于重要度传输矩阵的辨识方法和基于共识和分类改善文档聚类的辨识方法受到信息丢失率的影响比较大,随着信息丢失率的增加,文中方法在辨识光通信网络传输冗余信息时的虚警率始终维持在10%以内,说明文中方法辨识到的冗余信息都是有效的。
三种方法的光通信网络传输冗余信息检测率测试结果如图3所示。
图3 光通信网络传输冗余信息检测率测试结果
从图3的结果可以看出,随着信息丢失率的降低,三种方法的光通信网络传输冗余信息检测率也呈现出下降的趋势,但是文中方法在辨识光通信网络传输冗余信息时的检测率仍然高于85%,而基于重要度传输矩阵的辨识方法和基于共识和分类改善文档聚类的辨识方法在辨识光通信网络传输冗余信息时的检测率分别在44%~78%之间和63%~87%之间,说明文中方法不仅在辨识光通信网络传输冗余信息时的检测率高,而且检测率的变化幅度也是最小的,能够有效辨识到光通信网络传输冗余信息。
3 结束语
本研究基于特征选择的光通信网络传输冗余信息辨识方法研究,经实验测试发现,该方法在辨识光通信网络传输冗余信息时的虚警率低、检测率高,辨识到的冗余信息都是有效的。但是该研究还存在很多不足,在今后的研究中,希望可以不断模拟验证该辨识算法,建立一套优化的信息辨识系统,保证光通信网络的传输性能。