融合深度学习和栈式自编码算法的异常无线电信号监测方法
2020-12-23魏小忠申浩刘红杰
魏小忠,申浩,刘红杰
(1.江西省无线电监测站,江西 南昌 330000;2.江西省工业和信息化厅鹰潭市无线电管理局,江西 鹰潭 335000;3.北京博识广联科技有限公司,北京 100098)
0 引言
随着5G 的发展,无线电的应用需求显著增加,无线电监测也上升到前所未有的重要战略地位。无线电应用需求和现有空间电磁环境复杂多变成为无线电管理机构必须面对的迫切问题。
无线电信号监测是采用特定的手段对无线电信号的频谱使用情况和时空占用情况进行监测,并对异常的干扰源、非法使用的无线电源进行消除,维持合法的电波秩序。目前无线电信号监测相关的研究包括:Yin 等人[1]利用历史无线电频谱测量数据的周期性特征构建时域-频域时空模型,并采用马氏距离测量任意时隙的频谱资源测量数据时空特征与模型频谱数据时空特征的偏差,进而来实现频谱资源的异常告警;闫戈[2]融合逻辑回归算法和朴素贝叶斯算法统计频谱监测数据的特征属性规律性,实现对频谱测量数据的异常监测;Jordan 等人[3]针对异常无线电信号特征不确定性,采用自编码网络技术提取无线电信号的特征编码,探求无线电信号特征的分布情况,提升异常信号的识别与分辨的性能;Oshea 等人[4]针对无线电存在大量噪音和频谱相互干扰的问题,采用深度学习神经网络获取无线电频谱的高层次特征,提升异常信号的识别精度;NE West 等人[5]采用融合卷积神经网络和长短期记忆网络来提取无线电信号的时空特征,实现无线电信号的自动识别;孙倩彤[6]从大量实际样本提取无线电信号的特征,结合无监督的异常监测方法生成异常无线电信号的判别标准。刘观华[7]采用模糊C 均值聚类方法获取无线电信号的特征权重,结合有序加权聚合算子对特征权重进行聚合,实现无线电异常信号的判别;Li 等人[8]采用改进BP 神经网络对大量带标识的无线电信号进行分类,实现无线电异常信号的识别;刘栩楠[9]针对无线电监测数据采样率不高的问题,提出基于局部可达距离的离群点检测和非离群点分类方法实现异常无线电的监测;冯博[10]针对无线电信号存在人工操作的工作量过大和人工经验限制等问题,提出一种基于支持向量机的无线电异常信号识别方法,提升无线电信号识别的效率。然而,无线电信号存在采样率过低、数据量大、信息特征高维、随机干扰因素多、多种业务信号互相干扰导致电磁环境复杂多变等特征,对异常无线电信号监测与识别带来很大的难度,传统的方法往往存在信号特征提取不完备、噪音干扰过大、异常信号阈值确定难度大、预警虚报率过高等问题。
本文针对上述情况,提出一种融合深度学习和栈式自编码算法的无线电异常信号监测方法,该方法基于正常无线电信号频谱的使用周期和频率具有高度相似性,频谱使用空间具有固定性的特征,采用滑动窗口的方法重构无线电信号数据的时空特征;针对无线电信号特征提取的不完备的问题,在重构时空数据的基础上,采用深度学习的方法提取无线电信号的时空特征;针对无线电信号的噪音干扰过大的问题,采用栈式自编码网络对时空特征进行稀疏编码再重构,剔除噪音干扰对无线电信号时空特征的影响,增强时空特征的抗干扰能力,最后,针对动态复杂电磁环境导致的异常信号阈值确定难度大的问题,采用聚类算法对重构特征进行聚类,自适应门限值技术获取动态、自适应的阈值,实现无线电异常信号的智能监测。
1 无线电信号异常分析
由于频谱资源的使用具有周期性,因此,扫描的无线电频谱数据会呈现出高度的相似性。无线电信号监测通常对频谱数据进行异常指数转化,然后对业务频段和空闲频段的频谱异常指数时间序列图进行人工检测,如果异常指数的偏离度超出容忍值,那么就判断无线电信号存在异常。图1 显示某天空闲频段的频谱异常指数时间序列图。
图1 空闲频段的频谱异常指数时间序列图
从图1 可知,空闲频段一般情况下仅仅受到噪音的影响,工作人员对空闲频段的频谱异常指数时间序列图进行异常监测相对简单,如果频段异常指数超出某个容忍值则可以判断为异常值,图1 有两处是异常值,分别是15—20 与180—200 这两个位置存在异常。
对于业务频段数据则没有那么简单,由于业务频段数据自身具有一定的周期性,因此需要采用分段的方式构建业务频谱异常指数的时间序列图。
从图2 可知,业务频段不仅受到外部噪音的影响,还会由于接收仪器本身的不稳定而造成信号波动,工作人员对业务频段的频谱异常指数时间序列图进行异常监测则相对复杂,不仅要考虑业务频段在不同时间段的周期特征,还要判断信号产生波动原因。
为了应对信号周期性、外部噪音引起的波动性、接收仪器不稳定引起的波动性,本文采用数据重构的方法对信号的周期性进行提取,并结合深度学习提取信号的特征;在此基础上,借助栈式自编码网络进行特征重构,以期剔除由于外部噪音和接收仪器不稳定对频谱数据的干扰,提高信号时空特征的“纯度”;最后,考虑到电磁环境的复杂性,采用固定的阈值法对异常信号进行识别不具有实操性,因此,本文采用聚类和阈值法实现异常无线电信号的动态识别,增强异常检测模型的自主性。下面详细说明如何采用深度学习和栈式自编码算法的无线电信号异常监测过程。
2 无线电信号时空特征的提取
(1)重构无线电信号时空数据
影响异常无线电信号监测与识别的因素维度包括信号数据的空间属性、时间属性以及采样率、获取随机性等。空间属性包括不同信号源方向性、正交性、频谱占用度等;时间属性包括信号的频率、持续时间、周期等特征以及信号发射之间的先后与同时的关系。异常无线电信号监测与识别受到现有的采样率、采样数据获取的随机性影响,因此需要对无线电信号数据进行重构,重构数据不仅需要考虑到信号的时间属性和空间相互影响的关系,还要考虑采样率、获取数据的随机性、信号的持续时间、周期特征等因素。
本文重构无线电信号的时空数据的思路:结合采样率、信号的持续时间、周期特征确定滑动周期,以单个网格截取的所有空间数据来重构单个样本的时空数据。比如:以某一个无线电监测的网格的广播电台频段(87—108 MHz)为例,以100 kHz 为采样步长切分为211维,按照采样率为5 分钟/次,以4 小时为滑动周期来构造该网格的某一个样本的二维矩阵,那么样本大小为48×211。按照上述的方法,重构无线电信号的时空数据。如图3 所示。
(2)采用卷积神经网络获取无线电信号时空数据的特征
图2 业务频段的频谱异常指数时间序列图
重构的时空数据具有时间和空间不同维度的性质,其特征融合无线电信号的时空特征,更具可读性。本文采用深度学习的经典算法之一——卷积神经网络对重构的无线电信号时空数据进行特征提取,在卷积层对特征进行高层语义提取,在池化层对语义特征进行降维操作。卷积层进行高层语义提取,从空间尺度上,减少了噪音对无线电信号时空特征提取的影响,从空间维度上提升了无线电信号特征信息提取的精度。池化层面进行降维操作,从时间尺度上更好地提取无线电信号的周期特征,从时间维度上展现无线电信号特征的“动态”变化。
3 基于栈式自编码网络的时空特征重构
基于卷积神经网络提取的无线电信号时空特征虽然在一定程度上降低了噪音对无线电信号的影响,考虑到无线电环境具有高度复杂性,本文采用栈式自编码网络对无线电信号进行时空特征重构,以期进一步抑制噪音的干扰,提升了异常无线电信号识别的准确率。
基于栈式自编码网络的时空特征重构过程:对无线电信号时空特征进行稀疏编码再重构,通过栈式自编码网络的前几层,完成对上一步卷积神经网络提取的无线电信号时空特征进行再提取,获得高阶特征;在网络的最后一层隐含层获取到重构的特征s 以及重构基向量A。其中重构特征s 是网络最后一层隐含层的激活值,重构基向量A 是最后一层隐含层与输出层神经元之间连接的权重。为了实现时空特征的重构,栈式自编码网络的目标函数可以表示为:
式(1)的第一部分表示无线电信号时空特征重构与上一步卷积神经网络提取时空特征的差异性,通过规则化,将误差最小化,保证关键的有效特征被保留;式(1)的第二部分表示稀疏惩罚项,采用近似值平滑策略来实现重构特征的惩罚,由于本文的无线电信号时空特征没有进行缩放操作,因此不需要对重构基向量A 进行约束。
4 基于聚类和阈值法的异常无线电信号快速识别
由于本文采用滑动窗口的方法来重构无线电信息的时空数据,因此,重构特征会克服由于电磁环境本身发生轻微干扰时所出现的暂时性“偏离”的现象。重构样本的时空数据本身就反映整个时间周期内的时空特征,因此,无线电信号长时间“偏离”的现象就可以认定为异常无线电信号的关键特征。
本文在重构无线电时空特征的基础上,采用k-means 聚类方法实现实时监测数据正常信号和异常的相似度度量。
随机选取上一步获得的栈式自编码网络重构时空特征是si,找到与该重构时空特征sj距离最近的样本,采用向量的余弦值衡量两个特征的相似性,公式如式(2)。
判断两个特征的相似性是否达到阈值,如果达到阈值就做出同样类别的标记,否则,做出不一样类别的标记,不断迭代,直至迭代完毕。通过聚类,找出正常无线电信息的某类相似特征。为了适应不同电磁环境和监测的实际监测管理要求,对无线电信号的相似性特征采用自适应门限值技术设置一个报警阈值,增强异常检测模型的自主性,实现无线电异常信号的智能监测。
图3 基于无线电时空数据提取的时空特征示意图
5 实验验证
本文通过实验模拟广播发射信号场景,在实验中模拟5 个授权电台和2 个非法电台,共模拟523 条无线电信号,其中有17 条是非法无线电台所发出的异常无线电信号。在本次实验中,为了检验本文提出算法的可靠性和扩展性,对上述的数据集分别进行15 次实验,每次实验采用随机抽取的方式抽取1/3 数据集作为训练数据,剩下的2/3 数据集作为测试数据。在设置固定的正常信号和异常信号阈值的基础上,采用Matlab 对本文的算法进行编程,并对上述的训练集和测试集数据进行仿真分析,得到的仿真结果如图4 所示。
从图4 可知,每次实验都有训练准确率和测试准确率,一般来说,训练准确率越高越好,但是如果训练准确率过高,有可能带来泛化效果不好,图4 第2 次、第12 次和第15 次的仿真结果表明,虽然训练模型的准确率很高,但是该模型用于测试数据确不如人意。因此,为了保证模型的泛化能力,不仅要考虑训练准确率和测试准确率的平均值大小,还要考虑训练准确率和测试准确率两者之间的差异,让它们之间的差异尽可能减小。因此,本文选择第11 次的仿真结果作为本文的最终模型选择。
为了验证本文所选模型的有效性,让授权电台发送7 次正常信号,让非法电台发送5 次异常信号,在采集信号数据的基础上,分别让人工经验和本文所选择的最终模型对信号的异常性进行判断,得到的结果如表1 所示。
从表1 可知,采用人工经验的方法对异常信号进行经验值判别,其准确率只有66.7%,而本文算法准确率平均值为83.3%,说明本文算法对异常无线电信号的识别准确率比传统算法高。这是因为本文的算法采取以下步骤来提升异常无线电信号识别的精度:(1)在重构无线电信号时空数据基础上,采用卷积神经网络进行时空特征提取,在一定程度上剔除噪音和随机因素的干扰;(2)采用栈式自编码网络进一步抑制噪音和随机因素的干扰,为异常无线电信号精准识别提供基础;(3)基于k-means 聚类,采用自适应门限值技术对信号特征设置一个报警阈值,实现异常无线电信号的动态、自适应监测,能够动态应对无线电复杂环境的变化。基于上述分析,本文提出融合深度学习和栈式自编码算法的无线电信号异常监测方法具有一定的可靠性和扩展性。
表1 人工算法与本文算法准确率对比
图4 训练集和测试集的仿真结果
6 结束语
本文提出一种融合深度学习和栈式自编码算法的无线电异常信号监测方法,该方法不仅考虑了无线电信号的时空信息,还考虑无线电信号的噪音干扰对异常无线电信号识别的影响。由于无线电信息本身具有高维性,因此需要采用深度学习方法和栈式自编码网络提取数据的低维特征,使得提取的低维特征的表达能力更强、更具可读性。最后,考虑到无线电磁环境的复杂性,采用聚类算法和自适应门限值技术,设置一个动态的阈值来识别异常无线电信号,使之动态适应无线电环境的变化和实际监测管理的要求,增强异常检测模型的自主性。通过实验表明,融合深度学习和栈式自编码算法的监测方法在异常无线电信号识别上比人工经验模型更有效,预测精度更高,具有一定的扩展性。