基于卷积自编码的卫星通信入侵检测方法研究
2023-05-30王兆霖漆亚江王月沈玉王睿
王兆霖 漆亚江 王月 沈玉 王睿
摘要:现代通信手段中卫星通信凭借其覆盖范围广、通信质量高、网络建设速度快等优点在战场环境中有着举足轻重的战略地位,但是由于其通信信道裸露的特点,也易于被攻击、干扰或入侵,尤其是非法站點伪装成合法通信方进行非法接入,对军事通信安全和信息保密有着致命威胁,从物理层识别接入设备特征是解决此安全问题的一个有效途径。自编码器作为一种无监督神经网络,能有效地进行特征提取,并通过阈值设置,区分正常和异常信号。针对DVB-S2协议物理帧起始标志字(Start of Frame,SOF)内容固定、调制方式固定等特点,提出了利用自编码器对重复的SOF段功率谱进行无监督学习,设计了基于SOF功率谱的卷积自编码网络,并对比了不同采样点数和信噪比下检测的正确率。
关键词:卫星通信;卷积自编码;特征提取;异常检测
中图分类号:TN927文献标志码:A文章编号:1008-1739(2023)01-64-6
0引言
随着通信系统的不断发展,卫星通信频带宽、传输容量大、架设环境要求宽松等特点成为战时必要的通信手段之一,但是与众多无线通信一样,用户假冒身份、设备克隆等问题亟待解决。传统的安全认证机制大都采取后端密码学设备,这种机制并不完美,存在秘钥泄露和协议漏洞的风险。
为解决此问题,基于物理层的入侵检测变得尤为重要。由于设备电子元件的差异,各种细微的畸变使得发出的电磁波包含独特的特征,这种特征称为射频指纹(Radio Frequency Fingerprinting,RFF)[1]。本文基于这一特性,设计了对接收信号进行处理、提取出RFF特征并进行异常检测的方法,实现对非法卫星信号的有效识别,对卫星通信系统防入侵具有重要意义。
现今,大多文献的重点研究内容为个体识别,即一种有监督的分类学习。通常,分类样本是有限的,但通信异常检测[2-4]的任务样本通常不能穷举,是一种无监督的分类,本文将功率谱作为待识别样本,利用卷积自编码器(参考)对样本进行识别。
本文首先分析了畸变信号,然后对信号进行功率谱估计,最后利用卷积自编码网络对畸变信号进行异常检测。
1射频特征的选择
卫星通信的射频指纹仅由设备的自身硬件差异所决定,即使是同一设备制造商生产的同一型号的设备,也会存在一些因元器件容差而产生的不同畸变。通过对接收信号的分析,可以提取出卫星通信设备独一无二的RFF特征。因此利用该特性,就可以为有效识别合法和非法设备,防止非法用户进行设备仿冒,实施下一步破坏活动提供数据支持。
在基带信号通过各种设备直至发射的整个过程中,每个中间设备的元器件容差都会对信号造成相应的变化。图1展示了一种数字基带信号的发射过程,发射信号通过I/Q调制器、滤波器、功放、振荡器等电路完成畸变,RFF就来源于这些畸变[5]。
现阶段,国内使用的多数卫星通信调制解调器是基于DVB-S2标准设计的。依据DVB-S2标准[6],系统在信号传输时会形成3帧,首先是基带帧,然后是纠错帧,最后是物理帧。本文主要研究对象是物理帧的帧头部分(前同步码)的SOF段,图2是DVB-S2物理帧格式。其中XFECFRAM为映射后的基带信号,物理成帧时,将XFECFRAM每90个符号分一组,组成一个SLOT,然后每16个SLOT中间插入一个未经调制的导频部分,最后加入帧头PLHEADER,即为物理帧前导码部分。该部分又由两部分组成:
①SOF(26符号),定义帧的开始;
②PLSCODE(64符号),定义XFECFRAME部分的调制方式,长度等信息。
前导码部分固定使用π/2 BPSK进行调制,其中SOF部分为固定不变序列,18D2E82HEX(01-1000-…-0010),其不受发射端调制方式、编码方式等参数的改变而改变,利用信号的前同步码SOF部分作为网络输入能够有效避免信号负载对RFF识别结果带来的不利影响,因此SOF段数据可以选做RFF特征进行异常检测的使用。
2基于SOF功率谱的卷积自编码方法设计
2.1自编码网络
自编码器[7]是无监督神经网络的一种,利用高维特征向量对自己进行编码,输出入与输出均为无标签的样本。本质上,自编码器是接收输入样本,将其转换成高维特征向量(隐含层)。然后再利用隐含层的信息重构出输入样本,最终目的是希望输入、输出保持一致。自编码器包含两部分:编码器和解码器。解码器的输出尝试复制编码器的输入。
2.2基于卷积自编码器的异常检测方法
卷积自编码器将输入样本“映射”到低维空间,通过对其进行重建来学习样本的数据规律和内在通用特性,而异常样本由于与正常样本存在的内在特性差异较大,因此重建误差较大。可以基于上述理论设计基于卷积自编码器的异常检测方法,基本流程如图3所示。
训练时,首先对输入信号样本进行归一化,然后通过编码器进行特征提取得到信号的低维特征表示,接着解码器将低维特征表示进行重建,得到重建样本,通过降低重建样本和原有样本之间的误差来对网络进行训练。
测试时,将待测样本集输入至如图3所示的结构中得到待测样本的重建误差,根据重建误差的大小来判断该样本是否异常样本,如果重建误差明显大于训练集的重建误差,那么该样本有很大概率为异常样本。
由此可以将功率谱数据当做单通道进行输入,形成基于SOF功率谱数据的自编码异常检测方法,其流程如图4所示。
在功率谱估计过程中有很多种评价功率谱估计好坏的標准[8],但是由于大部分入侵行为都是在正常通信的环境中进行的,即双方正在通信,非法方通过功率压制强行接入,此时非法方的信噪比不会很高,要进行异常检测,需要寻求一种对噪声不敏感且分辨率较高的功率谱估计方法。频谱分辨率是功率谱上相邻两频点的最小区分量级,类似于频谱仪上的带宽分辨率(Resolution Bandwidth,RBW),分辨率越高,显示的频率成分越精细,能观察到的频率成分越清晰。频谱的方差大小反映的是频谱波动性的大小,方差过大时,频谱的细节就不容易表现出来。导致不易被观察或捕获到。在异常检测时,往往是一些细微差别决定了检测结果,因此选择一个正确的功率谱估计方法非常重要。
此方法应用窗函数对周期图进行了平滑处理,同时为了避免分段带来的频谱分辨率降低,Welch法将每段数据与前一段数据进行一定长度的叠加,进一步改善了估计性能。
Welch算法分段法如图5所示。
3实验结果与分析
3.1实验设置
参数设置:批处理(batch size)大小为100,迭代周期(epochs)为150,学习率初始设置为0.01,设置学习率在第30,60次迭代时分别下降10倍的动态学习率调整策略(MultiStepLR)。实验采用的网络结构主要由编码块和解码块组成,每个编码块和解码块中又由多个卷积层、批归一化层等基本网络层组成,网络结构如图6所示。
异常检测是一种无监督学习,在评价时可以当做一种特殊的二分类问题。通常,将正常数据定义为正类,异常数据定义为负类。TP表示真实为正,预测为正,TN表示真实为负,预测为负,FP表示真实为正,预测为负,FN表示真实为负,预测为正。用于评价指标的混淆矩阵如表5所示。
本文主要使用真正例率(TPR),也叫漏警率;假正例率(FPR),也叫虚警率绘制ROC曲线,以及计算AUC来评判分类器的好坏。
ROC曲线[9]能对分类器进行准确地评估,且不需要特定的决策阈值,因为ROC曲线遍历了所有阈值,ROC曲线横轴为FPR,纵轴为TPR。AUC为ROC曲线下面积,能够作为一种ROC的量化标准,该指标广泛地作为ROC的比较准则,AUC可以取0~1,但是通常为0.5~1。
3.2实验结果
首先研究FFT点数对异常检测的影响,固定信噪比为5 dB,分别对512,1 024,2 048,5 120个FFT点进行检测。图7为不同采样点数生成的ROC曲线,信噪比同样设置为5dB。
从ROC曲线来看,点数越高,AUC值越高。可见FFT点数越高,频谱分辨率越高,学习到的特征越多,越容易分辨。表6为各点数的虚警数、漏警数以及总正确率,阈值设置为1.2倍均方误差的均值。
由表6可以看出,阈值为1.2倍均方误差的均值时,5120点正确率达到了98.46%,结合上述ROC曲线同样可以看出,采样点数越高性能越好。
研究信噪比对检测结果的影响,选取FFT点数为2048,信噪比分别设置为1,3,5dB。图8为不同信噪比生成的ROC曲线。
信噪比對检测性能的影响比较直观,呈正比关系。信噪比越高,AUC曲线越接近于直角。表7为各信噪比的虚警数、漏警数以及总正确率。
可以看出,信噪比为5 dB时,PSD-AE方法的虚警和漏警低,正确率高。虽然从ROC曲线上观察到3,5 dB的AUC曲线相差不大,但正确率却有很大差异,主要是因为低信噪比时正常数据与异常数据的均方误差间差距不够大,阈值较难调整,造成正确率差异较大。
为了更直观地观察PSD-AE的网络运行效果,给出t-distributed Stochastic Neighbor Embedding(TSEN)图。TSEN是一种常用的非线性降维算法,一般用于高维数据降低至二维或者三维,并进行可视化。
图9为3 dB时PSD-AE分别采用FFT为512,1 024点的TSEN图。可以直观看出,点数越高,区分效果越好。
4结束语
本文提出了基于卷积自编码的卫星通信入侵检测方法,该方法对卫星通信物理帧头SOF段的功率谱进行检测,相较于传统聚类方法在低信噪比时的识别率有了较大的提高。自编码检测法仅对主要特征进行提取,对噪声不是很敏感,因此抗噪声能力强,准确率很高,能够适用于复杂电磁环境。但在整个仿真过程中,也存在一些问题,比如各个畸变参数是否切合实际、符合规定,神经超参数的设置能否优化,使得网络运行速度更快、响应更及时。
参考文献
[1] HALL J,BARBEAU M, KRANAKSI E.Detection of Transient in Radio FrequencyFingerprinting Using Signal Phase[J/OL].[2022-09-20].https://static.aminer. org/pdf/PDF/000/274/667/robust_detection_of_signals_ with_unknown_frequency_and_phase.pdf.
[2] LIU Y,LI R,BAO J,et al.A Statistical Study of the Ionospheric Anomalies Affecting SBAS Safety Detected over China Area in 2015[C]//第十一届中国卫星导航年会论文集-S07卫星导航增强技术.成都:中国卫星导航系统管理办公室学术交流中心,2020:18.
[3]金文进,杨武.异常检测技术研究综述[J].软件导刊,2008(1): 10-13.
[4]徐菁.频谱异常检测技术综述[J].信息与电脑(理论版), 2020,32(23):214-216.
[5]潘一苇.通信辐射源个体识别关键技术研究[D].郑州:战略支援部队信息工程大学,2019.
[6]蓝常源.基于DVB-S2的宽带卫星通信技术应用研究[D].西安:西安电子科技大学,2015.
[7]袁非牛,章琳,史劲亭,等.自编码神经网络理论及应用综述[J].计算机学报,2019,42(1):203-230.
[8]何霜宁.多窗口谱估计方法的研究[D].杭州:浙江工商大学, 2020.
[9]王彦光,朱鸿斌,徐维超. ROC曲线及其分析方法综述[J].广东工业大学学报, 2021, 38(1): 46-53.