APP下载

计算机线缆的电磁信息泄漏智能分析方法

2022-11-06茅剑唐妮刘晋明马通边

电波科学学报 2022年4期
关键词:线缆电磁卷积

茅剑 唐妮 刘晋明 马通边

(1. 集美大学计算机工程学院,厦门 361021;2. 中国电子科技集团公司第三十三研究所,太原 030006)

引 言

随着电子设备的快速发展与广泛应用,设备自身的信息安全问题日益凸显.研究发现,计算机、数控系统等电子设备在处理信息时,内部的电流变化会产生电磁辐射,向外界发射电磁信号[1].这些无意发射的非通信电磁信号,携带着设备内的有用信息,有可能被侦收并通过还原技术进行信息复现[2-4],导致敏感信息泄漏,危及信息安全.

1985 年,W.van Eck 披露计算机显示器电磁辐射泄漏信息的侦收与还原技术细节,引起了研究者对电磁信息泄漏问题的关注[5].在计算机系统中,显示器的图像输出是人机交互的主要方式,而系统内和系统间互连各类数据线缆承载着信息的传输,因此计算机线缆是电磁信息泄漏攻击的重要目标[6].MarKus G.Kuhn 研究发现LCD 显示器与CRT 显示器一样会通过无意电磁发射泄漏视频信息[7],显示器的视频图形阵列(video graphics array,VGA)接口则是重要的泄漏源.H Tanaka 等在30 m 处通过电流探圈截获笔记本电脑电源线所泄漏的电磁信息,并还原出显示屏上的图像信息[8].文献[9]研究了带有液晶显示器的台式计算机工作中产生的视频信息泄密电磁发射的测量、还原和信息认知.文献[10]针对计算机高清多媒体接口(high definition multimedia interface,HDMI)建立了视频信息特征模型,使用小波分解设计频域隐匿处理算法.文献[11]通过对电源线传导泄漏进行分析,建立了泄漏模型.文献[12]依据电源线泄漏特征,使用分类统计方法进行了图像重建.文献[13]对计算机网络互联电缆建立了电路辐射发射模型,并有效抑制了电路辐射.电磁泄漏信息的特征与其泄漏源有关,现有的文献多是在已知泄漏源的基础上,对电磁泄漏信号进行分析与处理,依赖于先验知识与操作经验对电磁泄漏信号进行特征查找,对于不同电磁环境的适应性不足.

目前深度学习在模式分类领域应用广泛,具有强大的能力和灵活性[14-15],可以从大数据中学习相关特征,形成智能判断识别能力.本文采用深度学习算法,针对VGA、HDMI、网络传输线缆和计算机电源线中无意传导发射的电磁信号,学习并提取其中的电磁特征,实现电磁信息泄漏的智能识别.

1 计算机线缆的电磁泄漏特征分析

连接计算机的各型线缆是产生电磁传导泄漏的主要途径.分析计算机线缆泄漏的电磁信号特征,可为电磁信息泄漏检测提供判别依据.本文在正常的室内环境下,使用电流卡钳和信号处理设备,对4 种计算机线缆所泄漏的电磁信号进行采样分析.

VGA 线缆是最常见的视频传输线缆.它基于VGA 标准传输模拟视频信号,当显示器的分辨率为1 024×768、刷新率为60 Hz 时,VGA 线缆所泄漏的视频信号频谱图如图1 所示.

当VGA 线缆传输信号时,线缆中的视频信息会以传导耦合的方式沿着计算机电源线传播,从而造成电源线上的信息泄漏[16].

根据视频电子标准协会(Video Electronics Standards Association,VESA)发布的计算机显示器工业标准和指南[17],显示器在1 024×768@60 Hz 的显示模式下的行频为48.363 kHz,所以从图1 和图2 可以看出,两个信号在行频点上都有较高的峰值,为信息泄漏的频点.两个信号的包络分布相似,这是由于计算机电源线上的视频信号是从VGA 线缆上耦合而来的.使用信号复现技术复现计算机电源线上泄漏的电磁信号,经验证其与VGA 线缆上泄漏的视频信息相同.由此可见,即使有先验知识,也难以根据频谱特征直接区分泄漏源的线缆类型.

图1 VGA 线缆视频泄漏电磁信号频谱Fig.1 EM signal spectrum leaked from VGA cable with video

图2 计算机电源线视频泄漏电磁信号频谱Fig.2 Spectrum of EM signal leaked from power line of computers

HDMI 线缆也是目前常用的音视频传输线缆[18].HDMI 线缆传输过程中所采集的电磁泄漏信号频谱如图3 所示.

根据VESA 指南,显示器在1 024×768@60 Hz 的显示模式下,其像素时钟频率为65 MHz.文献[19]指出了HDMI 线缆电磁信息泄漏原理,由于HDMI线缆所传输的视频信号经过最小化传输差分信号(time minimized differential signal,TMDS)编码,在一个像素时钟周期中可传输10 bit 的数据,其传输速率可达650 Mbps.本文使用1.25 GS/s 采样率以获取图3中的信号,依据文献[19],在650 MHz 内的波瓣中包含了所传输的视频信息.

图3 HDMI 线缆视频泄漏电磁信号频谱Fig.3 Spectrum of EM signal leaked from HEMI cable with video

常用的网络互联电缆为非屏蔽双绞线(unshielded twisted pair,UTP),通过串行传输数字信号,可以通过分频、分时、分位等方式被窃取和还原[20].UTP 线缆传输数据时所泄漏的视频信号的频谱图如图4 所示.

图4 UTP 线缆泄漏电磁信号频谱Fig.4 Spectrum of EM signal leaked from UTP cable

由于各型线缆在传输信息时所用的编码方式不同,理论上各自泄漏的电磁信号也应具有不同的特征.但实际电磁环境中存在着噪声干扰,计算机线缆作为泄漏源,其泄漏信号特征往往难以区分,进而识别泄漏信号中隐藏的信息就更加困难.因此本文提出一种基于深度学习的电磁信息泄漏分析方法.

2 基于深度学习的计算机线缆电磁信息泄漏分析方法

深度学习是一种特征递进式的学习算法,能够学习到数据中更为复杂抽象的深层特征.本文基于深度学习,设计了一个电磁信息泄漏分析方法.该分析方法在未知电磁信息泄漏源与特征的条件下,使用深度学习对电磁泄漏信息进行特征提取,分两步进行分析与检测.第一步对电磁信息进行分析判断其泄漏源;第二步对泄漏的电磁信息进行检测,首先判别电磁信号中是否包含信息,再进而识别其中的信息类别.分析流程如图5 所示.

图5 电磁信息泄漏分析流程Fig.5 Analysis process of EM information leakage

2.1 电磁泄漏信号预处理

本文所采集的原始信号是时间序列样本,所处的初始观测域是时域.

为了更好地提取电磁泄漏信号中的信息特征,需要对信号进行预处理,以便在不同的观测域对信号进行特征分析.

常见的视频泄漏信号在频谱上具有丰富的周期与频率特征.本文采用的第二种观测域是频域,所使用的预处理方法是快速傅里叶变换(fast Fourier transform,FFT)[21]:

式中:X(k)为 经过计算之后的频谱信号序列;x(n)为时域信号序列;N为信号序列的长度.

第三种观测域是小波域.小波滤波[22]在非平稳信号处理中应用广泛,通过小波变换(wavelet transform,WT)对电磁泄漏信号进行尺度分解之后,再利用阈值法等对小波系数进行过滤并重构,可以提升泄漏信号的信噪比.WT 的公式为

第四种观测域是倒谱域.倒谱分析[23](cepstrum)对电磁信号的傅里叶变换谱进行对数运算,可以分离电磁泄漏信号中的乘性噪声,改善信号质量:

式中:傅里叶变换后的数据可分为实部和虚部,X(ejw)为x(n)经 过公式(1)计算后的实数部分;Ceps(n)为实倒谱的计算结果.

对采集的原始时域信号,使用不同的信号预处理方法,在各观测域上对比分析其检测性能.

2.2 基于CNN 的电磁信息泄漏源检测

卷积神经网络(convolutional neural network,CNN)作为深度学习算法,已在图像处理、文本分析、语音识别等领域表现出优异的能力[24].本文为图5 中的泄漏源检测模块设计了一个包含两个卷积层的CNN结构,命名为D-CNN,用以识别4 种不同的泄漏源线缆,如图6 所示.该分析方法能在未知电磁信息泄漏源的情况下,通过训练实测的电磁信号,提取信号特征,生成具有分析能力的CNN 模型[25].将待测的电磁信号,输入到训练好的D-CNN 模型中,经过CNN 的逐层特征提取,最后在全连接层输出各个分类的预测得分,通过计算判别电磁信息泄漏源.

图6 电磁信息泄漏源检测流程Fig.6 The source identification process of EM information leakage

CNN 由输入层、输出层和隐藏层构成[26],其结构设计影响检测模型的准确率、鲁棒性等.本文的D-CNN 网络,针对一维电磁泄漏信号特征而设计,包含两个一维卷积层、两个池化层和一个全连接层,结构如图7 所示.

图7 D-CNN 结构图Fig.7 D-CNN model structure

D-CNN 的网络结构参数如表1 所示.CNN 的输入为频谱信号,长度为16 384.CNN 将输入层的数据传递到卷积层和池化层,经过特征提取和转化之后,将具有64 个通道且长度为1 024 的特征向量输入到全连接层中,最终由全连接层对特征进行汇总并输出结果.

表1 D-CNN 网络结构参数表Tab.1 D-CNN network structure parameters

1)卷积层

卷积层的特点为参数共享和局部连接,并且利用平移不变性从全局信号提取局部特征.卷积函数的计算公式为

式中:⊗表示卷积运算;N是CNN 中各层的索引号;X(N)和X(N+1)分别是卷积计算过程中第N层所输入和输出的特征向量;W(N)是 第N层CNN 的权值向量;B(N)是 第N层的偏置向量.

2)宽卷积

D-CNN 的卷积层使用宽卷积,即卷积过程中的填充方法为“SAME”填充.采用填充“0”的方式对卷积运算中的输入特征边缘进行补全,可以有效地保留原始的输入特征信息.

3)激活函数

激活函数负责对卷积层抽取的特征进行非线性映射,D-CNN 采用 ReLU 作为激活函数,ReLU能够过滤小于0 的值,保留非负值,产生单侧抑制的效果,在提高学习精度的同时缓解梯度消失的问题.ReLU函数的计算公式为

在ReLU函数之后,使用Dropout 函数,并设置概率值为0.5,用于抑制CNN 的过度拟合;之后使用最大池化(max Pooling)进行下采样,对特征进行筛选,有效减少网络参数并输出池化域内最大的特征值.

4)全连接层

全连接层使用 SoftMax作 为激活函数,SoftMax函数计算公式为

式中:i为进行运算的元素序号;Si表示第i个元素在(0,1)区间内的映射.

CNN 训练采用基于梯度下降的Adam 优化器.根据前期试验,本文将学习率设为0.000 1,使得计算高效,网络中的权值更加精细.

2.3 基于CNN 的电磁泄漏信息检测

针对计算机线缆泄漏的视频信息,继续使用CNN 对信号中隐藏的特征进行提取,进行电磁信息泄漏检测,判定其泄漏风险.电磁信息泄漏检测流程与图6 相似.

文献[27]曾提出多图CNN (multi-graph CNN,MGCNN)神经网络结构,用于检测电磁泄漏信息,其在 与AlexNet、GoogleNet 和VGGNet三个经典的图像分类算法相比时展现出优异的识别性能.

本文对MGCNN 中的卷积结构进行改进,在一维卷积层与 ReLU层之间添加一个批标准化(batch normalization,BN)层,如图8 所示,并命名为D-CNN-BN.

图8 D-CNN-BN 的卷积层结构图Fig.8 Convolution layer structure of D-CNN-BN

使用BN 方法,在卷积运算后对数据进行归一化,可在一定程度上缓解过拟合[28],加快梯度下降优化收敛,提高训练精度.BN 算法如下:

1)计算上一层输出数据的均值

2)计算上一层输出数据的标准差

3)归一化计算

4)对归一化后的数据进行重构

式(7)~(10)中:x是上一层的输出结果;m是此次训练样本batch 的大小;ε是接近于0 的很小值,可避免分母为0 的情况;β、γ为学习参数.

3 计算机线缆的电磁信息泄漏分析实验与分析

根据本文提出的电磁信息泄漏分析方法,计算机线缆的电磁信息泄漏分析实验分为电磁信息泄漏源检测和电磁泄漏信息检测两个步骤.每步实验的过程都包括数据采集、数据预处理、模型训练和模型验证.

3.1 基于CNN 的电磁信息泄漏源检测实验

在基于CNN 的电磁信息泄漏源检测实验中,检测的泄漏源为4 种计算机线缆:VGA 线缆、计算机电源线、HDMI 线缆和UTP.

3.1.1 数据采集与处理

本文的数据采集与测试都在正常的室内工作环境下,未屏蔽其他电子设备的电磁干扰.

电磁泄漏信号采集装置由A.H.Systems BCP-620 卡钳和型号为NI PXIe-5 162 的信号处理设备组成.卡钳用于电磁泄漏信息的收集,信号处理设备的采集精度为10 bit,主要用于信号的处理和存储.被采集的设备包含型号DELL OptiPLex3240 的LCD 显示器、携带HDMI 接口的AOC I2490PXC 显示器、计算机主机和HP 笔记本电脑,电磁泄漏信息采集方式如图9 所示.

图9 电磁泄漏信息的采集方式Fig.9 Electromagnetic signal leakage collection of different cables

实验中采集了4 种不同线缆的电磁泄漏样本.在不考虑还原泄漏信息的前提下,仅为了识别泄漏源特征,所使用的采样率均为1 MS/s.所采集的电磁泄漏信号为时域序列,分别使用FFT、WT 和倒谱对信号样本进行预处理,在时域、频域、小波域、倒谱域4 个观测域上分别对数据进行模型训练.信号样本长度为16 384.

经过数据的采集与处理,每个观测域上的数据集各包含了5 472 个电磁信息泄漏样本,如表2 所示.

表2 电磁信息泄漏源检测实验样本数Tab.2 EM information leakage detection dataset

3.1.2 泄漏源检测

将表2 中的电磁信号样本按照不同的线缆将数据分为4 类并标注类别标签,每类的样本数为1 368,以4∶1 的比例分为训练集与测试集.

泄漏源检测采用D-CNN 结构.利用监督学习的方式进行训练,使用梯度下降方法对模型进行迭代,使得预测结果逐渐逼近真实标签.模型训练的迭代次数(Epochs) 设置为200.实验采用5 折交叉验证,取5 轮的平均值作为性能评价依据.算法性能的评价指标为准确率和召回率.与经典的机器学习分类算法极限梯度提升(extreme gradient boosting,XGBOOST)、随机森林(random forest,RF) 和朴素贝叶斯(Naïve Bayes,NB)[29]的实验结果对比如表3 所示.

表3 泄漏源检测算法性能对比Tab.3 Performance comparison of source detection by different algorithms

从表3 可以看出,总体而言,D-CNN 模型的准确率和召回率大幅度优于XGBOOST、RF、和NB 模型.特别是在频域上,D-CNN 模型能够得到最优的性能,其准确率的平均值在95%之上,召回率可达到93%.

实验证明本文提出的方法在未知电磁信号泄漏源的前提下,能够提取电磁信号特征并判别电磁泄漏源.

3.2 基于CNN 的电磁泄漏信息检测实验

本实验基于图5 中泄漏信息检测流程,采用DCNN-BN 网络结构.

3.2.1 数据采集与处理

实验采用与图9 中相同的数据采集方式,采样率为250 MS/s,对VGA 线缆和电源线进行电磁信息泄漏数据采集.实验选取黑白文字图像,以及公开数据集CIFAR-10 中飞机和猫各10 张实物图片作为信息泄漏的激励,如图10 所示.将黑、白屏状态下的电磁信号定义为无信息泄漏的样本.

图10 实验图像示例Fig.10 Examples of images

250 MS/s 的采样率下,一帧图像所包含的电磁信号数据量过大,使得D-CNN-BN 网络过于庞大,大幅度提升了计算成本.考虑图像信息具有冗余性,本实验为了平衡算法执行速度和检测精度,对信号进行降采样.降采样后的数据也进行了FFT、WT、倒谱变换,得到4 种不同观测域的实验数据,数据分布如表4所示.

表4 电磁泄漏信息检测实验样本数Tab.4 Information detection dataset of EM signal leakage

3.2.2 泄漏信息检测

将黑白文字图像和实物图像归为有泄漏信息一类,黑、白屏图像归为无信息一类.每类样本以4∶1的比例分为训练集与测试集,再取训练集中的10%作为训练中的校验集.

对XGBOOST、RF、NB、MGCNN 与D-CNN-BN 5 种算法进行对比实验,以监督学习的方式对数据进行训练,使用梯度下降的方法对模型进行迭代训练,并使用准确率作为算法性能的评价指标,结果如表5所示.

表5 泄漏信息检测算法性能对比Tab.5 Performance comparison of leakage information detection

从实验结果可以看出,CNN 算法优于其他机器学习算法.其中,本文提出的D-CNN-BN 方法性能最佳.

结合泄漏源检测实验,对比各个观测域上的检测性能,频域的检测效果最好.这是由于电磁信号在频域上有较强的周期和频率特征,二维的视频信息映射到频域上,通过CNN 能提取并学习其特征,实现有效的分类识别.

单独对比MGCNN 与D-CNN-BN 两种算法,由于增加了BN 操作,在时域上D-CNN-BN 的性能有了大幅提升.进一步分析BN 对CNN 的优化作用,将两种网络结构的训练情况进行对比,结果如图11 所示.

图11 MGCNN 和D-CNN-BN 算法性能对比Fig.11 Performance comparison of MGCNN and D-CNN-BN algorithms

图11 表明,在CNN 结构中加入BN 之后,训练损失率下降得更快,加快了算法的收敛速度,从而增强了模型的鲁棒性.

使用表5 中的实物图像数据集对算法进行进一步验证,比较D-CNN-BN 和MGCNN 用于区分泄漏图像信息的性能表现.实验选取飞机和猫2 类图像泄漏信号进行二分类识别检测,采用5 折交叉验证,每轮实验从2 类信号中分别抽取8 幅图像产生的泄漏信号样本作为训练集,其余作为测试样本,以验证算法对未知图像信息的检测能力.由于前期实验已经证明频域信号的检测效果最佳,本实验只选取频域作为观测域.对比实验的结果如表6 所示.

表6 图像信息内容检测性能对比Tab.6 Performance comparison of image information detection

实验表明,D-CNN-BN 算法的性能明显优于MGCNN 算法,且算法的执行效率也高于MGCNN 算法.在实际的电磁环境中,利用BN 可以提升CNN 模型的检测性能,提取电磁信号中隐藏的视频图像特征,进而分类预测泄漏图像信息的类型.

4 结 论

本文采用深度学习的CNN 算法建立了用于电磁信息泄漏分析的D-CNN 模型,在未知电磁信号泄漏源的情况下,能够对电磁信号进行分析,并准确预测出电磁信号的泄漏源.相较于传统的通过操作经验与先验知识对电磁泄漏信息进行分析的方法,本文提出的智能分析方法提高了电磁泄漏信息分析效率,在信噪比低的情况下,也能准确提取信号中的特征判断泄漏源,准确率达到95%以上.在前人对显示器电磁信息泄漏检测的基础上,优化其CNN 结构,设计了D-CNN-BN 网络结构,通过添加BN 层使模型中梯度下降求解最优值的速度更快,同时避免了过拟合的问题,在小样本的情况下也能有较高的电磁泄漏信息检测效率与准确率.本文提出的方法可以通过添加更多的泄漏源,优化D-CNN 的网络结构与参数,以获取更高的准确率,增加模型的泛化能力,使模型更加高效与稳定.

猜你喜欢

线缆电磁卷积
基于全卷积神经网络的猪背膘厚快速准确测定
呼吸机用电磁比例阀工作特性仿真研究
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
千姿百态说电磁 历久弥新话感应——遵循“三步法”,搞定电磁感应综合题
手提包里的折叠滑板车
通信线缆收放装置的改良及设计
一种线缆盒
墙壁线缆探测器