APP下载

基于SVM的载波通信调制信号识别方法研究

2019-12-14董重重孙秉宇蔡兵兵王先培

中国测试 2019年11期
关键词:电力线特征参数载波

董重重,何 行,孙秉宇,谢 玮,蔡兵兵,王先培

(1.国网湖北省电力有限公司计量中心,湖北 武汉 430000;2.武汉大学电子信息学院,湖北 武汉 430000)

0 引 言

低压电力线载波通信(L-PLC)技术是智能电网用电信息采集系统本地通信方式之一,是利用现有的低压电力线进行远距离抄表等信息传递的媒介[1],由于低压电力线连通千家万户,故低压电力线载波通信技术因具有使用成本低廉,完美解决“最后一公里”问题等优点得到了广泛的应用。在目前国网建设的用电信息采集系统中,是作为本地通信首选通信方式。因此,其物理层通信安全问题不容忽视,在研究载波通信物理层安全问题中,如何判别其接收的信号是否是合法信号,其调制方式是其中的依据之一,因而研究电力线载波通信调制信号识别对于研究载波通信物理层安全具有重要意义。

电力线载波信号的调制识别指依据接收信号的特征来预估信号的调制方式,通过各种调制信号所表现的不同特征对调制信号进行分类[2]。目前研究算法主要有两类,一类是基于假设检验的最大似然方法,但该方法需要较多的调制参数作为先验知识,这在许多场合下不能满足,并且其识别准确率不高;另一类是基于特征提取的模式识别方法,通过抽取调制信号的一个或多个特征参数,采用分类器确定调制信号的调制类型。在调制信号特征的选择上,有基于概率峰度系数K、概率密度平坦系数F、概率密度函能量分布参数P特征的识别,除此之外,基于瞬时幅度、频率、相位特征等特征参数也是调制信号的常见选择之一[3]。这些不同调制信号的特征组成了一个总的特征集,但过多的特征参数容易使用分类器进行识别时出现过拟合问题,因此一般采用从总特征集中选取几个重要的特征来作为识别的依据,但实际上这种选取方法具有过多的人为主观因素,因而最终识别准确率不高。因此选择借助一个特征选择工具——FEAST,从一系列特征集中找出最能标识数据集的特征子集,以最大程度提高识别的准确率。对于调制识别的分类器,主要有SVM、人工神经网络、极端学习机ELM以及朴素贝叶斯等模式识别方法。

王毅等提出的应用BP神经网络方法,选取调制信号的4个特征进行调制信号的类型的识别,其识别效果显著。但BP神经网络收敛速度慢、泛化能力差,需调试选择不同神经元,方案复杂。并且其选取4个特征具有人为的主观因素。本文针对低压电力线载波通信信号以往研究的不足,采用SVM识别BFSK、BPSK和QPSK信号,构建调制信号特征总集[4],使用FEAST工具找出最能标识数据集的子集,依据信号特征子集对调制信号进行训练,从而进行调制信号的分类识别。仿真实验结果表明,SVM分类结果的识别准确率高于BP神经网络,其收敛速度也比神经网络快。

1 调制识别系统

1.1 调制识别系统方案

本文对国网部分主流电力线载波通信芯片的调制方式进行识别测试,主要为BFSK、BPSK、QPSK 3种调制类型。首先对测试设备供电,之后载波模块识别载波通信测试仪发的指令并发送相应传递信息的调制信号,在接收端滤波后被信号采集装置采集,调制识别系统图如图1所示。然后经上位机搭建基于Matlab的信号处理平台,对采集到的调制信号根据载波芯片的中心频率进行前期处理,包括下变频、载频分量的去除等,对处理后的信号利用FEAST工具构建训练集,采用SVM等分类器进行调制信号的识别。国网使用的主要载波通信芯片参数见表1。

图1 调制识别系统方案框图

1.2 系统总体实现

电力线载波通信调制信号系统总体实现主要包括数据收集、数据处理、特征选择提取、特征匹配4个模块,系统总体框图如图2所示。数据收集模块属于信号采集装置,通过信号采集装置对待测载波模块发出的各类载波调制信号进行采集数据。数据处理模块主要功能是分析识别采集到的信号中可能出现的噪声,并且对采集到的信号[5]进行滤波处理之后去除噪声影响,此模块包括噪声检测和去噪处理两个子模块。特征选择提取模块主要功能是从去噪之后的信号数据提取多个特征合成特征总集,使用FEAST工具对特征总集进行分析,选出最优子集来作为识别调制信号类型的依据。特征匹配模块是使用分类器训练好的模型进行电力线载波信号的识别,主要使用机器学习中的有监督学习方法,选取最适合本系统的分类算法进行信号调制类型的识别,最终识别出信号。

表1 国内载波通信芯片参数表

图2 系统总体实现图

2 SVM分类器设计

2.1 SVM原理

SVM一般包括3种,即软、硬间隔SVM,以及在引入核函数之后可解决非线性问题的非线性SVM[6]。由于载波调制信号特征识别是非线性问题,故采用非线性SVM。针对其训练的数据集:

其中xi为 训练的数据,yi为标签类别,m为支持向量的个数。通过引入的高斯函数将低维数据空间映射到高维数据空间,使得数据变为线性可分,在高维数据空间找到最佳“超平面”,其数学表达式[7]如下所示:

其中 ξi和常数C分别为辅助变量和惩罚因子,辅助变量为对应点距离主群点的远近的程度,惩罚因子表示对离群点带来的损失的重视度;W=ωT,ω =(ω1,ω2,···,ωi)为法向量,决定超平面方向;xi=(x1,x2,···,xi)T;b为位移项,决定超平面与原点的距离。首先对ai求解下列函数的最大值:

其中ai为Lagrange乘子为核函数,则最优分类函数式相应变为

2.2 Lib-SVM在Matlab中实现多分类

上述SVM只能区分两类模式的分类问题,当需要识别3种以及3种以上类型的电力线载波调制信号时,二分类分类器无法识别,需要将二分类器变成多分类器。其方法有两类:一类是一对多(oneto-many),对于需要识别的Z类对象,训练Z个分类器,选择其中的一类分类器作为正类,其余的Z-1分类器作为负类。以此类推,对每一个类将其于其余类划分为正类和负类,利用SVM进行分类识别,将多分类问题转化为二分类问题。对于一个需要分类的数据x,使用投票的方式来确定x的类别。最后统计得票最多的类,将是x的类属性;另一类是所有对所有(all-versus-all,AVA),给定Z个类,对Z个类中的每两个类都训练一个分类器,总共的二类分类器个数Z(Z-1)/2,比如有3 个类,那么需要3 个分类器,分别是对1和2类,1和3类,2和3类。对于一个需要分类的数据x,需要经过所有分类器的预测,也同样使用投票的方式来决定x的最终类属性,应用Lib-SVM工具包可在Matlab中实现多分类问题的解决,Lib-SVM工具包采用的是第二种“所有对所有”的方式实现多分类问题。

使用Lib-SVM实现多分类的步骤如下:

1)对数据作归一化(simple scaling)。将数据映射到小范围内处理,不仅可以加快分类器模型的收敛速度,而且能提升分类器模型的精度,使最终识别准确率更高[8]。

2)针对具体的分类识别问题选择合适的核函数。基于训练集将样本空间映射到高维,在高维样本空间中找到一个划分超平面,使线性不可分问题得以解决。这里选择使用 RBF(radial basis function)径向基核函数[9]。

3)选择最优的C和g。C是惩罚因子,是一个在训练模型前需要自己设置的一个数值,它表示对类中的离散数据的重视程度,C的值越大,重视程度越高;g是核函数中的gamma函数设置。

4)用得到的最优C和g训练多分类模型。使用Lib-SVM中的svmtrain函数来训练多分类模型。

5)测试。使用Lib-SVM中的svmpredict函数来测试分类精度。

3 基于SVM调制识别算法

3.1 载波调制信号特征参数选取

对电力线载波调制信号进行自动识别时,首先需要提取信号特征参数,使用SVM训练时依据不同调制信号对应的不同信号特征来区分调制信号的类型。在选择调制信号的特征参数时,特征参数选取的个数、种类直接影响调制信号的识别的准确率,由文献[2],特征参数选择有信号功率谱特征、信号平方谱特征、瞬时幅度、频率、相位以及概率峰度系数K和概率密度平坦系数F以及概率密度函能量分布参数P等,例如对于信号功率谱特征,频移键控信号与其他信号在信号功率上区别很大。BFSK信号在调制频率处具有不同的单频分量,相移键控如QPSK信号没有离散的单峰,二者有明显的不同,故可通过此特征识别BFSK调制。

11类特征参数的算法定义由以下各式给出:

1)零中心归一化瞬时幅度谱密度最大值 γmax:

其中Ns为取样点数,acn(i)为零中心归一化幅度值,由下式计算:

2)零中心归一化非弱信号段瞬时频率的一阶绝对原点矩fabsorg:

3)零中心非弱信号段瞬时相位非线性分量的一阶绝对中心矩Pabscen:

4)零中心非弱性信号段瞬时相位非线性分量绝对值标偏差 σap:

σap用来区分BPSK和QPSK信号。

5)信号功率谱包络的均值平方µ2和方差 σ2。记参数R为信号功率谱包络的波动程度。定义如下[10]:

由定义式知,若信号谱平滑,则R值逼近于0。反之,若信号不平滑,存在尖峰,则R值随着谱峰数的减少而增大。用 µ2,σ2作为特征参数,可用来识别BFSK信号。

6)瞬变谱中大于设定阈值的谱峰数目 SN和平方谱中大于设定阈值的谱峰数目N。通过设定阈值p1,根据大于p1阈值的平方谱峰数目N两种特征来区别BPSK和QPSK信号[11]。除此,还定义 SN=瞬变谱中大于设定阈值的谱峰数目,将此二者作为特征参数用来区分BPSK和QPSK调制信号特征参数。

7)另3 种特征参数为概率峰度系数K和概率密度平坦系数F以及概率密度函能量分布参数P[12]。

3.2 利用FEAST工具构建最优特征子集

3.1中列出了对于识别电力线载波调制信号常用的11类特征参数,但在实际使用过程中为防止过多的特征可能会出现过拟合现象,从而降低系统的识别性能,一般从这11类特征参数中抽取几类作为调制信号识别的依据。以往的研究中一般从中选取对要识别的信号相关度较高的特征参数作为识别的依据,但这种选取有着较强的主观因素,从而选取了不恰当的特征参数类别或数目,进而导致最终识别的准确率不够高[13]。因此,为最大程度提高选取特征参数的有效性,借助特征选择工具——FEAST从一系列由所有特征参数组成的特征总集中找出最能标识数据集的特征子集,使用到的主要命令为:

该命令通过输入的参数可以选择输出的最优特征子集数量,比如以上命令中选择输出5个特征参数组成的特征子集,FEAST就会给出5个对应标签的特征参数。

FEAST工具的基本原理是先对每一个特征与数据集的相关度进行分析,然后对相关度从大到小进行排序,然后根据要求给出对应数量特征参数的特征子集。上述命令为10时,给出的是要求为10个特征下的最优特征子集,调整参数为5,便给出的是要为5个特征下的最优子集。这10个特征或者5个特征并不是根据数据相关度的排序给出了前10个或者前5个特征参数,而是工具自身运算选出的最优组合。

4 测试结果与分析

为防止外界可能存在的干扰导致信号采集过程中存在较大误差,从而影响实验结果,整个实验过程在电磁兼容实验室完成。SNR取20 dB,采样频率为 100 MHz,模调制信号调制频率为 100 kHz,调制指数为1,数字调制的符号率为20 kHz,采样点数为10 000[14]。由图1的调制识别系统,图2的系统总体实现,对国网使用的不同调制类型的载波芯片进行识别。对采集到的信号作前期处理,如滤波等,之后将处理的信号传输至调制识别模块,作为其输入信号。为使调制识别系统达到较高的识别准确率,使用3.2中的FEAST工具选择合适的特征参数种类及数目,图3展示了整体的分类效果,说明了特征值数量和样本采集大小与分类准确度有关。

图3 设备识别性能和特征值数量及样本集大小的关系

从图中可以看出,随着所提取的特征值数量的增加,设备识别的平均F-Score值也在变化,当特征值增加到5个时,平均F-Score值达到最高,也即达到了精度和召回率的平衡点,这个数据也显示了不同的设备可以一个较高的准确率和召回率被区分。但当持续增加特征数量时,识别性能就不再增长,相反,曲线出现一定程度的下降趋势。因此本文选择前5个特征作为识别调制信号的依据。

由图3可得到样本量越大,设备识别的准确度越高,故从总体样本库中分别随机选择100个BFSK、QPSK、BPSK信号作为样本集,标签类别1为BFSK信号、2为BPSK信号、3为QPSK信号,从中选择30个BFSK信号、40个BPSK信号、20个QPSK信号作为测试集,剩余信号作为训练集,测试结果如图4所示。表2给出了从20组测试中抽取5组的测试结果。

由图4及表2可知,SVM预测结果准确率在98%以上。

为了更形象评价分类器性能,引入ROC(receiver operating characteristic) 曲 线 和AUC (area under curve)。ROC曲线上的每一点反映的是对同一信号刺激的感受性,它是衡量分类模型好坏的一种评价指标。曲线越靠近左上角,意味着越多的正例优于负例,模型的整体表现越好。其横轴表示的是负正类率(false positive rate,FPR)特异度,纵轴表示的是真正类率(true positive rate,TPR)灵敏度,其公式分别为式(15)、式(16)所示。AUC值表示的是正例排在负例前面的概率,其值为ROC曲线下的面积,也是分类模型的一种评价标准。

其中 TP 为真正例个数,FN 为假反例个数,FP为假正例个数,TN为真反例个数。

由于ROC曲线一般用于二分类,在针对多分类问题上也要将多分类问题转变为二分类问题。图5为基于SVM分类器下QPSK信号ROC曲线和AUC值。由图可知,曲线靠近左上角,AUC值为0.995,接近理想状态,分类器性能较好。

图5 SVM分类器下QPSK信号识别ROC曲线和AUC值

表3 BP神经网络下多次测试下准确率及运行时间[2]

图6 BP分类器下QPSK信号识别ROC曲线和AUC值

为表现SVM在电力线载波通信信号的识别的优越性,与BP神经网络调制识别性能作对比,表3给出了相同条件下BP神经网络相同条件下识别效果和运行时间。图6为BP分类器下QPSK信号ROC曲线和AUC值。将表2和表3作对比,图5和图6作对比,可见基于SVM的准确率均在98%以上,平均准确率为98.59%,平均运行时间为0.907 s。而BP神经网络准确率最好的情况也不到97%,平均准确率为94.56%,平均运行时间为1.668 s,而由两种分类器的ROC曲线和AUC值能得到更直观表现结果,相比BP分类器,SVM分类器的ROC曲线更靠近左上角,AUC值也更大。分析图表数据可知,基于SVM的调制信号识别,无论是在识别分类效果还是在运行速度上,都优于传统BP神经网络。总而言之,将本文方法应用于电力线载波调制信号的识别,取得了良好的效果,验证了本文方法的有效性。

5 结束语

本文以低压电力线载波通信物理层安全为目标,研究电力线载波芯片调制信号的识别问题。在特征参数的选择中,采用FEAST工具进行特征点的评估和选取,避免了以往主观因素选取特征参数导致最终调制识别性能差的问题。并且当识别更多类型调制信号时,使用FEAST工具可以弹性选择特征参数,可扩展至处理更多信号。分类器采用Lib-SVM对国网常用的3 种调制方式的载波芯片进行识别,并在相同条件下与BP神经网络作对比。仿真结果表明,Lib-SVM的识别准确率高于BP神经网络,且收敛速度更快,分类效果更好,多次测试结果表明,该方法的准确率可达98%以上。

猜你喜欢

电力线特征参数载波
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
基于电力线载波通信的智能限电装置
基于PSO-VMD的齿轮特征参数提取方法研究
一种压缩感知电力线信道估计机制
应急广播系统中副载波的构建与应用
统计特征参数及多分类SVM的局部放电类型识别
低压载波通讯测试仪的开发与应用
电力线载波通信标准PRIME和G3-PLC的研究
电力线通信中LDPC译码器的优化设计与实现