基于聚类算法的模板匹配信号识别改进算法
2019-06-12李靖超张之蕾
李靖超, 张之蕾
(上海电机学院 电子信息学院, 上海 201306)
早期的信号识别主要用于军事领域,当时的通信系统中,采用人工手动调制方式识别,即依靠人工计算测到的参数,判断信号源。如今民用的信号监测、信号确认、干扰识别、频谱管理、软件无线电和卫星通信等诸多领域中,都需要进行信号自动识别。目前国内外已发表的有关调制识别的文献中,信号调制识别的方法大致上可以分为两大类:基于特征提取的统计模式识别方法[1-3]和基于决策理论的最大似然假设检验方法[4-5]。李迅等[6]提出了一种基于多相滤波的数字正交变换技术提取信号瞬时特征的方法,此算法下的分类器可以有效估计信号的瞬时特征,将其运用于信号调制体制识别,取得了较好的效果;谢晓东等[7]提出了一种调制信号盲检测算法,为实现调制信号的盲识别提供了理论基础。罗利春[8]用准对数似然函数比(Quasi-logarithmic Likelihood Function Ratio, QLLR)方法构造检测多进制数字相位调制(Multiple Phase Shift Keying, MPSK)信号的假设检验及其QLLR,并求其数学期望,进而实现对信号的分类,取得了较好的效果。
信号识别[9]是信号处理的一个基本问题,其主要目的是从噪声信号中提取有用的特征数据库并对有用的信息进行识别。模板匹配[10]是一种最原始、最基本的模式识别方法,研究某一特定对象物的特征位于对象物的什么地方,进而识别对象物。它是信号处理中最基本、最常用的匹配方法。模板匹配具有自身的局限性,主要表现在它只能进行平行移动,若原信号中的匹配目标发生变化,该算法无效。模板匹配是信号识别中最具代表性的方法之一[11],它从待识别信号中提取若干特征向量与模板对应的特征向量进行比较,计算图像与模板特征向量之间的距离,用最小距离法判定所属类别[12-13]。因此,为了提高识别率,本文从识别精度较高的模板匹配法入手,对标准模板匹配算法进行改进,可使识别率有不同程度的提高。
1 改进模板匹配算法
模板匹配法是根据已有的经验和对未知信号类型的把握,建立通信信号样本的多维特征数据库。当接收机截获到某一信号时,首先提取该信号的特征,然后与数据库中样本信号特征匹配,计算与数据库中每一样本的特征距离,距离最小的即为待识别的通信信号所属的类型。
聚类算法又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性[14-16]。聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,不在同一个簇中的数据对象的差异性也尽可能大,即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离[17]。因此,当接收机截获到未知信号时,只需利用已建立的特征数据库,提取相应的特征向量,用模板匹配法,计算未知信号的特征向量与数据库中信号的特征距离,根据特征距离判断未知信号。
通信信号识别流程图如图1所示。
图1 信号识别流程图
假设识别系统有N类不同类型信号的特征数据库,定义未知通信信号的第j类信息特征Ej与已知的第i(i=1,2,…,N)类信号的第j类信息特征Aij的距离为
dij=|Ej-Aij|
(1)
式中,dij为测得的未知信号的第j类信息特征值。
待识别信号与第i类通信信号的信息特征距离为
(2)
待识别信号与第i类样本的贴近度计算公式为
(3)
式中,0≤Ni≤1。
对信号的误差值进行开根的计算,进而得出信号的贴近度,即定义待识别信号与第i类样本的贴近度为
(4)
通过改进的模型能更清晰地判断出未知信号所属的类型,更为精确地计算出待识别信号与已知信号之间的贴近度,从而达到更精确地对信号进行识别的目的。
2 仿真结果与分析
假设多维特征向量E=(E1,E2,E3,E4)分别为6种类型的通信信号对应的特征值,对于每一种调制类型,在信噪比为-10~20 dB之间每隔1 dB产生200个特征值样本,进而形成不同信噪比下样本信号的特征数据库。
假设不同信号的多维特征向量值如表1所示(以6种不同通信信号的小波熵值特征为例)。
表1 多维特征向量值
利用传统贴近度算法,在信噪比为5 dB时计算得到的贴近度值如表2所示,从计算结果中可知,传统的贴近度计算公式得到的贴近度与信号5、6的贴近度很接近,差异较小,这在更低的信噪比环境下会影响系统的识别率。利用改进算法计算信号贴近度数值如表3所示。
从表3可以很清晰地看出,改进后的贴近度模型中每个信号之间的差异都较大,未知待识别信号与信号4贴近度值接近1,与其他类型样本的贴近度都小于0.8,通过改进的模型能更清晰地判断出未知信号所属的类型。为了对比改进算法与传统算法的贴近度差异,贴近度值对比如图2所示。
表2 传统算法的贴近度数值
利用特征数据库中的特征,进行训练、测试,判决贴近度最大值所对应的模板信号的类别为待识别信号的类别,进而计算不同信噪比(Signal to Noise Ratio, SNR)下的多维特征识别结果如图3所示。
图3 基于模板匹配各信号正确识别率
信息融合理论表明,多特征的识别效果要优于单一某个特征的识别效果,这是因为不同的特征从不同的角度表现信号的复杂度和奇异性特征。信号1~6代表任意通信信号,通过仿真几种不同通信信号的多维特征,建立特征数据库进行分类,验证分类器的效果。当SNR>3 dB时,几种通信信号的识别率为95%以上,当SNR>10 dB时,这些信号的正确识别率为100%,可以实现较高SNR环境下对不同信号特征的准确识别。
3 结 语
针对信号识别中分类器设计这一环节,提出了改进的基于聚类算法的模板匹配信号识别方法。在传统的模板匹配识别算法的基础上,对计算方法进行改进,提高该算法在较低SNR环境下的识别能力。仿真结果表明:即使在SNR为5 dB的环境下,仍能够实现对不同信号特征的准确识别。这为模板匹配方法在信号识别、视频跟踪、工件精定位等领域的广泛应用提供了重要的理论依据。