基于同一性的健壮CS分类算法

2016-01-21陈赟，林峰

通信技术 2015年6期

陈　赟，林　峰

(1. 重庆邮电大学移通学院，重庆合川 401520；

2.重庆邮电大学电子信息与网络工程研究院，重庆 400065)

摘　要：针对利用压缩感知(CS)进行信号分类识别的问题，提出了一种联合欲分类信号和样本信号的健壮CS分类算法。该方法通过引入“同一性”的概念，克服了信号过完备字典传统构造方式的不足，增强了信号稀疏表示与信号类别间的关联性，提升了基于压缩感知的信号分类算法性能。仿真实验证明了所提方法的正确性，并进一步表明：在非最优过完备字典下，该方法较之传统CS分类算法更具有分类准确度。

关键词：压缩感知；信号分类；稀疏表示；同一性

doi:10.3969/j.issn.1002-0802.2015.06.012

基于同一性的健壮CS分类算法

陈赟1，林峰2

(1. 重庆邮电大学移通学院，重庆合川 401520；

2.重庆邮电大学电子信息与网络工程研究院，重庆 400065)

摘要：针对利用压缩感知(CS)进行信号分类识别的问题，提出了一种联合欲分类信号和样本信号的健壮CS分类算法。该方法通过引入“同一性”的概念，克服了信号过完备字典传统构造方式的不足，增强了信号稀疏表示与信号类别间的关联性，提升了基于压缩感知的信号分类算法性能。仿真实验证明了所提方法的正确性，并进一步表明：在非最优过完备字典下，该方法较之传统CS分类算法更具有分类准确度。

关键词：压缩感知；信号分类；稀疏表示；同一性

doi:10.3969/j.issn.1002-0802.2015.06.012

收稿日期：2015-01-08；修回日期：2015-04-19Received date:2015-01-18；Revised date：2015-04-19

中图分类号：TN911.7

文献标志码：码：A

文章编号：号：1002-0802(2015)06-0687-05

Abstract：Aiming at the problem of CS(Compressive Sensing) for signal recognition, a robust CS classification algorithm in combination with test sample and training samples is proposed. By introducing the concept of identity into signal processing，some deficiencies of traditional construction mode for signal over-complete dictionary are overcome,and the correlation of between signal sparse representations and signal classes is also enhanced, thus the performance of classification algorithm based on compressive sensing is improved. Simulation results verify the correctness of the proposed algorithm, and further show that this algorithm enjoys higher classification accuracy than traditional CS classification methods under non-optimal over-complete dictionary condition.

作者简介：

A Robust CS Classification Algorithm based on Identity

CHEN Yun1，LIN Feng2

(1. College of Mobile Telecommunication，Chongqing University of Post and Telecommunications，

Hechuan Chongqing 401520，China; 2. Electronic Information and Networking Research Institute,

Chonging University of Posts and Telecommunications，Chongqing 400065，China)

Key words：compressive sensing; signal classification; sparse representation; identity

0引言

信号分类是模式识别技术非常重要的一项应用，广泛存在于现代通信的各个领域。例如：信号调制区分、敌我身份研判、运行状态监测、语音文字鉴别等。最近，由Candès、Donoho以及Tao等数学家提出的压缩感知理论(CS，Compressive Sensing)[1]逐渐被应用于信号的模式识别。该理论的核心观点是：通过求解一个非线性最优化问题，稀疏信号可由少量的观测值(采样值)准确重构[1-2]。Wright J等人基于该理论首先提出将人脸图像分辨问题转化为测试样本在训练样本集中的最稀疏表示问题[3]，即求解最小L1范数问题。由此，逐渐发展出基于信号稀疏表示的一类新型智能模式识别方法。

研究表明，信号稀疏表示分类算法(本文称为CS分类算法)对噪声以及样本维度均具有较好的鲁棒性。较之模板匹配[4]、支持向量机[5]等，该方法在模式识别领域具有较好的应用前景。然而，CS分类算法的性能极大程度地依赖于信号的过完备字典。只有合适的过完备字典才能保证信号足够的稀疏度，从而保证非线性逼近时信号分类的准确度。

本文主要研究CS分类算法中过完备字典构造以及分类准则问题，对信号的特征提取与选择不作详细讨论。传统CS分类算法预先构造的过完备字典并不直接包含欲分类的信号，这种方式存在固定[6-11]、适应性差[6-7]或学习复杂[12-14]等缺点。针对以上问题，本文提出将欲分类信号修改为新原子插入到各类信号所对应的过完备字典原子库中，即Identity Perspective- Compressed Sensing (IP-CS)分类算法。该方法基于同一性观念，将欲分类信号看成是各类信号的同体(同一类型)，彼此越是相似，外部差异性就越小；通过比较插入(信号)原子对信号稀疏表示的影响进行分类识别。仿真实验重点对比了上述两种方法在非最优过完备字典下的分类性能，证明了所提IP-CS分类算法的有效性与可行性。

1传统CS分类思想

考虑共有k类的欲识别信号，将所有类型的训练样本组成过完备字典如下：

ψ=[ψ1,ψ2,…,ψk]=

[v11,…,v1n1,d1,v21,…,v2n2,…,vk1,…vknk]∈Rm×n

(1)

其中ψi是第i类训练样本集，vij是第i类中第j个训练样本；j=1,2,…,ni；m是样本的维度。

基于假设：任一测试样本可由其同类(训练样本)线性表出，因此测试样本x可用过完备字典表示为：

x=ψs0∈Rm

(2)

其中s0是最理想条件下稀疏表示的系数向量。

CS分类的一般步骤[5-16]为：首先，通过变换矩阵对信号进行线性测量；其次，求解最小L1范数问题寻找最稀疏表示；最后，计算最优非线性逼近分类信号。上述分类操作的两个关键是：过完备字典构造和分类准则。通常的做法是：寻找最匹配的样本构造字典和计算稀疏表示最小残差决策分类。

如何找到信号最佳的样本是非常困难的，传统CS分类算法基于人工或学习方式的字典构造(更新)方式要取得较好的分类效果，要么以字典的“可适性”要么以字典的“复杂性”为代价，并且仍然过度依赖于样本的“匹配度”。当外界条件发生改变时，过完备字典一旦变得不再“合适”，最小残差分类准则也就不再可靠。

2IP-CS分类算法

基于同一性压缩感知(IP-CS)分类算法，继承了传统稀疏表示分类思想，但在过完备字典构造以及分类准则两方面有所改变。这种改变实际是一种简单有效的字典学习方式，它将欲分类信号本身也参与分类决策，而不是仅仅依靠同类型的原子模板。同时，分类决策基于整个随机矩阵集合也更加准确、可靠。IP-CS分类算法具体步骤如下。

2.1过完备字典构造

根据传统CS分类算法，首先(基于人工或学习)将所有k类训练样本组成如(1)式所示字典，以此作为IP-CS分类算法的初始默认过完备字典。

然后，计算字典中各类型原子的样本均值为：

(3)

其中ni是第i类原子vi的样本数目。

考虑任何一个新测试样本x∈Rm×1，计算该信号对应的所有k个类型的同体(同一类型)原子为：

(4)

不失一般性，将产生的新原子(同体原子)分别插入对应的训练样本集末尾：

(5)

更新初始默认过完备字典如下：

[v11,…,v1n1,d1,v21,…,v2n2,d2,…,

vk1,…vknk,dk]∈Rm×n′

(6)

其中n′=n1+…+nk+k。由于同体原子di跟随测试样本每次变更，因此式(6)所示过完备字典具备动态更新特点。

同理，测试样本x重新用过完备字典可表示如下：

(7)

而s′0=[0,…,0,si1,si2,…sini,sdi,0,…,0]T∈Rn仍是最理想条件下稀疏表示的系数向量。

2.2稀疏解

根据压缩感知理论，选择高斯随机矩阵(满足RIP性质[1])作为变换矩阵Ф∈Rd×m，并且将变换矩阵的每一行都作归一化处理。

考虑噪声与误差，测试样本x的观测值为：

(8)

使用截断牛顿内点法(TNIPM)等算法求解以下L1范数问题：

(9)

2.3差异分析

计算线性测量y与δi近似之间的残差ri′(y)如下：

(10)

同理，计算线性测量y与δi近似之间的残差ri(y)如下：

(11)

ri(y)为传统方法下对各类型间偏差的度量，未考虑新原子贡献。

(12)

dki用于度量同类型内的偏差，其数值大小反映初始默认过完备字典中各类型训练信号与其同体原子di之间的相似程度。

计算新原子信号表示向量sh与同体表示向量shi的差异度如下：

(13)

ski用于度量各类型间的偏差，其数值大小反映同体原子所属种群与测试信号类型的相似程度。

2.4分类

传统CS算法分类决策仅仅依据最小残差ri(y)，本文IP-CS算法改进分类准则如下：

首先，基于最小错误概率分类原则，算法采用随机矩阵集合{Фj,j=1,2,…,}来进行健壮地差异分析；式(10)～式(13)采用随机矩阵Фj计算的结果分别表示为。

其次，定义特征函数δi近似线性测量y的总偏差如下：

(14)

计算所有第i类总偏差平均如下：

(15)

最后，分类决策如下：

(16)

式(16)表示分类线性测量y是基于测试样本稀疏表示在整个随机矩阵集合上的最小平均总偏差。

3仿真实验

特征提取与选择对模式识别的算法性能有着极大的影响。为公平地检验各算法的分类性能，所有算法仿真均采用原始信号本身作为特征。本文实验信号使用4种(QPSK、2-FSK、4-FSK、16-QAM)不同数字调制方式，采用IP-CS、传统CS两种算法进行分类识别。在MATLAB环境下，所有数字调制信号均采用相同的码元速率(40 kb/s)、采样频率(800 kHz)与载波频率(100 kHz)。计算机仿真进行3组对比实验，每组实验(在不同信噪比条件下)各种数字调制方式均产生250个信号样本，其中50个样本用于训练，其余200个样本则用于测试。其他的主要仿真实验参数如下：设置错误容限ε=0.01，变换矩阵采用高斯随机矩阵(矩阵行数d=100，共5个)。

3.1无噪声条件下分类

第一组实验在无噪声条件下产生所有实验信号。传统CS分类器的过完备字典由200个(每种调制方式50个)信号样本构成；IP-CS分类器的初始默认过完备字典由196个(每种调制方式49个)信号样本构成。800个信号样本用于测试分类算法的性能，仿真实验结果如表1所示。

表1　(无噪声)分类器识别率　(%)

从表1可看出：在理想(无噪声)条件下，IP-CS算法具有良好的分类准确度。一方面，该算法秉承了传统CS算法的“稀疏表示”思想，故可同样用于区分不同类型的信号；另一方面，该算法又引入欲分类信号本身，避免了决策仅仅依靠同类型原子模板的情况。分类决策充分利用同体原子的贡献(分解系数)，联合考虑“类间”偏差以及“类内”偏差，因此IP-CS算法的分类错误可明显少于传统CS算法。

3.2有噪声条件下分类

考虑一般实际情况，第二组实验在高斯白噪声条件下产生所有实验信号。信噪比从-5 dB到15 dB，每次间隔5 dB，共5种噪声变化情况。过完备字典构成同上，算法测试仿真实验结果如图1所示。

图1　正确分类的总体概率

图1给出了两种算法信号分类的总体性能，即将每次在相同信噪比条件下所有4种不同数字调制信号被正确分类的概率进行算术平均。总体性能是作为衡量分类准确度的重要指标。图中实线与虚线分别是IP-CS、传统CS两种分类算法进行仿真实验的总体性能曲线。如图1所示：对比发现两种算法在同等噪声环境下，IP-CS分类算法仍具有更好的识别性能。

3.3样本不匹配条件下分类

进一步考虑复杂情况，第三组实验在(无噪声、高斯白噪声)两种条件下产生所有实验信号。当外部环境发生变化时，重点测试分类算法在样本不匹配情况下的分类性能，以检验算法的适应能力。同理，过完备字典构成同上，算法测试仿真实验结果如表2、表3、表4、表5所示。

表2　(情况1)分类器识别率　(%)

注：情况1——训练样本(无噪声)，测试样本(信噪比：5 dB)

注：情况2——训练样本(信噪比：5 dB)，测试样本(无噪声)

注：情况3——训练样本(信噪比：5 dB)，测试样本(信噪比：-5 dB)

注：情况4——训练样本(信噪比：-5 dB)，测试样本(信噪比：5 dB)

CS分类算法的性能优劣极大程度地取决于(信号特征)过完备字典的“合适性”。在实际中，预先获得的训练样本集不一定能很好反映实际接收信号(受外界影响)的特征。表2、表3、表4、表5比较了当训练与测试样本不匹配时两种分类算法(传统CS、IP-CS)的适应能力。从表2、表3、表4、表5可看出：IP-CS分类算法具备健壮的识别性能，较之传统CS分类算法适应性更强。该优势得益于过完备字典的“动态原子库”，并且(相同条件下)插入信号同体原子的字典构造(更新)方式简单有效。因此，针对(条件受限下)非最优过完备字典的使用，信号分类采用IP-CS算法可在一定程度上改善传统算法可能出现的低识别率状况。

4结语

压缩感知(CS)分类是一种新颖的模式识别方法，分类识别基于样本在过完备字典上的最稀疏表示。本文在此基础上将稀疏性与同一性有力地结合，提出了将欲分类信号参与分类决策的IP-CS分类算法。通过插入同体原子，该算法构造的动态过完备字典明显优于传统静态固定字典，具有学习简单、适应性好的优点。同时，IP-CS分类算法改进了过去只重视信号“类间”偏差的最小残差分类准则，分类决策增加考虑了随机矩阵集合测量以及“类内”偏差分析。针对数字调制信号的分类仿真，实验证明了本文所提方法的有效性与可行性。通过对比分析实验结果，可以发现：在非最优过完备字典情况下，IP-CS分类算法相比传统CS分类算法展现出了良好的鲁棒性。因此，本文所提方法可用于在样本数量受限、匹配性差、维度过高等实际条件下的信号分类问题。下一步主要工作将深入研究该算法的性能提升以及模式识别推广问题。

参考文献：

[1]Candès E. Compressive Sampling[C]//Proceedings of the International Congress of Mathematicians. Madrid: Amer Mathematical Society, 2006: 1433-1452.

[2]Richard G, Baraniuk. Compressive Sensing[J]. IEEE Signal Processing Magazine, 2007, 24(4):118-124.

[3]Wright J, YANG A Y, Ganesh A, et al. Robust Face Recognition via Sparse Representation[J]. IEEE Trans. On Pattern Analysis and Machine Intelligence,2009,31(2): 210-227.

[4]于娴,贺松,彭亚雄等. 基于GMM模型的声纹识别模式匹配研究[J].通信技术, 2015，48(01)：97-101.

YU Xian, HE Song, PENG Ya-xiong, et al. Pattern Matching of Voiceprint Recognition based on GMM[J]. Communications Technology, 2015, 48(01): 97-101.

[5]张石清,赵小明,楼宋江等.一种局部敏感的核稀疏表示分类算法[J].光电子.激光, 2014，25(09)：1812-1817.

ZHANG Shi-qing,ZHAO Xiao-ming,LOU Song-jiang,et al. A Classification Algorithm based on Locality-Sensitive Kernel Sparse Representation for Face Recognition[J]. Journal of Optoelectronics.Laser,2014,25(09)：1812-1817.

[6]CHEN Y, LIU J, Lv S T. Modulation Classification based on Bispectrum and Sparse Representation in Cognitive Radio[C]//IEEE 13th International Conference on Communication Technology. Piscataway:IEEE Press,2011:25-28.

[7]SHEN Y, LIU G H, LIU H. Classification of Power Quality Disturbances based on Random Matrix Transform and Sparse Representation[C]//8th World Congress on Intelligent Control and Automation. Piscataway: IEEE Press, 2010: 7-9.

[8]ZHENG C H, ZHANG L, HUANG D S, et al.Metasample-based Sparse Representation for Tumor Classification[J]. IEEE-ACM Trans. On Comput Biol Bioinform, 2011, 8(5): 1273-1282.

[9]吕小听,李昕,屈燕琴等.基于稀疏表征的话者识别[J].计算机工程与应用，2014，50(20)：215-217，243 .

LV Xiao-ting, LI Xin, QU Yan-qin, et al. Speaker Identification based on Sparse Representation[J]. Computer Engineering and Applications,2014,50(20)：215-217,243.

[10]陆慧娟,陆江江,王明怡等.基于压缩感知的癌症基因表达数据分类[J].中国计量学院学报，2012, 23(01)：70-74.

LU Hui-juan, LU Jiang-jiang, WANG Ming-yi, et al. Classification of Cancer Gene Expression Data based on Compressed Sensing[J]. Journal of China University of Metrology, 2012, 23(01)：70-74.

[11]孙道达,赵健,王瑞等.基于稀疏表示的QR码识别[J].计算机应用，2013，33(01)：179-181，185.

SUN Dao-da, ZHAO Jian, WANG Rui,et al. QR Code Recognition based on Sparse Representation[J]. Journal of Computer Applications,2013,33(01):179-181,185.

[12]廖明熙,张小蓟,张歆.基于稀疏表示的水声信号分类识别[J].探测与控制学报，2014, 36(04)：67-70，77.

LIAO Ming-xi, ZHANG Xiao-ji, ZHANG Xin. Classification and Recognition of Underwater Acoustic Signal Based on Sparse Representation[J]. Journal of Detection & Control, 2014, 36(04)：67-70, 77.

[13]陈思宝,赵令,罗斌.局部保持的稀疏表示字典学习[J].华南理工大学学报自然科学版，2014，42(01)：142-146.

CHEN Si-bao, ZHAO Ling, LUO Bin. Dictionary Learning via Locality Preserving for Sparse Representation[J]. Journal of South China University of Technology(Natural Science Edition), 2014, 42(01)：142-146.

[14]Ptucha R, Savakis A E. LGE-KSVD: Robust Sparse Representation Classification[J].IEEE Trans. On Image Processing,2014,23(04):1737-1750.

[15]王铿,张重阳,齐朗晔.基于核距离的稀疏表示的交通标识识别[J].计算机应用与软件，2014，31(03)：146-150.

WANG Keng, ZHANG Chong-yang, QI Lang-ye. Traffic Sign Recognition in Sparse Representation based on Kernel Distance[J]. Computer Applications and Software, 2014, 31(03)：146-150.

[16]Li Y, Yu Z, Bi N, et al. Sparse Representation for Brain Signal Processing : A Tutorial on Methods and Applications[J]. IEEE Signal Processing Magazine, 2014, 31(03):96-106.