紧框架算法下的语音信号压缩感知
2016-09-20强策夏凌卿朝进童新西华大学电气与电子信息学院成都610039
强策,夏凌,卿朝进,童新(西华大学电气与电子信息学院,成都 610039)
QIANG Ce,XIA Ling,QING Chao-jin,TONG Xin(School of Electrical Engineering and Electronic Information,Xihua University,Chengdu 610039)
紧框架算法下的语音信号压缩感知
强策,夏凌,卿朝进,童新
(西华大学电气与电子信息学院,成都610039)
0 引言
压缩感知(Compressed Sensing,CS),又称压缩采样、压缩传感,是近几年才提出的新技术[1]。CS理论的核心思想是:将一个高维的向量投影到一个低维的空间,对获得的低维向量进行一系列的压缩、重构、存储或者传输,原来的高维信号(稀疏信号)可以通过特定的重构算法从获得的低维向量中较为精确地恢复出来[2]。在传统的压缩感知理论中,信号在一组正交基底表示下是稀疏表示的[3]。因而在正交基确定下来后,一个信号有且只有一种分解的方法,所以很多信号达不到最稀疏的表示[4]。然而在很多应用中发现信号在正交基的表示不是稀疏的,而是在冗余字典的表示下是稀疏的。冗余字典的稀疏表示[4]可以有效改善模式识别,压缩或去噪效果。同时也可以求解压缩感知的问题。
紧框架[4-5]作为冗余字典里面的一种重要形式,框架构造的简易性及使用的灵活性[6-7]。在解决大规模问题中有很重要的作用,本文利用紧框架理论,提出一种构造测量矩阵的改进方法,使得信号的表示更为稀疏,改善语音信号的CS性能。
1 压缩感知系统模型
系统模型如图1和图2所示,压缩感知提供了一种新方法来重构原始信号.设一维的离散信号x∈RN×1,假设RN空间内的任意的信号都可以被空间内的一组规范正交基(DCT基)Ψ=[φ1,φ2,…,φN]的线性组合表示,那么x就可以用DCT基的线性组合表示[8-9]:
图1 压缩感知采样流程
图2 压缩感知过程
(1)式表示信号x在Ψ域内的线性分解,投影系数αi= 离散信号x满足了稀疏性的条件后,就能将信号投影到一个和变换矩阵不相关的矩阵Ф的低维空间上,得到的投影称作观测序列,记作y,即: Ф是M×N矩阵,y是M维的列向量,由(2)式我们可以得出观测后的序列y维数M远远小于原始信号的维数N,这样就说明信号被压缩了,而且压缩后的数据大小远小于用奈奎斯特采样方法获得的数据[9]。将(1)式带代入(2)式中得到: 令Δ=ФΨ,一般称Δ为“感知矩阵”。 测量矩阵Ф每一行都是一个测量向量,α是具有K个非零元素的系数向量.压缩感知理论认为通过对测量矩阵的不断优化,得到一个性能优秀的测量矩阵,方便后期最大限度的重构原始信号[8]。 2.1语音信号在规范范正交际上的稀疏性 2.2基于紧框架算法的观测矩阵选取 特别的,信号在稀疏基上有且只有K个非零稀疏称为严格稀疏[1]。一般情况下信号不一定是严格稀疏的,但信号变换域系数经过排序以后以指数级衰减趋近于零时,信号可以被认为是近似稀疏表示,这在CS理论里是完全可行的。由此看来,语音信号稀疏基的选择是语音信号压缩重构的要过程。 语音信号在DCT域上可以被认为是近似稀疏表示。设一帧语音信号x=[x(1),x(2),…,x(N)]T,在DCT域上的系数为α=[α1,α2,…,αN]T,那么第n个DCT的系数αn为: CS理论认为,稀疏域的选取主要根据被处理的信号,由于随机高斯矩阵与大多数固定正交基构成的矩阵不相关,随机高斯矩阵是压缩感知中最常用的观测矩阵[10]。由于随机矩阵不会切合不同信号各自具有的特性,因而会导致压缩性能下降。本节以紧框架理论为依据,达到改善CS重构性能的目的。 一般情况下,未知大信号x∈RN×1可以表达为x=D x軇,其中D∈Rn×d(n< 对应标准的压缩感知模型,如果信号在紧框架(冗余字典)的表达下稀疏时,我们就可以通过下面的线性系统来恢复信号, 其中Ф∈Rm×n(m 输入:ΨDCT∈RN×L-DCT基M-观测次数Iter-迭代的次数 进行初始化:设P∈RM×N的初始值P0作为高斯随机矩阵,循环的计数变量k=0。 循环: (1)首先计算矩阵Gk:Yk=PkΨDCT,Yk为测量矩阵和投影矩阵相乘得到的感知矩阵。 归一化矩阵Yk的所有列向量后得到矩阵xk,Gk=。 (2)根据以下条件得到矩阵Gk*: (3)SVD分解:Guu=ALPHA*Gk+(1-ALPHA)*Gu,对进行SVD分解,使得矩阵的秩降为M,并将分解得到的Uk、Sk的秩也降为M。 (4)求解skqk:利用得到skqk=sk@· (5)更新P:找出Pk+1,使得误差最小。 (6)设k=k+1,直到k=Iter,循环结束。 输出:ΨDCT对应的紧框架矩阵P=PIter。 3.1PESQ 算法 PESQ算法是近期国际电信联盟组织(ITU)提出的针对语音质量客观评价的算法。PESQ算法考虑到网络的端到端时延,并且采用了改进后的听觉模型和认知模型新技术,对于通信时延、环境噪声等有很好的鲁棒性[11]。到目前为止,它是ITU公布的客观语音质量评价算法中和主观评价算法结果相关度最高的算法,在该算法下得到的MOS评分结果最贴合用户的主观感受。它的评分标准为:-0.5-4.5分,4.5分最好。下面是PESQ算法结构图。 本实验就是采用PESQ算法对重构语音进行评价。 3.2评分标准 MOS(Mean Opinion Score)值一般作为评价语音信号额主观方法[5],本文采用ITUP.862的PESQ程序对语音信号和重构信号的对比来得到MOS分,如表1所示,打分的范围为0(最差)~5(最好),实现主管质量的客观评价。 图3 PESQ算法原理 表1 五级评分标准 实验中分别采用高斯随机矩阵与紧框架矩阵作为观测矩阵,对录入的一段16kHz的语音信号进行压缩、重构,利用OMP[12]算法对压缩后的语音信号进行重构,比较不同观测矩阵对压缩重构性能的影响。在同等条件下,取语音帧长N=320个采样点,每一帧20ms,压缩比r分别取为0.6,0.5,0.4,0.3,0.2,0.1.实验环境为安静环境。从MOS评分表中可以看出,当压缩比r≤0.5时,紧框架矩阵的重构语音质量好于高斯随机矩阵的重构语音质量.当压缩比r=0.6时,紧框架下的重构语音质量与高斯随机矩阵的重构语音质量基本相同,MOS评分分别为3.289和3.261。 表2 重构语音的MOS评分 此外,引入语音质量评价客观标准:信噪比SNR。在r一定时,SNR越大说明CS语音重构性质量越好。各压缩比下,随机高斯矩阵和紧框架矩阵重构语音的SNR如表3、图4所示。 表3 重构语音的信噪比/dB 图4 重构语音SNR 从表3、图4都可以看出,随着压缩比r的增大,紧框架矩阵和随机高斯矩阵的SNR都增大,可以比较明显地看出紧框架的语音重构质量更好。 表4 算法运行时间比较/s 以循环一次为例,表4记录了高斯随机矩阵与紧框架矩阵在不同压缩比下运行所需要的时间,不难看出随着压缩比增大,观测次数M的增加,两种矩阵算法运行时间都会增加;在同一压缩比下,紧框架矩阵运行时间明显比高斯矩阵运行时间长。 通过实验结果比较,我们可以看出,紧框架作用下的测量矩阵压缩感知相较于使用随机测量矩阵能得到更好的重构信,紧框架矩阵算法明显改善了语音信号的CS性能。但是,此算法运行时间比随机观测算法稍长,今后会在改进紧框架算法方面和语音重构算法方面继续深入研究。 [1]石光明.压缩感知理论及研究进展[J].电子学报,2009,37(5):1070-1081. [2]焦李成,杨淑媛,刘芳等.压缩感知回顾与展望[J].电子学报,2011,39(7):1652-1662. [3]戴琼海,付长军,季向阳.压缩感知研究[J].计算机学报,2011,2011,34(3):425-434. [4]金伟.二元小波紧框架的构造与滤波器的设计[D].哈尔滨:哈尔滨理工大学,2012:21-29. [5]黄淼,崔丽鸿.参数化的三带小波框架中的扩充矩阵的构造[J].北京化工大学学报(自然科学版),2012,39(3):124-127. [6]张洪涛.四带小波紧框架的构造及其应用[D].西安:陕西师范大学,2014. [7]郭训香.框架的强分离性与紧框架的构造[J].数学学报,2015,58(4):587-592. [8]徐倩,季云云.基于最优观测的语音信号压缩感知[J].南京邮电大学学报(自然科学版),2011,31(6):49-54. [9]孙林惠,杨震.基于压缩感知的分布式语音压缩与重构[J].信号处理,2010,26(6):824-829. [10]S.L.Zhou,L.C.Kong and N.H.Xiu,New Bounds for RIC in Compressed Sensing,[J].Oper.Res.Soc.China,2013,vol.1,pp.227-237. [11]陈臻圆.语音信号的压缩感知研究及其在语音编码中的应用[D].苏州:苏州大学,2011. [12]刘智威.基于压缩感知的重构算法与语音压缩研究[D].南京:南京邮电大学,2012. Speech;Compressed Sensing;Tight Frame;Observation Matrix;Gaussian Random Matrix Speech Compressed Sensing Based on Tight Frame Algorithm 1007-1423(2016)07-0031-05 10.3969/j.issn.1007-1423.2016.07.007 强策(1990-),男,山东济宁人,在读研究生,主要研究方向为信息与信号处理 夏凌(1963-),女,汉族,四川成都人,副教授,研究生导师,研究方向为信息与信号处理卿朝进(1979-),男,四川南充人,副教授,研究生导师,研究方向为信息与信号处理 童新(1992-),女,四川眉山人,在读研究生,研究方向为信息与信号处理 2016-01-19 2016-02-25 QIANG Ce,XIA Ling,QING Chao-jin,TONG Xin 压缩感知,近年来在信号处理领域取得非常多的成果。在基于压缩感知进行语音压缩重构时,测量矩阵在重构原始信号的过程中发挥着重要的作用.为了提高重构语音质量,从观测矩阵着手,基于紧框架算法构造测量矩阵,并与传统的高斯随机观测矩阵进行重构语音质量的比较。实验结果表明,紧框架矩阵相对于传统常用的高斯随机矩阵,在语音重构过程中取得更好的效果。 语音;压缩感知;紧框架;观测矩阵;高斯随机矩阵 Compressed sensing is a research hotspot making so much progress in the field of signal processing.We know that the observation matrix plays an important role in the reconstruction of original speech signal.In order to improve the quality of reconstructed speech,starts from the observation matrix,constructs observation matrix based on tight frame algorithm and compares with the traditional gaussian random observation matrix on reconstructing of original speech.The experiments’results show that the tight frame matrix,compared with the tra-ditional gaussian random matrix achieves better effect in the process of speech re-construction.2 基于紧框架的观测矩阵的选取
3 重构语音的评价方法
4 实验结果
5 结语
(School of Electrical Engineering and Electronic Information,Xihua University,Chengdu 610039)