APP下载

基于压缩感知和约束随机线阵的声源方位估计

2020-09-24刘志红仪垂杰

关键词:入射角声源麦克风

李 贺,刘志红,仪垂杰

(1.青岛理工大学 信息与控制工程学院,山东 青岛266520;2.青岛理工大学 工业流体节能与污染控制教育部重点实验室,山东 青岛266520)

基于麦克风阵列进行声源方位估计是噪声源识别、水声通信和语音识别中的关键科学问题。在麦克风数目受限时,存在分辨率低、虚假声源抑制性差、精确定位多个声源难等问题。为解决这一系列问题,研究者一方面对麦克风阵列进行阵列结构优化,提高声阵列性能,以采集更多的有效声信息;另一方面不断改进声源方位估计算法,充分利用声信息对声源方向进行定位。

传统阵列结构大多是规则阵列(如:均匀线阵、矩形(方阵)、均匀圆形阵列、十字形阵列等),具有结构简单,搭建方便,结构容易调整等优点。但是这种阵元等间隔布放模式在使用波束形成算法进行声源方位识别时会产生测量空间分辨率受限、易发生串扰和精确定位多个声源难[1-2]等问题;在阵列性能方面体现为阵列方向图的主瓣宽度较宽、旁瓣值较大[1]等问题。为改善阵列性能,降低最大旁瓣过大造成的频谱泄露问题,研究者在规则阵列基础上,稀疏优化选择有限个数阵元的位置。Haupt等[3]首先提出利用遗传算法对以中心点对称的线阵阵列进行稀疏优化;刘小忠等[4]利用改进粒子群优化算法对对称线阵进行稀布;陈客松等[5]将阵列结构改变为非对称结构,进一步降低了阵列的最大旁瓣值;黄超等[6]通过采用保留最优个体和自适应交叉和变异算子相结合的方式,获得了更低的峰值旁瓣水平。但是,遗传算法、粒子群优化算法等全局优化算法计算量巨大,耗时较多,同时减小峰值旁瓣对其它算法是否能提高角度分辨率不确定。Chiariotti等[7]对波束形成算法中声阵列的性能参量和阵列形成算法进行了系统的研究,指出通过对规则阵列进行稀疏化的方法仍然不能去除空间周期性采样的影响。本研究考虑采用随机阵列,随机阵列是由阵元随机布放形成,这种布放随机性可彻底避免因结构周期性而导致的阵列性能变差问题,获得更大的阵列孔径和更小的峰值旁瓣级[8],有效提高声源分辨率。

声源方位估计方法中,典型算法包括常规波束形成(common beamforming,CBF)、最小方差无失真响应(minimum variance distortionless response,MVDR)算法[9]、多重信号分类(multiple signal classification,MUSIC)算法[10]和旋转不变子空间(estimating signal parameter via rotational invariance techniques,ESPRIT)算法[11]等。CBF算法空间分辨率不能超过瑞利限,且动态响应范围受旁瓣的影响,存在计算时间长、易出现负声源或假声源等问题;MVDR算法、MUSIC算法 和ESPRIT算法等子空间类算法在高信噪比、信源不相干和多快拍数情况下表现良好,但受信噪比影响较大,无法处理相干信号,对快拍数的依赖性比较强。自2005年Malioutov等[12]从稀疏信号重构角度基于传声器阵列对信源进行定位之后,压缩感知被广泛应用在声源方位识别中。Li等[12]通过压缩采样基于单次快拍数对信源方向进行识别,克服了对信号相干性的限制,同时也大大减小了所需信号快拍数;Zhu等[13]在信号稀疏理论框架下采用了协方差矩阵、内插矩阵和波束空间三种压缩感知模型对信源方向进行估计,对单信源和多信识别的角度分辨率优于传统算法;Das等[14]发现在识别相干多径信号波达方向时,压缩感知(compressed sensing,CS)算法优于MVDR算法。但这些应用都基于均匀线阵进行信号采集,孔径受限,空间周期性采样导致采集到的声信息具有重复性,这种因阵列结构引起的有效声信息不足严重影响识别的空间分辨率,通常无法分辨同频相近声源。Xenaki等[15]发现基于随机阵列可提高角度分辨率,并且分析了在特定结构的随机线性阵列基础上,分辨率随入射角度的变化,但没有对如何产生随机阵列以及识别方法中信号相关参数与分辨率的关系进行深入探讨。为解决这一问题,本研究提出利用阵元位置坐标符合均匀分布的随机阵列结构,结合压缩感知重构算法对声源方位进行识别的方法。并以随机线性阵列为例,为避免串扰而保持阵元间距大约半波长的限制,形成多约束均匀分布线性阵和压缩感知相结合的声源方位估计方法(multiple constraints uniform distributed random linear array+compressed sensing,MC-Uni-RLA+CS)。仿真结果表明:本方法可提高声源方位识别角度分辨率;同时研究了不同信噪比、入射信号个位数情况下算法的性能,对均匀线阵和压缩感知结合(uniform linear array compressed sensing,ULA+CS)方法和本方法在不同入射角度范围内的识别精度进行了比较。

1 压缩感知理论基础

压缩感知是近年来出现的新的信号采集理论,以远小于奈奎斯特采样定理要求的采集数据大概率恢复原始信号。主要包括信号稀疏性验证、测试矩阵设计和信号重建算法三个部分。压缩感知可应用的条件包括:①信号具有稀疏性;②测试矩阵与信号基空间具有不相干性。这些也是原始信号可重构的条件。

1.1 信号稀疏性

对信号x∈RN,如果它可以用N×1维正交基向量线性表示:

其中si是投影系数,s是对应的向量形式。如果只有k 个系数不为零,或者k 个系数远远大于其他系数,并且k≪N,就可以说信号x 在Ψ 域是稀疏的或者近似稀疏的。信号具有稀疏性是进行压缩感知的前提条件,常见正交变换如FFT变换、DCT变换和wavelet变换等对信号进行变换后如果只需要少量系数表达,信号在新的域中将具有稀疏性。

1.2 信号重构条件

对稀疏信号x 进行压缩采样不同于时域测量时记录信号在某个时刻的值,是对原始信号利用观测矩阵Φ 进行投影的过程。即测量值:y=Φx=ΦΨs。令ACS=ΦΨ,称为感知矩阵。从测量结果y(y∈RM)中恢复信号,可通过用求解P1问题完成。

P1问题是L1范数下的凸优化问题,如果信号足够稀疏,感知矩阵ACS满足受限正交性质(restricted isometry property,RIP)[16]是存在确定解的充要条件。

RIP条件:

定义等距常数δk:对每个整数k=1,2,…,K,定义矩阵A 的等距常数δk为满足以下条件的最小数值:

其中,稀疏向量x 为K 稀疏的。如果δk不太接近1,则认为矩阵ACS满足RIP条件。

但是RIP条件不易判定是否实现,文献[17]指出可通过测量矩阵和稀疏信号正交基之间是否相干确定信号的可重构性能,如果二者不相干,则矩阵ACS可大概率满足RIP条件。同时,根据相关性理论,不相干条件还可以等价为ACS中任意两列线性无关。根据[15],利用Gram 矩阵C(C=|AHA|)中主对角线之外的元素值,可直观表示矩阵任意两列相关性,Gij值越小,相干性越小。其中,Gram 矩阵的元素Gij是矩阵A 第i行和第j列对应列的L2范数内积。

2 Mc-Uni-RLA+CS方法

2.1 压缩感知声源DOA估计模型

基于声阵列进行声源方位估计的模型可表示为:

其中,y(t)是阵列输出矢量,A 是线阵对应的M×K 阵列流型,矩阵中元素:aij=e-j2π/λ·disinθj(i=1,2,…,M;j=1,2,…,K),M 表示阵元数量,K 为声信号入射角度个数,λ 为入射信号波长,di是第i个麦克风阵元与最左端参考点的距离,θj是第j 个声信号入射角;s(t)=[s1,s2,…,sK]为声信号矢量,表示从K 个不同方向入射的声信号;n(t)表示长度为M 的测试噪声向量。声源方位估计就是从麦克风输出向量y(t)中估计声信号入射角(θ1,θ2,…θK)的过程。

在选用线性阵列情况下,入射角可定义为声源传播方向与阵列法线的夹角,范围为[-90°,90°],将该范围分为N 个区域,每个区域对应一个方位角,则每个角度都可能是声信号的来波方向,K 个声源入射角度对应了N 个方位角中K 个不为0的值。因声源信号数K≪N,入射信号可视为空间稀疏度为K 的N 维稀疏向量,声源信号满足空间稀疏性。

对应于压缩感知理论,如果信号是K 稀疏的,可以采用与Ψ 不相关的测量矩阵ΦM×N(M≪N)对信号x 进行压缩观测,矩阵Φ 中每一行等效为一个传感器,通过与Φ 相乘,得到少量测量值,y=Φx。将x 表达式代入,得到M×1的测量向量y:

声源方位估计模型可表示为:

这样,把原始阵列流形A(M×K)扩展为过完备的感知矩阵ACS(M×N),实现基于CS理论的声源方位估计模型的建立。其中,ACS对应的Gram 矩阵元素值的大小反映了从声阵列测试数据进行声源方位估计估计的能力。

2.2 多约束均匀分布线性随机阵列

根据前述内容,影响声源方位估计的主要因素为感知矩阵ACS,而在有限麦克风数量条件下,影响矩阵ACS阵列流形的关键因素是麦克风数量、阵元间隔和阵列孔径。根据文献[17],观测矩阵Φ 的向量在正交空间均匀分布时,Φ 与Ψ 将具有更低的相干性,与此对应,本研究选择线阵位置坐标随机均匀分布在整个坐标空间;同时,为保证测试向量的正交性和避免串扰,选择阵元间隔大于信号半波长[18]。为综合以上限制,引入MC-Uni-RLA为基础阵,且采用连续位置坐标优化保证阵元位置均匀随机分布。具体生成过程为:设阵列孔径L 的线阵上有M 个阵元,为保证孔径不变,阵列两端各固定一个阵元,剩余M-2个阵元随机放置,即r0和rM-1固定,对r1,…,rM-2进行优化。由于要满足最小阵元间隔dc=0.5λ,首先获得均匀连续分布在[0,L-(M-1)×dc]范围内的坐标[l1,…,lM-2],此处使得l1<l2<…<lM-2,然后再把[l1,l2,…,lM-2]分别增加[dc,2dc,…,(M-2)×dc]得到[r1,r2,…,rM-2],具体可由式(8)计算。

3 数值仿真

3.1 信号重构条件验证

根据前述分析,感知矩阵ACS满足RIP条件等效为列向量之间不相干,可由对应的Gram 矩阵值进行衡量。因此,可计算不同阵列结构及参数的声阵列所对应Gram 矩阵,作为评判算法重构性能的依据。Gram矩阵元素值越小,说明感知矩阵的列相关性越小,正确恢复原信号的概率越大。

分别在相同阵元数目和相同阵列孔径下,对比均匀线阵和随机均匀分布线阵在不同参量条件下的Gram 矩阵。仿真参数具体设置见表1。

表1 仿真参数Tab.1 Simulation parameters

1)阵元数量相同

设置阵元个数m=8,对ULA,根据空间采样定理,选择阵元间隔0.5λ,对应Gram 矩阵如图1(a)所示;对MC-Uni-RLA,采用孔径L=10λ,对应Gram 矩阵如图1(b)所示。

图1 阵元个数相同时,声阵列对应Gram矩阵Fig.1 Grim matrix of arrays under the same number of elements

从图1可以看出,对于ULA,当阵元间距为0.5λ 时,阵列孔径较小,L=3.5λ,Gram 矩阵元素值较大,感知矩阵列相关性较强;而MC-Uni-RLA对应Gram 矩阵元素取值均较小,在[-60°,60°]范围内低于0.3。说明MC-Uni-RLA感知矩阵列相关性小于ULA,对信号重构条件满足更好。

2)阵列孔径大小相同

要保持ULA 与MC-Uni-RLA 孔径大小相同(L=10λ),ULA 需增加阵元个数到21 个,Gram 矩阵元素大小如图2,与图1(b)比较可知,ULA增加阵元个数后,对应感知矩阵的列相关性依然大于8个阵元构成的MC-Uni-RLA 的列相关性,对信号重构条件的满足情况比MC-Uni-RLA差。

3.2 方法对比分析及验证

假设声源处于远场入射,为了验证本方法性能与优势,在相同麦克风阵元数目下对多声源入射角度进行识别。

1)声源角度分辨率比较

当两个声源入射时,比较不同信噪比和快拍数下,不同算法的识别结果,如图3所示。

从图3中可以看出,当快拍数足够多(256)、信噪比较高(20 dB)时,对于间隔为6°入射的信号,CBF角度分辨率最差,已经不能正确区分,MVDR次之,MUSIC算法、ULA+CS方法和MC-Uni-RLA+CS方法可以正确区分;当快拍数减少时,MVDR算法和MUSIC算法识别效果开始变差,当快拍数减少到一定程度时,二者完全不能识别入射角度,而ULA+CS方法和MC-Uni-RLA+CS方法还可以区分,说明使用CS算法对声源角度进行识别,可以不受快拍数减少的影响;当入射角度间隔减小到2°时,以均匀线阵为基础的ULA+CS方法失效,以采用的多约束随机线阵为基础的MC-Uni-RLA+CS方法可以正确识别声源入射角度;保持其他参数不变,将信噪比减小到SNR=10 dB,依然可以正确识别。所提方法可以在低信噪比、少快拍数下实现更高的角度分辨率。

图2 与MC-Uni-RLA孔径大小相同的ULA阵列对应G矩阵图形,阵元个数m=21Fig.2 Grim matrix of ULA with the same aperture as MC-Uni-RLA,m=21

图3 双声源识别结果对比Fig.3 Comparison of double source recognition results

2)误差随信噪比变化

当两个声源入射角度差固定时,识别结果的均方根误差(root mean square error,RMSE)随信号SNR的变化情况,如图4所示。

从图4可知,入射角度为[0°,2°]时,信噪比大于6 dB,识别结果RMSE为0,具有较高角度分辨率;入射角度为[0°,6°]时,信噪比大于0 dB,识别结果RMSE为0。入射角度间隔越小,角度分辨率越高,要达到正确识别对信噪比要求也越高。

3)误差随入射声源个数变化

不同入射声源个数的RMSE的变化规律。假定多个声源之间角度间隔固定为1°,考察当声源个数增加时,声源识别结果RMSE随声源个数的变化,如图5所示。

图4 当两个声源入射方向固定时,识别结果RMSE随信噪比变化Fig.4 RMSE of identification results changes with SNR when two incident signal angles are fixed

当声源入射角度间隔为1°时,从图5发现,信源数较少时,RMSE为0,可以把间隔为1°的信源区分开,RMSE 随声源个数增多而增大,当增大到阵元个数M 附近时,识别结果RMSE大幅恶化,算法不能应用。说明本方法在处理欠定DOA估计问题时,具有良好的识别能力,可实现超分辨的DOA估计。

4)算法适用角度范围

考察在不同角度范围识别声源入射角的RMSE变化情况。对单声源角度进行有效角度范围测试,比较相同孔径大小(L=10λ)条件下MC-Uni-RLA(麦克风数目为m=8个)和ULA(麦克风间距为d=0.5λ,麦克风数目为m=21个)对应的识别结果以及适用角度范围。对单声源入射角估计,分别运行100次CS信号重构算法,将多次识别结果RMSE作为算法识别效果的衡量参数,结果如图6所示。

图5 识别结果RMSE随声源个数的变化,间隔为1°Fig.5 RMSE of identification results changes with the number of sources when the interval angle is 1°

图6 阵列孔径为:L=10λ,估计结果RMSEFig.6 The aperture:L=10λ,RMSE of results

从图6可以看出,当阵列孔径固定时,MC-Uni-RLA+CS比ULA+CS识别效果好,在[-50°,50°]角度范围内100次算法运行结果RMSE为0,可以全部识别正确,而ULA识别结果仅在0°角度附近RMSE为0。该结果与前文ULA对应Gram 矩阵元素值比本方法小(图1(b)和图2)相对应。本方法在麦克风数目减少(从21减少到8个)情况下,在更广泛的角度范围达到比相同孔径大小的均匀线性阵列更好的识别精度。

4 结论

为提高声源方位估计精度,增大声阵列孔径和角度分辨率,提出了多约束随机阵的压缩感知声源方位估计方法,主要研究结论如下:

1)在相同麦克风数目、低信噪比和少快拍数条件下,多约束随机线阵的应用提高了角度分辨率。MCUni-RLA+CS方法比CBF、MVDR、MUSIC和均匀线阵压缩感知(ULA+CS)方法角度分辨率高。

2)本算法可以在低信噪比情况下取得较高分辨率。入射信号角度间隔越小,角度分辨率越高,要达到正确识别对信噪比要求也越高。

3)本算法适用于多声源入射角度识别。当入射信号数目小于麦克风数目时,算法基本可正确识别来波信号入射角度,构建了随机线性阵构型与声源方位间的定量关系。

4)采用随机线阵结构,本算法可以在少数麦克风数目(阵元M=8)情况下,比同等大小孔径均匀线阵(阵元M=21)在更宽的角度范围内取得更高的角度识别正确率。

猜你喜欢

入射角声源麦克风
基于四负载最小二乘法的内燃机排气噪声预测
虚拟声源定位的等效源近场声全息算法
光通过平行玻璃砖侧位移大小的分析
计算辐射噪声的面声源和点声源结合方法
汽车内麦克风阵列布放位置优化方法研究*
基于GCC-nearest时延估计的室内声源定位
预制圆柱形钨破片斜穿甲钢靶的破孔能力分析*
利用H型钢柱电线杆实现高铁覆盖的探讨
麦克风的艺术
讯飞输入法也能离线语音输入