球谐域传播算子快速声定向算法

2018-11-07潘曦佟颖王华阳

兵工学报 2018年10期

潘曦，佟颖，王华阳

(1.北京理工大学机电学院，北京 100081； 2.上海无线电设备研究所，上海 200090)

0 引言

声源定向是一种应用于目标检测的被动定向方法。时间波达(TDOA)方法算法简单,是普遍使用的声源定向方法，但TDOA方法在给定的时间内只能处理单声源[1]定向问题，且定向精度和分辨率不高。多重信号分类(MUSIC)算法[2-4]和基于旋转不变技术的信号参数估计(ESPRIT)算法[5-6]是真正意义上的高分辨波达方向(DOA)方法，但不能解决宽带声源问题[7]。基于球谐波理论的球形麦克风阵列与子空间类DOA估计相结合的方法，即球谐域MUSIC (SH-MUSIC)算法能够解决宽带声源问题，并具有高定向精度[8]，主要原理是将接收信号转换到球谐域，并将球谐域的观察空间分解成噪声子空间和信号子空间，利用子空间的特性进行DOA估计。然而，该方法进行特征值分解、获取特征向量时需要很大计算量。与MUSIC算法相似，正交传播算子 (OPM)算法也是一种基于子空间的方法，但其不需要对传感器接收信号的交叉谱矩阵(CSM)进行特征值分解，并且传播算子是一个只依赖于导向向量的线性算子。因此与MUSIC算法相比，OPM算法可以显著降低计算复杂度[9]。

本文提出了基于球谐传播算子(SH-OPM)的两种声源定向算法，包括使用球傅里叶变换成分获得传播算子(SH-SFT-OPM)的算法和使用球傅里叶变换成分的CSM获得传播算子(SH-CSM-OPM)的算法。实验结果证明，与球谐域MUSIC (SH-MUSIC)算法相比，所提基于SH-OPM的算法均具有较好的声源定向性能和较低的计算复杂度。同时，为了实现对不同频带声源的DOA估计，本文分析了球阵列半径范围从0.07～0.10 m对信号频率范围从0.2～2.2 kHz的估计影响问题，总结了球阵列半径与可处理的声源频率范围之间的关系。

1 基于球麦克风阵列的声场模型

球麦克风阵列由球面上均匀分布的L个全指向声压麦克风组成，球半径为r，第l个麦克风所在方向为Ωml=(θml,φml)，在空间直角坐标系Oxyz中第l个麦克风的位置矢量表示为rml=(xml,yml,zml)T=(rsinθmlcosφml,rsinθmlsinφml,rcosθml)T，其中φ为方位角，θ为俯仰角，l=1, 2, …,L. 本文中所有方位角φ均在Omxmym面沿xm轴逆时针测得，所有俯仰角θ均沿zm轴向下测得。

假设有S个波数为k的宽带源平面波入射到阵列，其中k=2πf/c，f表示声源频率,c表示声速，且第s个平面波的波数为ks、第s个平面波的DOA为Ωs=(θs,φs)，s=1, 2, …,S. 那么第s个平面波的波矢量可被表示为ks=(kssinθscosφs,kssinθssinφs,kscosθs).

球阵列上第l个麦克风接收的声压信号的时间- 空间域模型可以写为

(1)

式中：ss(t)表示第s个声源入射信号随时间t变化的幅度；nml(t)表示麦克风接收信号中的加性噪声；τml(θs,φs)表示第s个声源入射信号到达第l个麦克风与到达球阵列球心点处的时间差，

(2)

Δλml为第l个麦克风所在位置与球阵列球心点处在入射方向(θs,φs)上的波程差。

对(1)式进行傅里叶变换，得到频率- 空间域模型：

(3)

将(2)式中的τml(θs,φs)代入(3)式，得

(4)

将(4)式写为矩阵形式：

(5)

记作

P(k)=A(k)s(k)+n(k)，

(6)

式中：A(k)∈CL×S表示导向矩阵, 可写为

(7)

s(k)∈CS×1且s(k)=[s1(k),s2(k),…，sS(k)]T表示信号波形向量；n(k)∈CL×1且n(k)=[n1(k),n2(k),…，nL(k)]T表示和信号向量s(k)无关的加性噪声向量。

与窄带声源信号不同，对于宽带声源信号的导向矩阵A(k)，其频率f表示整个信号频带，这里自变量波数k=2πf/c不是固定值，而是整个频带对应的不同波数。通过对接收信号进行离散采样获得数字信号，然后选取X个快拍进行X点离散傅里叶变换，就会得到X个离散的频率点，相当于将宽带声源信号的整个频带分成X个子频带，每个子频带对应的频率为fx(x=1, 2, …,X)，相应的波数为kx=2πfx/c. 那么(6)式离散化为

P(kx)=A(kx)s(kx)+n(kx).

(8)

对于单位幅度的平面波入射声场球谐函数展开式可写为

(9)

式中：k为波矢量；r为麦克风的位置矢量；Ynm(θ,φ)表示n阶m维度的球谐函数，且

(10)

Pnm(cosθ)表示缔合勒让德函数；bn(kr)称为模态强度，且有

(11)

(12)

将(12)式代入(7)式中，导向矩阵A(k)可被分解为

A(k)=Y(ΩmL)B(kr)YH(ΩS).

(13)

式中：Y(ΩmL)∈CL×(N+1)2为球谐函数矩阵，

(14)

B(kr)为远场模态强度的对角矩阵，

B(kr)=diag(b0(kr),b1(kr),b1(kr),…,bN(kr))；

(15)

Y(ΩS)∈CS×(N+1)2为入射声源的球谐波矩阵，

(16)

将(13)式代入(8)式，得

P(k)=Y(ΩmL)B(kr)YH(ΩS)s(k)+n(k).

(17)

(17)式即为声场球谐函数展开的矩阵表达式，给(17)式左右两边同时乘以YH(ΩmL)×V，其中V∈CL×L表示权重因子的对角矩阵，

V=diag(αm1,αm2,…,αml,…,αmL)，

(18)

式中：αml=4π/l，其中l=1,2,…,L表示整个采样点集。

对声场进行球谐分解，可得球傅里叶系数矩阵为

Pnm(k)=B(kr)YH(ΩmL)s(k)+nnm(k)，

(19)

式中：nnm(k)=YH(ΩmL)×V×n(k)为加性噪声球傅里叶变换系数矩阵。注意到(19)式中球傅里叶系数向量的导向向量为B(kr)YH(ΩmL)，即频率相关的分量已从角度相关的分量中解耦出来。这时通过给(19)式左乘B-1(kr)即可将频率相关的分量去除，获得只包含角度相关的分量，即球傅里叶变换成分Pnm∈C(N+1)2×1写为

Pnm(k)=YH(ΩS)s(kx)+N(kx)，

(20)

式中：N(kx)∈C(N+1)2×1，且N(kx)=B-1(kr)×YH(ΩmL)×V×n(kx)。定义矩阵F(kx)∈C(N+1)2×L，令

F(kx)=B-1(kr)×YH(ΩmL)×V，

(21)

则N(kx)可被重写为

N(kx)=F(kx)×n(kx).

(22)

2 球谐域的传播算子定向算法

2.1 SH-SFT-OPM算法

对于宽带声源，其频率覆盖范围宽。波数k=2πf/c的范围由声信号的带宽决定，现将声信号分解成X个子频带，则球傅里叶变换成分Pnm(k)宽带信号的球傅里叶变换成分Pnm∈C(N+1)2×X可被写为

Pnm=[Pnm(k1),Pnm(k2),…,Pnm(kX)].

(23)

传播算子的定义基于对球傅里叶变换成分Pnm获得

Pnm=[PA;PB],

(24)

式中：PA∈CS×X表示由矩阵Pnm的前S行组成的子矩阵；PB∈CU×X表示由矩阵Pnm的后U行组成的子矩阵，U=(N+1)2-S.

假定所有的入射信号均不相干，则矩阵Pnm满秩保证了子矩阵PA的行线性独立。

在无噪声的情况下，存在着矩阵P使得(25)式成立：

PB=PHPA.

(25)

当存在噪声时，尽管(24)式仍然成立，(25)式关系已不再满足。这时传播算子SFT估计值可以通过最小二乘法获得，可表示为

(26)

QHa(Ωs)=0，

(27)

于是DOA估计函数为

FPM(Ωs)=aH(Ωs)QQHa(Ωs).

(28)

为了引入噪声空间的投影算子，可以用其正交化矩阵取代矩阵Q，即

Q0=Q(QHQ)-1/2，

(29)

则DOA估计的伪谱为

(30)

通过扫描入射声源方向Ω, 伪谱中最大的峰值对应的Ω即为声源的入射方向Ωs.

2.2 SH-CSM-OPM算法

X个子频带的CSMRnm∈C(N+1)2×(N+1)2可被写为

(31)

(32)

(33)

(34)

(35)

在无噪声的情况下，存在着矩阵P使得(36)式成立：

H=GP.

(36)

当存在噪声时，尽管(24)式和(35)式的分块仍然成立，但(25)式和(36)式的关系已不再满足。这时传播算子CSM的估计值可以通过最小二乘法获得，可表示为

CSM=(GHG)-1GHH.

(37)

获取传播算子后，构建矩阵Q以及DOA估计都与SH-STF-OPM算法相同。

3 仿真及性能分析

在基于球形麦克风阵列的DOA估计中，DOA的估计性能主要取决于球傅里叶变换成分Pnm的准确性。本节通过定义球傅里叶变换成分的信噪比(SNR-SFT)对球麦克风阵列的DOA估计性能进行分析。

3.1 球阵列半径与可处理的声源频率范围

为了考虑不同来源的误差，通过随机过程仿真球形麦克风阵列的性能。给定L个麦克风以一个给定的安装误差均匀地分布在球形阵列的表面。用球阵列上L个麦克风接收到的声压信号计算S个平面波的来波方向[12]，且所有的接收声压值都添加了随机噪声。使用球形阵列的SNR-SFT可写为

(38)

式中：‖·‖F表示Frobenius范数；nm(k)表示球傅里叶变换成分的估计值。Pnm(k)和nm(k)可分别写为

Pnm(k)=YH(Ωs)s(k)，

(39)

nm(k)=F(k)A(k)s(k)+F(k)n(k).

(40)

结合图1和图2可以得出：在低频处球傅里叶变换成分的估计值nm并不真正等于其理论值Pnm，这种现象控制了球麦克风阵列可处理频率范围的下边界；在高频处由于空间混叠的存在，限制了球麦克风阵列的性能[13]。对半径和阵列可处理的频率范围作了相应的分析，结果如图3所示。从图3中可以看出，随着球阵列半径的增加，阵列DOA估计可处理的声源信号频率范围先增加、后下降。

3.2 传播算法DOA估计性能

本节所有的仿真均使用同一个远场正弦线性扫频信号，该信号频率范围为0.2～2.2 kHz，并以8 kHz/s频率变化率线性扫频。声信号的入射方向(θ,φ)为(100°, 100°)。麦克风接收信号的信噪比设置为0 dB. 快拍数为512个，采样率为10.24 kHz.

使用半径为0.07 m刚性单球阵列，进行仿真实验，图4给出了3种DOA估计算法的空间谱。通过比较可以得出：图4(a)中使用SH-SFT-OPM 算法的DOA估计准确性最差；图4(b)和图4(c)中分别使用SH-CSM-OPM算法和SH-MUSIC算法的DOA估计结果非常接近，和图4(a)中使用SH-SFT-OPM 算法得到的空间谱相比，这两种算法的空间谱谱峰均很尖锐。

通过比较3种算法DOA估计结果的均方根误差(RMSE)分析这3种算法在不同信噪比下的DOA估计性能。RMSE由 (41)式计算：

(41)

式中：S和W分别表示声源个数和独立的蒙特卡洛实验次数；(s,w,s,w)表示第w次蒙特卡洛实验中以(θs,φs)方向入射到阵列第s个声源的DOA估计值[14]。俯仰角和方位角的扫描间隔设为(1°, 1°)，麦克风接收信号的信噪比为-10～20 dB. 入射声源信号的所有参数即3.2节开头所设。使用半径为0.07 m的刚性单球阵列对SH-SFT-OPM算法、SH-CSM-OPM算法和SH-MUSIC算法3种DOA估计算法进行估计误差分析，共进行500次独立蒙特卡洛实验，得到RMSE随信噪比(SNR)变化的结果如图5所示。

从图5可知：本文所提SH-SFT-OPM算法和SH-CSM-OPM 算法在信噪比为0～20 dB时具有与SH-MUSIC算法相似的性能；在信噪比低于0 dB时所提算法的RMSE比SH-MUSIC算法小，特别是SH-SFT-OPM算法不需要计算CSM，也不需要进行白化，因此该算法具有最低的计算复杂度，在对实时性要求较高的环境中具有实际应用价值。

4 实验及测试结果分析

4.1 球阵列设计

为了验证本文所提基于球形阵列宽带源快速定向算法的有效性，本节设计了表面均匀分布8个全指向麦克风的球形阵列结构[14]，球阵列半径为0.07 m，8个麦克风被安装在刚性球内接正方体的8个顶点上，刚性球阵列实物图如图6所示，8个麦克风所在方位如表1所示。

表1 球阵列表面8个麦克风所在方位

4.2 定位误差分析

将声源固定在不同的方位进行声源定向实验，所用声源信号为录制的坦克行走声音，该声信号的某段时域波形如图7所示，同时图8给出了对应的声源信号幅频图。图8中结果显示所用声源频率范围主要集中在200～1 500 Hz之间。

图9为实际声源方向测量实验场景，用蓝牙音箱分别在距离球阵列中心2 m处8个不同的空间位置播放声音，图10给出了8个声源空间位置的示意图，图中灰色小球表示球阵列，赤道圆环上的4个黑色小点表示实验位置1到实验位置4中俯仰角固定为90°时方位角分别为0°、90°、180°、270°的位置，4个蓝色小点表示实验位置5到实验位置8中固定方位角为180°时，俯仰角分别为30°、60°、120°、150°的位置。

每个声源位置都进行了100次独立实验，并使用3种不同算法进行计算，所得结果的平均值如表2所示，使用SH-CSM-OPM算法进行第3次测量结果的空间谱三维图和俯视图分别如图11(a)和图11(b)所示。

表2 8个不同空间位置测得的声源方向平均值

从表2中可以看出，所提算法能够准确识别声源DOA. 其中SH-SFT-OPM算法估计精度较差，最大估计误差为(4°, 6°)；而SH-CSM-OPM算法和SH-MUSIC算法估计结果相近，最大估计误差为(3°, 5°)。综上所述，实验结果证明了所提算法的有效性。

4.3 时间开销

测试了使用该单球阵列进行SH-SFT-OPM算法、SH-CSM-OPM算法和SH-MUSIC算法3种DOA估计算法花费的时间。表3给出了经过10次实验的平均花费时间。

表3 10次实验的平均花费时间

由表3可以看出，随着扫描间隔的变小，3种算法DOA估计花费的时间快速地增大，其中SH-SFT-OPM算法花费的时间更少，这是因为该算法不需要计算CSM，也不需要噪声白化。而SH-CSM-OPM算法和SH-MUSIC算法花费的时间非常相近。

5 结论

本文提出了基于SH-OPM的两种声源定向算法：SH-SFT-OPM算法和SH-CSM-OPM算法。总结了球阵列半径与可处理的声源频率范围之间的关系，解决了宽带声源频率适应性问题。通过比较分析两种算法和SH-MUSIC算法在不同信噪比下的DOA估计性能，进行声源定向实验并测试了3种算法的DOA估计用时，得到了如下结论：

1)所提算法在信噪比为0～20 dB时具有和SH-MUSIC算法相似的性能；在信噪比低于0 dB时所提算法的RMSE比SH-MUSIC算法小，特别地，SH-SFT-OPM算法具有最低的计算复杂度，在对实时性要求较高的环境中具有实际应用价值。

2)所提算法能够准确识别声源波达方向。其中SH-SFT-OPM算法估计精度较差，SH-CSM-OPM算法和SH-MUSIC算法估计结果相近。

3)随着扫描间隔的变小，3种算法DOA估计花费的时间快速增大。其中SH-SFT-OPM算法花费的时间更少，这是因为该算法不需要计算CSM以及噪声白化，而SH-CSM-OPM 算法和SH-MUSIC算法花费的时间相近。