基于时延估计的四元声源定位研究

2020-06-18经若楠

电声技术 2020年3期

经若楠

(华北电力大学(保定)，河北保定 071000)

1 引言

随着科技的发展与进步，传声器阵列技术当前已被广泛地应用到音频与视频会议、汽车的安全以及语音增强等多个领域[1]。阵列信号处理的一个主要的任务就是声源定位，它是空间滤波技术实现的基础。基于时延估计的声源定位方法主要有两步，最主要的就是要对信号到达不同的传声器之间的时间差(TDOA)来进行估计，然后再利用几何关系来确定声源的位置[2]。20世纪70年代开始逐渐有各种TDOA的方法被提出，比如自适应最小均方、基于声门脉冲激励的方法、基于基音周期的方法等。一个好的时延估计方法要同时具备良好的抗噪声与抗混响性能和较小的运算量[3]。

2 声源定位技术的发展现状

国外对于声源定位技术的研究起步相比国内而言更早一些，但是曾经一度因为其他种类的传感技术的兴起声源定位技术被边缘化了。随着当前科学技术的发展与进步，声源定位技术又由于其所具有的隐蔽性好、成本低等优势条件显露出来，从而重新进入到人们的视野中。现在许多国家都对于声源定位技术进行了大量的实验研究与应用。

目前许多的西方国家的军队中都已经应用了声源定位系统，并且声源定位系统在其中发挥了，非常重要的作用。比如以色列所研制出的AEWS系统主要用来进行声测预警，它能够检测到飞机的信息同时可以将定位的数据发送给指挥中心。在2005年时，美国的军方通过利用Crossbow公司研制的传感器节点来实现了枪声定位系统，用它来对目标建筑范围内的突发事件比如枪声或者爆炸声的位置来进行监测。2011年，德国的莱茵金属公司制造出了一款新型的车载声学狙击定位系统(如图1所示)，该系统由综合的电子分析设备以及与它相连的扩音器的天线，还有安装在装甲车内部的控制设备与显示设备。当该系统能够探测到有武器的射击时，就会用声音和图像或者时以视频的形式发出警告，同时在控制设备与显示设备上显示对于敌人的分析所得出来的信息。

3 基于时延估计的定位算法

声源定位技术的定位算法有四种，分别是：基于可控波束形成的声源定位方法，基于高分辨率谱估计得定位方法，基于声压幅度比得定位算法，基于声达时间差(TDOA)的定位算法。这里主要对于最后一种方法进行介绍，它一般被分成时延估计和声源定位两个部分。

时延估计定位方法是当前声源定位系统设计经常使用的算法。时延估计算法在实际的应用中价值非常高，在数字信号处理领域的活跃度特别高。时延估计算法分为两部分，分别是延迟估计和位置估计。

时延估计算法的基本原理：利用传声器阵列来对实时的信号进行接收，并对这些数据进行处理从而获得在不同阵列间的延迟值。然后再用这个得出的时延值来计算不同的传声器与目标声源之间的距离差，并且将距离差代入到传声器阵列的几何模型所推导出的位置公式中，最终得到具体的声源坐标。时间延迟(TDOA)指的是由同一声源出发，但是由于传输路径的不同最终导致两个传声器接收到的信号存在的时间差。延迟估计还可以确定目标的距离、方向以及速度等参数。

基于时延估计的定位算法有多个互相关联的算法，因此当声源只有一个时定位的效果是最好的，而在声源较多的情况下，定位的效果并不是很好有时可能直接无法定位。在相对复杂的环境中，在声音信号进行传播的过程中通常会发生反射现象，并且可能会有较强的噪声源存在，这样就给时间延迟的准确性计算带来了相当大的难度，因此使得定位的精度大大降低。所以，时延估计算法通常被用到一些噪声强度较小与声音信号反射比较少的地方，在这些环境条件下，算法计算起来难度相对较低，只需要对时延估计算法进行很小的改进就可以获得比较准确的时延值。同时，时延估计算法对于硬件设备的要求并不高，很简单的设备就可以实现，设备的成本相对较低，方便推广使用。

3.1 传声器和声源位置关系的几何模型

传声器和声源位置关系的几何模型如图2，连接着两个传感器，分别为M1和M2，将它们的中点当作远点，它们之间的连线就是X轴，τ12就是声源信号在两个传感器的时间时延。分别用m1和m2来表示这两个传声器所出的位置，用rs这个矢量来表示声源所在的位置，那么声源S就应该满足下列方程式：

||rs-m1-||rs-m2||=τ12c

(1)

其中c表示声音的传播速度。由双曲面的定义知，能够符合该方程的解一定会在双曲线上。把声源S(r,θ,φ)的极坐标表示转化成直角坐标的形式，如下：

(2)

将(2)式以及m1=(|m1-m2|/2,0,0)与m2=(-|m1-m2|/2,0,0)共同带入到(1)式中，并且对其两端同时进行平方得到下式：

(3)

若处在远场模型中，声源与传声器二者之间的距离会相对远一些，也就是说，当r的取值非常大时，1/4r2将会接近0，则上式就可以近似表示为

(4)

3.2 平面四元十字阵

在三维立体空间中，要想确定某个声源的位置，就需要有三个相互独立的时延估计值，所以在传声阵列中至少需要有四个单元，即四元的十字阵，平面四元十字阵如图3所示。在阵列中四个传声器的坐标分别为M1(d/2,0,0)，M2(0,d/2,0)，M3(-d/2,0,0)，M4(0,-d/2,0)，声源目标S所处位置的坐标为(x,y,z)，r是声源目标S与原点之间的距离，θ是其俯角，φ为其方位角，d则是两传声器之间的距离。如果r远大于d，那么我们能够做出这样的假设，阵列接收到的信号以平面波的形式来进行传播。如果对于M1来说，声源信号到达其他三个位置的时延分别是τ21、τ31、τ41，到达三点与M1之间的声差分别是d21、d31、d41。

最终得出声差的公式，声源方位角φ(0°≤φ≤360°)，俯角θ(0°≤θ≤90°)以及声源S与传声器阵列的中心之间的距离r。

(5)

(6)

(7)

(8)