基于麦克风阵列系统的声源定位技术研究现状

2014-04-29王顺利洪强夏长春

电脑迷 2014年11期

王顺利　洪强　夏长春

摘要麦克风阵列信号处理是数字信号处理领域的一个热点问题，对麦克风阵列接收到的信息量，根据各个阵列之间信息的相关性，可以使用融合处理的方式实现对参数的估计，这种融合不仅可以在时间域处理，也可以在频域处理。麦克风阵列信号处理技术能够在统计意义上得到测量数据，该技术已应用在无线通信，雷达，声纳与工业控制等场合得到了广泛的应用。

关键词声源定位麦克风阵列数字信号处理三维空间可控波束

中图分类号：TB51 文献标识码：A

1麦克风阵列系统的声源定位技术研究意义

输入的信息只有两个方向难以确定声源的位置，人类的听觉系统主要取决于头和外耳气压差声波实现声源定位。假使没有这个压力差，只能定位在平面上声源的位置，但就无法知道声音是从前面，或从后面传来的。因此，由人的听觉系统，科技研发人员得到了灵感，使用多个麦克风系统可以实现在三维空间中的声源位置的定位，麦克风的数量越多，所接收到的信息量也越多。

声源的声源定位和声源增强是实现智能处理的两个关键问题，而声源定位是实现语音增强的前提和基础。一个麦克风的信息量较少，使得声源定位所需的信息缺乏，而麦克风阵列克服了上述缺点，充分利用每个麦克风信号之间的数据相关性，并加以融合，可以实现声源定位。

麦克风阵列系统已广泛应用于许多领域的基础上，一些典型的应用：

（1）视频会议

传统的视频会议和大型会议，如果只在一个固定的位置放置一个麦克风，扬声器远离麦克风，语音信号的质量收集很差，为了得到增强的语音信号，有两种选择，一种是谁讲麦克风传给谁，这是最常用的方法，其成本低，但使用不方便。另一个方法是对每个人都配置麦克风，这种方法容易在参与者的数量较少的情况下实现，但其成本太高，不太现实。基于麦克风阵列的系统不仅成本适中，安装方便，使用者还可以自动将提高扬声器的声音，和周围环境的噪声抑制。

在视频会议和视频监控，自动声源定位系统的麦克风阵列方向扰动摄像头的热点区域，以获得更好的图像和声音，大大地节省了人力。

（2）移动电话系统

当车辆在高速运行状态时，如果用手拿移动电话，可能会导致安全问题，免提电话由此应运而生。然而，当一些人在汽车中高声谈论事情时以及和当车辆高速运行时产生噪声的情况下，使用免提电话就比较困难。如果驾驶员位置使用麦克风阵列定位，加强在这个位置上的声音，消除其他方向上的干扰声音，通话效果就会有明显改善。

（3）故障诊断

故障诊断的第一步是确定故障的位置，在故障诊断中的声源定位是一种使用音频信号来实现无源探测定位的技术。声源定位系统采用被动方式工作，电磁辐射具有很强的隐蔽性，声源定位故障检测是在军事领域和民用领域得到了广泛的应用。

2麦克风阵列系统的声源定位技术的各种算法

（1）可控波束法

可控波束的方法首次应用在雷达，声纳和通信，军事和经济领域，在这些应用领域中，声源模型是远场模型，目标是得到声源的方向角。一种最简单的可控波束的声源定位方法是基于延迟求和波束形成方法。麦克风的信号传播延迟的方法，用于麦克风延迟声源的补偿，这些信号通过时间延迟叠加后形成混合信号，每个信号补偿后，在时间上基本相同，而叠加信号输出能量是最大的。对麦克风求产生的信号求和来得到波束，然后通过搜索声源的位置来引导波束，最大输出能量的波束点就是声源位置。

波束形成的基本思想是信号加权后每个数组元素集合的总和，利用麦克风阵列来调整最大输出功率的权重。在传统的可控波束的形式中，权值的确定取决于各阵元信号之间的延迟，而相位延迟与时延迟和到达方向有关系，所以它也被称为延迟求和波束形成器。在现代的波束形成器中，权值可以突破限制，根据调整权值的依据来获得相应的波速形成器，常用的依据为最小均方误差准则。一般来说，信号的加权求和过程可以被看作是过滤过程。所以称这种波束形成为滤波器求和波束形成器。

（2）TDOA算法

TDOA定位算法是一種对TOA算法的改进版本，他不能直接使用信号来到达时间，必须要与多个基站接收以确定移动站的信号位置，与TOA算法相比，不需要加入专门的时间戳，定位精度提高。2种TDOA值的采集：

第一种形式是移动站到2个基站的时间，使用差值来获得，此时还需要基站的时间严格的同步，但是当基站移动信道特性相似时，可以降低由多径效应引起的误差，如图1所示。

到达时间差的方法分为两个步骤，首先计算出声源在每个麦克风的相对时间差，再结合麦克风阵列的物理结构，得到声源的位置。时延估计中的第一步准确与否直接决定第二步定位精度。

参考文献

[1] 肖华.麦克风阵列的校正方法研究[D]. 电子科技大学，2008.

[2] 崔玮玮.基于麦克风阵列的声源定位与语音增强方法研究[D]. 清华大学，2009.