基于声源定位的智能小车

2023-08-09苏俊杰胡杰

计算机应用文摘 2023年15期

苏俊杰胡杰

摘要：文章基于声源定位技术研发出一款在移动过程中自动避障的小车，其以 STM32F103C8T6为主控开发板，将 K210 搭载麦克风阵列作为声源处理装置，并且采用时延算法得出声源到达不同麦克风阵列的时间差，从而计算出声源和小车的距离以及角度。为了使角度更加准确，加上了卡尔曼滤波。测试结果表明，小车到达声源的位置较为准确。

关键词：时延算法;声源定位;超声波测距;麦克凤阵列;STM32

中图法分类号：TN912文献标识码：A

１引言

声源定位小车是一种基于声学传感技术的智能机器人，它能够在那些复杂的环境中实现一些声源的定位和跟踪，具有广泛的应用前景。

目前，声源定位小车已在安防、智能家居、医疗等领域得到了广泛的应用，例如，在安防领域，声源定位小车可以通过定位报警设备的声源位置，实现对安全隐患的及时发现和处理；在智能家居领域，声源定位小车可以作为家庭智能助手，对家庭中的各种声源进行识别和分析，从而实现智能家居的控制和管理。然而，声源定位小车在实际应用中面临着许多挑战，如复杂的声音环境、定位精度、运动控制等方面的问题。因此，本文旨在研究和实现一种基于声学传感技术的声源定位小车，通过对声学信号的采集和分析，实现声源的准确定位和跟踪，以及对小车的运动控制。

本文基于麦克风阵列实现声源定位。麦克风阵列声源定位技术在阵列信号处理技术蓬勃发展的契机下诞生，能够在多种场景下对各种声音信号源定位。用麦克风阵列来采集处理声波信号受到越来越多学者及专家的关注［１］。

２总体设计

系统设计方案如图１所示，以实现声源定位的要求。其采用“６＋１”形式的数字麦克风阵列进行声源收集，Ｋ２１０负责对收集到的声源进行处理和声源定位，ＳＴＭ３２Ｆ１０３Ｃ８Ｔ６作为主控，传感器模块包括编码器、超声波测距模块、ＯＬＥＤ显示屏，驱动模块有电机和驱动电路。

３硬件设计

基于整体设计方案，本文对系统的主要部分进行详细设计。

３．１ＳＴＭ３２Ｆ１０３Ｃ８Ｔ６主控板

ＳＴＭ３２Ｆ１０３Ｃ８Ｔ６为系统的主控板，它主要获取Ｋ２１０通过串口发送的数据、收集超声波测距模块传过来的距离信息，使小车避障，并通过Ｋ２１０发来的数据驱动小车。

３．２Ｋ２１０核心模块

Ｋ２１０可结合机器视觉和机器听觉能力，提供更强大的功能，如图２所示，在应用中可以通过声源定位对目标进行跟踪，可以根据麦克风阵列确定一个说话人的方向。Ｋ２１０的ＦＰＩＯＡ特性，支持每个外设随意映射到任意引脚，这使得Ｋ２１０可以有多个Ｉ２Ｓ的通道来处理麦克风阵列收集的音频。

３．３ＯＬＥＤ显示屏

硬件的显示模块使用０．９６寸的ＯＬＥＤ屏幕，并采用Ｉ２Ｃ的通信协议来连接ＳＴＭ３２，精致小巧的特点使它便于安装在小车上并实时显示声源的角度和水平的距离。

３．４麦克风阵列

麦克风阵列模块由７個数字麦克风组成，其中６个麦克风围绕在四周不同方向，每个麦克风夹角为６０°，还有１个在模块正中央。另外１２个ＬＥＤ指示灯，方便指示声源位置，麦克风阵列的１２个灯珠将整体划分为１２等份，角间距为π／６。麦克风阵列如图３所示。

３．５超声波测距模块

超声波是一种频率高于２００００赫兹的声波，超声波测距模块（ＨＣ?ＳＲ０４模块）可以测得最近距离２ｃｍ，最远距离４ｍ，测量角度可以达到１５°，具有性能稳定，方向性好，穿透能力强，易于获得较集中的声能，便于使用的优点。

３．６驱动电路

驱动电路的功率元器件由ＬＲ７８４３型ＭＯＳＦＥＴ管组成，直流电机采用可逆双极型桥式驱动器，极大地提升了电机的转速［２］。

４系统软件设计

４．１系统主程序

先初始化各个模块，以麦克风阵列Ｓ图标正方向为坐标原点，右边为Ｘ正轴，竖直向上为Ｙ轴建立坐标系，以Ｓ图标正下方角度为０度，顺时针度数依次增加，当麦克风阵列接收到声源的信号，Ｋ２１０记录声源到达每个麦克风的时间，从而通过时延算法，计算出声源的角度和距离。Ｋ２１０通过串口将计算出的角度和距离发送给ＳＴＭ３２，并在ＯＬＥＤ显示屏实时显示发送过来的角度和距离。ＳＴＭ３２收到数据后会驱动电机让小车朝着声源的方向移动，在移动的过程中，超声波测距模块会检测小车的前面有无障碍物。

４．２ＴＤＯＡ

４．２．１基本概念

该设计采用基于ＴＤＯＡ到达时间差定位原理和广义互相关函数的时延估计（ＧｅｎｅｒａｌｉｚｅｄＣｒｏｓｓＣｏｒｒｅｌａｔｉｏｎＰＨＡｓｅＴｒａｎｓｆｏｒｍａｔｉｏｎ，ＧＣＣ?ＰＨＡＴ）原理［３］。在有２个麦克风Ｍ１和Ｍ２并有噪声的情况下收到声源，对其建立模型，具体如下：

ｘ１（ｔ）＝ｓ（ｔ－τ１）＋ｎ１（ｔ）（１）

ｘ２（ｔ）＝ｓ（ｔ－τ２）＋ｎ２（ｔ）（２）

其中，τ１和τ２分别是声源到达２个麦克风的延迟时间，ｎ１（ｔ）和ｎ２（ｔ）为加性噪声。那么声源信号到达２个麦克风的ＴＤＯＡ为：

在麦克风阵列几何形状已知的情况下，声源定位问题变为对时延的估计问题。在确定麦克风阵列的排布后，声源定位问题进一步变为对时延估算的问题。

４．２．２时延估计

时延估计常用的有很多种方法，如使用广义互相关函数。广义互相关函数的目的就是为了在嘈杂环境下，削弱噪声和混响的影响，使实际环境声源的定位更加准确。在互功率谱域使用加权函数加权，然后经过ＩＦＦＴ运算后找到峰值估计时延，最后通过式（４）和式（５）计算出声源到达２个麦克风的时延，Ｇｘ１ｘ２（ω）是互频谱。

４．２．３定位估计

就二维平面来说，声源到达麦克风阵列的波形被看作平面波，如图４所示。

声速假定为ｃ，这２个麦克风之间的距为ａ，Ｍ１和Ｍ２的时延是τ （，根据图４的几何关系可以得出：

由于其他参数已知，进而可以得到声源对于麦克风阵列的角度：

４．３串口通信

串口通信是一种串行异步通信，通信双方以字符帧为数据传输单位，字符帧按位依次传输，每个位占固定的时间长度。两个字符帧之间的传输时间间隔可以是任意的，即传输完一个字符帧后，可以间隔任意时间再传输下一个字符帧。

Ｋ２１０和ＳＴＭ３２都支持串口通信功能，它们之间的串口通信可以通过连接它们之间的ＴＸ和ＲＸ引脚来实现。Ｋ２１０一共有３个ＵＡＲＴ，由于Ｋ２１０的ＦＰＩＯＡ特性，支持每个外设随意映射到任意引脚，因此ＵＡＲＴ可以进行自由的引脚映射。我们将Ｋ２１０的２４号和２５号引脚作为ＵＡＲＴ通信的ＲＸ和ＴＸ。ＳＴＭ３２Ｃ８Ｔ６有３个ＵＡＲＴ接口，本次采用ＵＡＲＴ１接口，将ＰＡ１０和ＰＡ９作为ＵＡＲＴ通信的ＲＸ和ＴＸ。下面将介绍Ｋ２１０和ＳＴＭ３２之间通过串口通信进行数据传输的基本步骤。

（１）确定串口通信参数：在Ｋ２１０和ＳＴＭ３２之间进行串口通信前，需要确认串口通信的波特率、数据位、停止位和校验位等参数，保证２个设备设置的参数一致。

（２）配置Ｋ２１０的串口：在Ｋ２１０中，本次使用ＭａｉｘＰｙ、串口參数等信息。

（３）配置ＳＴＭ３２的串口：在ＳＴＭ３２中，使用Ｋｅｉｌ５进行串口配置。

（４）发送与接收数据：Ｋ２１０是发送数据的一端，ＳＴＭ３２则接收Ｋ２１０发送过来的串口数据。数据的传输需要保证２个设备的串口通信参数一致，而且发送和接收数据的方式也需要保持一致，这样才能确保数据的正确传输。由于Ｋ２１０发送的数据是ＡＳＣＩＩ码的形式，并且是每次发送一个字符，因此发送数据的结尾要以‘ ＼ｒ＼ｎ来表明发送数据结束。

５系统测试

在实验中，先对小车进行固定声源定位的实验。将小车放在一个标明角度的大圆盘中，将声源依次放置不同的角度和距离，看小车能否准确到达声源的位置。先测量小车起始位置与声源的距离，等到小车停止后，记录小车所处圆盘的角度并测出小车所停位置与起点的距离，其实验数据如表１所列。

第２次实验，在小车的附近放置障碍物，将声源的发声装置放在障碍物的后方，测试小车能否绕过障碍物，从而抵达声源位置。经过２次实验可以得出，在室内封闭的场所，小车在声源定位时，可以基本准确到达声源位置，并且可以绕开障碍物。

６结束语

本文设计了一种基于声源定位的智能小车，其重点还是如何处理声源定位。经测试，小车可以很好地确定声源的角度和距离，也可以较好地实现了对小车的运动控制，可以验证基于声源定位的智能小车的定位和可移动性能，并且可以比较不同系统设计和参数之间的差异。本次实验中存在一定的角度和距离误差，不能在声源嘈杂的环境下进行声源定位，未来的改进还需要考虑声源定位算法的优化、定位精度的提高、运动控制等方面的问题。此外，对于不同的应用场景，可能需要对系统进行特定的优点适配，以满足不同的需求，以便可以更加精确地进行声源定位。本文旨在为后面声源定位的研究提供参考。

参考文献：

［１］邵佳伟．基于麦克风阵列的声源定位问题研究［Ｄ］．沈阳：沈阳工业大学，２０２２．

［２］朱智，严超，潘晓辉．基于声源定位的智能小车控制系统设计与实现［Ｊ］．无线互联科技，２０２２，１９（１３）：７６－７８．

［３］王小怀，伊树彬，蔡洛思．基于ＴＤＯＡ技术及几何模型的声源精准定位［Ｊ］．中国新技术新产品，２０２２，（２２）：２９－３１＋８４．

作者简介：

苏俊杰（１９９９—），硕士，研究方向：嵌入式系统。

胡杰（１９６８—），硕士，副教授，研究方向：物联网感知技术、嵌入式系统。

计算机应用文摘

2023年15期

基于声源定位的智能小车

杂志排行

计算机应用文摘的其它文章