麦克风阵列时延估计在单片机上的研究与应用
2023-05-26林彬
林彬
【摘要】科技的发展日新月异,4G、5G技术的日渐成熟催生了相关行业领域的科技创新发展,对于麦克风信号领域通信传输的要求也在增加,人们对高品质高稳定的通信阵列信号处理需求也更加强烈,对语音信号处理需求也增大。本文通过介绍基于单片机的麦克风阵列时延估计系统,细致分析了单片机设计方案及麦克风选型及阵列设计,了解到单片机能够非实时地计算出实验中的阵列系统时延,帮助复杂的麦克风阵列时延估计实时性的研究,可实现对麦克风阵列声源定位等理论知识研究应用分析。
【关键词】麦克风;阵列;时延;单片机;语音信号
中图分类号:G212 文献标识码:A DOI:10.12246/j.issn.1673-0348.2023.09.067
1. 麦克风阵列
麦克风阵列是由一定数目的声学传感器(麦克风)按照一定规则排列的多麦克风系统。而声源定位,是指运用麦克风拾取声音信号,再通过对麦克风阵列信号的分析与处理,得到一个或者多个声源的位置信息定位声源位置。麦克风阵列系统的声源定位技术研究意义在于:当输入的信息只有两个方向,难以确定声源的位置。人类的听觉系统是个两个传感器的拾音系统,原则上,任意两个传感器的拾音定位系统只能定位在一个平面上声源的位置距离,但无法知道声音是从前面还是后面任何相同距离的声源传来的。人耳取决于头和外耳气压差声波实现声源定位。一个传感器定位系统对三维空间里某个声源进行定位,需要最少三个传感器来定义声源在三维空间中的坐标。麦克风的数量越多,所接收到的信息量也越多,声源的精确定位也变成可能。
麦克风阵列的声源定位技术首先是对声音信号进行采样,再通过麦克风阵列对信号进行处理,得到声源到达阵列的波达方向,从而定位声源的位置信息。随着技术创新与发展,基于麦克风阵列的声源定位技术已经形成了比较成熟的理论基础。但对于其声源定位方法可以分为基于到达时延估计算法、基于最大输出功率的可控波束形成算法和高分辨率谱估计算法三种计算方法。但人们常用的声源定位信号处理方法是基于时延的定位算法,因为这种算法定位精度高,所以被广泛使用。
2. 关于声源定位
目前基于麦克风阵列的声源定位方法主要有三種:基于最大输出功率的可控波束成形和基于高分辨谱估计以及基于到达时延差估计的定位方法。首先波束形成法的原理是将麦克风接收到的信号进行滤波加权求和来形成波束,再按照特定的规律对声源位置进行搜索定位,最终得到麦克风最大输出功率时,即为真实的声源方位。而基于高分辨率谱估计的定位方法适合多个声源的情况下,是通过分解协方差矩阵估计声源方位,突破了物理限制,模糊了声源的分辨率与阵列尺寸之间的关系。优点是在特定条件下可以实现任意程度的声源定位,并且不受采样频率限制。但是计算系统比较复杂,抗噪和抗混响性能较差,因此该方法对环境要求比较高。基于到达时延差估计的定位方法可以拓展到宽带处理模式,但是对数据误差十分敏感,通常适合远场模型,且矩阵的运算量巨大,必须运用麦克风阵列克服,充分利用每个麦克风信号之间的数据相关性,加以融合来实现声源定位。
对于语音信号处理的发生过程,先是增强单个麦克风信号的语音信号,提高信噪比。然后,为了应对声学环境的复杂性特点,人们接着实现了多麦克风按照一定的空间位置排列的麦克风阵列信号处理。同时需要对麦克风阵列进行处理,去掉干扰信号,减少杂音的影响,从而增强语音信号。
麦克风阵列处理技术为麦克风系统提供了更好的稳定性,是语音信号增强及处理的重要部分。阵列处理方法通常包括固定波速形成算法和自适应波速形成算法两种。波速形成对空间噪声有更好的抑制效果,逐渐成为阵列信号处理的主流,其中自适应波速形成算法中的时延估计成为阵列处理中的重要一环。虽然时延估计的算法很多,但是能够实际应用的却很少,这就归结于研究人员的研究方向和实际使用效果。除去波速形成算法外,对于麦克风处理技术还有多种关键技术,比如:混响消除是为了降低声波的多次反射和吸收,提高声音的真实效果;回声消除是为了更真实地保留外界声响,消除设备本身反射声响;阵列增益为了解决拾音距离问题,抑制噪音增强设备声响。
3. 单片机麦克风
单片机(Single-Chip Microcomputer)是一种集成电路芯片,它采用超大规模集成电路技术把各种电子电路集成到一起,其中包括具有数据处理能力的中央处理器CPU、随机存储器RAM、只读存储器ROM、多种I/O口和中断系统、定时器/计数器等功能(可能还包括显示驱动电路、脉宽调制电路、模拟多路转换器、A/D转换器等电路)等,最终集成到一块硅片上,从而构成的一个小而完善的微型计算机系统,并在工业控制、电子电器等领域中广泛应用。从最早的4位、8位单片机,经过长期的发展直到现在的高速单片机,后续也许还会有集成更高、性能更高的单片机出现。
单片机采集麦克风的信号一般来说是不能直接采集的,要加一个外围芯片,麦克风出来的信号一般来说是频率信号,外围芯片的作用就是把频率信号转换为电压信号,再通过单片机的A/D口采集。还有另外一种方案是直接采集频率信号,只能通过通信的方式,设置单片机的一个定时器时钟为外部时钟,麦克风的频率信号连接这个时钟引脚用自带的晶振再设置一个定时器,通过定时器来判断外部时钟来了多少个周期来计算频率,如果麦克风声音频率过高会造成信号失真,所以一般不采取这个方案。
4. 单片机设计方案
基于DS声源定位和AT89C52单片机设计的麦克风阵列语音增强系统基于延迟叠加声源定位的原理,提出了一个四通道语音增强的设计方案,这里将介绍硬件和软件设计的原理,硬件设计包括单片机、数模转换和模数转换器、电路连接等等。设计采用了软件和硬件相结合的方法循环缓冲区,为软件实时运行提供可能性。
麦克风阵列广泛应用于语言通信应用程序的时空过滤,比如汽车环境等的有效的语音处理。因此,麦克风阵列语音增强的技术已经成为语音增强处理的重点。空间滤波是一种基于麦克风阵列的信号采集的基本特征,在应用程序中扮演了一个重要的角色,比如语音增强和语音识别。有的专家设计了一个便宜的麦克风阵列实现了一个特定的语音增强技术,首先,介绍了声源定位延迟叠加原理用于语音增强。其次,提出了语音增强系统的设计方案,包括硬件和软件设计。硬件设计使用AT89C52单片机,ADS8515模数转换器和DAC8820数模转换器等。
波束形成是根据所需信号的位置,从噪声和干扰区分空间滤波的方法。波束形成技术是DS声源定位实现定向阵列系统的最简单和最古老的技术。由于有带宽,因此大部分麦克风阵列语音采集的实现为DS声源定位。DS声源定位已经广泛的应用于测量,声源定位,DOA估计,免提语音应用程序等等。DS声源定位是通过适当补偿信号延迟到每个麦克风之前结合使用一个加法运算,这延迟信号求和的结果是一个加强版的期望信号从不同的渠道减少噪音。
5. 麥克风选型与阵列设计
对于声源定位系统来讲,麦克风阵列是最前端设备,麦克风阵列的性能优劣直接影响声源定位的精准度。因此对麦克风的选型及阵列的设计非常重要,关系着整体系统的最终效果,在对声源定位系统设计之前必须作好麦克风阵列性能的设计预判,选择合适的麦克风类型。
麦克风的种类繁多,可以根据结构造型分为动圈式、电容式、压电式等;还可以根据适用方式分为有线和无线;根据接受声波方向分为定向麦克风和全向麦克风。对于声源定位系统中常用的麦克风就是动圈式和电容式两种。
动圈式麦克风常应用于演出现场、音视频娱乐场所等,而电容式麦克风则应用于消费电子领域。但在声源定位系统中,人们综合考虑常用电容式麦克风作为首选。
电容式麦克风主要包括驻极体麦克风和微型机电系统麦克风,而微型机电系统麦克风有相对的优势就是功耗低、成本低、稳定性好。因此常用来构成麦克风阵列系统。而对于声源定位系统来讲,还需要对麦克风性能参数做出具体的要求,选定合适型号的麦克风,具体要求为:
⑴为了适应环境的需求需要接收到各个方位的声音,并去除单向麦克风带来的声学问题,定位系统一般选取全指向性麦克风;
⑵为了对不同信号更好地接收,对麦克风的灵敏度的选择居中为宜,过高或者过低的灵敏度都会影响声音信号的接收;
⑶为了对频率响应范围的最大化接受,应该根据环境和接受声音的频响范围做设定,选择合适的频响功率,比如人声频率响应范围应该在200Hz~10kHz左右;
⑷对于麦克风输出阻抗的选择也应该适中,过高过低都会影响,或者阻抗噪声能力差,或者麦克风灵敏度偏低。
同时声源定位技术在助听器行业、军事国防领域、智能机器人等系统也有广泛的应用。但随着社会发展的需求,电子设备向多样化、小型化发展,对于声源定位技术来说,如何构建结构简单、低成本、高精度的小型定位系统,是今后需要重点关注的方向。由于基于到达时延估计的双步定位法的特殊算法问题,在大型声源定位系统中已经广泛应用,但是对于小型声源定位系统来说,这种算法就相对复杂化了,限制了其推广应用。因此还需要寻找多种算法对应不同的环境需求。对于各种条件下的麦克风阵列声源定位系统的研究,就需要相关人员更多的努力。目前对于麦克风阵列声源定位系统,部分专家已经能够使其在8位单片机中实现。
关于算法的研究中,有的研究人员首先针对基于时延估计的声源定位,介绍了时延估计算法的基本原理,给出了各个算法本身的优缺点。其次,通过GCC方法利用频域加权函数对信号进行滤波,但是如果再运用8位单片机实现时,会受到容量限制,难以实现理想效果。因此可以针对特定音频信号的时延估计,可以设计一种结合匹配滤波与互相关的时延估计方法。再根据8位单片机的硬件条件限制要求,对时延估计进行了优化设计,合理匹配存储量和计算量的实际需求。再次,以单片机作为硬件平台基础,基于8位单片机的硬件要求,设计一种声音识别与测向功能的控制器,用于麦克风阵列接收声音信号的控制单元,通过8位单片机来对声音进行检测、前后识别、模式识别,以及测向系统的时延估计,最终设计成为结合匹配滤波与互相关的时延估计算法。最后,根据实际环境需求对控制器进行测试调试,得出实验结果。明确显示该设计系统算法具有更高的实时性和抗噪声性能,并且简单化、运算量小,可以运用到实时定位系统中。
6. 结束语
本文通过对声源定位系统的介绍以及单片机硬件的设计的分析,解释了一部分关于声源定位系统的时延算法,在单片机内直接把两路语音信号的时延差非实时的求出。有的专家在一定程度上已经设计出无论是从需求还是运算量或者速度上都可以完美呈现效果的声源定位系统,这就为后续的实时时延算法的设计提供了参考,也更方便完善复杂的阵列信号处理。随着互联网技术的发展与实际行业的融合,阵列信号定位系统正在向多样化、多媒体化以及多业务融合方向发展。单片机正从以传统单片机向多位单片机发展,同时多媒体信息业务也趋向转变,增值业务种类增加。网络架构呈分层趋势,规范的能力层接口使越来越多的业务开发者无须深刻了解这种技术便能从事声源系统的开发,所有这些变化都将导致单片机的类型和数量呈几何级数增长。把麦克风利用到单片机上正是在此背景下提出的,同时概念性运行环境也是一种颠覆传统业务平台的建设模式,属于完全不同的创新性建设模式。通过对麦克风的关键影响因素进行研究分析,为麦克风在单片机上的应用找到理论依据和技术创新方式,提高麦克风阵列系统工作效率,简化声源定位系统维护管理工作,实现声源定位系统的广泛应用,为国家新时代建设提供技术支持。
参考文献:
[1]李树德,黄颂,刘彩霞,柳佳.基于TC264单片机的智能无人小车设计[J].桂林航天工业学院学报,2021,26(04):435-440.
[2]郭龙霞.一种基于互相关算法的二维声源定位系统[J].中国科技信息,2021(12):98-99.
[3]吉爱国,刘伟平,刘志强,刘栋,宋传旺.麦克风阵列近场声源定位与跟踪系统[J].信息记录材料,2019,20(07):149-152.
[4]王宇威,雍洋,孙新.基于麦克风阵列的声源跟踪系统[J].电子产品世界,2018,25(12):48-51.
[5]支艳利,张云伟.基于环形麦克风阵列的远场语音识别系统[J].微型电脑应用,2017,33(04):62-64,73.