APP下载

传声器阵列在语音空调中的设计研究及应用

2021-06-15毛跃辉

家电科技 2021年3期
关键词:音孔声学音箱

毛跃辉

珠海格力电器股份有限公司 广东珠海 519070

1 引言

语音是人类交流最自然、最便捷的方式,因而也必然成为人机交互最自然的手段之一。常规空调搭载传声器阵列、语音模组、音箱等器件,并组成语音控制系统,用于空调控制和人机交互,此类空调称之为语音空调。语音空调人机交互技术包括前端声学处理、语音识别(ASR)、语义理解(NLU)和语音合成(TTS)等,其中前端声学处理尤为重要,是语音识别的先决条件。语音空调声学处理主要包括前端声学件(传声器阵列)设计及前端识别降噪处理(语音模组),声学件设计的好坏,直接影响前端降噪效果,进而影响语音音频转文本效果。

本文重点论述前端声学件传声器阵列的设计选型方法、布放位置及相关整机工程应用设计注意要点,便于后续指导相应语音产品开发。

2 语音空调声学设计重要性

消费级传声器阵列应用,主要面临环境噪声、房间混响、人声叠加、模型噪声、阵列结构等问题,若应用到语音识别场景,需要考虑阵列结构与整机匹配、密封性,阵列与音箱的相对位置、空调内部振动,以及避免振动对传声器阵列干扰等问题。良好的声学设计能保证传声器阵列采音质量,有利于降噪算法处理。

图1 语音信号处理流程图

前端信号处理流程如图1所示,从图中可知,传声器阵列声学处理处于十分重要的位置,其采音效果好坏,直接影响信号处理中回声以及混响消除结果;其次,音箱发声时,信号通过空调内部腔体传播后直接传输到传声器阵列处,其与通过外部传输的传输噪声存在显著差异,影响回声消除效果;另外,空调内部振动传声,也会影响语音空调唤醒与识别效果,且很难通过后期信号处理算法进行消除,此点在设计时需做规避。

3 传声器阵列设计及对语音识别影响

空调中主要运动部件包括压缩机、电机、导风板等,该部件在运转过程中会产生各种机械振动及噪声,空调上的传声器阵列在采集声信号过程中,同时会采集这些干扰噪声,将对信号处理、语音识别等过程带来不利影响。为减弱这些干扰,需要综合考虑传声器阵列拓扑结构设计、音箱布放位置对阵列影响、阵列与整机密封性匹配、内部振动影响阵列等多种因素。合理的声学结构设计能有效改善阵列阵元采音质量,从源头上降低噪声干扰,从而降低降噪算法信号处理复杂度。

3.1 传声器阵列设计要点分析

阵列选型设计时需注意:

(1)避免大音量时语音失真和回采音箱音量时被截幅,传声器最大录音声压需要相应提高。

(2)总谐波失真要尽量小,可参照工程经验值:100 Hz~200 Hz,总谐波失真<10%;200 Hz~350 Hz,总谐波失真<5%;350 Hz以上,总谐波失真<3%。

(3)传声器本身引入噪声对信号质量有影响,必须保证高信噪比,一般选择SNR≥67 dB。

(4)有效采样比特位数优先考虑选择不小于16 bit阵元为宜。

(5)同一传声器阵列中选用的阵元均需采用同一档位灵敏度及其公差,保证阵元电性能参数一致性。

(6)设计中要求拾音孔深度≤1.5 mm,拾音孔直径尽可能大,最小要求2 mm;均匀线性阵列采用紧贴面板安装方式,参照如图2所示。

图2 挂式空调线性阵列设计示意图

(7)振动对传声器阵列阵元拾音影响。当音箱播放音量超出其线性发声区域而引起结构上振动,或由于内部隔声效果不佳导致振音由内部结构被阵列阵元采集,而不是通过外部声学路径传输,此时会导致传声器阵列采音质量明显受到影响,对后续信号处理、语音识别等过程造成严重干扰。

以AEC处理为例,内部直接传导振音强、弱对其处理效果影响是十分明显的。如图3、图4所示,在同样信号回声比情形下,较强和较弱振动直接传导的算法前后处理效果对比。从图3分析,振动残余会对AEC算法造成影响,有若干频带振动分量的明显残余(人耳听会有明显的刺拉声),进而影响后端各项处理,此时,需要在结构设计时加以规避,图4为经过减振优化后效果。

人为因子 是指人类在对植物资源的利用、改造和破坏过程中给植物带来的有利或有害影响。这是一类特殊的因子,因为人类对植物的作用是有意识的和有目的的,所以具有无限的支配力。

图3 较强振动直接传导AEC算法处理前后效果对比

图4 较弱振动直接传导AEC算法处理前后效果对比

对于振动的影响,采用胶套进行减振密封处理,一般采用硅材质,硅胶软硬程度可根据实际结构契合度进行匹配调整,要求尽可能软,便于起到良好的减振作用。

(8)阵列拓扑结构外声音能以接近自由场方式直接到达每一个阵元,避免出现掩蔽效应。阵元外表面要充分透声,不能有声反射区形成,可用阻尼布等材料覆盖表面设计,防水透声同时可避免反射形成。

(9)阵列设计时要考虑阵元各拾音孔腔之间的独立性,确保每个阵元孔腔是唯一进声孔。开发中可以采用简易方法进行定性验证,即用手按住阵元拾音孔,拾音音量减小值≥10 dB。图5为双传声器阵列安装时声腔内部与阵元之间结构配合示意图。

图5 均匀线阵双传声器阵列阵元与面板安装方式结构示意图

(10)阵列与安装位置面板间密封性匹配。传声器阵列阵元采用全向,空调运行中将无法避免产生各种自噪声,且被传声器阵列所采集,此类噪声要加以规避。为此,需要进一步对传声器拾音孔以外的部位进行密封,保证人声拾音仅由拾音孔通道进入,而不去采集空调内部的声音,降低结构内部传声带来的强干扰。

3.2 传声器阵列布放位置选择

传声器阵列通常安装于室内机壳体内部,并在表面开孔以进行拾音。针对特定空调结构,需确定其主要噪声(如蒸发器液流声、电机运转声等)和振动异响(如面壳接合处不严所造成的摩擦等)的来源,并将传声器阵列布放在远离这些干扰源位置,同时辅以相应隔音措施。图6为挂式空调传声器阵列布放位置选择示意图。

图6中示例的几种阵列布放方式共同遵循原则:远离出风口、振动噪声源以及音箱位置,便于获得较高信号回声比和良好声学回声抵消效果。

图6 挂式空调传声器阵列安装位置

图6中左图所示结构相对远离空调内机最大干扰源(出风口),同时距离音箱(音箱位于左上角)摆放位置较远,其拾音信噪比和信号回声比相对较高,是一个较好的传声器阵列布放位置。考虑外观效果,传声器阵列拾音需要在面板开孔,且开孔难以很好隐蔽,从而导致空调整体造型会受到影响。因而,在实施过程中,需要同步考虑将传声器阵列放置在出风口底壳附近且出风口下部(中图方框示意)或底壳最底部(右图方框示意)位置。

图7 立式空调传声器阵列与音箱典型布放位置示意图

如图8,通过对传声器阵列和音箱在空调内部模拟声音泄露路径分析,两者布放设计要点总结如下:

(1)音箱结构设计要避免引发失真,安装及周围关联位置要进行减振、隔声处理,避免振动对阵列造成影响;

(2)避免结构内声音传播,即音箱声音不能在结构内直接泄露到阵列阵元处,只能通过结构外空气传播至阵元。音箱和阵列布放在不同腔体,选用较好密封材料,单独对传声器阵列进行密封隔离;

(3)150 Hz~7 kHz频率范围的THD优先考虑在1%以下,具体可结合工程应用做实际调整。

图8 空调内部模拟声音泄露传播路径图

3.3 传声器阵列布放位置对不同方位说话人影响

目前空调头部基本为弧面结构,导致阵列适应结构设计也呈弧面形式,易出现某些边界角度唤醒、识别明显弱于说话人正面水平识别,主要原因有:

(1)传声器阵列安装时与面板弧面拾音孔契合度不好,漏音,导致拾音不集中;

(2)传声器阵列各阵元间灵敏度存在较大差异,一致性不够;

(3)结构本身限制,对传声器阵列形成了遮挡或拾音孔位置偏离,影响阵元整体拾音。

对于上述影响因素,在阵列设计之初,注意阵元参数一致性,阵列拓扑结构选型以及装配时与结构契合度等多种保障措施协调配合。

4 试验验证及结果分析

以某款挂式语音空调为例进行整机声学工程试验验证,关键试验项有:①设备自身MIC录音,REF信号幅值,REF信道底噪试验;②REF和MIC录音通道延时试验;③MIC频响曲线试验;④MIC的总谐波失真(THD)试验;⑤音箱总谐波失真(THD)试验。通过上述试验,并结合实际语音识别性能(唤醒率、识别率、误唤醒)测试,验证本文提出设计方法和关键技术要点可行性,试验效果如下(以下序号分别对应上述试验项):

(1)不播放任何声音,空调自身MIC录音,REF信号幅值应该为0 smpl,REF信道的底噪设计要求<100 Hz,相应测试结果如图9所示,基本趋于无信号。

(2)REF和MIC录音通道延时设计要求<10 ms,如图10所示,验证结果为2 ms。

(3)传声器频响曲线(FR)测试,在200 Hz~1 kHz时,测试差值为±1.7和±2.3;在1 kHz-8 kHz时,测试差值为±4.4和±4.6,如图11所示。

(4)传声器的总谐波失真(THD),设计要求在200 Hz~8 kHz时,小于0.5%,目前测试结果分别为0.6%和0.52%,如图12所示,略微超出设计要求,后续需要结合实际语音识别性能进行综合判断。

图9 空调MIC录音时REF信号幅值

图10 REF和MIC录音通道延时

(5)音箱总谐波失真(THD),设计要求在100 Hz~200 Hz时,THD<10%;在200 Hz~350 Hz时,THD<5%;350 Hz以上时,THD<3%,测试结果仅在4 kHz处有超标,测试结果为8.4%,如图13所示,后续结合实际识别性能进行综合判断。

5 结论

通过对语音空调传声器阵列设计研究分析,提出设计方法和关键技术注意要点,并在项目实施中经过一系列工程试验验证,得到较好效果,总结传声器阵列设计和确认步骤如下:

针对传声器阵列进行设计选型评价。主要对传声器阵列、音箱声学结构设计评估,便于确认阵元选型和阵列拓扑构型,明确阵列与声腔及安装结构间匹配度,确认阵列拾音孔深度和直径大小;其次,确认音箱选型、音箱构型、出声孔直径和数量,确认阵列与音箱布放相对位置。

进行首次快速摸底测试评价。计算阵元和带声腔结构传声器阵列之间录音的谐波程度、密封性验证情况等,根据分析结果确定是否通过摸底测试。

系统性试验最终验收评价。针对试制机子进行综合指标测试,包含阵元和阵列密封性、REF信号幅值、REF信道底噪、REF和阵元录音通道延时、阵元频响曲线、阵元总谐波失真(THD)、音箱总谐波失真(THD)试验,确认最终设计评价是否通过。

通过上述评价并结合语音识别性能试验测试,整体识别率达到95%以上,最终通过产品应用确认,所设计的传声器阵列符合产品要求,可保证产品性能可靠性,满足用户使用要求。

图11 传声器频响曲线(FR)测试曲线

图12 传声器总谐波失真(THD)测试曲线

图13 音箱总谐波失真(THD)测试曲线

猜你喜欢

音孔声学音箱
论阮音孔的改制与变迁(下)
KEF推出新一代LS50 Wireless Ⅱ音箱
Polk(普乐之声)推出高端Reserve系列音箱
爱的就是这股Hi-Fi味 Davis Acoustics(戴维斯声学)Balthus 70
小音箱,大精彩 B&W 805 D3尊贵版书架音箱
Acoustical Treatment Primer:Diffusion谈谈声学处理中的“扩散”
Acoustical Treatment Primer:Absorption谈谈声学处理中的“吸声”(二)
多一对音箱,多一份惊喜Marantz AV8805
Acoustical Treatment Primer:Absorption 谈谈声学处理中的“吸声”
探究陶笛发音频率与开放音孔组合总面积的关系