APP下载

关于语音识别在空调上的应用与改善

2019-08-07桑亚超李龙杰袁传青霍庆磊

日用电器 2019年7期
关键词:高保真混响分贝

桑亚超 李龙杰 袁传青 霍庆磊 张 乐

(格力电器(合肥)有限公司 合肥 230088)

前言

随着科学技术的不断更新迭代,人们生活的方方面面不断朝智能化方向发展,而人工智能在家居方面的应用,各个地区已屡见不鲜并呈爆炸式的增长。目前智能家居的概念已经深入广大消费者的心中,中国空调行业在该领域发展迅猛,已经成为智能普及度相对较高的白色家电之一。本文通过介绍语音识别在空调上的应用及测试方法等内容阐述其应用原理和判定要求和进一步的优化空间,为智能语音空调的发展提供借鉴。

1 语音识别的应用途径

智能语音在空调上实现应用需要三个环节:首先是获取——将人发出的语音信号转化为可处理的数字信号;然后是预处理——对采集到的语音信号进行识别过滤,降噪、消回声、去混响等处理,形成可准确判断的有效音频信号;最后是预设置的的语音识别引擎对过滤的的语音信号进行识别和分析,从而实现智能反馈要求的规定动作。从算法层面分析,在完成识别引擎集中处理获取的信号之前需要进行不同方位及距离拾音,所以必须使用麦克风阵列,加上语音预处理算法规则,才能实现人机交互且能正确反馈。信号获取前端处理是至关重要的一环,高信噪比是解决复杂语音设计最大挑战。目前智能手机上已经相对成熟的智能语音应用有Siri、Google Assistant,但目前最主要的智能语音应用最大交互识别距离只有3~5 m,更远距离或者环境更嘈杂的远场智能语音信号处理急需解决,这就需要不同阵列的麦克风组合,以解决多通道语音采集、低复杂度、高信噪比(SNR)以及不同语境方言的设计要求。在整个语音识别反馈流程中,前端语音获取和预处理对语音识别的准确率起到了决定性作用,所以语音ADC芯片的性能表现是关键因素。一般而言,信噪比SNR是决定ADC芯片性能强弱的一个重要参数,它代表了最大不失真声音信号的可识别比例、即可被过滤的有用信号强度与过滤后的比率,信噪比SNR越大,噪音越小,代表芯片可处理效果及功能就越好。

2 语音识别的发展现状

智能空调的第一阶段以智能连接为主,目前这一技术已经趋于成熟,全面加速向互联网转型已经成为空调企业的一致选择。随着智能连接技术的进一步普及,空调厂商的获利空间被进一步压缩,而降低成本、投入更多资源研发更高段的智能化空调就成为大多数空调厂商的下一步选择。白色家电中如空调,增加语音识别交互功能整体成本相对要增加5 %~10 %,相对成本占比及整体压力还是非常之大,所以可通过量产集中式的定制方案不断压缩成本,以提高竞争力。目前关于语音识别功能制造的各个环节厂商都在加速融合及分工以达到最高的性价比。不同环节下语音信号可以通过升采样率的方式,实现了标准的I2S支持多路音频数据传输,从而在优化方案中可以节省FPGA或MCU,同时也可以降低设计成本及产品复杂程度。

通过定制化和模块化的优化方案不仅能降低生产成本,还能加快新品语音空调的上市周期,这对于增加品牌挤占快速发展的消费市场份额非常重要。无论是ADC还是SoC,都只是语音识别系统中的一环,整个语音识别系统的成熟发展至关重要。目前多维度组合的麦克风阵列以及配套语音前处理算法、云端处理平台等已经相对发展成熟。急需处理的为快速提升语音识别效果及准确率,这其中包括大量AI训练下的多语种、多方言、多环境支持,以达到可以快速量产环节等等。

3 语音识别的测试方法及验收标准

3.1 语音测试方法

测试方法主要用于指导测试语音系统的唤醒识别、指令识别。下面介绍使用Dirc软件、噪音分贝仪等设备在选择底噪、面积小的房间测试空调的语音功能。

3.1.1 房间选择需要注意3个条件:混响、噪音、距离。

3.1.2 底噪测试方法:将被测语音空调放到测试房间中要测试的位置,把分贝仪的开关打开,放在被测语音空调的MIC处,读取分贝仪上的数值,即为房间底噪,底噪建议不能大于40 dB

3.1.3 SNR测试方法:将播放语料的高保真音箱放在要测试的位置,电脑连接高保真音箱播放语料,把分贝仪的开关打开,放在被测语音空调的MIC处,读取分贝仪上的数据,即为人声的分贝;停止播放语料,用另一台电脑接另一个音箱播放生活噪音(电视或者音乐等),把分贝仪再次放在被测语音空调的MIC处,读取分贝仪上的数据,即为噪音的分贝,噪音分贝不能高于60 dB。将人声的分贝减去噪音的分贝即为当前的SNR,SNR不能低于15 dB。

3.2 语音测试场景

主要有如下测试场景:

3.2.1 唤醒识别:

①安静、典型混响、3 m、唤醒

②安静、典型混响、5 m、唤醒

③噪音、典型混响、1 m、唤醒

④噪音、典型混响、3 m、唤醒

⑤噪音、典型混响、5 m、唤醒

3.2.2 指令识别:

①安静、典型混响、1 m、识别

②安静、典型混响、3 m、识别

③安静、典型混响、5 m、识别

④噪音、典型混响、1 m、识别

⑤噪音、典型混响、3 m、识别

⑥噪音、典型混响、5 m、识别

4 性能详细测试步骤举例

由于测试场景较多,选择两个场景举例

4.1 安静、典型混响、3 m、唤醒

操作步骤:

1)在选定的典型混响、底噪不超过40 dB,长度大于6 m的房间中,放入被测语音空调、两台电脑、两个音箱(有一个必须是高保真音箱,用来播放语料);

2)用其中一台电脑连接高保真音箱,高保真音箱放在距离被测语音空调3 m正对面;

3)电脑播放唤醒语料,用分贝仪在被测语音空调MIC处测量播放的分贝值,用该分贝值减去底噪音,即为SNR,SNR必须大于15 dB;

4)确定播放的分贝值后,给语音空调上电,等播报“欢迎使用格力空调”的提示;

5)用电脑播放唤醒语料,并且记录唤醒率。

4.2 噪音、典型混响、5 m、识别

操作步骤:

表1 语音唤醒测试拟定的条件与判断依据

1)在选定的典型混响、底噪不超过40 dB,长度大于6 m的房间中,放入被测语音空调、两台电脑、两个音箱(有一个必须是高保真音箱,用来播放语料);

2)用其中一台电脑A连接其中一个音箱,音箱放在房间的任意位置;

3)电脑A播放生活噪音,用分贝仪在被测语音空调MIC处测量噪音的分贝值,记为X,X不能大于60 dB;

4)停止播放生活噪音;

5)另一台电脑B连接高保真音箱,音箱放在被测试语音空调5 m正对面处;

6)电脑B播放识别语料,用分贝仪在被测语音空调MIC处测量人声的分贝值,记为Y;

表2 语音识别测试拟定的条件与判断依据

7)用Y减去X,即为SNR,SNR必须大于15 dB;

8)确定播放的分贝值后,给语音空调上电,等播报“欢迎使用”的提示

9)先播放生活噪音,再唤醒语音空调,然后再播放指令识别语料,并且记录识别率;

5 语音验收标准

5.1 表1为语音唤醒测试拟定的条件与判断依据

5.2 表2为语音识别测试拟定的条件与判断依据

5.3 语音识别功能在空调上模拟测试

图1为模拟测试而进行的语言准备功能测试模拟图(如图1),设备准备调试完成之后进行测试。从以下结果中(如表3)可以看出环境、角度以及距离等差异对语音识别合格率差异较大。

图1 空调语言功能模拟

表3 空调语言功能模拟结果

6 结论

1)语音识别功能在空调上进行应用需经过三个环节:拾取、处理和反馈;

2)语音识别功能在实际模拟过程中需不断进行标准制定和优化以适应不同开发机型的功能的应用,同时不同命令词识别、唤醒时在不同工况下差异较大;

3)语音识别功能在混合环境下功能体验性较差,而信噪比是决定语音功能实际应用和优化的一个重要参数。

猜你喜欢

高保真混响分贝
高保真IP指挥调度系统关键技术应用
Loud Volumes Can Harm Your Hearing
基于AxureRP的电信运营商O2O产品原型设计和应用
浅谈在混音中混响插件的组合使用
海洋混响特性分析与建模仿真研究∗
一种工程化的海洋混响仿真模型研究
电商类APP的视觉设计制作
浅谈音响效果器的应用
Symmetries in the Sem iosphere:A Typology
小分贝上街“不讲话”了