关于语音识别在空调上的应用与改善

2019-08-07桑亚超李龙杰袁传青霍庆磊

日用电器 2019年7期

桑亚超李龙杰袁传青霍庆磊张乐

（格力电器（合肥）有限公司合肥 230088）

前言

随着科学技术的不断更新迭代，人们生活的方方面面不断朝智能化方向发展，而人工智能在家居方面的应用，各个地区已屡见不鲜并呈爆炸式的增长。目前智能家居的概念已经深入广大消费者的心中，中国空调行业在该领域发展迅猛，已经成为智能普及度相对较高的白色家电之一。本文通过介绍语音识别在空调上的应用及测试方法等内容阐述其应用原理和判定要求和进一步的优化空间，为智能语音空调的发展提供借鉴。

1 语音识别的应用途径

智能语音在空调上实现应用需要三个环节：首先是获取——将人发出的语音信号转化为可处理的数字信号；然后是预处理——对采集到的语音信号进行识别过滤，降噪、消回声、去混响等处理，形成可准确判断的有效音频信号；最后是预设置的的语音识别引擎对过滤的的语音信号进行识别和分析，从而实现智能反馈要求的规定动作。从算法层面分析，在完成识别引擎集中处理获取的信号之前需要进行不同方位及距离拾音，所以必须使用麦克风阵列，加上语音预处理算法规则，才能实现人机交互且能正确反馈。信号获取前端处理是至关重要的一环，高信噪比是解决复杂语音设计最大挑战。目前智能手机上已经相对成熟的智能语音应用有Siri、Google Assistant，但目前最主要的智能语音应用最大交互识别距离只有3～5 m，更远距离或者环境更嘈杂的远场智能语音信号处理急需解决，这就需要不同阵列的麦克风组合，以解决多通道语音采集、低复杂度、高信噪比（SNR）以及不同语境方言的设计要求。在整个语音识别反馈流程中，前端语音获取和预处理对语音识别的准确率起到了决定性作用，所以语音ADC芯片的性能表现是关键因素。一般而言，信噪比SNR是决定ADC芯片性能强弱的一个重要参数，它代表了最大不失真声音信号的可识别比例、即可被过滤的有用信号强度与过滤后的比率，信噪比SNR越大，噪音越小，代表芯片可处理效果及功能就越好。

2 语音识别的发展现状

智能空调的第一阶段以智能连接为主，目前这一技术已经趋于成熟，全面加速向互联网转型已经成为空调企业的一致选择。随着智能连接技术的进一步普及，空调厂商的获利空间被进一步压缩，而降低成本、投入更多资源研发更高段的智能化空调就成为大多数空调厂商的下一步选择。白色家电中如空调，增加语音识别交互功能整体成本相对要增加5 %～10 %，相对成本占比及整体压力还是非常之大，所以可通过量产集中式的定制方案不断压缩成本，以提高竞争力。目前关于语音识别功能制造的各个环节厂商都在加速融合及分工以达到最高的性价比。不同环节下语音信号可以通过升采样率的方式，实现了标准的I2S支持多路音频数据传输，从而在优化方案中可以节省FPGA或MCU，同时也可以降低设计成本及产品复杂程度。

通过定制化和模块化的优化方案不仅能降低生产成本，还能加快新品语音空调的上市周期，这对于增加品牌挤占快速发展的消费市场份额非常重要。无论是ADC还是SoC，都只是语音识别系统中的一环，整个语音识别系统的成熟发展至关重要。目前多维度组合的麦克风阵列以及配套语音前处理算法、云端处理平台等已经相对发展成熟。急需处理的为快速提升语音识别效果及准确率，这其中包括大量AI训练下的多语种、多方言、多环境支持，以达到可以快速量产环节等等。

3 语音识别的测试方法及验收标准

3.1 语音测试方法

测试方法主要用于指导测试语音系统的唤醒识别、指令识别。下面介绍使用Dirc软件、噪音分贝仪等设备在选择底噪、面积小的房间测试空调的语音功能。

3.1.1 房间选择需要注意3个条件：混响、噪音、距离。

3.1.2 底噪测试方法：将被测语音空调放到测试房间中要测试的位置，把分贝仪的开关打开，放在被测语音空调的MIC处，读取分贝仪上的数值，即为房间底噪，底噪建议不能大于40 dB

3.1.3 SNR测试方法：将播放语料的高保真音箱放在要测试的位置，电脑连接高保真音箱播放语料，把分贝仪的开关打开，放在被测语音空调的MIC处，读取分贝仪上的数据，即为人声的分贝；停止播放语料，用另一台电脑接另一个音箱播放生活噪音（电视或者音乐等），把分贝仪再次放在被测语音空调的MIC处，读取分贝仪上的数据，即为噪音的分贝，噪音分贝不能高于60 dB。将人声的分贝减去噪音的分贝即为当前的SNR，SNR不能低于15 dB。