阿里研发高工业噪声环境下语音识别及传输技术

2018-08-28洪蕾

中国信息化周报 2018年19期

洪蕾

近日，阿里巴巴机器智能技术实验室称，团队正将语音识别的应用领域拓宽到了工厂，以解决“耳聋工厂”问题。

在许多中小型工厂车间里，工人之间的交流通常靠喊、吼。噪声，也成为了工厂工人摆脱不掉的困扰，“职业性噪声聋”已成“尘肺病”后全国第二大职业病。

据北京中医药大学东直门医院耳鼻喉科主任医师刘建华介绍，目前，职业性噪声聋呈增发趋势。另外，高噪声对人听力损害是逐步显现，潜在危害比较高。很多工人习惯了在超85分贝的高噪音环境工作后，觉得没事。但暴露在该噪声环境中超过3个月，对听力将造成不可逆的损害。这样的损害持续积累，当工人发现听力出现问题时，已很难恢复。然而，大多數中小制造企业没经验和能力考虑降噪。最现实的，还是给工人戴防护耳罩，但又不便于交流。

为了解决上述问题，阿里巴巴机器智能技术实验室研发了高工业噪声环境下的语音识别及传输技术。该技术可实现在85分贝工业噪声下，将一米处正常音量语音转换为文字，并可发送至手机等设备上。

“实现高噪声下的语音识别，主要依靠的是阵列麦克风技术以及AI语音识别模型。阵列麦克风配合算法，可有效提取出纯净语音信号。AI语音模型则能识别语音信号含义并转换成正确文字。”阿里巴巴语音工程师云铠表示。

阿里巴巴称，语音转换的过程都在云端完成，只要有网络并配上类似智能音箱的语音终端，便可构建局域性的语音文字转换和传输系统。目前，阿里巴巴的语音识别技术能在85分贝的噪音环境下，对一米外正常音量语音做到准确识别，按照预期，他们希望能实现在95分贝噪音下的语音识别。