语音降噪技术及在轨道交通自动售检票系统的实践研究
2020-07-03王高峰
王高峰
摘 要 轨道交通自动售检票系统(AFC,Automatic Fare Collection),英文缩写AFC,传统的架构为5层,从下至上分别是车票位于第5层,车站现场设备(SLE)位于第4层,车站计算机系统(SC)和线路中央计算机系统(LC)分别位于第3和第2层,最上端是清分中心计算机系统(ACC),本系统可对轨道交通票卡完整生命周期进行管理。笔者通过介绍语音识别技术理论,重点对车站现场设备的语音识别模块的降噪技术、环境影响及安装技术进行了研究,结合城市轨道交通语音识别技术应用项目,对实践中的建设经验进行介绍,以期为轨道交通自动售检票系统的语音识别技术大面积应用提供一定参考。
关键词 语音识别;轨道交通;降噪;麦克风阵列;安装
引言
轨道交通自动售检票系统(AFC)的车站现场设备当中使用语音识别相关设备引导乘客进行车票购买、地图查询等工作。车站现场环噪音影响大,乘客语言描述种类多,应用环境复杂等问题显著。
降噪技术为车站环境应用语音购票系统提供了必要的技术支撑,本文在对噪音消除技术理论研究的基础上,结合轨道交通实际业务要求和建设实践给出了安装实施、检测等建议。
1语音识别降噪技术研究
1.1 实现原理
目前主要的降噪技术方法有四种,包括谱相减法、维纳滤波法、卡尔曼滤波法和噪声对消法。
在平稳条件下的数字滤波器算法一般采用维纳滤波法,最小均方误差是此种方法的设计准则,含有噪音的语音信号通过此滤波器后可以得到语音信号的最优估计值。
在维纳滤波法的基础上采用信号与噪声的状态空间模型,对状态变量的估计使用前一时刻的估计值和当前时刻的观察值来更新,以求现时刻的估计值,这种方法称为卡尔曼滤波法。
谱相减法是利用人耳对声波相位不敏感的特点,从带有噪声的语音估值中,采用傅立叶及逆傅立叶变换方法,削减去噪声频谱估值,得到纯净语音频谱估值,主要针对短时幅度谱进行应用。
在以上方法基础上采用噪声对消法采用多个麦克风对背景噪声进行拾音,经过计算后对噪声进行对消,保留原始语音。
市场上语音识别对应厂家很多,本文以科大讯飞的语音识别模块及4麦克风阵列为例介绍相关技术和应用实践说明。
1.2 语音识别模块介绍
麦克风阵列的语音前端设备是语音识别处理模块。
语音识别处理模块利用空域滤波特性,定位说话人的角度,进而形成定向拾音波束。
通过软件算法对波束以外的噪声进行对消处理,增强语音质量、加强识别效果。
模块功能包括:定位声源、噪音抑制、消除回声、声音感应。
模块主要包括评估板卡、麦克板卡、音频线、录音线、USB电源线(5V)、USB转串口数据线(控制线)。
1.3 四麦克风阵列介绍
四麦线性阵列的尺寸为165(毫米)x18(毫米)x10(毫米);
4个麦克风直线等距离摆放,每个麦克风之间的距离保持35毫米,4麦克风阵列可以形成3个波束,这样在0°~180°范围内每个波束可以覆盖60°的区域。
针对识别点语音利用信号处理的方法对进行识别点检测、噪音消除等预处理,以便得到最适合识别算法模型处理的语音。
四麦克风阵列:支持,四麦线性构型
支持波束形成技术;
支持回声消除技术;
支持声源定位技术;
支持去除混响技术;
2语音识别技术在AFC系统建设中的应用实践
2.1 麦克风的应用要求说明
①要求每个麦克风均能不被遮挡的直接收到声源,不可出现声音遮蔽,保证每个麦克风都能均等机会接收声源。例如某个麦克风被衣物遮挡,从而造成掩蔽效应。②声源与麦克风的路径做到最短、最宽。在紧贴面壳安装拾音孔时,距离MIC进声孔外侧的距离不要大于1.5毫米,拾音孔的直径越大越好,但最小要求2毫米。条件适合的情况下,麦克风最好安装在表面,这样效果最好。③安装结构当中的干扰和震动(包括喇叭、转动结构等)要远离麦克风,并尽可能采用硅胶套进行减震密封,减少干扰,根据使用环境和气候条件选择尽量柔软的硅胶套以达到最好效果。④喇叭在尽量远离的原则上要进行减震处理,例如减震棉或减震垫片等,也可从结构设计上尽量避免对麦克风造成影响出现失真。⑤在结构内设计不同的声音通道,采用不同的腔体结构分别对麦克风和喇叭进行密封分离,避免出现结构内声音传播,腔体选用性能较好的密封材料以达到最好的效果。⑥麦克风的生产要注意保护,避免出现结构性的损坏,特别是驻极体麦克风需要避免挤压带来的一致性损失。
2.2 麦克风结构和说明
本文介绍的麦克风阵列产品采用面壳安装方式,本产品在面壳固定安装之前预先装配硅胶套以达到密封减震目的,预留的拾音孔位于面壳上,通过它进行录音采集。
①硅胶套的作用使每个麦克风之间严格独立,预先留置的拾音孔是唯一的进声孔。(验证方法:用手按住麦克风的拾音孔,拾音音量降低不小于10dB。) ②麦克风需要有橡胶套和固体表面隔绝,起到降低壳体震动传声以及密封的作用。③麦克风距离外表面的距离(拾音孔深度)要尽可能的小(一般要求小于 1.5毫米),声孔直径尽可能大(一般要求大于 2毫米),防止声音在拾音孔内壁的反射形成谐振点。④根據轨道交通应用场景情况,使用防风棉和防尘棉对麦克风表面增加防护,减少环境噪声和静电影响等问题出现。
2.3 喇叭与麦克风安装
轨道交通应用环境当中的语音设备采用喇叭与麦克风隔离安装的方案,结构内喇叭不会传导声音到麦克风,在麦克风表面测试喇叭声压不超过90分贝。有效声源音量与喇叭音量信噪比高于-25dB,有效声源在麦克风表面测试声压约为65分贝。
调试步骤:
(1)将喇叭音量调整到最大,测试麦克风表面录音效果,达到不劫辐的要求。
(2)从麦克风距离0到5米均匀分布测试点进行有效声源的唤醒测试(当超过3米后要提升声源强度),经测试确认声源唤醒的有效距离,通过调整功放增益达到要求的唤醒距离。
3结束语
随着轨道交通智能化的高速发展,语音识别技术可以极大丰富购票、事务处理等业务形式,提升乘客乘车体验,越来越便利的应用场景带来越来越复杂的使用环境,语音识别技术还需要继续深入研究和实践,以其满足更多更新的业务需求。
参考文献
[1] 钱小毅,龚迥.地铁互联网购票方式的研发[J].科技风,2019,9(1):63-65.