低误触发高识别率离线语音识别冰箱控制及系统研究
2018-09-28罗莉文陈庆传刘道金韩斌斌
罗莉文 陈庆传 刘道金 韩斌斌
杭州华日家电有限公司 浙江杭州 311401
1 引言
随着信息技术的发展,用户与家电之间的交互方式越来越丰富,语音控制技术在近几年来发展迅速,且为家电行业注入了新的活力。冰箱作为传统家电中不可分割的一部分,结合语音控制能够为用户提供更为便捷、高效的服务。本文研究为普通电脑控制冰箱,提供语音控制的新途径,实现低成本的人机语音交互,解放用户的双手。采用非特定人声的检测方式对不同口音的用户指令进行识别,结合人体检测、语音唤醒词、以及降噪功能降低语音指令的误触发,以固定词条通过通信协议下发指令到冰箱电控实现冰箱各功能的控制和交互。
2 关键检测电路解析
红外人体检测电路原理图见图1,该电路由红外对管U2的发射管及电阻R2,晶体管Q1,电阻R3组成信号发射部分,由红外对管U2的接收管、电阻R1、比较器U1及过滤电容C2组成信号接收部分。反射式指发光管与接收管并列一起,平时接收管始终无光照,只在发光管发出的红外光线遇到反射物时,接收管收到反射回来的红外光线才工作。
麦克风偏置及滤波电路原理图见图2,音源发出的声音由空气为介质而传导,传导的声波碰击麦克风的振动,振动会随音波传导的方向沿转动轴心前、后振动,在麦克风输出端会根据此振动的反应产生电气信号。
3 本方案控制系统剖析
本方案系统框图见图3,系统包括:以MCU处理器为核心的语音控制模块;采集人体接近信号的人体传感器;采集语音信号的麦克风阵列;播报交互词条的喇叭;以及执行冰箱控制的电脑控制器部件。
语音控制模块电路,包括MCU处理器、看门狗电路、语音信号放大、电源及通道滤波电路、数据存储器、以及通信电路。
人体传感器,包括红外人体检测、检测精度调整电路、检测距离增益调制电路。
播放喇叭,包括喇叭的播报音量增益可调节、喇叭播报内容为对应语言指令的交互词条。
麦克风阵列,一个正对用户的主麦克风,两个安装在冰箱两侧用于降噪的麦克风。
存储Flash:内置数据Flash用于存储语音识别特征文件,外部Flash用于存储播放文件。
冰箱控制电路,包括压缩机控制电路,冰箱冷却风机控制电路,冰箱门灯控制电路、冰箱制冷控温软件方案、以及通信电路。
4 低误触发高识别率及其降噪实现
本方案软件控制流程图见图4,采用降噪算法,其降噪算法流程为:软件算法将采集到的原始信号进行频域转化,统计与指令特征不一致的语音信号频率在一段时间内出现的次数,根据统计结果,将出现周期稳定、出现频率较高的噪声源提取出来。通过软件设置特点的噪声滤波器用于之后一段时间内的噪声信号消除。
通过一段时间麦克风检测并统计不同音阶中出现的音调频率,除去检测到的指令音阶次数。统计出发声频率较高的声音特征,通过软件调制的方式,将此类音频信号作为无关信号滤波。能够增强语音信号的抗干扰能力。
有指向性的消噪,两个对着噪声源,一个对着语音源,噪音MIC固定在相对位置,可以判定噪声来源位置。用途是在播放音乐的时候或有噪音时可以做语音识别,播放时候录音会录入音乐声音和人声,AEC技术可以在混合声音中,去除音乐声音,保留人声用于语音识别。
人体检测模块检测到人体后,语音模块检测声音信号,发现指令词则与冰箱控制器通信下发对应的控制指令,并通过喇叭发出对应的提示音。
图1 红外人体检测电路
图2 麦克风偏置及滤波电路
图3 本方案控制系统框图
5 本系统语音识别控制流程
本文研究的语音识别控制流程如图5,软件算法将采集到的语音信号进行加窗处理,对每一个窗体内的语音信号进行频域变换处理,提取频域变换后各个窗体内频域信号的特征点,将其特征点与存储器内的指令词特征进行比对,与指令词连续匹配的特征信号将被判定为指令词。
极低的误触发,其系统控制实现方式为:人体检测模块检测到人体后才会触发语音识别模块,语音识别设置唤醒词,唤醒词触发后,在规定时间内下发语音控制才有效。
具有高识别率,其系统控制实现方式为:由麦克风阵列对采集到的不同方向上的语音信号进行滤波,采样后的信号再经过软件滤波后,对其语音的特征信号进行提取,比对内部存储的指令特征,从而提取出连续匹配的指令词条完成语音识别,并通过通信电路发出对应的控制指令。
本文研究的语音控制模块,人体传感器和麦克风阵列检测到人体接近并发出声音,对声音进行降噪处理后分析提取声音内的特征值,将特征与存储器内的指令特征对比,根据对比结果实用喇叭播报对应词条,通过通信电路发送对应指令控制命令给冰箱控制器达到控制目的。
图4 语音识别定向降噪软件流程图
图5 本方案语音识别控制流程图
6 本方案在冰箱控制上实现
选取我司一台BCD-388WH**冰箱,此冰箱冷藏为小对开形式,图6为本方案传感器布置图,M2、M3为降噪麦克风,安装于两侧上门轴处,且麦克风音源输入口背对冰箱;M1为主麦克风安装在冷藏右门中间位置;T1为红外人体传感器安装在冷藏右门中间位置。
冰箱每次上电:播放5秒音乐,然后播放当前冷藏室设置温度,变温室设置温度,冷冻室设置温度,模式,净化状态。
唤醒词为:“**冰箱”或“你好,**”。
语音识别到唤醒词“**冰箱”后,会播报冰箱当前设置运行状态;在20秒内又识别到“**冰箱”,会播报“你好,我是**冰箱,一个给你食物保鲜的智能管家”。
语音识别到唤醒词“你好,**”后,会随机播报“你好啊”,或“你好我在请说指令”,或“我来啦”或“咋啦”,或“说话不能说一半呀”等。
在唤醒词识别的20秒内可以给系统下发控制指令:
“冷藏升温”“冷藏降温”:冷藏温度会在设置温度范围升降,并播报设置后的温度;
“变温升温”“变温降温”:变温温度会在设置温度范围升降,并播报设置后的温度;
“冷冻升温”“冷冻降温”:冷冻温度会在设置温度范围升降,并播报设置后的温度;
“智能模式”“假日模式”“速冻模式”:可以切换冰箱运行模式,并播报设置后的模式;
“开启冷藏”“关闭冷藏”:可以开启和关闭冰箱冷藏制冷系统,并播报设置后的状态;
“开启变温”“关闭变温”:可以开启和关闭冰箱变温制冷系统,并播报设置后的状态;
“开启净化”“关闭净化”:可以开启和关闭冰箱净化系统,并播报设置后的状态;
“冷藏温度”“变温温度”“冷冻温度”“环境温度”:会播报当前实际温度。
当检测冰箱门超过30秒未关闭时:每隔一分钟会播报“你好,请关冰箱门”,直到用户关闭冰箱门。
图7为本系统方案的在冰箱上的语音识别范围,在嘈杂环境中,冰箱正前方100度范围7米内识别率可以到达95%以上,冰箱两侧则范围4米内识别率可以达到95%以上;结合人体检测和唤醒词双保险,误差发基本为零。
7 结论
本文提供的语音识别处理方法以降噪算法结合三MIC算法有效提高识别率,加入人体检测和唤醒词触发,并结合MCU滤波算法和信号加窗处理极大降低了周期性环境噪声对语音交互的干扰,降低了语音交互的误触发率,通过串口与冰箱控制器通信来实现控制冰箱的目的。这种语音控制器可以取代传统的显示加按键的操作面板,且以模块的方式接入到冰箱,总体成本较低,能够实现低成本适配传统的电脑控制冰箱快速升级到更具科技感的语音控制冰箱。并预留接口,可以通过接入Wi-Fi模块以实现在线非固定词条语音控制。
图6 传感器布置示意图
图7 识别范围图