基于语音控制的智能记事提示系统设计
2021-06-29沈阳理工大学自动化与电气工程学院阮小烔野莹莹任璐珩
沈阳理工大学自动化与电气工程学院 阮小烔 野莹莹 李 帅 任璐珩
目前市场上大多数电子记事本都以文字输入形式呈现,且只能通过文字或语音记录、进行定时提醒,操作繁琐,对于不擅长使用手机、记忆力不好的老人并不友好。通过采用以STM32F103C8T6作为主控芯片LD3320语音智能识别芯片设计一款语音控制记事提示系统,做到语音记录备忘大大提高记事的便利性,且芯片小,功能单纯,轻便简单。
1 系统整体设计
该语音智能记事提示系统主要由图1的语音识别模块、语音录放模块、数字分析处理模块、显示输入模块组成。显示输入模块启动本系统,语音识别模块检测负责接收周围声音信号,提取、分析有效的语音指令。收到指令后传输到数字分析模块,并由数字分析模块传输相应的指令到显示输入模块和语音录放模块。
图1 系统结构图
以上五大模块主要由以下部件构成STM32F103单片机核心电路、LD3320语音识别模块、OLED12864、ISD4003。STM32F103为数字分析处理模块,LD3320芯片作为负责语音识别模块主控芯片,OLED12864作为显示输入模块主要器件,而ISD4003芯片主要作为语音录放模块。
2 硬件设计
2.1 STM32F103C8T6主控芯片
本系统设计使用STM32F103C8T6作为主控芯片。STM32F103C8T6是一款增强型系列微控制器,使用高性能的ARMRCortexTM-M3 32位的RISC内核。它的指令代码完美兼容了51单片机,具有高性能、低电压、低功耗、低风险。
2.2 LD3320语音识别模块
本设计中,语音识别模块的核心是LD3320芯片。该模块使用ASR(Auto speech recognition)技术。该技术识别率高达95%,快速且稳定。该模块工作时,先经过MIC输入声音施行频谱分析,再将语音特征提取并匹配重点字词的语音信息。后将匹配程度最高分作为识别输出结果。图2为LD3320与主控芯片接线图。
图2 LD3320与主控芯片接线图
2.3 OLED12864显示模块
OLED12864作为本系统主要显示模块,通过IIC接线与主控芯片接连通讯,显示密码输入情况,提示系统处于语音识别或者录入状态。如图3为OLED12864与主控芯片接线图。
图3 OLED12864与主控芯片接线图
2.4 ISD4004语音录入输出模块
本系统利用REC-1000语音模块集成了ISD4004语音芯片的单片机控制芯片及其外围电路,并提供了常用端口的接口插口形式,使语音芯片的使用简单化。可用I/O口仿真SPI通信协议,工作电压3V,录放时间为8到16min,高保真录音。如图4为ISD4004与主控芯片的接线图。
图4 ISD4004与主控芯片的接线图
3 软件设计
3.1 主程序流程图
对所有变量进行初始化后进入循环判断。先输入密码,密码信号正确,则检测语音信号输入。解析信号,根据语音信号执行相应的语音命令,再按照各个命令执行相应的程序。主程序流程图如图5所示。
图5 主程序流程图
图6 语音识别原理框图
3.2 语音识别程序流程图
本系统语音识别模块由LD3320组成,利用ASR技术识别。图6是语音识别原理框图。语音识别流程采用中断方式工作。设计程序时,首先要通用初始化和语音初始化。再写入识别列表添加关键词和定义识别码。当麦克风采集到的声音时,将产生一个中断信号,再由中断程序根据分析结果选取最高分的结果。
图7 系统电路图
4 实验结果及分析
通过调试,本系统主要通过LD3320芯片的语音识别模块和ISD4004芯片的语音录入输出模块实现语音控制的智能记事提示。以STM32作为主控芯片来协调控制各个模块的启动。图7为整个系统的硬件电路图。
启动电源,两盏指示灯将会亮起,OLED屏初始化。以按键输入密码,输入错误则OLED屏提示密码输入错误。密码输入正确则启动语音识别模块,若系统检测到语音指令,如“记录书包位置”,语音识别模块将识别到反馈给主控芯片,主控芯片将发出信号控制语音录入输出模块启动录音功能记录位置。当说出语音指令“查询书包位置”,语音识别模块识别到指令之后,将会反馈到主控芯片,主控芯片将发出信号使语音录入输出模块输出之前记录到的物品位置。系统实物接线图如图8所示。
图8 系统实物图
结论:本设计提出了语音记事提示功能,对比于其它形式的记事本更简单易上手,更大程度上解放了双手,方便了弱势群体生活。但同时系统简便的同时指令也比较单一,但出于成本控制采用了按键式密码,按键式密码虽然提高了安全性但也不够便捷。因此对于该系统,还有很大的研发空间。