基于语音识别的电梯辅助控制系统设计*
2017-03-31林麒麟包广清宋旭辉张宝强
林麒麟 包广清 宋旭辉 张宝强 陶 佳
(兰州理工大学电气工程与信息工程学院 兰州 730050)
基于语音识别的电梯辅助控制系统设计*
林麒麟 包广清 宋旭辉 张宝强 陶 佳
(兰州理工大学电气工程与信息工程学院 兰州 730050)
针对盲人或者行动不便的特殊人群能够更加方便地使用电梯,同时也为了电梯的使用变得更加人性化、智能化,论文提出一种基于语音识别技术的电梯辅助控制系统的设计方法。设计部分主要包括:语音识别模块、MCU主控电路、继电器控制模块、语音播报模块。语音模块电路采用了语音芯片LD3320,该芯片集成了语音识别处理器和一些外部电路,并且不需要外接任何的辅助芯片,直接集成在现有的产品中即可以实现语音识别、人机对话功能。MCU主控电路采用STC11系列单片机,具有低功耗,超低价,高速,强抗干扰等特点,与语音芯片LD3320通信,接收语音命令,并输出相应控制命令。继电器模块,采用SONGLE继电器,能够承受28V~250V电压,能够实现通断控制。
语音识别; 电梯; 辅助控制系统; 人性化
Class Number TP273
1 引言
随着人工智能、科技水平的不断提高发展,同时为了更好地满足人类生活安全、智能、便捷的需求,各类智能产品及其技术在人们生活、工厂作业中得到充分运用。其中语音识别技术[1~3]是人工智能的重要体现,能够实现人机交流、人机对话,能够有效地进行信息传递,让机器听懂人类的语言。一般的一个语音识别系统通常包括以下几个步骤:首先进行语音信号的采集和预处理,然后进行语音特征的提取,再建立语音训练模型,最后进行语音模式的匹配与识别。随着语音识别准确度的不断提高,语音识别技术在医疗陪护、智能玩具、智能手机、智能家居[4]中均有应用。本文选用了LD3320作为语音识别系统的核心芯片,提出了一种基于语音识别的电梯辅助控制系统设计方案。该方案目的在于让公共场所的电梯变得更加人性化、智能化,方便盲人或行动不便的特殊人群使用。目前电梯多为人工按钮控制,对特殊人群缺乏理性考虑与关怀,本文通过语音识别技术,用语音作为辅助开关实现对电梯辅助控制。该控制系统主要包括以下几个部分:语音识别模块、MCU主控电路、继电器控制模块、语音播报模块。语音模块集成了语音识别处理器和一些外部电路包括AD、DA 转换器、麦克风接口、声音输出接口,并且不需要外接任何的辅助芯片如Flash、RAM 等,直接集成在现有的产品中即可以实现语音识别、人机对话功能[5~6]。MCU主控电路采用STC11系列单片机,具有低功耗、超低价、高速、强抗干扰等特点,它与语音芯片LD3320通信,接收语音命令,并输出相应控制命令。继电器模块,采用SONGLE继电器,能够承受10A 250VAC、10A 125VAC、10A 30VDC、10A 28VDC四种类型电压,能够实现通断控制。以上元器件价格均较便宜,能够以低成本实现较好的控制性能。
2 硬件设计
该系统该控制系统主要包括:语音识别模块、MCU主控电路、继电器控制模块、语音播报模块。首先通过语音识别模块识别语音信息,并将该信息传递给MCU主控电路,MCU主控电路分析处理该信息后,分别向继电器控制模块发出控制命令,当接收到控制命令后,语音播报模块播出相应的信息,同时当用户到达所需楼层时,播出提示信息。具体系统框图如图1所示。
图1 系统框图
2.1 语音模块
语音识别模块采用LD3320语音芯片,该芯片基于非特定人(Speaker-Independent Automatic Speech Recognition,SI-ASR)技术的语音识别声控芯片。ASR技术是基于关键词语列表识别的技术[7~8]。每次识别的过程,就是把用户说出的语音内容,通过频谱转换为语音特征,和这个关键词语列表中的条目进行一一匹配,最优匹配的一条作为识别结果[9]。只需要设定好要识别的关键词语列表,并把这些关键词语以字符的形式传送到LD3320内部,就可以对用户说出的关键词语进行识别。ASR技术最重要的现实意义就在于提供了一种脱离按键,键盘,鼠标的基于语音的用户界面(Voice User Interface,VUI)。该芯片主要特色功能在于:非特定人语音识别技术,不需要用户进行录音训练;可动态编辑的识别关键词语列表送进芯片;不需要任何外接的辅助 Flash 和 RAM,真正降低系统成本;内置高精度A/D和 D/A通道;高准确度和实用的语音识别效果。语音模块采用电路图设计如图2所示。
图2 语音模块电路
2.2 主控模块
图3 主控模块电路
本设计选用宏晶系列STC11L08XE单片机作为主控电路芯片,该芯片具有高速、低功耗、超强抗干扰的特点,指令代码完全兼容8051,但速度比其快8~12倍,内部集成高可靠复位电路,可应用于高速通信,智能控制,强干扰场合[10]。其复位电路、时钟电路以及外围引脚电路如图3所示。
2.3 继电器模块
本文采用SONGLE继电器进行通断控制,进而实现对电梯的控制。本方案初步设计了10路继电器模块,分别控制1~10楼的电梯按钮的通断。具体控制流程为:首先识别语音关键词(如:上2楼,上3楼,…,上10楼),语音模块识别后与MCU通信,MCU经过分析处理后,发出相应的控制命令,通过控制继电器通与断,代替电梯按钮的开与关。其中一路继电器设计电路如图4所示。
图4 继电器模块电路
2.4 语音播报模块
语音播报模块是为了使该电梯辅助控制系统更加人性化,同时也是对特殊人群的照顾。当到达所到达楼层时,会播报出所到达楼层的相应信息。例如:当到达5楼时,扬声器会播出“5楼已到达,请慢走!”。该语音信息可以通过VoiceReader语音合成软件制作而成,然后存储至TF卡,并将该TF卡外接LD3320芯片。当到达所需楼层时,就播出该语音信息。LD3320内置550mW单声道扬声器放大器输出,通常直接将其SPOP和SPON引脚直接外接扬声器即可,如图5所示。
图5 语音播报模块电路
3 软件实现
基于语音识别的电梯辅助控制系统,是一个可以较好地实现人机交互便捷性的系统,不仅有比较稳定的识别效果,同时还体现了离线识别的优势,很好地规避了其缺点,主要的工作流程如图6所示。
具体的语音识别步骤为
Step1:首先进行语音识别初始化,并对相关寄存器进行设置,程序片段如图7所示。
Step2:进行关键词设置,写入识别条目。每个识别条目对应一个特定的编号,不同的识别条目可以有相同的编号,编号顺序无需连续,部分关键词如表1所示。
表1 部分关键词列表
Step3:通过咪头进行语音信息的采集。
Step4:将采集到的语音信息与已经设置好的关键词进行匹配,查找是否有相应的语音信息。
Step5:若识别成功,则进行继电器控制操作,等待到达相应的楼层,到达后播出相应的提示信息;若识别失败,则结束,并发出相应的语音提醒。
图6 语言识别流程图
Step6:当每次语音识别结束后,即到达相应的楼层后,相应楼层继电器控制开关恢复初始状态,语音模块等待下一个语音信息。
图7 初始化程序片段
4 参数设置
在该语音识别辅助控制系统设计过程中,主要涉及以下几个参数的设置:
1) 波特率。波特率是针对串口通信功能的一个通信速度参数调整,参数值如下:1bps~4800bps;2bps~9600bps;3bps~19200bps;4bps~57600bps;5bps~115200bps。不同序号对应不同的波特率,通常选9600bps。
2) 音量。音量调整为喇叭的音量大小调整参数,具体参数如下:
参数范围:0~15 ;0:最小音量;15:最大音量。音量大小根据实际情况设定,在该控制系统中设置为10。
3) 麦克风灵敏度。麦克风灵敏度即不同识别距离,识别距离越远,表明其灵敏度越高。具体参数如下:
参数范围:1~99;1:最低灵敏度;99:最高灵敏度。灵敏度越高,识别距离越远,但误识别率容易越高,故灵敏度并不是越高越好。具体参数表2所示。本控制系统根据实际情况选择灵敏度为75。
表2 灵敏度参数
5 抗噪处理和测试分析
该系统噪声可以主要分为系统内部噪声和麦克风输入噪声两部分。针对系统内部噪声,可以通过合理规划各硬件模块位置,使其尽量远离,避免交叉干扰。同时将声音采集模块用海绵包裹,避免与其他部分直接接触。此外,由于该模块是非特定语音识别模块,对任何人的声音都可进行判断,为了避免误识别,可以设置口令模式,即只有先说出口令才能进一步识别。其次,为了更好地识别效果,要求客户尽量讲普通话,注意发音技巧。最后,要使电梯环境尽可能安静。语音识别是对声音比较敏感的设备,有噪音和人员对话时会影响识别距离和识别精度。
在电梯环境中进行语音识别测试,分别采集男、女各10人的语音信息,每人每层采集10次,然后进行语音识别准确率分析,表3给出了上楼时语音测试结果,下楼时测试方法类似,此处不再赘述。
表3 语音识别准确率分析
由表3可以看出,该设计系统提供的设计方案准确识别率达到87%,具有较好的语音识别效果。其次从表1还可以看出,由于男生的浊音比女生重,女生的语音识别准确率略高于男生。
6 结语
本文从智能化、人性化的角度出发,结合日常生活中盲人或行动不便的特殊人群使用电梯不便的现象,提出了一种基于语音识别的电梯辅助控制系统设计方案。该方案生产成本较低,而且通过测试表明该系统识别效果较好,具有一定的实用价值。
[1] 韩纪庆,张磊,郑铁然.语音信号处理[M].北京:清华大学出版社,2013:1-10. HAN Jiqing, ZHANG Lei, ZHENG TieRan. Speech signal processing[M]. Beijing: Tsinghua University Press,2013:1-10.
[2] 孙成立.语音关键词识别技术的研究[D].北京:北京邮电大学,2008. SUN Chengli. A Study of Speech Keyword Recognition Technology[D]. Beijing: Beijing University of Posts and Telecommunications,2008.
[3] Li Jinyu, Deng Li, Gong Yifan, et al. An overview of noise-robust automatic speech recognition[J]. IEEE Trans on Audio, Speech and Language Processing, 2014, 22(4): 745-777.
[4] 刘文强.语音识别技术在智能家居中的研究与应用[D].大连:大连海事大学,2013:1-62. LIU Wenqiang. Researches and Applications of Speech Recognition Technology in the Smart Home[D]. Dalian: Dalian Maritime University,2013:1-62.
[5] 徐义芳,张金杰.语音増强用于抗噪声语音识别[J].清华大学学报(自然科学版),2001,21(1):41-44. XU Yifang, ZHANG Jinjie. Speech enhancement applied to speech recognition in noisy environments[J]. Tsinghua Univ (Sci & Tech ),2001,21(1):41-44.
[6] 许金普,诸叶平. 基于语音识别的农产品价格信息采集方法[J]. 中国农业科学,2015,48(3):449-458. XU Jinpu, ZHU Yeping. The Agricultural Price Information Acquisition Method Based on Speech Recognition[J]. Scientia Agricultura Sinica,2015,48(3):449-458.
[7] 袁里驰.基于改进的隐马尔科夫模型的语音识别方法[J].中南大学学报(自然科学版),2008,39(6): 1303-1308. YUAN Lichi. A speech recognition method based on improved hidden Markov model[J]. J. Cent. South Univ. (Science and Technology),2008,39(6):1303-1308.
[8] 宋青松,田正鑫,孙文磊.用于孤立数字语音识别的一种组合降维方法[J].西安交通大学学报,2016,50(6):1-5. SONG Qingsong, TIAN Zhengxin, SUN Wenlei. A Combined Dimension Reduction Method for Isolated Digital Speech Recognition[J]. Journal of XiAn Jiaotong University,2016,50(6):1-5.
[9] 徐子豪,张腾飞.基于语音识别和无线传感网络的智能家居系统设计[J].计算机测量与控制,2012,20(1):180-182. XU Zhihao, ZHANG Tengfei. Design of Smart Home System Based on Speech Recognition and Wireless Sensor Network[J]. Computer Measurement & Control,2012,20(1):180-182.
[10] 夏志华.基于单片机的温度控制系统的研究与实现[J].煤炭技术,2013,32(2):191-193. XIA ZhiHua. Research and Implementation of Temperature Control System Based on Single Chip[J]. Coal Technology,2013,32(2):191-193.
Design of Elevator Assistant Control System Based on Speech Recognition
LIN Qilin BAO Guangqing SONG Xuhui ZHANG Baoqiang TAO Jia
(College of Electrical Engineering and Information Engineering, Lanzhou University of Technology, Lanzhou 730050)
In order to humanize the elevator and make it more intelligent, then let the special people such as the blind and the disabled use the elevator more conveniently, this paper designs an assistant control system based on speech recognition. The design part mainly includes speech recognition module, MCU main control circuit, relay control module, voice broadcast module. Speech recognition module uses the voice chip LD3320, the chip integrated speech recognition processor and some external circuits, and it does not require external auxiliary chip, which directly integrated in existing products can be used to realize speech recognition and man-machine conversation function. MCU main control circuit uses STC11 series microcontroller, which has performance of low power consumption, low cost, high speed, strong anti-interference. MCU receives voice commands and outputs the control commands by communicating with LD3320. Relay module uses SONGLE relay, which can achieve on-off control and be able to bear the range of voltage from 28V to 250V.
speech recognition, elevator, assistant control system, humanization
2016年9月9日,
2016年10月28日
甘肃省大学生创新创业训练计划项目基金(编号:DC2015054)资助。
林麒麟,男,硕士研究生,研究方向:模式识别与智能控制。包广清,女,博士,教授,研究方向:电气自动化领域。宋旭辉,男,硕士研究生,研究方向:控制科学与工程。张宝强,男,研究方向:自动化。陶佳,女,研究方向:自动化。
TP273
10.3969/j.issn.1672-9722.2017.03.029