脑瘫康复机器人语音识别系统的研发与临床应用
2018-02-19
215500江苏省常熟市第二人民医院康复医学科
小儿脑瘫(Cerebral palsy)是指从出生前到出生后1个月内大脑发育未成熟阶段,由于非进行性的大脑损伤或发育异常而导致的躯体各类残疾,目前随着二孩政策的开放,脑瘫的比例逐渐增多[1],全球脑瘫发病率约1‰~5‰[2],我国的脑瘫发病率也大致相同。因此,控制脑瘫发病率刻不容缓[3]。近年来,脑瘫康复治疗技术飞跃发展,语音交互模式技术的出现拓宽了我们的视野。我们在此基础上用51单片机最小系统和LD3320语音芯片的配合,设计了脑瘫康复训练的语言系统,实现下位机和上位机的信息同步。在2017年初,我们设计成功了首台脑瘫语音识别康复机器人,为观察脑瘫康复机器人语音识别系统的临床应用效果,2017年3月-2018年3月利用瘫康复机器人语音识别系统治疗脑瘫患儿16例,对其进行回顾性分析,现报告如下。
资料与方法
2017年3月-2018年3月利用脑瘫康复机器人语音识别系统治疗脑瘫患儿16例,男7例,女9例;年龄5~13岁,平均(8.3±2.1)岁;坐位平衡均≥Ⅰ级。
方法:所有患儿均采用脑瘫康复机器人语音识别系统进行训练。具体方法:患儿由康复治疗师或者家长辅助坐位,选择51单片机STC12C5A60S2作最小的系统控制。将采集的声音信号通过非特定型语音识别模块的录入和识别,根据内部输入的拼音库转化为库里拼音,与已输入的拼音进行比较。当每次将按键按下去时,所要识别的文字拼音将会在液晶屏显示出来,相应的图片显示在上位机界面。对着芯片患儿说出“口令”,灯亮,然后对应图片说出相应的名称,便开始进行识别。最后对比图片和患儿说出的名称和是否吻合,评判系统对识别的时间和正确率。语音交互系统的整体设计框图,见图1。
本研究对整个电路的驱动和控制采用的是选择STC12C5A60S2 51单片机模式。语音芯片的型号是LD3320。语音模块的核心控制平台是单片机,并控制着语音芯片来完成对语音信号的采集和对比分析,同时以串口中断的方式将对比得出的一个最优结果传回给上位机,使上位机窗口显示对应的图片。从而读取患儿识别图片的正确率与时间的快慢。在本设计中语音识别列表是患儿对应图片说出小猫、火车、铅笔这3个词语。语音识别过程,见图2。
LD3320识别支持多达50个条目,每个条目是一个标准的识别普通话拼音(小写),每个单词(拼音)之间有一个间隔,每一个数字可以相同,但不可以是连续的,但数值要<256(00H-FFH)[4]。当编写一个列表识别时,每个待识别的语句需要一个编号,见表1。
图1 语音交互系统设计框图
图2 语音识别芯片识别过程
完成各初始化,将关键词列表写入芯片以后,就可以等待语音指令的输入。单片机程序,通常在编程的状态组LD3320芯片开始识别前用一个全局变量对当前状态进行控制[5]。在C5寄存器存入识别到的结果。如果麦克风采集到声音,不管它是否是正常的,其结果将产生一个中断信号,并根据寄存器分析结果的值中断程序。将该结果所对应的序号传递给单片机。此时该信号会经模块通过串口发送给主单片机出去。语音控制指令所对应的返回,见表2。
结 果
患儿16例识图正确率和耗时:患儿在第1次识图平均耗时8.8 s,正确6个,正确率37.5%,第2次识图平均耗时8 s,正确6个,正确率37.5%,第3次识图平均耗时7.8 s,均正确,正确率100.0%,第4次识图平均耗时7.7 s,均正确,正确率100.0%,第5次均正确,平均耗时7 s,随着识图次数的增加用时逐步减少,正确率也明显提高,见表3。
讨 论
言语训练主要包括呼吸训练、发音训练、发音器官训练、韵律训练、听力理解训练、阅读理解训练、口语表达训练、书写训练、朗读训练等。本文我们主要介绍了采用自主研发的脑瘫康复机器人语音识别系统提高言语训练的临床效果[6]。
人机交互训练模式能够大大提高脑瘫患儿的训练兴趣,打破以往枯燥的纸片式训练方式。计算机辅助训练的另一个优势就是可以根据患儿评估结果,任意添加设置图片及语音识别内容,帮助不同阶段的儿童提高言语能力。图片还可以不定期的更新,保持患者同等水平学习兴趣。
近年来,脑瘫康复治疗技术飞速发展,语音交互模式技术的出现拓宽了我们的视野。我们在此基础上用51单片机最小系统和LD3320语音芯片的配合,设计了脑瘫康复训练的语言系统,实现下位机和上位机的信息的同步。在2017年初,我们设计成功了首台脑瘫语音识别康复机器人。应用结果显示,脑瘫康复机器人语音识别系统可以明显提高患儿的正确识图能力,提高脑瘫患儿的治疗效果。同时,随着计算机技术的不断发展,我们相信该语音识别系统可以不断提高和完善,适合更多的需要言语康复的人群。
表1 语音识别
表2 语音控制指令对应的串口返回值