基于语音技术的早教写字机器人设计
2014-03-10王倩魏鑫易奎李文生何谦潘小琴
王倩+魏鑫+易奎+李文生+何谦+潘小琴
摘要:随着科技的飞速发展,儿童的玩伴不再拘泥于传统玩具,具有人机交互功能的教育机器人将得到极大发展。文章设计出一种基于语音技术的早教写字机器人,该机器人采用轮式结构,以STM32F103作为主控芯片,用x、y、z三自由度写字机构实现写字功能,语音模块能够准确识别使用者命令并传递控制信号,超声波传感器可实现机器人避障。实验结果表明,语音技术能较好实现人机交互,所写字迹规范、清晰。
关键词:机器人;语音技术;人机交互;写字技术
中图分类号:TP242 文献标识码:A 文章编号:1009-2374(2014)06-0021-03
机器人一直是国内外研究的热点,其中教育机器人则是以激发学生学习兴趣、提高学生综合能力为目标,它在丰富儿童童年生活的同时,激发了儿童对科学技术的好奇心和求知欲。目前,国内已出现了机器人写字相关技术的研究。陈雪华、张学文等人对四自由度写字机器人做了详细的研究,并对其控制系统设计、轨迹规划、运动学仿真进行了详细的分析;宫晓博利用IRB140型机器人做了汉字绘制的研究;但将机器人写字技术与语音技术相结合的研究并不多见。汉王科技推出的“双枪笔”利用语音技术实现了当使用者对着麦克风朗读,相应文字就会自动录入电脑,但这一技术却没能实现书写过程的展示。文章主要阐述基于语音技术的早教写字机器人,通过x、y、z三自由度机构带动笔的运动来展现书写过程。语音控制技术强化了人机交互功能,使得机器人更加人性化。
1 系统总体设计
图1 系统总体设计框图
系统是基于语音技术的早教写字机器人。该机器人能按照使用者的语音命令,驱动其写字机构运动——带动上面的常规绘图笔,完成10以内的算术运算的书写。系统是典型的机电声技术相结合的轮式结构机器人,由STM32F103作为主控芯片,系统按功能由车身驱动部分、写字部分、语音处理部分、电源模块和显示器、播放器等辅助设备组成。系统总体设计框图如图1所示。系统由24V,3A的开关电源供电。机械结构包括车体和写字机构。车体采用四轮式,以安装于后轮的两个直流电机作为驱动;写字机构放在写字板上,一同置于车体中层;在车前方安装了三个互成一定角度的超声波传感器用于避障检测。
2 写字机构设计
图2 “十”字滑块结构
写字机构搭载在写字板上,采用“十”字滑块结构实现XY平面内的任意轨迹运动;曲柄滑块机构实现Z方向的提笔、下笔运动。“十”字滑块结构由导轨座、移动滑块、写字板、滚珠丝杠螺母副和步进电机等部件构成,“十”字滑块结构如图2所示。两个步进电机作为原动机以驱动滚珠丝杠,分别安装在写字板的X轴和Y轴上。移动滑块位于两滚珠丝杠的交点处,滚珠丝杠的螺母带动滑块上的绘图笔实现沿x、y平面内任意轨迹的运动,从而实现绘图笔对平面任意点的遍历。曲柄滑块机构用来完成Z方向的提笔和下笔动作,曲柄滑块机构如图3所示,它能将圆周运动转换为直线运动,笔固定于滑块上,通过舵机转动控制曲柄的圆周摆动从而使滑块沿Z方向上下移动。
图3 曲柄滑块机构
3 写字功能的实现及写字算法
该功能旨在完成10以内的算术运算。一个完整的算术运算由运算元和运算子构成,例如“3+6=9”。以下将运算元和运算子统称为运算单元,不同的运算单元又由不同的直线、斜线、圆弧等组合构成。在XY平面,两个57系列的步进电机带动写字机构运动。步进电机是将电脉冲信号转变为角位移或线位移的开环控制元件。在非超载的情况下,电机的转速、停止的位置只取决于脉冲信号的频率和脉冲数,而不受负载变化的影响,即给电机加一个脉冲信号,电机则转过一个步距角。电机的驱动为TB6560驱动板,由于电机的步距角为1.8°,再经一定的细分后,定位将更加精确。
由STM32产生一定频率、一定时间的PWM波使步进电动机完成相应的转动,滚珠丝杠能将步进电机的旋转角度转换为绘图笔相对于坐标轴相应距离的直线运动。当一个电机转动而另一个电机不转动的情况下,可完成横线或竖线的书写;当两个电机同时转动,完成斜线的书写,斜线的斜率取决于两电机转动频率差值;由于圆弧可看成由若干斜率不同的细小的直线段构成,虽然电机的转动对时间是离散的,但电机的步距精度很高,可以实现圆弧的书写。
以绘图板左上角为坐标原点建立X-Y平面坐标系。设A(x1,y1),B(x2,y1),C(x3,y1),D(x4,y1),E(x5,y1)分别为书写过程中五个运算单元的起始坐标。程序根据对脉冲的计数可定位出绘图笔当前的坐标P(xp,yp),计算过程如下:
书写第一个运算单元时,以A(x1,y1)作为笔的起始坐标。设定控制X轴向运动的电机的最小步距角为θ0,某段时间内微控制器输出给X轴向电机的脉冲频率为fxk,对应脉冲个数为nxk(k=1,2,3,...),则此时间段内该电机转过的角度为θxp,有
(1)
设步进电机输出轴半径为R0,则笔的当前X轴向坐标为xp,有:
xp=x1+R0θxp (2)
同理,对Y轴向上的运动有:
yp=y1+R0θyp (3)
(4)
弧线的书写是算法实现过程中较为复杂的部分,下面介绍从A点开始画半径为R的弧APn的算法实现过程。如图4,将圆若干等细分后每部分弧线均可看做直线,且对应的圆心角为α°。设笔已经完成了弧APn-1的书写,弧Pn-1Pn近视等效为直线Pn-1Pn,此时:
(5)
(6)
将xPn-1,xPn的值分别代入式2中的x1、xp,联立式1和式2,即可求出书写弧Pn-1Pn这一过程中X轴向电机接受单片机输出脉冲个数nxk。同理可求出yxk。
当完成一个运算单元的书写,滑块上的舵机完成Z方向提笔,接下来需完成由上一个运算单元的结束位置(x'p,y'p)到下一个运算单元的起始坐标(xk,yk)(k=2,3,4...)后落笔的动作,然后书写下一个运算单元。
图4 画弧示意图
4 机器人驱动及避障的实现
系统利用两个差速电机提供动力,采用L298作为此电机驱动。为解决单个超声波的检测不准确的问题,系统使用3个超声波传感器,通过计算出最小盲区和最小干扰范围,设计出合理的超声波传感器摆放位置。超声波测距的公式为:
L=C×T (7)
式中L为测量的距离长度;T为超声波从发射到接收的时间间隔的一半;C为超声波在空气中的传播速度,计算公式为:
C=C0+0.607×T℃ (8)
C0为零摄氏度时的声波速度332m/s,T为环境当前的摄氏温度,这样补偿了温度变化对于超声波传播速度的影响。
系统依靠3路超声波进行距离测量,得到3个方位的距离数据后进行判断,当距离小于最小避障距离30cm后,底盘上两直流电机形成差速使机器人避障。具体策略如表1所示:
表1 超声波避障策略
传感器编号 策略
左 中 右 左转优先
0 0 0 前进
0 0 1 左转
0 1 0 左转
1 0 0 右转
0 1 1 左转
1 0 1 后退
1 1 0 右转
1 1 1 后退
注:图示:1.进入避障范围;0.不在避障范围
5 语音控制技术
语音控制技术包括语音识别和单片机控制技术。
系统采用以IC公司LD3320语音芯片为核心的ASR(Automatic Speech Recognition)模块,实现语音识别功能。系统通过稳定的算法可完成非特定语音识别,不需要用户事先录音和训练。经测试,在口令触发模式下识别准确率高达95%,非口令触发模式下识别准确率可达70%;内置功放电路,麦克风、立体声耳机和单声道喇叭,方便与芯片管脚连接;用户每次可设置50项不超过79字节的拼音串候选识别句。
语音控制框图如图5所示,图中“LD3320与外围电路”实现将采集到的非特定语音信号转化为数字信号,并与语音库进行信号匹配,确定有用信息及信息内容,并通过串口将有效内容以十进制数方式传递给主控制器,主控制器控制执行机构做出相应动作,同时MP3模块发出提示音。
图5 语音控制框图
6 实验验证及总结
实验证明,本系统能较好地实现早教功能;写字机构运动稳定、噪声小,定位精度达90%,所写字迹清晰,圆润,书写结果正确率达99%;语音控制方便、灵活,识别准确率高达95%。通过使用者与机器人的良好交互,机器人完成的书写效果如图6所示。
图 6 写字效果图
参考文献
[1] Carson-Berndsen Julie.Finite-state models,
event logics and statistics in speech recognition
[J].Philosophical Transactions of the Royal
Society A: Mathematical, Physical and Engineering
Sciences,2000,358.
[2] Lixiao Huang,Terri Varnado ,Douglas Gillan.
An Exploration of Robot BuildersAttachment to
Their LEGO Robots[J].Proceedings of the Human
Factors and Ergonomics Society Annual Meeting,
2013,(1).
[3] 李杨.基于智能语音识别的云电视系统设计[J].
中国高新技术企业,2012,(7).
[4] 杨智鑫.移动机器人语音识别系统的研究与实现
[D].北京:北京化工大学,2011.
[5] 张学文,陈小安,梁锡昌.写字机器人运动学分析
及仿真[J].现代制造工程,2009,(10).
[6] 谢光辉,梁锡昌,李伟.一种机器人绘字控制系统
的研制[J].制造业自动化,2007,(2).
[7] 杨晶东,杨敬辉,蔡则苏.基于多目标优化的移动
机器人避障算法[J].上海交通大学学报2012,
(2).
基金项目:本文系西南科技大学实验技术研究项目(14syjs-10);西南科技大学大学生创新基金项目(CX13-053)研究成果。
作者简介:王倩(1991—),女,四川南充人,西南科技大学“智能机器人”创新实践班班长,研究方向:机器人控制技术、机器人运动规划。
图4 画弧示意图
4 机器人驱动及避障的实现
系统利用两个差速电机提供动力,采用L298作为此电机驱动。为解决单个超声波的检测不准确的问题,系统使用3个超声波传感器,通过计算出最小盲区和最小干扰范围,设计出合理的超声波传感器摆放位置。超声波测距的公式为:
L=C×T (7)
式中L为测量的距离长度;T为超声波从发射到接收的时间间隔的一半;C为超声波在空气中的传播速度,计算公式为:
C=C0+0.607×T℃ (8)
C0为零摄氏度时的声波速度332m/s,T为环境当前的摄氏温度,这样补偿了温度变化对于超声波传播速度的影响。
系统依靠3路超声波进行距离测量,得到3个方位的距离数据后进行判断,当距离小于最小避障距离30cm后,底盘上两直流电机形成差速使机器人避障。具体策略如表1所示:
表1 超声波避障策略
传感器编号 策略
左 中 右 左转优先
0 0 0 前进
0 0 1 左转
0 1 0 左转
1 0 0 右转
0 1 1 左转
1 0 1 后退
1 1 0 右转
1 1 1 后退
注:图示:1.进入避障范围;0.不在避障范围
5 语音控制技术
语音控制技术包括语音识别和单片机控制技术。
系统采用以IC公司LD3320语音芯片为核心的ASR(Automatic Speech Recognition)模块,实现语音识别功能。系统通过稳定的算法可完成非特定语音识别,不需要用户事先录音和训练。经测试,在口令触发模式下识别准确率高达95%,非口令触发模式下识别准确率可达70%;内置功放电路,麦克风、立体声耳机和单声道喇叭,方便与芯片管脚连接;用户每次可设置50项不超过79字节的拼音串候选识别句。
语音控制框图如图5所示,图中“LD3320与外围电路”实现将采集到的非特定语音信号转化为数字信号,并与语音库进行信号匹配,确定有用信息及信息内容,并通过串口将有效内容以十进制数方式传递给主控制器,主控制器控制执行机构做出相应动作,同时MP3模块发出提示音。
图5 语音控制框图
6 实验验证及总结
实验证明,本系统能较好地实现早教功能;写字机构运动稳定、噪声小,定位精度达90%,所写字迹清晰,圆润,书写结果正确率达99%;语音控制方便、灵活,识别准确率高达95%。通过使用者与机器人的良好交互,机器人完成的书写效果如图6所示。
图 6 写字效果图
参考文献
[1] Carson-Berndsen Julie.Finite-state models,
event logics and statistics in speech recognition
[J].Philosophical Transactions of the Royal
Society A: Mathematical, Physical and Engineering
Sciences,2000,358.
[2] Lixiao Huang,Terri Varnado ,Douglas Gillan.
An Exploration of Robot BuildersAttachment to
Their LEGO Robots[J].Proceedings of the Human
Factors and Ergonomics Society Annual Meeting,
2013,(1).
[3] 李杨.基于智能语音识别的云电视系统设计[J].
中国高新技术企业,2012,(7).
[4] 杨智鑫.移动机器人语音识别系统的研究与实现
[D].北京:北京化工大学,2011.
[5] 张学文,陈小安,梁锡昌.写字机器人运动学分析
及仿真[J].现代制造工程,2009,(10).
[6] 谢光辉,梁锡昌,李伟.一种机器人绘字控制系统
的研制[J].制造业自动化,2007,(2).
[7] 杨晶东,杨敬辉,蔡则苏.基于多目标优化的移动
机器人避障算法[J].上海交通大学学报2012,
(2).
基金项目:本文系西南科技大学实验技术研究项目(14syjs-10);西南科技大学大学生创新基金项目(CX13-053)研究成果。
作者简介:王倩(1991—),女,四川南充人,西南科技大学“智能机器人”创新实践班班长,研究方向:机器人控制技术、机器人运动规划。
图4 画弧示意图
4 机器人驱动及避障的实现
系统利用两个差速电机提供动力,采用L298作为此电机驱动。为解决单个超声波的检测不准确的问题,系统使用3个超声波传感器,通过计算出最小盲区和最小干扰范围,设计出合理的超声波传感器摆放位置。超声波测距的公式为:
L=C×T (7)
式中L为测量的距离长度;T为超声波从发射到接收的时间间隔的一半;C为超声波在空气中的传播速度,计算公式为:
C=C0+0.607×T℃ (8)
C0为零摄氏度时的声波速度332m/s,T为环境当前的摄氏温度,这样补偿了温度变化对于超声波传播速度的影响。
系统依靠3路超声波进行距离测量,得到3个方位的距离数据后进行判断,当距离小于最小避障距离30cm后,底盘上两直流电机形成差速使机器人避障。具体策略如表1所示:
表1 超声波避障策略
传感器编号 策略
左 中 右 左转优先
0 0 0 前进
0 0 1 左转
0 1 0 左转
1 0 0 右转
0 1 1 左转
1 0 1 后退
1 1 0 右转
1 1 1 后退
注:图示:1.进入避障范围;0.不在避障范围
5 语音控制技术
语音控制技术包括语音识别和单片机控制技术。
系统采用以IC公司LD3320语音芯片为核心的ASR(Automatic Speech Recognition)模块,实现语音识别功能。系统通过稳定的算法可完成非特定语音识别,不需要用户事先录音和训练。经测试,在口令触发模式下识别准确率高达95%,非口令触发模式下识别准确率可达70%;内置功放电路,麦克风、立体声耳机和单声道喇叭,方便与芯片管脚连接;用户每次可设置50项不超过79字节的拼音串候选识别句。
语音控制框图如图5所示,图中“LD3320与外围电路”实现将采集到的非特定语音信号转化为数字信号,并与语音库进行信号匹配,确定有用信息及信息内容,并通过串口将有效内容以十进制数方式传递给主控制器,主控制器控制执行机构做出相应动作,同时MP3模块发出提示音。
图5 语音控制框图
6 实验验证及总结
实验证明,本系统能较好地实现早教功能;写字机构运动稳定、噪声小,定位精度达90%,所写字迹清晰,圆润,书写结果正确率达99%;语音控制方便、灵活,识别准确率高达95%。通过使用者与机器人的良好交互,机器人完成的书写效果如图6所示。
图 6 写字效果图
参考文献
[1] Carson-Berndsen Julie.Finite-state models,
event logics and statistics in speech recognition
[J].Philosophical Transactions of the Royal
Society A: Mathematical, Physical and Engineering
Sciences,2000,358.
[2] Lixiao Huang,Terri Varnado ,Douglas Gillan.
An Exploration of Robot BuildersAttachment to
Their LEGO Robots[J].Proceedings of the Human
Factors and Ergonomics Society Annual Meeting,
2013,(1).
[3] 李杨.基于智能语音识别的云电视系统设计[J].
中国高新技术企业,2012,(7).
[4] 杨智鑫.移动机器人语音识别系统的研究与实现
[D].北京:北京化工大学,2011.
[5] 张学文,陈小安,梁锡昌.写字机器人运动学分析
及仿真[J].现代制造工程,2009,(10).
[6] 谢光辉,梁锡昌,李伟.一种机器人绘字控制系统
的研制[J].制造业自动化,2007,(2).
[7] 杨晶东,杨敬辉,蔡则苏.基于多目标优化的移动
机器人避障算法[J].上海交通大学学报2012,
(2).
基金项目:本文系西南科技大学实验技术研究项目(14syjs-10);西南科技大学大学生创新基金项目(CX13-053)研究成果。
作者简介:王倩(1991—),女,四川南充人,西南科技大学“智能机器人”创新实践班班长,研究方向:机器人控制技术、机器人运动规划。