APP下载

GA优化的RBF神经网络外骨骼灵敏度放大控制

2015-09-03杜志江王伟东

哈尔滨工业大学学报 2015年7期
关键词:外骨骼权值矢量

龙 亿,杜志江,王伟东

(机器人技术与系统国家重点实验室(哈尔滨工业大学),150001哈尔滨)

穿戴式外骨骼机器人,与人体高度贴合,可增强人体的力量与耐力,缓解人体疲劳.BLEEX下肢外骨骼机器人是由美国加利福利亚Berkeley分校研制的,于2004年进行了样机试验.BLEEX采用液压驱动系统,所有传感器安装在外骨骼机器人上,包括力/力矩传感器、位置码盘等,所提出的控制方法称为灵敏度放大控制(sensitivity amplification control,SAC)[1-2].在SAC 中,灵敏度被定义为外骨骼的输出运动信息与人机交互信息之间的关系,所以如果控制灵敏度在合适范围内,就可以减小人机交互作用,使外骨骼实现高度跟随人体运动轨迹.SAC方法是基于模型的控制,其控制效果取决于系统动态模型的精确程度,而外骨骼机器人是多自由度的非线性系统,要建立其精确的数学模型非常困难[3].神经网络在机器人系统的动力学辨识方面得到了广泛的应用[4-5].如下肢外骨骼的动力学精确模型的建立,一是离线的BP网络训练;二是系统的模式识别.运用BP网络来学习外骨骼的逆模型,网络的输入层为外骨骼关节的运动参数(角度、角速度、角加速度),输出为力矩,采用正模型来获取实验数据,离线学习得到BP网络[6].然而,BP网络每一次学习都需要重新调整权值,收敛速度慢,离线学习得到的BP网络的泛化能力难以得到保证.基于外骨骼单腿的三连杆模型,使用最小二乘法,运用实验手段对外骨骼模型中的参数(如刚度力矩、摩擦力等)进行了辨识[7],但是全部过程需要大量的实验数据,耗时长.

针对外骨骼机器人系统有效地在线学习方法报道很少,本文设计了一种基于遗传算子(GA)优化的径向基函数(RBF)网络在线学习方法,获取外骨骼机器人的动力学模型,并将模型用于SAC中.

1 灵敏度放大控制原理

1.1 灵敏度放大控制的定义

灵敏度放大控制(SAC)是美国Berkley外骨骼系统(BLEEX)采用的控制方法,其控制原理如图1.其中,Ghm是人机交互模型,Gexo是外骨骼的动力学模型,Td是外部干扰力矩,包括人施加的人机作用力以及环境的干扰力,Ta是外骨骼驱动器施加的力矩,q=[q,,]为外骨骼的输出轨迹参数.

由图1可得

定义系统的灵敏度为

S表示外骨骼的输出轨迹对外在力的感应程度,S越大,表示Td对q的影响越大.

考虑人机交互力矩以及机构的阻尼、摩擦等,将图1改写为闭环的形式,如图2所示,其中,Thm是人机交互力矩,Ta是驱动器施加的力矩,α是放大系数,G'exo是外骨骼的逆动力学模型,qhm人体运动轨迹,即是外骨骼的目标运动轨迹.一般地,Ta=(1-α-1)G'exo,那么可以推导出新的灵敏度为

图1 SAC原理

图2 SAC闭环控制

1.2 SAC控制律

外骨骼实体机构如图3所示,每一条腿有两个主动自由度,踝关节不加驱动,驱动部分由液压缸完成.不失一般性,外骨骼机器人的动力学方程可以表示为

其中:M(q)∈R2×2是惯性项,C(q,)∈R2×2是阻尼与摩擦项,G(q)∈R2×1是重力项,T∈R2×1是关节力矩,D∈R2×1为未建模动力学以及干扰项.

图3 外骨骼机器人模型

在SAC中,设计控制律为[8]

在式(1)中,T=Ta+Thm,可得

式(3)表明,α越大,Thm越小,即是灵敏度增大了,人机交互力矩就会减小,外骨骼的跟随性就会越好.

2 GA优化RBF

RBF的性能很大程度上取决于中心矢量、基宽度参数以及权值,用GA优化RBF结构能够获得较好的性能[9-11].本文权值由设定的算法进行在线更新,在已知输入值范围的条件下,用GA优化出RBF网络最佳的中心矢量与基宽度.

GA优化RBF网络流程见图4.

图4 GA优化RBF网络的基本流程

设定进化代为G=250,种群规模为30,编码长度为10.要设计的RBF网络是用来学习外骨骼动力学方程中的矩阵M(q)、C(q,)以及G(q),分别通过GA获得相应的中心矢量

式中:cM、cC、cG为中心矢量,N为隐含层节点数.基宽度可以由下面的经验式获得:

式中:bM、bC、bG为基宽度,cMmax,cCmax,cGmax为中心矢量元素的最大间隔.进行GA优化,得到优化后的 RBF网络的基宽度与中心矢量.对学习M(q)的RBF网络,GA优化RBF网络的结果如图5,迭代到20代左右即可获得最佳个体.

图5 GA优化中心矢量与基宽度的收敛过程

3 RBF在线学习外骨骼动力学模型

外骨骼机器人系统由于其高度的非线性以及外部环境的影响,很难求得精确的动力学模型,借助神经网络的学习能力,构造一种在线学习的RBF网络,可获取更为准确的动力学方程.本文提出了RBF网络在线学习外骨骼动力学模型(1)中的矩阵M(q)、C(q,)以及G(q).在RBF的结构中,输入向量为X=[x1,x2,…,xn],映射到隐含层采用高斯径向基函数

式中:N为隐含层节点数,Hj为jth节点隐含层的输出,bj为jth节点的基宽度,cj为jth节点中心矢量.

外骨骼的动力学模型中,矩阵M(q)、C(q,)以及G(q)是关于关节角度、角速度的矩阵.对于M(q)、C(q,)以及G(q),基于(4)中的中心矢量与基宽度,输入矢量分别为关节角度与角速度的组合,通过高斯径向基函数,可以得到隐含层的输出为

其中,输入矢量分别为

式中:bM(j)、bC(j)、bG(j)分别为jth节点的基宽度,cM(j)、cC(j)、cG(j)分别为jth节点的中心矢量,t是时间变量,学习过程如图6,输入是关节的角度(角速度),经过隐含层的映射,然后与当前时刻的权值相乘,加和后即可得矩阵(q)(q,),(q))输出的元素,每个时刻对权值进行在线更新.

设外骨骼跟随人体轨迹的角度、角速度、角加速度误差为

式中:qh(t)是人体轨迹,q(t)是外骨骼轨迹,定义s(t)(t)+λe(t),其中,λ是正常数,定义等效速度与等效加速度为

式中:κ是正常数.权值的更新是根据实际的轨迹误差以及误差变化率构造的,权值更新的表达式如下[12-13]:

式中:WM-1(j)、WC-1(j)、WG-1(j)为初始权值矩阵,WM(j)、WC(j)、WG(j)是更新后的权值矩阵,η是学习速率.经过RBF网络学习后,网络的输出为

所以,控制律(2)改写为

图6 RBF在线学习动力学模型的M(q)矩阵

控制框图如图7所示.

图7 在线学习动力学方程的SAC控制框图

4 Matlab仿真结果

图3所示的外骨骼主动自由度包括髋关节、膝关节,踝关节为被动自由度.根据临床步态实验[14],一个步态周期内髋关节、膝关节的轨迹如图8,将获得的离散点拟合为时间t的(周期为2 s)方程:

图8 人体临床步态髋关节、膝关节运动轨迹

取采样周期为Ts=0.001 s,0≤t≤2,应用控制律(5),控制外骨骼机器人跟踪(6)所示的曲线,得到的跟随效果如图9.图9表明,外骨骼的关节轨迹与人体的行走轨迹基本吻合,实现了高度地跟随.跟随的误差曲线如图10,可以看出,误差在0的小邻域内变化,基本能够收敛到0.为了说明GA对RBF网络的作用,常规的RBF与优化后的RBF比较结果如图11、12所示.优化后的RBF网络跟踪误差更小,优化后的RBF网络SAC控制使得人机交互信息基本稳定地保持在0的小邻域内,人机交互信息的减小,表明了外骨骼能够高度跟随人体的运动轨迹.

图9 RBF在线学习SAC的人体轨迹跟踪

图10 RBF在线学习SAC的轨迹跟踪误差

图11 人体轨迹跟踪误差对比曲线

图12 人机交互力矩对比曲线

5 结论

1)利用GA优化出满足适应度函数要求的RBF神经网络最佳中心矢量与基宽度,能够一定程度上改善RBF网络的映射能力.

2)设定的在线RBF学习过程只作权值的更新,通过设定的算法在线计算外骨骼机器人的动力学模型.

3)GA优化的RBF网络与没有优化的RBF网络的SAC控制比较表明,GA优化的RBF网络在跟随人体运动轨迹时有较高的精度以及较小的人机交互力矩.

4)基于GA优化的RBF网络学习外骨骼动力学模型的方法是可行的,实现SAC控制方法精确控制,但实际应用需要试验验证.

[1]KAZEROONI H,STEGER R,HUANG L.Hybrid control of the Berkeley Lower Extremity Exoskeleton(BLEEX)[J].The International Journal of Robotics Research,2006,25(5/6):561-573.

[2]ZOSS A B,KAZEROONI H,CHU Andrew.Biomechanical design oftheBerkeleyLowerExtremityExoskeleton(BLEEX)[J].IEEE/ASME Trans on Mechatronics,2006,11(2):128-138.

[3] GHAN J,STEGER R,KAZEROONI H.Control and system identification for the Berkeley Lower Extremity Exoskeleton(BLEEX)[J].Advanced Robotics,2006,20(9):989-1014.

[4]JIANG Z,ISHIDA T,SUNAWADA M.Neural network aided dynamic parameter identification of robot manipulators[C]//Proceedings of IEEE International Conference on Systems,Man and Cybernetics.Taipei:IEEE,2006:3298-3303.

[5] BIDYADHAR S.DEBASHISHA J.Nonlinear system identification using memetic differential evolution trained neural networks[J].Neurocomputing,2011,74(10):1696-1709.

[6]杨智勇,归丽华,杨秀霞,等.骨骼服神经网络灵敏度放大控制方法[J].吉林大学学报:工学版,2009(3):824-829.

[7] GHAN J,KAZEROONI H.System Identification for the Berkeley Lower Extremity Exoskeleton(BLEEX)[C]//Proceedings of IEEE International Conference on Robotics and Automation.Orlando:IEEE,2006:3477-3484.

[8]杨智勇,张远山,顾文锦,等.骨骼服灵敏度放大控制方法研究[J].计算机仿真,2010(1):177-180.

[9] WANG Hongfa,XU Xinai.Applying RBF neural networks and genetic algorithms to nonlinear system optimization[J].Advanced Materials Research,2012,605-607:2457-2460.

[10]DING Shifei, XU LI, SU Chunyang, et al.An optimizing method of RBF neural network based on genetic algorithm [J]. Neural Computing &Applications,2012,21(2):333-336.

[11]WANG Binli,BAI Guangliang,WEI Zhaolan.Bridge safety evaluation by RBF neural network with genetic algorithm[C]//Proceedings ofIEEE International Conference on Information and Financial Engineering(ICIFE).Chongqing:IEEE,2010:563-566.

[12]GE S S,HANG C C,WOON L C.Adaptive neural network control of robot manipulators in task space[J].IEEE Trans on Industrial Electronics,1997,44(6):746-752.

[13]刘金琨.机器人控制系统的设计与MATLAB仿真[M].北京:清华大学出版社,2008:31-158.

[14]KIRTLEY C.CGA normative gait database[DB/OL].[2014-06-5].http://www.clinicalgaitanalysis.com/data/.

猜你喜欢

外骨骼权值矢量
下肢外骨骼康复机器人的研究与发展
一种融合时间权值和用户行为序列的电影推荐模型
一种适用于高轨空间的GNSS矢量跟踪方案设计
矢量三角形法的应用
昆虫的外骨骼
CONTENTS
一种可穿戴式外骨骼康复机械手结构设计
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
基于矢量最优估计的稳健测向方法