基于PSO-LSTM 模型的上肢动作识别方法
2024-11-04常钰坤曹港生马振九康高峰夏春明
摘要:针对上肢肌音信号(Mechanomyography,MMG) 动作识别准确率不高的问题,提出一种基于粒子群算法(PSO) 与长短期记忆网络相结合的混合模型(Particle Swarm Optimization-Long Short Term Memory,PSO-LSTM) 的动作识别方法。采用5 通道传感器对受试者进行上肢肌音信号采集,使用巴特沃斯滤波(Butterworth Filter) 等方法对肌音信号进行预处理,并进行特征提取;构建基于PSO-LSTM 的上肢肌音信号识别模型并进行模型训练和测试;最后从不同测度对比了长短期记忆(LSTM) 模型、麻雀搜索算法(Sparrow Search Algorithm,SSA) 优化的LSTM模型(Sparrow Search Algorithm-Long Short Term Memory, SSA-LSTM) 以及PSO-LSTM 模型的实验结果。结果表明, PSO-LSTM 模型的准确度均高于LSTM、SSA-LSTM 模型, 达到96.9% 左右,在迭代损失、迭代速度等方面也优于LSTM、SSA-LSTM 模型,从而证明了该模型用于上肢肌音信号识别的优越性。
关键词:肌音信号;动作识别;粒子群算法;长短期记忆;特征提取
中图分类号:TN911.72 文献标志码:A
上肢是人体的重要部位,其包括手部、前臂、肘部、肩膀等,是人类肢体功能运动的主要承担者。很多社会工作以及个人生活都离不开人体上肢的活动,上肢功能的健全对个人生活质量的影响不可忽视[1]。据统计中国每年新增脑卒中患者约240 余万,现有脑卒中幸存者1 100 多万[2],而脑卒中对上肢的影响比下肢更为严重。开发针对上肢功能患者的康复机器人,是改善患者健康状况的重要手段[3],目前越来越多的研究人员把目光投向脑卒中后可穿戴外骨骼机器人[4],希望通过识别患者上肢肌音信号来读取患者的行为意图,从而控制外骨骼机器人来帮助患者实现一系列上肢动作。
肌音信号(Mechanomyography, MMG) 是一种记录和量化骨骼肌肌纤维的低频横向振动信号[5],与肌电信号相比,其具有采集成本低、抗干扰能力强等优点[6],并且可以在不接触皮肤的情况下直接进行采集,对采集时受试者着装要求低[7],且在肌肉收缩疲劳时仍有较高的准确率[8]。目前,国内外大多数基于肌音信号的动作识别大多集中在上肢部分[9],研究方向主要在特征选择、识别模型改进等方面。张松等[10] 提出一种单通道表面肌电信号(SurfaceElectromyography, sEMG) 分解与长短期记忆(LSTM)神经网络相结合的手势识别方法,取得了较高的准确率,这为本文选用LSTM 为主要识别模型提供了思路,但其在文中并没有说明LSTM 模型的初始学习率,以及如何选取中间层神经元数目的问题,因而可能导致由于LSTM 神经网络的超参数选取不当,导致识别准确率下降。Alves 等[11] 对上肢进行了两通道MMG采集,实现了3 种上肢动作的分类,但其采用的是瞬态信号,其模型在是否能在稳态信号分类中达到较高成功率上仍存疑。Geng 等[12] 提出了基于卷积神经网络(Convolutional Neural Networks,CNN) 的手部动作识别方法,但其建立的模型存在严重的过拟合的问题,导致识别准确率略低。Hu 等[13]通过在Geng 等[12] 提出的卷积神经网络的基础上加入了LSTM 层,使得识别准确率再次提高到 99.7% ;Sadiq 等[14] 提出了基于支持向量机和k-近邻算法混合模型( Support Vector Machines-k-Nearest Neighbor,SVM-KNN) 的识别模型,其识别准确率达到98.97%,表明了SVM 和KNN 的多类分类框架对肢体肌电信号识别有着较好的适应性;Zhang 等[15] 提出了基于视觉变压器的下肢运动识别方法, 准确率达到了94.62% 以上,其采用基于视觉变压器的识别方法,成功避免了机器学习本身带来的一些问题,如特征提取和特征选择等过程带来的一些问题,对未来的下肢运动识别模型的改进提供了新思路。