基于ReliefF-NOSCA-AdakNN的肌肉疲劳识别技术研究
2024-05-30李传江吉星照尹仕熠
李传江 吉星照 尹仕熠
摘 要: 針对竞技体育训练中的肌肉疲劳监测问题,提出了一种基于ReliefF-NOSCA-AdakNN(RNA)的表面肌电信号(sEMG)特征提取和分类算法. 该算法结合了特征和类别之间的相关性分析和启发式搜索算法,对高维特征进行了有效的筛选和分类. 将RNA算法应用于经过滤波处理的肱二头肌肌电信号数据,对不同疲劳状态进行了识别和分类. 实验结果表明,提出的RNA算法在平均分类准确率和标准差方面分别达到了83.88%和0.012 7,均显著优于传统单一算法,体现了较好的分类性能.
关键词: 表面肌电信号(sEMG); 特征选择; 肌肉疲劳; 模式识别
中图分类号: TN 911.7 文献标志码: A 文章编号: 1000-5137(2024)02-0205-06
Research on muscle fatigue identification technology based on ReliefF-NOSCA-AdakNN
LI Chuanjiang, JI Xingzhao, YIN Shiyi*
(College of Information,Mechanical and Electrical Engineering,Shanghai Normal University,Shanghai 201418,China)
Abstract: To address the problem of muscle fatigue monitoring in competitive sport training, a surface electromyography (sEMG) feature extraction and classification algorithm based on ReliefF-NOSCA-AdakNN (RNA) was proposed. The analysis of the relevance between features and classes with the heuristic search algorithm, were combined by this algorithm. Besides, high-dimensional features were effectively selected and classified. The RNA algorithm was applied to the filtered biceps brachii sEMG data to identify and classify different fatigue states. The experimental results showed that the proposed RNA algorithm significantly outperformed the traditional single algorithms in terms of average classification accuracy and standard deviation, which reached 83.88% and 0.0127 respectively, demonstrating a good classification performance.
Key words: surface electromyography (sEMG); feature selection; muscle fatigue; pattern recognition
为了避免运动中年轻人因过量运动而导致的肌肉疲劳和损伤,肌肉疲劳状态的实时准确检测具有重要的运动学和医学意义. 表面肌电信号(sEMG)因其能反映浅层肌肉和神经干上电活动在皮肤表面的综合效应,且包含了丰富的肌肉力量信息,成为了检测肌肉疲劳的常用方法. 目前,研究者采用了不同的机器学习方法对sEMG信号进行分类,以检测肌肉疲劳状态.王君洪等[1]使用了基于改进小波去噪和长短期记忆(LSTM)方法识别肌肉疲劳,刘光达等[2]使用果蝇-遗传优化算法-神经网络(FGNN)算法对sEMG信号进行疲劳检测.
针对常规机器学习方法因特征数量过多而导致的计算复杂度高、性能低下和过拟合等问题,本研究将特征选择作为融合算法的一部分,旨在提高肌肉疲劳检测的效率和准确性. 特征选择算法可分为过滤器和启发式算法. 过滤器算法根据特征与类别的相关性或差异性,给特征赋权或评分. 常见的过滤器算法有ReliefF、主成分分析法和互信息法,此类算法计算速度快,但特征选择效果差. 启发式算法利用随机性和概率性的搜索技术,模拟自然界的现象或动物行为,在特征空间中寻找最优特征组合,特征选择效果好,分类准确率高,但计算复杂度高,易陷入局部最优,稳定性差. SAMIEIYAN等[3]使用新型乌鸦算法对特征进行降维,提高了分类准确率. SOUZA等[4]使用二进制粒子群优化(BPSO)方法解决了手写签名验证(HSV)中的过拟合问题.
针对以上特征选择算法的缺点,本文作者提出了一种基于ReliefF-NOCSA-AdakNN(RNA)的新型融合算法. 通过与单个算法进行对照实验发现,该算法可以对数据进行降维,筛选出有代表性的特征子集,并实现良好的分类效果.
1 数据采集和预处理
1.1 实验对象与设备
本研究招募了10位年轻参与者,其中包含8位男性和2位女性,平均年龄为23.5岁,平均身高为174.2 cm,平均体重为67 kg. 使用Noraxon设备记录参与者的表面肌电信号,该设备能够提供2 000 Hz的最大采样频率. 实验使用PC的CPU为AMDR5-5600H,GPU为NvidiaGTX 1650. 研究使用的全部算法均运行在MATLABR2023a环境中.
1.2 数据采集
本实验测量了人体右手臂肱二头肌在举哑铃时的肌电信号. 首先,用磨砂膏和酒精棉清洁皮肤表面,减少皮肤阻抗的干扰,并将两个差分电极贴合在肱二头肌突起的最高位置. 采集过程中,受试者恒力托举哑铃,保持正坐姿势,采集负重状态下的肌电数据,操作员记录受试者的主观疲劳等级量表(RPE)值和时间,如图1所示. 实验采用被测试者根据自身主观疲劳感受而主动报告的RPE值划分疲劳程度,RPE值为6~10,疲劳程度为轻松态;RPE值为11~18,疲劳程度为疲劳过渡态;RPE值为19~20,疲劳程度为疲劳态[5].
1.3 sEMG信号数据预处理
本研究对原始信号设置50~200 Hz的通频带进行滤波处理,以抑制白噪声和工频干扰[6]. 为了排除实验开始和结束时刻的干扰,去除了第1 秒和最后1 秒的sEMG信号,并把剩下的信号按照受试者的主观感受分割成200 ms的滑动窗口,增量为40 ms(重叠程度为20%).
1.4 特征提取
本研究从采集到肱二头肌的肌电信号中提取出共计33种时域和频域特征. 经典的时域特征包括均方根值(RMS),积分肌电值(iEMG),方差(VAR)和过零率(ZC)等. 经典的频域特征包括平均频率(MNF)、平均功率(MPF)和中值频率(MDF)等[7].
2 RNA算法
2.1 基于ReliefF算法的特征权重估计
针对肌肉疲劳识别中不同肌电特征的关联紧密度差异,首先使用ReliefF算法根據特征的类别和相关性赋予特征权重,进行初步筛选. 具体而言,对于每个信号特征,随机选择一个样本,并确定其所属的类. 接着在的同类样本中找出个最近邻的样本,以及在的异类样本中找出个最近邻的样本. 如果样本在肌电信号特征上与的距离小于(或大于)与的距离,表明该特征对信号的分类效果有益(或起到了负面作用),则增加(或减少)该特征的权重[8].
2.2 基于NOCSA算法的特征筛选
乌鸦算法是一种基于乌鸦社会行为的元启发式算法,可判断特征对所采集的肌电信号分类效果影响是否较大,但其对初始条件较为敏感,在选择特征子集之前,需要对其进行排序,从而得到较好的分类效果和较高的运算效率. 此外,传统的乌鸦算法容易陷入局部最优解,因此运用引入动态感知概率(DAP)机制的新型乌鸦算法NOCSA,进一步精简所选择的新特征子集[9]. 使用二进制对肌电信号对ReliefF排序后的前m个特征子集进行编码,作为乌鸦的位置信息,使用0和1分别代表该特征是否被选择. 按照乌鸦位置更新规则对特征子集进行迭代优化,同时以AdakNN模型的分类精度和所选特征子集的特征数作为适应度函数. NOCSA步骤如下:
(1) 随机生成初始乌鸦种群;
(2) 计算种群中每只乌鸦的适应度并排序;
(3) 根据DAP机制,使适应度较低的乌鸦进行局部搜索,生成一个随机的特征逻辑数组;使适应度较高的乌鸦进行全局搜索,创建一个包含20%新特征的逻辑数组,并与当前逻辑数组进行合并;
(4) 重复步骤(2)、(3),直至算法收敛,输出适应度最高的个体所选择的特征子集.
2.3 基于AdakNN算法的分类器
K近邻(KNN)分类中存在超参数值难以寻优且数据集类别不平衡的问题,本文作者运用加入了前馈多层感知器(MLP)和全局不平衡处理方案(GIHS)的AdakNN算法,验证NOCSA中乌鸦位置的优劣,并且作为分类器对肌肉疲劳状态进行识别[10].首先,根据每个类别的数据量为其分配一个全局權重,然后,初始化超参数,计算测试集中每个样本与训练集中所有样本的距离,并选取距离最近的个样本的类别标签,最后,根据类别标签的计数结果确定预测类别,并利用MLP,根据预测准确率,动态调整超参数的取值.
综上,RNA算法融合了ReliefF、NOCSA和AdakNN三种算法的优势. 其中,ReliefF算法负责初步的特征筛选,有效避免了启发式算法对初始条件过多依赖的问题. NOCSA有效解决了单独使用ReliefF算法时对噪声过于敏感的问题,显著提升了整个算法的稳健性. AdakNN算法起到了精确评估特征子集分类效果的作用. 图2展示了RNA算法的完整流程.
3 实验与分析
为了验证所提算法的先进性和有效性,选择了过滤式特征选择算法和启发式特征选择算法中最经典和广泛的两种算法(互信息法和遗传算法)进行对比,结果如表1所示.
实验结果表明,本研究提出的RNA算法获得了最优的识别精度(83.88%),筛选出11个有效的特征,在保证了分类准确率的前提下,比其他算法减少了3%~9%的运行时间,表明了其在搜索空间中具有强大的探索能力. 此外,RNA算法在重复实验中获得了最低的标准差值,表明该算法具有良好的分类稳定性. 综上所述,RNA算法在保证快速运行的同时,不仅维持了较高的识别精度,还对特征有较精确的约简能力.
图3中展示了三种算法的F1分数,RNA算法的F1分数为0.81,而互信息法和遗传算法的F1分数分别为0.75和0.74,说明RNA算法在分类问题上具有明显的优势. 选取了一位受试者的数据样本,绘制了RNA算法识别肌肉疲劳状态的混淆矩阵,如图4所示. 混淆矩阵展示了模型在特定类别上的性能表现. 矩阵的行表示实际类别,列表示预测类别. 对角线上的元素(54,48,48)代表了正确分类的实例数量,相应的百分比分别为29.7%,26.4%,和26.4%,显示了模型在各个类别上的准确性,表明该算法能够较好地识别出正确的类别,同时也能全面地覆盖所有的类别.
4 结论
本文作者提出了一种基于RNA融合算法的sEMG肌肉疲劳分类方法. 该融合算法结合了ReliefF、NOCSA和AdakNN的优势,有效缩减了特征数量,提高了分类准确率和稳定性,解决了单一算法对噪声敏感和容易陷入局部最优解的问题. 实验结果表明,该方法在sEMG肌肉疲劳识别问题上具有较强的性能和竞争力. 未来的工作将致力于提升sEMG信号处理和算法运行的效率,探索更低延迟的人机交互技术.
参考文献:
[1] 王君洪, 孙少明, 孙怡宁, 等. 基于改进小波去噪和长短时记忆网络的肌肉疲劳识别模型研究 [J]. 生物医学工程学杂志, 2022, 39(3):507-515.
WANG J H, SUN S M, SUN Y N, et al. Research on muscle fatigue recognition model based on improved wavelet denoising and long short-term memory [J]. Journal of Biomedical Engineering, 2022,39(3):507-515.
[2] 刘光达, 许蓝予, 肖若兰, 等. 基于FGNN算法的sEMG肌肉疲劳分类方法 [J]. 科学技术与工程, 2022,22(19): 8370-8377.
LIU G D, XU L Y, XIAO R L, et al. Muscle fatigue classification method of sEMG signal based on FGNN algorithm [J]. Science Technology and Engineering, 2022,22(19):8370-8377.
[3] SAMIEIYAN B, MOHAMMADINASAB P, MOLLAEI M A, et al. Novel optimized crow search algorithm for feature selection [J]. Expert Systems with Applications, 2022,204:117486.
[4] SOUZA V L F, OLIVEIRA A L I, CRUZ R M O, et al. Improving BPSO-based feature selection applied to offline WI handwritten signature verification through overfitting control [C]// Proceedings of the 2020 Genetic and Evolutionary Computation Conference Companion.Cancún: ACM,2020:69-70.
[5] FOSTER C, FLORHAUG J A, FRANKLIN J, et al. A new approach to monitoring exercise training [J]. The Journal of Strength and Conditioning Research, 2001,15(1):109-115.
[6] JUNIOR J J A M, PONTIM C E, DIAS T S, et al. How do sEMG segmentation parameters influence pattern recognition process? An approach based on wearable sEMG sensor [J]. Biomedical Signal Processing and Control, 2023, 81: 104546.
[7] ZHOU B Y, CHEN B, SHI H J, et al. SEMG-based fighter pilot muscle fatigue analysis and operation performance research [J]. Medicine in Novel Technology and Devices, 2022,16(4):345-349.
[8] 何涛, 胡洁, 夏鹏, 等. 基于ReliefF算法与遗传算法的肌电信号特征选择 [J]. 上海交通大学学报, 2016,50(2):204-208.
HE T, HU J, XIA P, et al. Feature selection of EMG signal based on ReliefF algorithm and genetic algorithm [J]. Journal of Shanghai Jiaotong University, 2016,50(2):204-208.
[9] GONG W Y, CAI Z H. Differential evolution with ranking-based mutation operators [J]. IEEE Transactions on Cybernetics, 2013,43(6):2066-2081.
[10] MULLICK S, DATTA S, DAS S. Adaptive learning-based k-nearest neighbor classifiers with resilience to class imbalance [J]. IEEE transactions on neural networks and learning systems, 2018,29(11):5713-5725.
(責任编辑:包震宇,顾浩然)
DOI: 10.3969/J.ISSN.1000-5137.2024.02.009
收稿日期: 2023-12-25
作者简介: 李传江(1978—), 男, 教授, 主要从事智能机器人、 先进控制理论及其应用等方面的研究. E-mail: licj@shnu.edu.cn
* 通信作者: 尹仕熠(1985—), 男, 讲师, 主要从事智能传感、 应用数学、 多物理场建模、 人工智能、 流体测量、 智能优化算法、 机器人控制等方面的研究. E-mail: yinshiyi@shnu.edu.cn
引用格式: 李传江, 吉星照, 尹仕熠. 基于ReliefF-NOSCA-AdakNN的肌肉疲劳识别技术研究 [J]. 上海师范大学学报 (自然科学版中英文), 2024,53(2):205?210.
Citation format: LI Chuanjiang, JI Xingzhao, YIN Shiyi. Research on muscle fatigue identification technology based on ReliefF-NOSCA-AdakNN [J]. Journal of Shanghai Normal University (Natural Sciences), 2024,53(2):205?210.