APP下载

肌音信号的采样率与截止频率对识别率影响研究

2022-09-09姚佳旭夏春明章含阳王新平

现代电子技术 2022年17期
关键词:截止频率高通识别率

姚佳旭,夏春明,2,章含阳,章 悦,王新平

(1.华东理工大学 机械与动力工程学院,上海 200237;2.上海工程技术大学 机械与汽车工程学院,上海 201620)

0 引 言

肌音信号(Mechanomyography,MMG)是由肌肉运动时肌肉纤维尺寸变化而产生的一种生物医学信号,它在测量上具有非侵入性和无创伤的优点。肌音信号可以反映人体的一些生理状态,在临床医学肌肉的健康诊断例如肌肉的力学特性、疲劳特性等方面有重要的实用价值。近年来,肌音信号在人机交互系统上也在发挥着巨大的作用。文献[4]通过采集头部的肌音信号实现了六种头部动作的模式识别,准确率到达91%,并成功控制了模型小车的左右前后加速减速运动。还有基于肌音信号的外骨骼机器人、基于手部动作识别的虚拟交互游戏等,利用肌音信号实现人机交互的前提是肌音信号可以准确地识别出人体的动作,而模式识别需要使用采集设备对信号进行采集并存储。其中信号采样率和截止频率是关键的部分。根据奈奎斯特采样定理可知,采样频率应大于信号最高频率的2 倍。而肌音信号的频率在2~120 Hz,为了遵循奈奎斯特采样定理,采样率应该设置为240 Hz 以上。但在实际的数据采集过程中采样率的选择千差万别,缺少相应的理论和实验研究支持,如文献[7]建议采样频率应该为信号最高频率的3~10 倍,可以更好地得到信号所包含的信息;文献[8]指出对于最高频率为400 Hz 的肌电信号,400 Hz 的采样率即可实现与1 000 Hz 采样率相近的识别率精度。对于信号的采样频率,学者们有着不同的结论。肌音信号的模式识别目前常用的采样率为1 000 Hz,但高采样频率会导致计算的复杂性偏高,处理时间变长,难以实现实时处理,使得人机交互的发展受到限制。对于计算能力有限的处理器,更希望有着较少的计算量。文献[11]所设计的基于肌音信号的哑语翻译器采样率为333 Hz,也达到了97.5%的识别率。所以,有必要探究肌音信号的采样率对识别率的影响以及可以同时兼顾识别准确性和成本效益的最优采样率。

肌音信号通常使用带通滤波器以消除噪声,使用正确的带通滤波器对模式识别有着重要意义。根据奈奎斯特定理,一般低通滤波器的截止频率小于或等于采样率的一半,高通截止频率一般是为了消除运动伪影。目前肌音信号所采用的高通截止频率为2 Hz 或5 Hz,处于低频段的信号可能包含对模式识别具有重要意义的信息。

1 实验设备与方法

1.1 受试者信息

本研究分别对7 名从未有神经肌肉病史的受试者进行了肌音信号的离线采集。其中包含5 名男性和2 名女性,年龄在22~25 岁之间。在实验的24 h 之内,受试者都没有进行剧烈运动,并签署了同意书。

1.2 实验和数据采集

本实验采用八通道ADXL354 加速度传感器采集肌音信号,该传感器可以实现,,三个方向的肌音信号数据采集,该实验选取传感器轴方向的信号作为输出。

通过NI 公司的9205 采集卡对八通道数据进行同步采集,采样频率为1 000 Hz,通过A/D 转换将信号传输到上位机,所使用的低通滤波器截止频率为2 Hz。本实验总共采集了8 个动作,分别为握拳、伸掌、腕屈、腕伸、手腕桡偏、手腕尺偏、小臂内旋、小臂外旋,如图1所示。受试者要求跟随屏幕上的动作演示进行相应的动作,以相同和舒适的用力进行运动。每个动作重复100次,每相邻两个相同动作之间有一定的间隔。为了缓解肌肉疲劳,受试者在不同的动作之间休息5~10 min。

图1 八种手势动作

1.3 信号处理

动作的活动段分割可以从连续的信号中去除无用的信号,提取出单个的活动段,以便后续处理。本实验使用指数加权平均的方法进行活动段分割,首先提取8 个传感器即8 个通道内的信号值,进行去零漂;然后使用加权移动平均法处理每个时刻的数据,将处理后的数据与原始数据做差,从而得到每个时刻信号的波动情况;再使用固定长度的数据窗对信号进行积分,从而得到信号段的能量,通过设定能量阈值,取阈值点前后一段的信号作为活动段进行后续的分析处理。具体方法如图2所示。该方法可以有效地区分活动段与非活动段,不需要提取时域信号进行频谱分析,大大减少了信号处理的时间。

图2 加权移动平均法分割信号

特征提取使用每个信号段里的4 个常见的时域特征,包括均方根(Root Mean Square,RMS)、绝对平均幅值(Mean Absolute Value,MAV)、波形长度(Waveform Length,WL)和均方差(Variance,VAR)。将每一个样本分割动作段后提取特征,贴上动作标签后随机打乱顺序。

为了得到可靠稳定的模型,经常使用交叉验证。交叉验证是分类时常用的方法,可以降低模型过拟合,提高分类器的泛化能力。本实验使用五折交叉验证来验证识别结果,取80%的数据作为训练集,20%的数据作为测试集。采用五折交叉验证法时,训练集会被等分为5 份,其中4 份作为训练对象,剩下1 份作为验证集,重复5次,这样每一份都有一次机会作为验证集。最后用训练后的模型对测试集进行测试,验证分类效果。

本文分别采用线性判别式分析(Linear Discriminant Analysis,LDA)、支持向量机(Support Vector Machine,SVM)、K 最近邻(K-Nearest Neighbor,KNN)、朴素贝叶斯(Naive Bayes,NB)分类器进行手势识别的分类,并比较不同判别方式的优劣。

1.4 实验方法

对于每一个受试者,通过1 000 Hz 的采样率采集原始肌音信号进行手部动作识别,并使用Matlab 进行数据保存和分析。为了判断不同采样率对肌音信号识别的影响,本实验对原始信号进行重新采样,采样频率在4~1 000 Hz 之间,选择13 个不同的频率进行间隔选择,然后对每个频率下的信号重新进行模式识别。在信号重采样中,Matlab 使用了一定的抗混叠(低通)有限脉冲响应(FIR)滤波器。为了判断高通截止频率对信号识别率的影响,本实验使用不同的高通截止频率对信号进行处理,在截止频率为2~50 Hz 之间选取11 个截止频率。滤波器选择的是6 阶巴特沃斯滤波器。

2 结果与分析

2.1 采样率对分类结果的影响

在对肌音信号使用不同频率进行采样时,高通滤波器截止频率始终保持为2 Hz。不同采样率对肌音信号手部动作的识别率如图3所示。

图3 不同采样率信号的动作识别率

从图3 中可以看出,LDA、SVM、KNN、NB 四种分类器的识别率均随着采样频率的降低而下降,其中LDA、SVM、KNN 识别效果比较相近,但NB 的识别率在整个采样频率段最低,可能的原因是朴素贝叶斯的前提条件是假设各特征属性之间是相互独立的。但本实验中的4 个特征会有一定的相似度,前提条件不完全成立,并且朴素贝叶斯是通过先验和数据以确定后验的概率,从而决定如何分类,所以分类决策时可能会有一定的误差。从图3 中还可以看出,当采样频率频率从1 000 Hz下降到300 Hz 时,识别率从99.42%下降到98.23%,下降比较缓慢。为了验证下降趋势,手势识别率是否为显著下降(2%以内),本研究使用单样本t 检验判断识别率的下降趋势(使用SVM 算法进行计算)。

首先建立检验假设,确定校验水准。检验假设H0:当采样频率从1 000 Hz 下降到300 Hz 时,分类器的识别率显著下降,即超过2%;假设H1:当采样频率从1 000 Hz 下降到300 Hz 时,分类器的识别率没有显著下降,即不超过2%。校验水准为0.05。使用SVM 分类器的结果作为验证,随机选取80%数据作为训练集,20%数据作为测试集。重复30次后,分别得到30 组1 000 Hz 频率下的识别率与30 组300 Hz 频率下的识别率。经过计算相对应每一组识别率的差值,得到样本的均值ˉ=0.013 75,样本方差=0.000 109 9。首先假设H0 成立,即手势识别率下降超过2%,需要求出在假设成立条件下,随机得到30 个样本或比样本更加极端的概率。由于样本量较小,所以该统计量服从自由度为29 的分布,即:

式中的值为0.02。

将样本均值和样本方差代入上式,得到值为-3.265 4,通过查阅相关表格计算可得值为0.002 81,即比此值更极端的值发生的概率为0.002 81,小于校验水准0.05,即拒绝原假设,选择备选假设H1,即使用SVM 对本次数据集进行分类时,当频率从1 000 Hz 下降到300 Hz,分类的准确率小于2%。使用其他三种分类器也是相同结论。从图3 中可以看出,当采样频率从40 Hz 下降到10 Hz 时,分类器的识别率从95.62%下降到89.27%,发生显著下降。根据奈奎斯特采样定理,即采样率要大于被测信号最高频率分量的2 倍,可以推断出,手势识别所依赖的信号频段有一部分集中在5~20 Hz。为了验证这个结论,对原始的肌音信号进行频谱分析,得到的频谱图如图4所示。从图中可以看出,肌音信号的频率有很大一部分集中在5~20 Hz,与本研究得到的结论比较相近。

图4 肌音信号频谱图

图5是不同采样频率下肌音信号的波形图。从图中可以看出1 000 Hz与500 Hz的波形图比较相似,300 Hz的波形图也比较正常,但100 Hz 的波形图与上述3 种波形图存在较大差异。这主要的原因是随着采样率的下降,数据点会相应地减少。在连接相邻两个点时,图像会变得不光滑。从信号的频谱图也可以看出,在初始阶段采样率降低时,仍然包括大量的低频信号,信号的损失并不大,仍然可以用于手势识别。但当采样率降低到一定程度时,会损失一些较为重要的信号,使得手势识别率降低。

图5 不同频率下的波形图

为了判断单个特征对信号的识别率,使用上文中的4 个特征和不同的分类器进行动作的识别,得到的识别率如表1所示。从表1 中可以看出,4 个特征的识别率都是随着采样率的降低而下降。当采样率从1 000 Hz下降到300 Hz 时,识别率缓慢下降。当采样率从40 Hz下降到10 Hz 的时候识别率显著降低,这与上文4 个特征一起使用的趋势相似。其中RMS、VAR、MAV 的识别率大致相同,WL 的识别率相对于其他3 个特征识别率较低,可能的原因是WL 是波形长度,代表了肌音信号的复杂度,8 个动作的手势较相近,信号复杂度差别不大,故识别率相对较低。

表1 单一特征使用不同分类算法和采样率对识别率的影响 %

2.2 高通滤波器截止频率对分类结果的影响

对于不同的高通截止频率,采样频率保持为1 000 Hz,使用RMS、VAR、MAV、WL 四个特征。图6 为不同高通滤波器截止频率对不同分类器识别率的影响。

从图6 中可以看出,分别使用4 个分类器时肌音信号的识别率随着高通截止频率的增加而呈下降趋势,在截止频率为2~5 Hz 时,识别率从99.42%下降到98.24%(以SVM 为例),下降得并不明显,只有略微降低;截止频率在5 Hz 之后,分类器的识别率显著降低,其中朴素贝叶斯分类器对截止频率的变化最为敏感,下降幅度较大。研究说明在模式识别中,肌音信号在低频段有重要的信息,在选择高通截止频率时,应选择较低的频率。

图6 不同高通截止频率的动作识别率

3 结 语

肌音信号是一种具有非侵入式特点的生物医学信号,能用来研究许多人体肌肉特征。对于不同的研究,可能所需要的信号频带有所不同。一些研究需要精确的肌音信号的波形,来分析信号的一些特性,如信号幅度。在模式识别和人机交互技术上,则需要信号提供能区分运动分类的准确信息。使用较高的采样率可以得到更多信号所包含的信息,更好地进行分类,但也会使得处理和计算的复杂度增加,对处理器的性能要求更高。此外,较高的高通截止频率虽然可以降低运动伪影,但也会造成肌音信号的丢失。

本文对7 名受试者手部8 个动作、4 个特征和4 个分类器进行研究,分别选取了13 个采样频率和11 个高通截止频率。结果表明随着采样率的降低,LDA、SVM、KNN 分类器的识别结果较相似,但NB 分类器的识别结果较差。与采样率为1 000 Hz 的识别率相比,500 Hz的识别率只降低1%左右,300 Hz 的识别率降低不到2%。当采样率从40 Hz 下降到10 Hz 时,分类器的识别率会显著下降。对于高通滤波器,随着截止频率的增大,4 个分类器的识别率都呈下降趋势,且在5 Hz 之后识别率会显著下降。

研究发现,可以使用降低的采样频率采集肌音信号,并不会过度影响分类精度。与1 000 Hz 的采样率相比,500 Hz 的采样率可以减少一半的数据存储空间和一半的处理时间,同时略微牺牲精度(约1%),这可以简化采集设备的设计,减少采集成本;而且减少处理数据的时间,可以更好地提高人机交互的实时性。因此,在对识别精度没有过高要求的情况下,适当降低采样频率是一个非常好的选择。此外,随着高通滤波器截止频率的增大,肌音信号也同时会被滤除。这表明肌音信号的低频段有对识别率起重要作用的信息。所以建议采用截止频率为2~5 Hz 的高通滤波器,可以有效地滤除运动伪影,并可以保留对识别率有用的信号频段,同时该研究也可以为肌音信号的采集频率选择提供了一定的实验研究支持。

猜你喜欢

截止频率高通识别率
基于规范图像的光电成像系统采样响应研究
基于超声Lamb波截止频率的双层薄板各层厚度表征
基于类图像处理与向量化的大数据脚本攻击智能检测
低频射频识别系统中的RC放大器电路性能分析与研究
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
高通、苹果专利案新进展:苹果拒绝与高通和解
历史转折后的高通前执行董事长
提升高速公路MTC二次抓拍车牌识别率方案研究
《福布斯》欧盟罚高通
梯度饱和多孔材料中弹性波的截止频率