基于DTW算法的眼动信号分类研究
2023-08-23彭毅
彭毅
(贵阳银行股份有限公司,贵州贵阳,550000)
0 引言
在人机交互领域,EOG的分类和识别一直是研究者们的一个重要科学研究领域。EOG信号为肢体残疾的人实现人机交互提供了可能性。本文利用DTW算法对EOG信号进行分类。第1节介绍了眼动信号提取的相关工作,第2节介绍了EOG端点检查和有效信号的提取,第3节介绍了DTW算法,第4节是实验和结果分析。最后,对本文进行了总结和展望。
1 EOG信号的收集
■1.1 电极方式的选择
EOG主要由分布在眼睛周围的生物电极收集,有两种方式放置电极,分别是单极连接和双极连接。双极连接的缺点是它不能有效地反映单个活性电极电势的实时变化。基于以上分析,本文对EOG的分类进行了研究,信号的实时性要求较低,因此采用了双极连接来采集信号。
■1.2 信号采集
本文使用RM6280C多通道生理信号采集和处理系统来实现信号采集。我们选择200Hz作为采样频率,选择100Hz作为滤波器,以达到要求,因为EOG的幅度范围约在50~300uv之间,频率范围约在0~38Hz之间。图1是时域和频域图原始EOG信号的。
图1 原始EOG信号
2 有效EOG信号的提取
■2.1 EOG信号的预处理
虽然我们在原始EOG采集过程中使用了一些硬件滤波器,但经过硬件滤波器后的EOG不是纯信号,并且信号中仍然包含一些来自眼球震颤、人体EMG信号、ECG信号、物体静电充电、电磁噪声和50Hz频率干扰的干扰信号,因此必须对原始信号进行进一步处理。由于EOG频率在0-38之间,其主要有效信号在0-10范围内,因此本文将使用截止频率为10Hz的四阶低通滤波器对EOG进行滤波。滤波前后的结果对比图见图2。
图2 滤波前后结果的比较
■2.2 有效信号的提取
EOG是由眼球运动产生的生物电信号,包括有效运动和无效运动,因此有效信号的提取是EOG研究的重要前提,根据能量值判断信号起始点,提取信号。
2.2.1 EOG的子帧和处理窗口
EOG的子帧和处理窗口是将一个“窗口”应用于连续信号的周期。然后将“窗口”向后移动一定距离,并研究“窗口”周期内的信号。其中,“窗口”的长度变为帧长度,其移动的距离变为帧偏移,帧长和帧移通常选择2:1的比率,为了信号的连续性,最后一个信号和下一个信号应该叠加。本文选择的帧长为20ms,帧移为10ms。图3是开窗示意图。
图3 开窗示意图
为了保持高分辨率并减少光谱泄漏,通常选择Hamming窗作为窗函数,其在公式(2)中的表达式如下:
假设EOG的时域信号为,窗口函数为s(n),因此加窗w(n),EOG表达式类似于公式(1)中的表达式,如下所示:
2.2.2 短期能量计算
在正常情况下,我们希望通过显著的差异来区分有效和无效信号,因此我们引入了EOG能量的概念。通过比较EOG能量有效和无效之间的差异,可以通过设置一定的阈值来实现设置目标。以EOG的一段为例,将经过加窗分的第n帧信号计为xn(m),一帧包含m个点,则定义第n帧的能量为:
图4是EOG能量。
图4 EOG能量
2.2.3 端点检测
如图4所示,有效和无效信号的能量值之间存在显著差异,因此,根据实验设置阈值可以让我们定位和标记信号的起点和终点。在本实验中,能量阈值M为0.04,只要将每个帧的信号能量与阈值进行比较,就可以找到信号的起点和终点。端点检测算法如图5所示。
图5 端点检测算法
通过端点检测找到一系列信号的起点和终点,绿线标记的位置是信号的起点,红线标记的位置为信号的终点,如图6所示。
图6 信号的起点和终点
2.2.4 有效信号的提取
有效信号是从眼睛运动开始并随着眼睛停止而停止的信号。可以根据确定的运动起点和终点提取EOG。图7中的(a)、(b)、(c)、(d)是向左、向右、单眨眼、双眨眼的EOG示意图。
图7 EOG信号示意图
3 DTW算法
在EOG信号的分类和识别领域,通常使用人工神经网络将各种EOG特征相结合的分类方法,很少使用基于模型匹配的分类算法,模型匹配的分类方法可以应用于EOG信号的分类。DTW算法是一种基于动态规划(DP)的模型匹配方法,可以解决同一类EOG信号的不同长度和幅度的识别问题。
动态时间扭曲算法计算两个信号之间的最佳匹配路径。DTW算法还计算两个图像之间的距离,根据两个图像的相关特征值计算两个可能的点对之间的累积距离。该算法计算长度分别为(a1,a2,···,an)和(b1,b2,···,bm)的两个序列的元素之间的局部距离n和m。结果是具有项的n 行和m列的距离矩阵:
根据局部距离,根据下一个优化目标,使用动态规划算法计算两个序列之间的最小距离矩阵:
(1)边界条件:路径从左下角开始t11,到右上角结束tnm。
(2)单调性条件:路径不会返回自身,这意味着i和j索引要么保持不变,要么增加,但永远不会减少。
(3)步长条件:路径逐渐前进。索引i和j在每一步上最多增加一个单位。
4 实验结论
■4.1 数据收集
实验选择了5个人(三男两女),他们的眼睛功能正常,年龄在23岁到25岁之间,他们都参加过EOG信号采集实验,熟悉实验环境。使用RM6280C多通道生理信号采集与处理系统采集EOG。用于EOG采集的电极位于眼睛两侧以及单眼的上下部分。电极1和电极2收集EOG的水平分量,这些分量对眼睛的水平运动起反应;电极3和电极4收集EOG的垂直分量,这些分量对眼睛的垂直运动和眨眼作出反应。电极5是接地电极,如图8所示。
图8 EOG电极的位置
实验收集了三名受试者的四种EOG:左移动、右移动、一次眨眼和两次眨眼。每个动作需要50组数据,因此总共有1000组数据。为了防止受试者疲劳,每个受试者每次只收集5组数据。根据眼动习惯,完成一个动作的时间大约在0.4秒到0.6秒之间,每个动作之间的间隔在2~3秒之间。在采集5组数据后,让受试者休息,以确保眼睛处于放松状态,然后继续收集下一个数据。
■4.2 数据分析
实验使用信号的波形作为分析样本。将从5名受试者中采集四种EOG,它们是向左移动眼睛的信号、向右移动眼睛的信息、眨眼一次的信号和眨眼两次的信号,每个动作有50组数据,因此总共有1000组数据。从每种信号中随机选择一组信号作为DTW算法的匹配模板,所选择的信号组将用作模板组。剩下的信号将是测试组。为了计算测试组的信号和模板组的信号之间的距离,应在这两组信号中应用处理。根据DTW算法,信号将属于测试信号与其距离较短的模板。表1、2、3、4、5是5名受试者的DTW操作结果。(LT表示左模板,T R表示右模板,OBT表示眨眼模板,DBT表示双眨眼模板。)
表1 实验者I匹配结果
表2 实验者Ⅱ匹配结果
表3 实验者Ⅲ匹配结果
表4 实验者Ⅳ匹配结果
表5 实验者Ⅴ匹配结果
表1、2、3、4、5分别显示了5个受试者的四种信号在匹配模板和测试模板之间的平均距离。根据表1、3、3、5可以看出,当每种信号的50组数据与基于DTW算法的相应信号匹配时,平均距离最短。(已用粗体标记)。这一现象表明DTW算法完全适用于EOG分类。表6是五个受试者的4种类型信号的识别率。
表6 识别率分析
5 结论
本文介绍了EOG的提取、EOG的端点检测,并将语音信号分类中常用的DTW算法应用于EOG的分类和识别,实验结果表明,基于DTW算法的EOG平均分类率可达99%以上。为基于EOG的人机交互奠定了良好的基础。但是在实验过程中也发现了使用DTW算法分类时存在的一些问题,例如:模块的选择对分类结果有明显的影响,使用时域特征值时会产生太多的数据,并且运算结果相对较慢。下一步的工作:找到适用于DTW算法的EOG信号的合适特征值,提高运算速度。