APP下载

基于LMD-CSP和随机森林的运动想象脑电信号分类*

2021-11-12马丽英张洪杰罗天洪郑讯佳

传感技术学报 2021年9期
关键词:电信号受试者分量

马丽英,张洪杰,罗天洪,郑讯佳

(1.重庆交通大学机电与车辆工程学院,重庆 400074;2.重庆文理学院智能制造工程学院,重庆 402160)

脑-机接口(Brain-Computer Interface,BCI)技术能够将人的意图转换为脑电信号(Electroencephalogram,EEG),不依赖肌肉和外周神经,在外部设备与人脑之间建立起通道,直接进行信息交流[1-3]。BCI技术使得人们可以通过大脑直接控制智能假肢、智能轮椅、康复外骨骼机器人等设备。因此,BCI技术在医疗康复等领域得到了广泛的应用,而在自动化驾驶以及通信娱乐等方面也具有广阔的应用前景[4-8]。

EEG信号具有非平稳性、信噪比低等特性,传统的信号分析方法不能够对其进行完全有效的处理[9-11]。如何有效的提取出EEG信号的特征以及提高脑电信号的分类准确率是当下BCI技术的核心难题[12-15]。目前,国内外研究者提出了各种EEG信号特征提取方法以及分类方法。Kwon-Woo Ha等[16]提出了一种基于胶囊网络(CapsNet)的EEG信号分类方法,首先通过短时傅里叶变换算法将EEG信号转换成2D图像,然后在使用胶囊网络进行识别分类,但该方法的分类准确率较低。孙会文等[17]提出了一种基于希尔伯特黄变换(Hilbert-Huang Transform,HHT)的EEG信号识别方法,提取脑电信号前三阶本征模态函数的平均瞬时能量以及前6阶AR模型的系数作为特征,将其输入到支持向量机进行分类识别,但该方法侧重于提取EEG信号中具有分类特征信息的瞬时幅值而忽略其他特征。Park Y等[18]提出了一种基于局部区域共空间模式(Local Region CSP,LRCSP)的EEG信号分类方法。刘宝等[19]提出了一种基于PS0-CSP-SVM的EEG信号分类方法,利用粒子群优化算法得到EEG信号的最佳时段,并采用CSP对最佳时段进行特征提取,最后通过支持向量机对提取的特征进行分类。汲继跃等[20]提出了一种基于最优区域共空间模式(Optimal Region CSP,ORCSP)的EEG信号分类识别方法,该方法通过计算方差比来选取通道附近的最优区域进行特征提取,并通过支持向量机进行分类识别。徐建等[21]提出了一种基于人工蜂群(Artificial Bee Colony,ABC)算法和反向传播(Back Propagation,BP)神经网络的EEG信号分类方法,通过引入交叉运算增强ABC算法的全局搜索能力,并通过该算法进一步优化BP神经网络,从而提高对EEG信号的分类识别。谷学静等[22]提出了一种将CSP和卷积神经网络(Convolutional Neural Network,CNN)相结合的EEG信号分类方法,通过CSP提取到EEG信号的空域特征,并将其输入到CNN网络进行分类识别。

综上所述,针对脑电信号因为具有非平稳性、时变性以及非线性等特性而导致分类准确率低的问题,本文提出一种基于LMD-CSP和随机森林的EEG信号分类方法。LMD是一种具有很强自适应性的非线性分析方法,能够将非平稳、非线性的EEG信号分解为多个更平稳的PF分量,而对于EEG信号的时变性,利用CSP分别对PF分量进行空域特征的提取,将EEG信号的特征进行差异最大化,最后利用随机森林算法对CSP特征进行分类识别,获得更高的分类准确率。

1 分类依据

现代神经电生理学研究表明:当人进行单侧肢体运动想象时,大脑对侧运动感觉区域中EEG信号相应频段的幅值降低,频带能量也降低;相反,大脑同侧的运动感觉区域中EEG信号相应频段的幅值增大,频带能量升高,这种现象分别称为事件相关去同步(Event Related Desynchronization,ERD)和事件相关同步(Event Related Synchronization,ERS)[23]。例如进行右手运动想象时,大脑右半球区域产生的脑电波幅值降低,出现ERD现象;同时,大脑左半球区域产生的脑电波幅值增加,出现ERS现象。此外,ERD/ERS现象还具有频段特性。EEG信号按频率的不同分为四个波段,分别为8 Hz~13 Hz的α波、13 Hz~30 Hz的β波、4 Hz~8 Hz的θ波以及0.5 Hz~4 Hz的δ波,而在进行肢体运动想象时,ERD/ERS现象主要出现在频率范围为8 Hz~30 Hz[24-27]。因此,ERD/ERS现象的空间特性和频段特性为运动想象的分类提供了理论依据。利用LMD分解能够获取EEG信号和个体的运动想象最想关的频段,再利用CSP能够提取最佳频段EEG信号的空间特征,最后将CSP空间特征输入到随机森林分类器中获得分类准确率。

2 分类方法

为提高EEG信号分类准确率,本文提出一种基于LMD-CSP和随机森林的分类方法。首先对原始脑电信号进行滤波、陷波等预处理,为了获取EEG信号的最佳频段,利用LMD将EEG信号分解为多个PF分量,并通过每个PF分量频谱图选取出符合EEG信号最佳频段的PF分量。共空间模式能够通过构建空间滤波器将两类数据的特征差异最大化,有效进行分类,通过共空间模式对选取的PF分量进行特征提取,得到具有较大区别度的空间特征,然后将得到的CSP特征输入到随机森林分类器中,经过分类识别后得到最终分类结果,算法的流程图如图1所示。

图1 算法流程图

2.1 基于LMD-CSP的脑电信号特征提取

针对脑电信号,LMD能够进行自适应分解,并且产生PF分量,PF分量具有真实物理意义,同时反映出脑电信号能量在空间尺度上的时频发布。相对于经验模态分解,更具有端点效应小、迭代次数少等特点。首先采用LMD对EEG信号进行处理,其过程如下。

①求取输入EEG信号x(t)的全部局部极值点ni,并求取相邻极值点ni和ni+1的均值mi,以及包络估计值ai,即:

②将得到的全部均值mi和包络估计值ai分别用直线进行连接,然后进行平滑处理,分别得到局部均值函数m11(t)和包络估计函数a11(t),并将局部均值函数从EEG信号剔除,即:

③用h11(t)除以包络估计函数a11(t),得到调制信号s11(t),即:

④计算s11(t)的包络估计函数a12(t),如果a12(t)≠1,则s11(t)不是纯调频信号,重复上述步骤,直到得到纯调频信号s1n(t),即:

式中,

⑤求得纯调频信号s1n(t)相应的包络信号a1(t),并与之相乘得到第一个乘积函数PF1(t),即:

⑥将PF1(t)从EEG信号x(t)中剔除,得到新的信号u1(t),再将u1(t)作为原始信号重复上述步骤k次,直至uk(t)为一个常数或单调函数为止,即:

原始EEG信号x(t)可表示为乘积函数PFk(t)与残余分量uk(t)之和,即:

对脑电信号进行LMD后,再利用CSP算法分别对最具判别性的PF分量进行特征提取。CSP算法主要针对EEG信号的空域特性,能有效提取出EEG信号的空域特征[28]。具体过程如下。

①将各个PF分量分为左手运动想象数据X1以及右手运动想象数据X2,并求取对应的协方差矩阵R1和R2,并求取两类数据的混合空间协方差矩阵R,即:

式中,i=1,2,表示矩阵的转置,trace()为矩阵的迹。

②对混合空间协方差矩阵R进行奇异值分解,并求取白化特征矩阵P,即:

式中,U为特征向量矩阵,λ为对应特征值的对角矩阵,且特征值为降序排列。

③对协方差矩阵R1和R2,进行以下变换:

④S1、S2具有公共特征向量,且存在两个对角矩阵λ1、λ2和相同的特征向量矩阵B,对S1、S2进行主分量分解,可得:

式中,I为单位矩阵。

⑤计算投影矩阵W,即:

⑥求取左手运动想象数据X1以及右手运动想象数据X2的特征矩阵以及特征向量,即:

式中,i=1,2,Zi为对应的特征矩阵,fi为对应特征向量。

原始EEG信号经过LMD-CSP算法后,将获得一组CSP特征,然后将CSP特征输入到随机森林分类器中进行分类识别。

2.2 基于随机森林的脑电信号分类识别

随机森林算法是对多个决策树分类器的集成,决策树得出结果后,通过对不同结果实行简单投票法来获得最终结果。随机森林具有泛化能力强、训练速度快等特点,同时随机森林还具有样本随机性以及特征选取随机性,降低了每一棵决策树的相关性,保证随机森林的分类能力。其算法结构如图2所示。

图2 随机森林算法结构图

其算法流程如下:①首先对给定的训练特征集F进行有放回的随机抽样,形成子训练集,即θ;②子训练集θ一共有M个属性特征,在决策树的每个节点需要分裂时,从中任意选出m个特征做为候选的分裂属性特征;③计算所选m个特征的信息增益,并将其中增益最大作为分裂特征属性;④每个节点都按照上面步骤进行分裂,直到生成的决策树可以准确地将训练特征集F中的样本进行分类,或者用完所有属性特征;⑤重复上述步骤,建立大量决策树并组成随机森林模型。

将提取到的CSP特征作输入到随机森林分类器中,得到最后的分类结果。

3 实验及对比分析

3.1 数据来源

本文实验数据来源于奥地利Graz University of Technology提供的BCI Competition 2008 data sets 2b数据集,该实验中共有9个受试者(编号为B01~B09),每个受试者视力都正常。经过实验最终获得9个受试者的左右手运动想象脑电数据。

实验过程如图3所示,实验一共持续8 s~9 s,前两秒,屏幕上出现一个“+”,该时间段内受试者放空大脑,不进行任何想象。第二秒时,出现一个持续时间为70 ms的蜂鸣声。从第三秒开始,屏幕上出现一个持续时间为1.25 s的提示箭头,受试者根据箭头指示,进行持续时间为3 s的运动想象。最后受试者休息1.5 s,为下一次测试做准备。每个受试者进行三组测试,前两组测试均进行60次左手运动想象以及60次右手运动想象,第三组测试进行80次运动想象,每个受试者总计进行200次左手及右手运动想象。

图3 实验过程

该次实验只记录了C3、C4以及CZ三个电极产生的EEG信号以及三个眼电通道所记录的眼电信号,其中采样频率为250 Hz,并对EEG信号进行了50 Hz的陷波处理以及0.5 Hz~100 Hz的带通滤波处理,电极分布为国际10-20系统,如图4所示。

图4 电极分布图

3.2 预处理

当受试者进行实验时,运动想象所产生的EEG信号频段主要集中在8 Hz~30 Hz,因此采用FIR带通滤波器对EEG信号进行8 Hz~30 Hz的带通滤波处理。由实验过程可知,前几秒数据与运动想象无关且考虑到受试者需要反应时间,本文选取每次实验中的4 s~7 s的数据进行分析,因此对滤波后的EEG信号进行事件分段以及伪迹去除。

3.3 特征提取

通过LMD将EEG信号分解为多个PF分量以及一个残余分量,并对最具判别性的PF分量进行后续分析。其中以C3通道一次运动想象为例,利用LMD对脑电信号进行分解,结果如图5、图6所示。

图5 左手运动想象PF分量波形及频谱图

从图5、图6均可以看出,PF3以及PF4分量的频率都在5 Hz以下,而EEG信号对应的频段为8 Hz~30 Hz。因此根据运动想象脑电信号的频带范围,选取PF1和PF2分量作为后续分析对象。将所有选取出来的左右手运动想象的PF分量矩阵分别作为CSP的输入进行特征提取,最后可以得到200组左手及200组右手CSP特征向量,共400组特征向量。

图6 右手运动想象PF分量波形及频谱图

3.4 分类识别

为了保证分类结果的准确性以及有效性,将得到的400组CSP特征向量随机选取百分之七十作为训练集,百分之三十作为测试集,并输入到随机森林分类器中。而随机森林分类器最终的分类结果与随机森林中决策树的个数有关,为了保证最终分类准确率达到最高,因此选取不同数目的决策树,看其与分类准确率的关系,其结果如图7所示。

图7 决策树对分类准确率影响图

由图6可以看出,决策树大约在达到40棵及以后时,脑电信号的分类准确率达到最高,考虑到算法响应时间等因素,决策树选取为40棵。将其中一位受试者的测试集数据输入到随机森林分类器中,得到结果如图8所示。

图8 分类结果图

上图中类别1代表左手运动想象,类别2代表右手运动想象。当“o”与“*”重合时,说明分类结果的类别与实际类别一样,从图中可以看出左右手运动想象的分类结果大多与实际类别相同,其中右手分类准确率达到92.4%,左手分类准确率达到98.1%,具有较高的分类准确率。为保证实验结果的可靠性以及普遍性,对每位受试者进行了50次实验,得到其每次实验的分类准确率,并最终取50次实验的分类准确率的平均值为最后的分类准确率,其结果如表1所示。

表1 所有受试者分类准确率

从表中可以看出,受试者B09的分类准确率最低时,只有81.5%,而受试者B04的分类准确率最高时,达到了99.1%。同时9位受试者中的平均分类准确率都达到了90%以上,说明LMD-CSP+RF方法运用在EEG信号特征提取以及分类识别上是有效可行的。

3.5 对比分析

为更好的验证LMD-CSP+RF方法的可行性,将9位受试者的分类准确率的平均值作为该方法的最终分类准确率,并将LMD-CSP+RF方法与其他方法得到的结果进行对比分析,其结果如表2所示。

表2 本文方法与其他方法分类准确率比较

由表2可以看出采用LMD-CSP+RF方法对EEG信号进行分类识别得到的分类准确率远高于其他文献方法,相比于其他文献采用的CapsNet方法、HHT+SVM方法、LRCSP+SVM方法、PS0-CSP+SVM方法、ORCSP+SVM方法对EEG信号进行分类识别,分类准确率分别提高了13.74%、11.1%、10.06%、4.53%、2.4%,进行一步证明了本文方法对脑电信号特征提取以及分类识别的有效性。

4 结论

针对EEG信号具有非平稳性、非线性等特性而导致特征提取困难、分类准确率低的问题,本文提出一种基于LMD-CSP和随机森林的运动想象脑电信号分类方法。利用LMD对BCI Competition 2008 data sets 2b数据集中脑电信号进行分解,选取最具判别性的PF分量并通过CSP进行特征提取,之后将CSP特征输入到随机森林分类器,最终分类准确率达到了92.18%。为了进行一步验证本文方法的有效性以及可行性,对比了本文方法与其他文献方法的EEG信号分类准确率,结果表明:相比于其他算法,本文方法的分类准确率有了明显的提升,为基于运动想象EEG信号的BCI技术提供一种新方法与思路。

猜你喜欢

电信号受试者分量
涉及人的生物医学研究应遵循的伦理原则
涉及人的生物医学研究应遵循的伦理原则
基于联合聚类分析的单通道腹部心电信号的胎心率提取
帽子的分量
涉及人的生物医学研究应遵循的伦理原则
一物千斤
基于Code Composer Studio3.3完成对心电信号的去噪
涉及人的生物医学研究应遵循的伦理原则
论《哈姆雷特》中良心的分量
基于随机森林的航天器电信号多分类识别方法