多类运动想象脑电信号特征提取与分类
2016-03-17段锁林尚允坤潘礼正
段锁林,尚允坤,潘礼正
(常州大学 机器人研究所,江苏 常州 213164)
多类运动想象脑电信号特征提取与分类
段锁林,尚允坤,潘礼正
(常州大学 机器人研究所,江苏 常州213164)
摘要:针对多类运动想象情况下存在的脑电信号识别正确率比较低的问题,提出了一种基于小波包特定频段的小波包方差,小波包熵和共同空间模式相结合的脑电信号特征提取的方法,并将特征向量输入到支持向量机中达到分类的目的;首先选择重要导联的脑电信号,进行特定频段的小波包去噪和分解;其次对通道优化的重要导联的每个通道信号计算小波包方差和小波包熵值作为特征向量;然后对所有重要导联的分解系数重构并进行共同空间模式特征提取;最后结合2种不同导联方式所获取的特征向量作为分类器的输入进行分类;采用BCI2005desc_IIIa中l1b数据进行验证,该算法的分类正确率最高达到88.75%,相对2种单一的提取方法分别提高28.27%和6.55%;结果表明该算法能够有效提取特征向量,进而改善多类识别正确率较低的问题。
关键词:脑电信号;小波包方差;小波包熵;共同空间模式;特征提取;支持向量机
0引言
近年来,一种与人的意念和思维相关的新兴控制系统迅速发展[1-2],它是依赖于大脑外周神经系统对运动想象产生脑电波变化,从而分析其想象动作的真实脑电波的组成,即脑-机接口(brain computer interface,BCI)[3]。正是因为它可以代替人的肢体或语言器官实现人与外界交流以及对外部设备的控制,这才使得国内外学者对其不断研究[4]。其关键在于对信号分析,它包括信号预处理、特征提取、模式识别。经过几十年的发展,对信号分析的方法及研究成果也在不断拓展,从残疾服务型机器、康复机器到娱乐、智能化家用设备和军事研究等广泛的领域得到应用[5]。
BCI是综合多门学科的前沿技术,其关键技术在于如何快速、准确、有效地实时提取EEG的特征和分类。常用的特征提取和分类一般认为有线性和非线性之分,特征提取的方法一般包括功率谱法(PSM)、自适应自回归模型法(AAR)、共同空间模式(CSP)法及小波包分析法[6-7]等。而分类的方法一般包括线性判别法(LDA)、k最近邻分类器、遗传支持向量机(GA-SVM)、人工神经网络法[8-9]等。功率谱是一种反映信号的能量随频率变化而变化并表明出频域而存在,但不能体现出时域的方法;自适应自回归模型(AAR)适合于平稳信号和不需要相关频带的先验信息,以及计算量较小的优点。但脑电信号属于复杂非稳定的微弱信号而且很容易受到外界干扰,脑电信号通常比工频、眼电等伪迹微弱的多;共同空间模式(CSP)需要输入多导联以及不能反映出频域的信息等缺点,但对于两分类问题正确率较高;小波包分析法(WPA)不仅能将频带进行多层次划分,而且能自适应地选择相应频带及提高时频分辨率等优点。
针对多类运动想象识别率比较低的问题,本文充分利用小波包分析法和CSP的优点,并采用小波包分解(WPD)这种快速的时频分析算法使CSP缺乏频率信息的缺陷得到弥补。基于小波包特定频段的WPV,WPE和CSP算法相结合的特征不仅能反映出脑电信号的复杂程度,幅值变化,时频与空间域,而且通过仿真验证了对多类运动想象识别正确率有所提高。
1算法基本理论
小波包分解能够为信号提供一种更精细的分析方法,并能够根据分析信号的特征,自适应地选择相应频段,从而提高时频分辨率[10]。特征提取中用CSP来对脑电信号特征提取已经广泛使用,特别是对二分类问题,已经相当成熟[11]。而在分类中支持向量机采用结构风险最小化原理兼顾训练误差和泛化能力,对于小样本、高维数、非线性的分类问题效果显著[12]。
1.1小波包方差与熵
首先确定合理分解层数,才能有效利用小波包分析法,根据小波包分解特性,表示为:
(1)
式中,m为最终需分解层数,当m非整数时,需向上取整,Bx为信号带宽。
(2)
能量序列的分布被认为各尺度的归一化能量表示为:
(3)
根据shannon信息熵的定义,它能够用来对序列未知程度提供一种测度,也能反映出脑电信号的复杂程度。将小波包分解系数能量分布于信息熵结合起来定义小波包熵为:
(4)
而小波包方差对于反映大脑皮层点活动被激活后表现出的幅值变化具有重要意义。其定义为:
(5)
1.2共同空间模式(CSP)
其基本原理是利用矩阵对角化,需找一组最优空间滤波器参数使得2类信号的方差值相对极值化,从而获得分类准确度高的特征向量。
设单次任务实验的原始信号表示为一个N×Y维的矩阵H,其中N为所选择的重要导联数,Y为脑电信号采集时对应每个通道的采样点数,每次进行CSP时需要n个Trial的数据采集[13]。一般步骤如下:
对2类运动想象的每个脑电信号进行协方差,可以表示为:
(6)
其中,trace(HHT)为矩阵的迹。
混合以后的空间协方差矩阵表示为:
(7)
将特征值按照降序进行排列,对应的特征向量同样如此。之后进行白化:
(8)
将白化后的脑电信号在共同的特征向量B投影下,获得B的前m列和后m列。所得的投影矩阵W=(BTP)T,对应的单次任务脑电数据H变换成Z=WH。
最后关于脑电特征提取的维数f根据H的噪声大小和分类器的要求而变化,所形成的的维数不能超出所选择的电极导联数N。
滤波后所得到的Z前m行和后m行(2m (9) 其中:var(Z)是计算脑电数据变换后Z的方差。 1.3分类算法 基本原理是:对线性不可分的样本数据,通过定义一个非线性映射,将输入向量映射到一个高维特征向量空间,在这个特征空间构造一个最优分类面,使得目标样本中正负两类样本能正确识别并让它们之间的隔离边缘最大化。 设样本集为(xi,yi),i=1,…,n,x∈Rd,y∈{-1,+1}是类别符号。标准的SVM模型为: (10) 式中,ω为惯性权重;b为常数;ξi为松弛变量;c为惩罚参数。求解公式(10),得到ω和b,进而求得最优分类面。 对于线性不可分的样本,支持向量机通过非线性映射Φ:Rd→H将输入空间样本点映射到高维空间H中,在高维空间H中运用线性方法构造最优分类面。根据泛函相关理论,采用适当的内积函数K(xi,xj)满足Mercer条件,就能实现非线性变换后的线性分类,此时,公式(1)目标函数变为: (11) 式中,αi为对应的拉格朗日乘子。 解上述问题得到最优分类函数为: (12) 公式(13)中函数K(xi,xj)称为核函数,SVM中常用的核函数有多项式核函数、高斯核函数和sigmoid核函数。本文选用径向基核函数(radialbasisfunction,RBF)作为SVM的核函数。RBF公式为: (13) 公式(15)中σ为核函数的核参数,将公式(13)代入公式(12),得到最后的最优分类函数: (14) 2基于小波包方差和熵与CSP相结合的特征提取与分类 对于BCI最核心部分包括预处理、特征提取、分类识别。根据本文提出的算法将对国际BCI2005desc_IIIa组的数据进行处理。 2.1实验环境与数据 实验的仿真环境: CPU E4500 2.2 GHz, RAM 2.19 GHz, Windows XP SP3,MatlabR2009b。 数据采集工具为来自Neuroscan的64导脑电放大器,其中左乳突作为参考,右乳突作为地面。采样频率为250 Hz,对采集的数据进行带通滤波(1~50 Hz)。电极放置位置如图1(a)所示。被试坐在有扶手的休闲椅上,根据所提示的线索进行想象左手,右手,脚或舌头运动,提示的顺序是随机的。实验进行的步骤过程(图1(b))如下:开始前的2 s为被试调整状态,使自己处于安静状态,到2 s时计算机不仅发出提示音而且屏幕也会出现“+”,接下来1 s结束后,计算机便会随机出现向左、向右、向上或向下的箭头,要求被试按照所提醒的方向进行运动想象,该运动想象过程一直持续4 s。 (a) EEG电极位置图 (b) 实验时序示意图图1 电极位置与实验过程图 2.2脑电信号预处理 对于脑电信号的预处理主要是对其进行滤波,使脑电中噪声尽可能较少,为后续处理提供很好的基础。研究表明,大脑皮层神经活动所引发的事件相关电位[14](event related potential,ERP)是人体感受到外界或内在刺激时相应产生电位变化。大脑进行运动想象时,在特定频段(α节律和β节律)会发生脑电功率谱增强(event relatedsynchronization,ERS)或减弱(event related desynchronization,ERD)[15]现象。脑电功率谱增强或减弱主要体现在8~30 Hz,由于运动想象的脑电频段会因被试不同,存在着差异,对不同的被试选择不同的最佳滤波器及滤波频段是提高正确分类的关键。因此,本文首先对不同被试的重要通道的频段所在范围进行分析,并对其进行小波包去噪降低噪声。 2.3小波包方差和熵与CSP相结合的特征提取 对所选择的通道进行4层WPD后,获得基于特定频段的方差与熵所形成的特征向量和CSP对特定频段重构信号提取的特征向量,以及其结合后的特征向量。将小波包方差和小波包熵算法简化成WPVE,CSP对特定频段重构信号提取的算法简化成WP-CSP。算法流程如图2所示。 图2 小波包方差和熵与CSP相结合的算法 BCI2005desc_IIIa所采用的采样频率为250 Hz,fde取值为8 Hz,带入式(1),m向上取整为4。由于daubechies小波函数具有更有效的分析性和综合性,本文使用‘db4’作为小波基。对与运动想象密切相关的9个重要导联通道(18、21、24、C3、Cz、C4、38、41、44)的信号进行小波包去噪和4层小波包分解。根据文献[16]时频结论以及在线脑极接口应用,优化选取5个重要导联的每个通道求取WPE和WPV,形成20维特征向量f1;9个重要导联的每个通道选取2-4子带系数进行重构,之后进行CSP特征提取,其中将多类问题转化成一对一的二分类特征提取的问题,对于一个N类运动想象任务的特征提取,转化以后得到N×(N-1)/2个两类问题。采用本文数据得到6对空间滤波器参数,每类对应3个,对于9个重要导联的相关频带系数进行重构,获得9维数组形成H9×Y。 2.4支持向量机分类 为了更好地使用训练数据来获取训练分类器,采用网格搜索全局寻优,使其最大化的获得最佳参数。对于运动想象实验表明,径向基(RBF)函数在支持向量机特征分类中优于其他核函数,由于其能够实现非线性映射,而且参数的数量影响模型的复杂程度。因此,核参数g的大小决定数据分布范围,惩罚系数c是对错误分类的惩罚程度,若c的取值比较大,则减少错分误差的可能。若c的取值比较小,便会获得较强的泛化能力。惩罚系数c和核参数g的最优组合是决定正确分类的关键。本文采用网格搜索方法对核函数参数g和误差惩罚因子c进行全局寻优,最佳参数输入支持向量机(C-SVM)进行测试集的实际分类与预测分类。 3实验数据结果 以BCI2005desc_IIIa中l1b数据为例,通过小波包去噪后,通道为C3的运动想象(left)4种节律所在频段,如图3所示。表明与运动想象有关的频段在8~30 Hz,验证了数据的有效性。 图3 4种节律所在频段 对9个导联的EEG信号分别进行4层WPD,将信号划分成16个频段,故4层WPD各个节点对于频段范围如表1所示,与运动想象最相关频带的节点(4,1)、(4,2)、(4,3)。 表1 小波包分解第四层各节点对应的频带范围 对于表中的(4,1)和(4,2)节点对应的频带由小波包的Mallat算法性质决定的。当分解层数达到一定时,便会存在交错非顺序的现象。采用lb1被试的C3通道,对3个与运动想象最相关的小波包系数进行提取与重构信号,如图4所示。 图4 运动想象最相关的小波包系数的提取与重构 本文将240次实验进行3折交叉验证方法,每组包含各类的20次任务运动想象,随机选取其中2组作为训练数据,剩余1组作为测试数据。最后惩罚系数c和核参数g最佳取值分别为2和0.919 5,如图5(a)和5(b)所示。确定最佳参数后,图6对测试数据进行预测分类与实际分类结果作对比,验证了本文算法的有效性。 (a) 参数选择结果图(3D视图) (b) 参数最佳的取值图5 实验数据图 图6 测试集的实际分类和预测分类图 实验的对象有3人,本文主要以BCI2005desc_IIIa中l1b数据来验证算法的可靠性,通过对比3种算法分类的正确率,结合以后的算法的分类正确率有所提高,针对分类正确率的实验结果如图7所示,采用WPVE算法所获得的大约平均正确率61%,WP-CSP算法获得的平均正确率80%,采用本文结合后的算法获得平均正确率88%。需要强调的是,由于被试的不同和采用算法的特点不同,对分类正确率有着不容忽视的影响,3名被试中k3b的实验次数最多,分类正确率并非最高,更能说明本文采用的方法因人存在差异性,但整体分类正确率得到提高。 图7 不同被试的平均正确率 将本文的分类结果与其他文献的结果作对比,如表2所示,与文献[12,16,17]比较,对于被试k6b,l1b,本文采用的算法分类正确率相较于其他文献有所提高,最高达到88.75%。与文献[12]得到的结果有所相似,k3b虽然实验次数最多,并非正确率最高,更能说明被试和算法不同,得到的分类效果有所不同。整体而言,本文采用的算法较于BCI竞赛分类正确率有所提高。 表2 与其他文献的分类正确率比较 4结论 本文从脑机接口中多类运动想象存在分类正确率较低的角度,提出了一种基于特定频段的WPVE和WP-CSP相结合的特征提取方法,其优点不仅结合了方差和熵能反映出信号的不同尺度下的特征和能量的分布变化,而且更好地通过CSP考虑运动想象脑电信号的时频与空间域。实验结果表明,针对多类运动想象分类正确率较低的问题,本文算法相较于其他文献有所提高。考虑到本文采用的算法是对BCI2005desc_IIIa数据在离线状态下进行,下一步将对实时在线脑机接口应用的可行性深入研究,并将获得的特征转化成控制信号来实现代替人的肢体或语言器官实现人与外界交流,使诸多患者能够再次获得正常的生活。 参考文献: [1] Wolpaw R, Birbaumer N, McFarland D J, et al. Vaughan, Brain-compuetr interfaces for comumunication and control, Clin. Neurophysiol[J]. Neuroimage,2002,11 (3):767-791. [2] 王行愚,金晶,张宇.基于脑-机接口的人机融合控制[J].自动化学报,2013, 39(3):208-221. [3] Kelly, S P, Lalor E C, Finucane C, et al.Visual spatial attention control in an independent brain-computer interface [J]. IEEE Trans. Biomed. Eng. 2005,52,1588-1592. [4] Pfurtscheller G, Brunner C, Schlogl A, et al. Mu rhythm (de) synchronization and EEG single-trial classification of different motor imagery tasks[J]. Neuroimage, 2006,31(1):154-157. [5] 何庆华,彭承琳,吴宝明. 脑机接口技术研究方法[J]. 重庆:重庆大学学报,2002,25(12):106-109. [6] Muller G, Putz G R,Schlogla,et al.15 years of research at Graz University of Technology:Current projects[J]. IEEE Trans.Neural Sys.Rehab.Eng,2006,14(2):205-210. [7] 李明爱,林琳,杨金福.基于小波包最优基的运动想象EEG自适应特征提取方法[J].计算机测量与控制,2011,19(11): 2755-2762. [8] 刘冲,颜世玉,赵海滨,等.多类运动想象任务脑电信号的KNN分类研究[J].仪器仪表学报,2012,33(8): 1714-1720. [9] 刘胜,李妍妍,等.自适应GA-SVM参数选 择算法研究[J].哈尔滨工程大学学报,2007,28(4):398-402. [10] 任亚莉.小波包熵和BP神经网络在意识任务识别中的应用[J].计算机应用与软件,2009,26(8):78-81. [11] 刘广权,黄淦,朱向阳.共空域模式方法在多类别分类中的应用[J].中国生物医学工程学报,2009,28(6):935-938. [12] 王璐,吴小培,高湘萍.四类运动想象任务的脑电特征分析及分类[J].计算机技术与发展,2008,18(10):23-26. [13] 杨帮华,陆文宇,何美燕,等.脑机接口中基于WPD和CSP的特征提取[J].仪器仪表学报,2012,33(11):2560-2565. [14] Pfurtscheller G, Neuper C, Schlogl A, et al.Separability of EEG signals recorded during right and left motor imaginary using adaptive autoregressive parameters[J].IEEE Trans.Rehabil Eng.,1998 (6):316-325. [15] Wolpaw J R, McFarland D J, Vaughan T M, et al.Brain computer interface research at the Wadsworth Center[J].IEEE Trans.Rehabil Eng.,2000 (8);222-225. [16] 施锦河,沈继忠,王攀.四类运动想象脑电信号特征提取与分类算法[J].浙江大学学报,2012,46(2):338-244. [17] 庄玮,段锁林,徐亭婷.基于SVM的4类运动想象的脑电信号分类方法[J].常州大学学报,2014,26(1):42-46. Feature Extraction and Classification of Multi-class Motor Imagery EEG Data Duan Suolin,Shang Yunkun,Pan Lizheng (Robotics Institute, Changzhou University, Changzhou213164, China) Abstract:Due to EEG recognition accuracy was relatively low in the case of multi-class problem of motor imagery,this paper presents a method that a new combination about wavelet packet variance (WPV), wavelet EEG feature package entropy (wavelet packet entropy, WPE) and common spatial patterns (CSP) extract features based on wavelet packet specific frequency bands, which input into support vector machine(SVM ) classifier achieve resultant classification. Firstly, selecting the EEG of important channels make wavelet packet de-noising and decomposition(wavelet packet decomposition,WPD) of specific frequency bands; Secondly, optimization of important channels calculate the wavelet packet variance (WPV) and wavelet packet entropy(WPE) as feature vectors; then, the three sub-band coefficients for each channel EEG signal of important channels are reconstructed and feature extraction carried by common space pattern(CSP); Finally, two kinds of feature vectors from different ways that feed into a classifier and achieve classification. The highest classification accuracy rate of 88.75%, comparing with the relative two kinds of single-extraction method increased 28.27% and 6.55% by l1b from BCI2005desc_IIIa.The results show that the algorithm can effectively extract the feature vectors, thereby improving the lower classification accuracy problems. Keywords:EEG; wavelet packet variance(WPV); wavelet packet entropy(WPE); common space pattern(CSP); feature extraction; support vector machine(SVM) 文章编号:1671-4598(2016)02-0283-05 DOI:10.16526/j.cnki.11-4762/tp.2016.02.078 中图分类号:TP391.4 文献标识码:A 作者简介:段锁林(1956-),男,陕西岐山人,博士,教授,主要从事机器视觉与智能移动机器人控制方向的研究。 基金项目:江苏省科技支撑计划项目(社会发展)(BEK2013671)。 收稿日期:2015-09-06;修回日期:2015-10-08。