APP下载

基于粗糙集离散化的多频带脑电特征选择方法的研究

2014-09-26吴金玲

电子设计工程 2014年1期
关键词:粗糙集频带特征选择

吴金玲

(上海海事大学 信息工程学院,上海 201306)

脑—机接口(BCI)是一种新型的不依赖人的外围神经和肌肉组织与外部设备建立的直接交流通道,BCI系统可以把大脑神经活动信息直接转换成驱动外部设备的命令,实现大脑直接与外界的交流以及对外部环境的控制[1],实现人与计算机之间或者人与外部环境之间的通信,为严重丧失运动机能的病人与外界交流提供了可能性。

当人们进行肢体运动或想象运动时,在对侧的大脑皮层会出现事件相关去同步现象(Event-related desynchronization,ERD),表现为在指定频带范围内,脑电信号中对应特定神经活动相关的脑电节律能量的衰减的过程;而运动后或放松状态下,对侧大脑皮层会有节律波能量的增加,这称为事件相关同步现象(Event-relatedsynchronization,ERS)[2]。在运动想象脑-机接口中,就是通过检测脑电中的ERD/ERS现象来判断用户的运动想象脑电模式。

共同空间模式(Common Spatial Pattern,CSP)被认为是提取ERD模式特征最好的方法之一,它通过最大化两类任务的差异来提取ERD模式的特征[3-4],但与运动想象相关的ERD/ERS的模式存在着较大的个体差异,每个人脑电信号所表现出来的特性在频带分布上会有所差异,运用单一频带的CSP特征难以良好的区分不同个体的运动想象模式。大量研究表明[5-6],CSP性能与频带选择有密切的关系,在不同频带的CSP特征包含不同的可辨别的脑电信息,因此分频带选择不同受试的个性化频带能够提高不同任务的脑电识别准确度。

为了解决这个问题提,本文着眼于左右手运动想象任务,提出了一种新的特征选择算法—基于粗糙集离散化的多频带CSP脑电特征选择方法。具体流程分为4步:1)采用带通滤波器滤波,将单一频带段分成多频带段;2)运用CSP算法提取不同频带的脑电特征;3)运用粗糙集理论的离散化算法来选取有效频带的脑电特征量,剔除冗余特征量;4)运用SVM分类器评价最终的分类准确度。

1 方 法

1.1 系统框架

文中所采用的方法如图1所示,将每个受试采集的630 Hz的脑电数据先经过10通道的选择,再经过11个频带的带通滤波器滤波,频带宽度为4 Hz,相邻滤波器之间重叠2 Hz。信号经过滤波器滤波后,分别进行CSP特征提取,得到脑电特征向量。特征向量经过离散化算法进行个性化频带特征选择,选择后的有效特征用于SVM分类器的训练,最终得到分类准确率。

图1 离线分析基本框图Fig.1 Basic block diagram for offline analysis

1.2 基于粗糙集理论的特征选择算法

假设选取的特征量对应的逻辑系统为T:x→y,其一组样本构成的集合为S={(xi,yi)}(yi∈{-1,1}),建模的目标就是要建立分类界面,为此可以由一组折线拟合它,这些折线的坐标点构成了坐标的一组分点,因此可以通过对输入变量坐标选取分点将输入空间划分成不同的区域,在每一区域中尽可能的只包含同一类的样本。因此选取最佳特征量可以看作选取适当的特征量,对其选取适当的分点划分后特征空间构成的每个区域中包含同一类的概率最大。

为按照以上思想实现CSP特征量的选取,可以采用粗糙集理论中的数据离散化算法。粗糙集离散化算法有多种,从计算效率上考虑,本文采用基于分点(也称断点)重要性的算法[7]。假设本实验中经多频带滤波后计算出来的CSP特征的维数为m,粗糙集离散化算法用于在m维的特征中选择出最有效的特征组合,使其能够较好的区分两类脑电信号。

2 实 验

为了验证方法的有效性,我们离线分析了5名受试左右手两类运动想象的数据[8]。5名受试都是右手习惯,且先前没有任何BCI经验,平均年龄约为22.3 1.63。实验中受试都进行左右手的运动想象任务。每个受试参加7次实验(隔天一次),每次实验包括两组实验, 两组实验之间会有10分钟左右的休息时间。每组实验包括10次实验,每次实验由20个左中手运动想象任务组成,每类任务各10个。每个运动想象任务均采用13通道导联(FC3 FC4 FCz C5 C3 C1 Cz C2 C4 C6 CP3 CPz CP4)采集数据,持续时间为3 s,分为10个步长(每个步长0.3 s),采样频率为256 Hz,滤波频率为5~30 Hz。本次试验中我们随机选取每个受试1天实验中的前一组10次实验的数据进行了离线分析,且选取了C3,C4及其周围的共10个电极通道(FC3 FC4 C5 C3 C1 C2 C4 C6 CP3 CP4)的数据。

2.1 离线数据分析方法

1)基于粗糙集离散化算法的分频带特征选取

随机选取每名受试一天中的前10次实验的脑电数据,再随机选择其中90%(180个样本 )的数据进行训练,10%(20个样本)的数据进行测试,且都经过10通道数据的选择。将训练集的数据经过11个不同频带的椭圆带通滤波器,然后用CSP提取特征(每类2个特征),1个频带4个特征,11频带44个特征。然后用粗糙集离散化算法对提取的CSP特征进行选择,用选出的特征用来训练模型进而对测试数据进行模式分类。测试集的数据也经过同样的11个椭圆带通滤波器分频带滤波,然后得出的多频带的特征用SVM进行分类。如此对每个受试10次实验的数据分别进行20次实验,每次实验随机选择训练集和测试集,但训练集和测试集的比例为9:1保持不变。

2)单一频带的CSP特征提取

将1)中的随机选择的20次的实验数据经过相同的10通道选择,不经过分频带滤波和粗糙集离散化算法特征选取,直接用单频带CSP特征训练模型然后用SVM进行分类。

2.2 结果与讨论

表1 单频带/多频带平均训练准确率和平均分类准确率Tab.1 The average training accuracy and average classif i cation accuracy for single band/multiband

表1中第1列为离线分析的5名受试者的序号,第2-3列分别为5名受试单一频带20次试验的平均训练准确度和平均分类准确,第4-5列分别为5名受试分频带20次实验的平均训练准确度和平均分类准确度。

表1为5名受试的单一频带和用粗糙集分频带的20次实验的平均训练准确率和平均分类准确率,可以看出,经过粗糙集算法处理后的训练准确率和分类准确率总体上都有不同程度的提高。从表中可以看出,受试1、受试2、受试4、受试5单一频带平均分类准确率均未超过60%,受试2、受试4甚至低于50%。而经过粗糙集处理后受试2、受试4的平均分类准确率超过了50%接近60%,受试1、受试5的平均分类准确率均超过60%接近70%,受试3的平均分类准确率也从67%提升到75%以上。由此说明此特征选择算法是有效地。

3 结 论

文中对运动想象的脑电数据进行分频带滤波,并且对不同频带的数据进行CSP特征提取,然后运用粗糙集离散化算法对冗余特征进行选择,从而得到有效的特征表达。结果表明,基于粗糙集离散化的特征选择方法比常规单一频带CSP可以得到更为有效的特征。

[1]Wolpaw J R, McFarland D J, Vaughan T M, et al. The Wadsworth Center brain-computer interface(BCI)research and development program[J]. Neural Systems and Rehabilitation Engineering, IEEE Transactions on, 2003, 11(2):1-4.

[2]Pfurtscheller G, Lopes da Silva F H.Event-related EEG/MEG synchronization and desynchronization: basic principles[J].Clinical Neurophysiology, 1999, 110(11): 1842-1857.

[3]Pfurtscheller G, Neuper C. Motor imagery and direct braincomputer communication[J]. Proceedings of the IEEE, 2001,89(7):1123-1134.

[4]Blankertz B, Dornhege G,Krauledat M,et al.The non-invasive BerlinBrain-Computer Interface: Fast acquisition of effective performance in untrained subjects[J].NeuroImage,2007,37(2): 539-550.

[5]Novi Q, Guan C, Dat T H, et al. Sub-band common spatial pattern(SBCSP)for brain-computer interface[C]//Neural Engineering,2007. CNE'07. 3rd International IEEE/EMBS Conference on. IEEE, 2007: 204-207.

[6]Ang K K, Chin Z Y, Zhang H, et al. Filter bank common spatial pattern (FBCSP) in brain-computer interface[C]//Neural Networks,2008. IJCNN 2008.(IEEE World Congress on Computational Intelligence). IEEE International Joint Conference on. IEEE, 2008:2390-2397.

[7]谢宏,程浩忠,牛东晓.基于信息熵的粗糙集连续属性离散化算法[J].计算机学报, 2005, 28(9):1570-1574.

XIE Hong , CHENG Hao-zhong , NIU Xiao-dong. Rough Set DiscretizationAlgorithm Based on InformationEntropy[J].Chinese Journal of Computers, 2005, 28(9):1570-1574.

[8]Xia B, Zhang Q, Xie H, et al. A Neurofeedback training paradigm for motor imagery based Brain-Computer Interface[C]//Neural Networks(IJCNN),The 2012 International Joint Conference on.IEEE, 2012: 1-4.

猜你喜欢

粗糙集频带特征选择
基于Pawlak粗糙集模型的集合运算关系
Wi-Fi网络中5G和2.4G是什么?有何区别?
基于Bark域的电子耳蜗频带划分分析和拟合研究
基于二进制链表的粗糙集属性约简
单音及部分频带干扰下DSSS系统性能分析
Kmeans 应用与特征选择
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
联合互信息水下目标特征选择算法
基于特征选择聚类方法的稀疏TSK模糊系统