APP下载

基于ICA和极限学习机的模拟阅读脑电特征分类

2018-04-09官金安杨建华赵瑞娟

关键词:电信号靶标权值

官金安,杨建华,赵瑞娟

(1中南民族大学 生物医学工程学院,认知科学国家民委重点实验室, 武汉 430074;2 中南民族大学 医学信息分析及肿瘤诊疗湖北省重点实验室,武汉 430074)

近年来,我们对“模拟阅读”脑-机接口(BCI)进行了持续的研究[1-4],其中,脑电信号的特征提取和模式分类是两个重要研究内容,对提高BCI的准确率起到至关重要的作用.

在特征提取方面,先后采用了张量时频空模式[5]、共空间模式(CSP)[6]、最佳单通道[7]等方法, 均取得了较好的效果.但我们发现,有些受试者可以高效地使用BCI,也有许多人因错误率太高而无法使用,存在所谓“金牌受试者”的问题.这表明,要使绝大多数人脑电信号的模式识别率都达到较高水平,在特征提取方面还需进行新的探索.事实上,可以把多道脑电信号的独立成分看成大脑中若干个“等效源”,这些等效源的输出传播到不同的头皮电极位置,就形成了所测得的多通道的脑电信号.此外,脑电信号还包含50Hz工频干扰、眼电、肌电及心电等干扰信号.独立分量分析(ICA)是近年来发展起来的一种基于无监督统计学习的盲源分离方法,能够将复杂的混合信号分解成独立的信号分量.本文利用ICA方法分离其他干扰信号,达到消噪的效果,同时自动提取出混合在脑电信号中的N2-P3成分.实验结果表明,ICA方法能够有效地提出N2-P3成分[8],大幅提高分类正确率.

在EEG信号模式分类上,以支持向量机(SVM)[9]和人工神经网络(ANNs)[10]等最为常见,但是SVM和ANNs等分类器会有训练速度慢、参数选择难、易产生局部最优解等缺点.Huang于2006年提出了基于前馈神经网络的ELM学习算法[11,12].近年来,该方法在大规模计算,高速信号处理,人工智能等领域应用越来越广泛[13].与传统的神经网络和支持向量机器相比,ELM拥有着显著的优势,如学习速度快,易于实施,和最小的人为干预等等.因此,选择ELM作为分类器来进行分类,在训练前只需设置合适的隐含层节点数和激活函数,然后为输入权值和隐含层偏差量进行随机赋值,最后引入矩阵广义逆的思想且通过最小二乘法获得输出权值,整个训练过程快速简单,无需繁琐地迭代和调整参数.

本文在“模拟阅读”实验模式下,对7名健康受试者用ICA进行 EEG信号的盲源分离[13],提取出N2和P3成分作为靶特征,采用ELM对靶与非靶特征进行训练和分类.为了验证ICA方法的有效性,与采用最佳单通道时域信号作为特征的分类效果进行了比较.此外,在模型训练所需的时间、分类准确率等方面,将ELM与SVM进行了对比.

1 实验模式以及数据获取

1.1 实验模式

本实验采用中南民族大学提出的模拟阅读(IR) 诱发电位模式,该模式能够让受试者在实验中像平常阅读书本文字一样来获得视觉刺激,从而产生基于视觉诱发事件相关电位的N2和P3成分.用此模式在屏幕上构建一个虚拟键盘,就能实现人机交互.“模拟阅读”与通常阅读书本不同的是,实验过程中,受试者的视线相对视觉诱发界面保持静止状态,刺激符号串相对于视线移动,以减少视线移动引起的眼电对脑电信号的污染.在这种刺激方式中,将一个靶标符号(图1(a))随机放到多个相似的非靶标符号(图1(b))中,构成刺激符号串(图1(c)).实验时,符号串匀速移过小视窗的速度是5ms/pixel.一个试次(trial)的运行时间指的是符号串刚开始进入小视窗到符号串全部离开小视窗的时间间隔.图(1(d))为一个试次的示意图.一旦靶标通过小视窗就会产生稳定的事件相关电位.其中,靶标符号、非靶标符号和小视窗的尺寸是30*30像素,靶标符号和非靶标符号具有相同的结构,两种符号的差别在于中间竖线是否被染成红色,靶标符号的中间竖线被染成红色,非靶标符号没有.

图1 “模拟自然阅读”模式下的诱发字符串Fig.1 Character String on the pattern of Imitating-Reading

1.2 实验数据获取

实验使用Biosemi Active II多导生理信号采集装置,采样频率为2048Hz.实验采集了7名健康受试者在“模拟阅读”实验范式下的脑电信号,编号S1-S7.每个受试者采集4组数据,每组50个试次,一共200个试次,数据的存储格式为:通道数×通道采样点数×实验试次数.实验采集的EEG会受到工频和肌电等噪声干扰,为了更加有效地提取出信号的特征,首先对EEG数据进行预处理.包括:去均值、20Hz低通滤波及归一化.实验流程如图2所示.

图2 实验过程示意图Fig.2 Diagram of the experimental process

2 研究方法

2.1 独立分量分析(ICA)

本文分别对每个受试者的脑电数据进行ICA盲源分离,独立分量分析是近年发展起来的一种盲源分离方法(BSS).ICA分离算法的关键在于如何度量分离结果的独立性,以随机变量的非高斯性和相互独立为分析目标,最终是为了从多通道观测数据中分离出相互独立的信号源.不仅可以消除噪声,而且可有效分离出相应的特征信号.ICA算法的数学模型为:

(1)

(2)

(3)

2.2 极限学习机

2.2.1单隐层前馈神经网络

设训练集X有N个样本,表示为X=[x1,x2,…,xN],输出集为T,表示为T=[t1,t2,…,tN],激活函数为g(x)的标准单隐层前馈神经网络[14-16]的数学模型可以表示为:

(4)

式中,xj和tj表示第j个样本的输入和输出,ai是连接第i个隐层节点与输入神经元的权重向量,bj为第i个隐层节点的偏置,βi是第i个隐层节点和输出神经元的连接权值,g(x)是无线可微的激励函数.

式(4)可以表示为:

Hβ=T,

(5)

H(a1,a2,…,aL,b1,ab,…,bL,x1,x2,…,xL)=

(6)

输出权值矩阵β可以表示为:

(7)

2.2.2极限学习机理论

(8)

其中输出yj=[y1jy2j…ymjT],j=1,2,…,n.

极限学习机的理论思想可以总结为:如果选择的激活函数g(x)无限可微,可以不用设置单隐含层神经网络的输出层偏置,同时.训练前随机产生连接权值a和隐含层神经元阈值b,在训练过程中不用调整.通过求解(9)式的最小二乘解可以得到输出权值矩阵β:

min‖Hβ-T′‖s.t.min‖β‖,

(9)

其解为:β=H+T,其中H+为H的Moore-Penrose广义逆.'

标准的ELM算法过程为:

(1)设定隐含层神经元的个数L,给出连接权值α和隐含层神经元阈值b;

(2)选择合适的激活函数,计算隐含层输出矩阵H;

(3)根据公式β=H+T计算输出权值β.

2.3 实验方法

对实验靶数据进行ICA分解,N2成分的提取是自动查询150~250ms时间段的样本方差的最大的分量,P3的提取是自动查询250~450ms的样本方差的最大的分量,ICA分离可能会造成波形倒相,所以要进行极性调整.把提取的分量直接作为靶特征,相对应的对非靶数据也进行上述特征提取,提取的对应分量作为非靶特征.对每个受试者200个trial的样本进行上述特征提取过程,得到200个靶样本集和200个非靶样本集,拿出一半的数据集组成训练样本,另外一半作为测试样本.

将训练样本和测试样本导入ELM分类器进行训练,根据标准的ELM算法过程,首先要设定隐含层神经元个数L,随机产生连接权值a和隐含层神经元阈值.选择合适的激活函数,本文选择的是“sigmoid”激活函数.因为神经元个数不同会对分类准确率有影响,所以在本文中对隐层神经元数进行寻优,经过多次训练,选择寻优空间为L=[100,600],步长为10.找出最佳的分类器模型,然后对测试样本分类,得到分类准确率.为了验证ELM的分类效果,本文利用ICA+SVM分类器对比.

3 实验结果及分析

本实验采集了7名受试者的脑电数据.首先将所有受试者的脑电数据分别进行ICA,将经ICA得到的N2和P3分别作为靶特征,与非靶特征一起用ELM和SVM进行分类,分别对分类准确率和训练时间做了对比,同时还将比较最佳单通道与ICA两种方式下的分类准确率.本文所有程序及实验结果都是在MATLAB R2016a环境下运行得到.

3.1 分类准确率

表1记录了最佳单通道和ICA在SVM和ELM两种分类器的训练准确率.从表中可以看出,SVM和ELM分别做最佳单通道的分类,两者的分类准确率差别很小,平均分类准确率分别为82.4%和83.1%.经过ICA之后的分类准确率相较传统的最佳单通道有较大幅度的提升,平均准确率由82.4%和83.1%上升到94%和96%以上,除了S4和S7这两名受试者原本准确率就很高,可见ICA的对那些准确率不高的受试者的效果非常明显.其次是在以N2和P3分别作为靶特征时的准确率比较,从图中可以看出,以N2成分和P3成分分别作为靶特征时,用ELM分类的准确率基本都比用SVM分类的准确率较高,ELM作为分类器达到了很好的效果.

表1 分类准确率Tab.1 The clasification accuracies

3.2 训练时间

本文将ELM和SVM的训练时间进行比较.在SVM分类器中,对惩罚因子C和RBF核函数exp(-gama*(u-v)2)的参数gama通过以下的网格C=[2-5,2-4,...,25]和gama= [2-5,2-4,...,25]进行训练.在ELM分类器中选择sigmoid激活函数,对隐含层神经元个数L=[100,600]步长为10进行训练.两种方法对应的训练时间如表2所示.

表2 不同分类方法下的耗时Tab.2 The training time of different method

可以看出ELM的训练时间明显比SVM的训练时间少.ELM平均训练时间只需3.699s和3.587s,而SVM平均训练时间需要35.789s和70.006s,两者差异巨大.这是因为ELM只需要设置网络的隐层节点个数,在算法执行过程中不需要调整网络的输入权值以及隐元的偏置,并且产生唯一的最优解,因此学习速度快;SVM方法通过核函数把原空间映射到高维空间,使得非线性可分的问题转化为在特征空间中的线性可分的问题,升维这个过程会增加计算的复杂度,导致分类耗时增加.

4 结语

本文提出了一种将ICA与ELM结合的脑电信号特征分类方法,该方法使用ELM作为分类器,结合ICA作为特征选择算法,对7名受试者在“模拟阅读”范式下的电信号进行分析,同时对ELM隐含层的神经元个数进行寻优,以训练准确率为评价指标,确定最佳神经元个数.为了验证该方法的有效性,与最佳单通道时域信号作为特征的分类正确率进行了比较.同时,还对SVM和ELM分类器进行了对比,以确定二者在我们的BCI应用上的效果.实验结果表明,使用ICA特征提取后,分类准确率有较大幅度的提高;使用ELM作为分类器,训练时间较SVM大幅度减少,平均准确率也有所提高.这一为构建在线BCI系统打下了良好的基础.

[1]官金安. 脑-机接口及其信号的单次提取[D]. 武汉:华中科技大学, 2005.

[2]官金安, 陈亚光. 脑控双页虚拟键盘的设计与性能分析[J]. 中国临床康复, 2006, 10(9):124-126.

[3]谢水清, 杨阳, 杨仲乐. 脑-机接口中高性能虚拟键盘的实现[J]. 中南民族大学学报(自然科学版), 2004, 23(2):38-40.

[4]李梅. 模拟阅读BCI信号空时特征提取与模式识别[D]. 武汉:中南民族大学, 2013.

[5]邱静雯, 官金安. 张量时频空模式在脑电信号特征提取中的研究[J]. 计算机与数字工程, 2015, 43(5):797-800.

[6]官金安, 李梅, 荆汉娜等. 基于CSP的模拟阅读脑-机接口信号分类[J]. 华中科技大学学报(自然科学版), 2013, 41(11):123-127.

[7]官金安, 陈亚光. 通道选择对诱发脑电单次提取精度影响的研究[J]. 计算机应用, 2006, 26(8):1932-1934.

[8]Kachenoura A, Albera L, Senhadji L, et al. Ica: a potential tool for bci systems[J]. IEEE Signal Processing Magazine, 2007, 25(1):57-68.

[9]Gao J, Lu L, Yang Y, et al. A novel concealed information test method based on independent component analysis and support vector machine[J]. Clinical EEG and Neuroscience, 2012, 43(1):54.

[10]Wu T, Yang B, Sun H. EEG Classification Based on Artificial Neural Network in Brain Computer Interface[C]// Springer. Life System Modeling and Intelligent Computing. Berlin:Springer, 2010:154-162.

[11]Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70(1-3):489-501.

[12]Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: a new learning scheme of feedforward neural networks[C]// IEEE. International Joint Conference on Neural Networks, 2004. Proceedings. New Jersey:IEEE, 2005:985-990

[13]Huang G, Huang G B, Song S, et al. Trends in extreme learning machines: areview[J]. Neural Networks the Official Journal of the International Neural Network Society, 2015, 61(C):32.

[14]Zhang W J.Feedforward Neural Networks[J]. Comprehensive Chemometrics, 2009, 13(4):27-31.

[15]Zurada J M, Kang M J. Stationary points of single-layer feedback neural networks[C]// IEEE. International Symposium on Circuits and Systems, 1992. ISCAS '92. Proceedings. New Jersey:IEEE, 2002:57-60.

[16]Hagan M T,Menhaj M B. Training feedforward networks with the Marquardt algorithm[J]. IEEE Transactions on Neural Networks, 2002, 5(6):989-993.

猜你喜欢

电信号靶标权值
纳米载体可缓解农药对靶标作物的负作用
一种融合时间权值和用户行为序列的电影推荐模型
基于联合聚类分析的单通道腹部心电信号的胎心率提取
“百灵”一号超音速大机动靶标
基于5G MR实现Massive MIMO权值智能寻优的技术方案研究
基于一致性学习预测药物-靶标相互作用
纳米除草剂和靶标生物的相互作用
基于Code Composer Studio3.3完成对心电信号的去噪
强规划的最小期望权值求解算法∗
程序属性的检测与程序属性的分类