基于方差和深度学习的脑电信号分类算法
2017-12-19殷盺,陈宇
殷 盺,陈 宇
(东北林业大学 信息与计算机工程学院,黑龙江 哈尔滨 150040)
基于方差和深度学习的脑电信号分类算法
殷 盺,陈 宇
(东北林业大学 信息与计算机工程学院,黑龙江 哈尔滨 150040)
为了改善传统脑电信号分类不够准确且分类难度较大的问题,研究一种基于方差和深度学习的模型对脑电信号进行分类。针对脑电信号图像识别率较低的问题,采用方差对脑电信号进行特征提取,结合深度学习的一种典型方法——深度信念网络对提取数据进行训练,构建分类器,实现对脑电信号更高效的分类。实验证明,相比于SVM支持向量机、朴素贝叶斯等分类算法,该模型可以更准确地分类。
脑电信号分类;方差;深度学习算法;分类器
一百多年前,德国生物学家汉斯伯格检测到脑电波,此后经过后人前赴后继的研究,脑波检测技术得到空前的发展。脑电波的电位十分微弱,人的大脑在不同的精神状态下会持续不断地输出不同的脑电波。通过采集脑电波并分析,就能够获得一系列的信息。目前,人们对脑电波的采集和开发主要应用在医疗健康、游戏娱乐、特殊教育等领域。随着脑波芯片集成技术的发展,脑波相关产品的多样性也得以提高,这为脑波控制的日常化奠定了技术基础。
随着芯片集成技术的不断成熟,人们也渐渐研发出脑波检测集成芯片。2005年,NeuroSky(神念科技)研发出第一块脑波检测芯片TGAM,之后不到3 a便相继研发出第二代芯片、第三代芯片。这种芯片体积非常小,不需要涂抹凝胶。而且在嘈杂的环境中,也可以检测到脑波数据,且具有很高的准确度。通过这种芯片,可以对脑波进行即时检测。随着脑波芯片集成技术的发展,脑波相关产品的多样性也得以提高,这为脑波控制的日常化奠定了技术基础。
在我国,对于脑电信号的研究相比于其他国家来说比较晚,早期在借鉴国外研究成果的基础上,对其进行优化和改进。随着我国科技的飞速发展,对于脑电信号分类也有了很大的进步。但是,由于脑电形成原因不是一成不变的,各类分类算法还存在着准确率不高、分类不均匀等问题。
通常对于脑电信号分类算法的研究主要分为两个阶段:首先是将样本的特征提取出来,获得能够区分出脑电信号类别的特征,同时降低维度。结构法、频谱法、模型方法和统计法是国内外学者常用的基于数字图像处理的纹理算法[1]。接下来对提取出来的特征进行分类,进而对脑电信号进行识别。SVM支持向量机、BP神经网络、贝叶斯、决策树、ELM极限学习机[2]等方法通常用来进行分类。
本文采用的是使用方差对脑电信号信息进行特征提取,取得脑电的特征数据。深度学习是机器学习的一个新的突破,通过模拟人脑的视觉肌理对数据进行特征的训练和识别,在图像分类领域取得了更加显著的效果。本文采用的深度信念网络(Deep Belief Networks)是深度学习算法中的无监督学习,是深度学习的典型方法。一层一层的受限玻尔兹曼机 (Restricted Boltzmann Machines, RBM)组成了深度信念网络,训练同样也是一层一层进行。近年来,深度学习应用于对文本、声音、图像的识别,它具有识别率高、分类准确的特点。实验表明,采用方差和深度学习的方法对脑电信号进行分类能够得到更高的分类正确率,并且可以达到预期的目的。
1 基本理论
1.1 方差
在数理统计中常用的标准差表示精密度,标准偏差(简称标准差)或称为均方误差,用σ代表,表达式为
(1)
式(1)应用于大量数据条件下(一般有30次以上测定),这时,测定的平均值接近于真值,用μ表示,根式的分子表达各个测定数据的偏差的平方和,N是测定次数。方差代表各偏差平方和的平均值,用σ2表示。只有当测定次数为无限多或者至少有30次以上时,所有的平均值称为真值。但是,通常测定次数总是有限的,这样,所得的平均值并不是真值,如果按式(1)去计算标准偏差就不合理[3-4]。
测定平均值与真值不相等,测定值与平均值之差同测定值与真值之差不相等。为要表示有限测定次数的精密度采用符号S代替σ,有限测定次数标准偏差的计算公式为
(2)
1.2 深度学习
神经网络在20世纪80~90年代经历过短暂的兴盛,但由于当时计算机发展存在很多局限性而逐渐衰落。2006年Hinton等人提出了深度信念网络[7](Deep Belief Nets),从此开创了深度学习新纪元。深度学习的深度信念网络通常包括两个阶段:预训练阶段和网络调优阶段。
深度学习(Deep Learning)运算机理是通过神经网络模拟人大脑结构处理、学习信息的过程。经过研究发现,哺乳动物的大脑在处理信息时采用的是分层机制,信息通过哺乳动物的感官器输入哺乳动物的大脑,经过大脑的每一层神经元时,神经元将表现特征的本质信息提取出来再传递给下一层神经元,最后得出结论[8]。深度学习就是还原哺乳动物处理、学习信息的过程,它由大量的神经元组成,每层的输入来自于更底层神经元的输出,通过观测层与层之间的分布式特征进行学习。深度学习带来了一个全新的思维模式,并且在语音识别、人脸识别、文本分类等方面都取得了很好的成果,所以有人将它视为第三代神经网络。
由于传统的梯度下降法会使多隐层训练效果不明显。Hinton等人提出利用深度信念网络的逐层贪婪学习方法[9]避免这一问题,并且具有很好的学习能力。在预训练阶段,深度信念网络是由许多个级联的受限玻尔兹曼机组成。受限玻尔兹曼机模型[10]如图1所示。
图1 RBM的模型
深度信念网络通过构建多个这样的无监督RBM模型和一层有监督的反向传播BP神经网络组成的深度神经网络来挖掘不同脑电信号图像特征,从而实现脑电信号的分类。RBM调节是整个系统中非常重要的一部分,每一个RBM模型共有两层,分别是隐层h和可视层v。图1中标识的Wn×m作为连接可视层和隐层的权重矩阵。b(b1,b2,…,bn),c(c1,c2,…,cn)分别是可视层和隐层节点的偏移量。v(v1,v2,…,vn),h(h1,h2,…,hn)分别是可视层和隐层的状态向量。RBM是一种基于能量的模型[11],它的能量函数定义为
(3)
式中:θ=(W,b,c),是参数的集合,参数确定后,RBM的归一化因子为Z(θ)=∑v,he-E(v,h|θ),此时基于能量函数,可以得到(v,h)的联合概率分布:
(4)
隐层节点的条件概率为
p(hj=1|v)=δ(cj+∑iviwij).
(5)
可视层节点的条件概率为
p(vi=1|h)=δ(bi+∑jwijhj).
(6)
深度信念网络的本质是一种深层的非线性网络结构,其学习过程是经过一层一层的神经网络对特征数据进行特征挖掘实现网络训练,前一层的RBM训练完成将输出重新输入到下一层的RBM中,训练完成后继续向下一层传递[12]。假设N是一个DBN系统,它包含n层(N1,N2,…,Nn),如果分别用I,O表示输入和输出,那么网络可以表示为:I→N1→N2→…→Nn→O,可以不断地调整网络中的参数,让网络中的输出依旧是I,这样就可以得到每一层的特征。DBN是一个概率生成模型,建立了观测数据和标签之间的联合分布。所以要求一个分布,在这个分布里,训练样本的概率最大。训练RBM的目的就是要找到最合适的权值W。深度学习的网络调节过程如图2所示。
图2 深度学习模型的调节过程
Hinton在2006年提出一种对比分歧算法,简称CD算法[9]。这种算法更加快速,它只需要迭代1次就可以准确地获得对模型的估计。这种算法先用训练数据初始化可视层,再用条件分布计算隐
层;再根据隐层用条件分布计算可视层,产生的结果就是对输入的重构。简单来说,在训练阶段,在系统的可视层会产生一个向量v,通过这个向量把值传递到隐层,然后随机选择可视层的输入,用来尝试重构最开始的输入信号,接着新的可视神经激活单元会前向传递重构隐层激活单元,最终获得h。这些步骤就是Gibbs采样[14]。更新权值是根据隐层激活单元和可视层输入之间的相关性差别。根据CD算法:
ΔWij=ε(〈vihj〉data-〈vihj〉recon).
(7)
式中:用ε表示学习率,样本的数据期望用〈vihj〉data表示,重构后可视层的数据期望用〈vihj〉recon表示。
在完成以上步骤确定网络的各个权值后,进行网络微调阶段,即在DBN的最后一层用BP神经网络算法进行一次有监督学习,将RBM的输出特征向量作为它的输入特征向量。BP网络可以利用反向传播网络将错误信息自顶向下调整整个网络,它接受最顶层RBM的输出进行输入,接着微调每一层RBM的权重,这样的好处是不会使结果局部最优,而是可以提高整个网络的分类性能。这个过程就是深度信念网络的调优。
深度学习网络的训练过程可以归纳如下:
1)用贪婪算法训练第一个RBM网络;
2)保持上一个经过训练的RBM的权值和偏移量不变,并将结果输入到下一层RBM中;
3)重复1)、2)步骤多次;
在软件“审批”功能下,使用者可以根据实际情况设计表单内容。同时,软件还支持将审批内容统一生成表格文件,便于汇总。这一功能将有助于实现学生信息采集工作高效率完成。①信息采集工作的主体为学生本人。本人信息的填报极大地降低了错误发生的可能性。②通过审批记录能够准确定位未填写学生姓名,实现动态监管,保证在时间节点内完成。③软件形成的表单可直接编辑整理,便于对接学校的学生管理系统。
4)进入网络调优阶段;
5)训练结束,最终确定网络各层节点的权值和偏移量。
2 实验过程及结果2.1 实验过程
本实验采集两类不同的脑电信号并进行分类,分别是眨眼和不眨眼时的脑电波RAW_DATA数据,如图3所示。从图中可以明显地看出不眨眼的波动小;眨眼有明显的肉眼可见的波动。在实验前,分别选择不眨眼100个样本,眨眼100个样本,并对样本进行预处理。
图3 两种不同的脑电信号
选择好样本后,用上文提到的方差进行数据处理,其窗口选择大小为10。得到样本特征后便可以用深度学习的深度信念网络对其进行训练和测试并得到实验结果。如图4所示为基于方差和深度学习的脑电信号分类具体的实验流程。
图4 构造深度学习分类器流程
实验过程中,用方差对所选的样本进行特征提取,特征提取后,将一部分数据作为测试数据,一部分数据留做检验精度。接下来用深度学习算法对提取出来的特征数据进行训练和测试,实验过程中,选用眨眼和不眨眼的样本200个,分成两组:一组作为训练数据,一组作为测试数据进行特征提取,共有两类数据,初始化参数,网络节点数分别为1-500-300-60-2。从图5可以看出,随着迭代次数的增加,作为评估受限玻尔兹曼机的指标值不断递减,当迭代次数为30时,逐渐接近于0.02后趋于平缓,说明受限玻尔兹曼机逐渐达到了平稳状态。
图5 DBN在脑电信号数据集上的收敛
为了对比深度学习网络的分类效果,选用相同的训练样本和测试样本并用不同的分类算法进行分类,分别使用朴素贝叶斯[13]、支持向量机进行实验。从图6可以看出,SVM算法相对较差,朴素贝叶斯分类效果较好,但是效果都不如DBN深度学习网络,说明DBN在脑电信号分类中分类效果显著。
在用相同的样本并用4个分类算法分别进行实验时,同时记录下每个分类算法的训练时间,由于当选用不同的网络节点数和迭代次数时,训练时间会不同,这里的DBN网络的节点数为1-500-300-60-2,迭代次数为50次,此时分类效果可以达到最优。可以得到表1中的结果,从结果可以看出,DBN的训练时间相比其他几个分类算法更长一些。但是从分类效果上来说,要比其他算法更胜一筹。DBN以牺牲时间为代价提高了分类精度。
图6 3种分类算法正确率对比
分类算法训练时间/s正确率/%beyes11098SVM31096DBN41584100
分别另外选取50个样本用beyes、SVM对其进行分类,测出眨眼样本和不眨眼样本的测试误差,得到如表2所示的数据。
表2 脑电信号分类的结果对比
由表2可以看出,4种分类算法眨眼的正确率明显高于不眨眼,这是由两类样本的自身特点决定的,眨眼特征鲜明,所以分类效果好。但是DBN分类效果较稳定,证明DBN分类效果更好。
接下来随机抽取眨眼、不眨眼各10个样本再次用不同的算法对其进行分类,可以得到图7中的正确率走势图,依旧可以看出DBN网络正确率最高,再次证明了深度学习算法的稳定性,分类效果明显[15]。
图7 20个样本不同算法正确率对比
3 结束语
本文提出用方差和深度学习算法对脑电信号进行分类,用方差对脑电信号进行特征提取,可以节省计算机硬件的运算和存储消耗,将特征矩阵输入到DBN网络,用深度学习算法对其训练和分类。经过试验,相比于朴素贝叶斯和SVM分类器,用本文提出的方法能够实现对脑电信号更准确的分类。所以,将方差和深度学习运算法应用在脑电信号分类中,取得了明显的效果,为脑电信号的分类开拓了新的视野。
[1] 徐一清.脑电信号识别算法研究进展[J].大众科技,2010,(132):145-146.
[2] 陈宇,王明月,许莉薇.基于DE-ELM的林业信息文本分类算法[J].计算机工程与设计,2015,36(9):2412-2431.
[3] 杨小勇. 方差分析法浅析——单因素的方差分析[J]. 实验科学与技术,2013(1):41-43.
[4] 黄创绵,蔡汝山. 单因素方差分析方法在环境试验中的应用[J]. 电子产品可靠性与环境试验,2010(6):21-26.
[5] 张继红,郭世贞. 方差分析平方和分解分析方法的一种新形式——数理统计方差分析教学的一种新方法[J]. 数学的实践与认识,2008(2):150-155.
[6] 胡庆军,吴翊. 主方差分析方法[J]. 国防科技大学学报,2000(2):117-120.
[7] HINTON G E,SALAKHUTDINOV R R.Reducing the dimensionlity of data with neuralnetworks[J].Science,2006,313(5786):504-507.
[8] LEE T S,MUMFORD D.Hierarchical Bayesian inference in the visual cortex[J].JOSA A,2003,20(7):1434-1448.
[9] HINTON G E,OSINDERO S,TEH Y.A fast learning algorithm for deep belief nets.Neural Computation,2006,18(7):1527-1554.
[10] 孙志军,薛磊,许阳明.基于深度学习的边际Fisher分析特征提取算法[J].电子与信息学报,2013,35(4):805-811.
[11] 陈翠平.基于深度信念网络的文本分类算法[J].计算机系统应用,2015,24(2):121-126.
[12] 朱少杰.基于深度学习的文本清高分类研究[D].哈尔滨:哈尔滨工业大学,2014.
[13] 周屹.基于Naive Bayes的文本分类器的设计与实现[J]. 黑龙江工程学院学报(自然科学版),2007,21(2):28-30.
[14] BENGIO Y.Learning deep architectures for AI[J].Foundations and Trends in Machine Learning,2009,2(1):1-127.
[15] 鲁铮.基于T-RBM算法的DBN分类网络的研究[D].长春:吉林大学,2014.
EEG detection classification algorithm based onvariance and deep learning algorithm
YIN Xin, CHEN Yu
(School of Information and Computer Science, Northeast Forestry University, Harbin 150040, China)
In order to improve the problem that the traditional EEG classification is not accurate and the classification is difficult, this paper proposes a model based on variance and depth learning to classify the EEG signals. Aiming at the problem of low recognition rate in EEG signal, this paper uses the variance to extract the feature of EEG signal, combined with a typical method of depth learning-depth belief network to train the extracted data and construct classifier. The EEG signal is more efficient classification. Experiments show that compared with SVM support vector machine and Naive Bayesian classification algorithm, this model can be more accurately classified.
EEG detection classification;variance; depth learning algorithm; classifier
10.19352/j.cnki.issn1671-4679.2017.06.009
2017-06-29
中央高校基本科研业务费专项资金项目(2572015DY07);国家级大学生创新创业训练计划(201710225128);哈尔滨市科技创新人才专项资金项目(2013RFQXJ100);国家自然科学基金资助项目(61300098)
殷 盺(1996-),女,硕士研究生,研究方向:图像处理;模式分类.
TP181
A
1671-4679(2017)06-0042-06
[责任编辑:郝丽英]