融合深度和浅层特征的多视角癫痫检测算法*
2020-10-15田晓彬邓赵红王士同
田晓彬,邓赵红,王士同
江南大学数字媒体学院,江苏无锡 214122
1 引言
全球大约有1%~2%的人患有癫痫。尽管大多数患有癫痫的人在癫痫未发作期间和正常人无异,但癫痫突然发生时的不可预测性是其导致病人残疾甚至死亡的主要原因,这种发作的不确定性严重影响病人的生活。EEG信号是一种记录大脑神经元活动的重要信号,它通过使用电生理指标来记录大脑活动时产生的大脑皮层的电波变化,是大脑神经元活动在大脑皮层的总体反映。在生物医学研究方向的电信号研究中,癫痫发作时,由于大脑神经元的异常放电,导致此时的EEG信号和正常状态下的EEG信号是不相同的,因此通过识别EEG信号来检测癫痫是否发作是一种有效的癫痫检测方法。
随着机器学习的发展,越来越多的智能算法被运用到EEG信号的癫痫检测,例如支持向量[1-2]、朴素贝叶斯[3]、神经网络[4]和模糊逻辑系统[5-6]等分类方法,以及主成分分析(principal component analysis,PCA)[7]、小波包分解(wavelet packet decomposition,WPD)[1,8]、高阶交叉(higher order crossings,HOC)[9]等特征提取方法。这些方法首先对原始特征进行特征提取,使用获得的新特征训练出一个分类模型,然后使用训练好的模型进行预测,从而达到癫痫检测的功能。虽然已有很多的特征提取和分类方法运用于EEG癫痫检测中,但如何提取有效的含有丰富鉴别信息的特征用于后续的有效检验依然是一个重要的挑战。
近年来,深度学习作为一种机器学习方法,在特征学习等方面受到了广泛关注。深度学习通过期望的输出来学习到每一层的权重,层次结构的每一层都对特征进行调整来获得更可能得到期望输出的特征,即每一层都对输入特征进行了优化学习,从而获得越来越有鉴别性的特征。近些年来,深度学习技术在EEG信号处理方面已得到有效应用,有研究[10-12]使用不同的特征提取方法得到EEG信号的特征,然后利用卷积神经网络来对得到的特征进行癫痫检测。
多视角学习技术是通过考虑不同视角之间的多样性来从多视角数据中学习的方法[13-14],根据多视角学习技术之间的相似点和不同点,多视图学习算法可以被分为三种:(1)协同训练;(2)多核学习;(3)子空间学习。虽然三种方法存在显著差异,但它们主要利用共识原则或互补原则来确保多视角学习的成功。多视角学习技术也被广泛地应用到EEG信号的癫痫检测中,通过多种特征提取方法获得EEG信号的多视角数据,然后使用多视角学习技术来进行癫痫检测[6,15]。
为了使用EEG信号构建出有效的特征用于癫痫检测,本文利用深度学习和多视角学习技术,提出了融合深度和浅层特征的多视角分类算法。由于EEG信号具有多种不同的浅层特征,如频域特征、时频域特征、非线性特征等,因此对多个不同的浅层特征进行深度特征提取得到深度特征,并将深度特征和浅层特征一起构造出多视角数据集。进一步,使用多视角学习技术对多视角特征集进行分类,从而实现癫痫检测的功能。
本文提出的算法可概括为如下三部分:
(1)EEG信号浅层特征的获取:EEG信号有很多构建浅层特征的方法,用不同方式构造出的浅层特征都具有一定的效果,也各有优缺点。为了将不同方法构造的浅层特征的优势结合起来,获取多个不同的浅层特征来进行癫痫的检测。本文使用的浅层特征包括使用快速傅里叶变换(fast Fourier transform,FFT)和WPD获取EEG信号的频域浅层特征、时频域浅层特征。
(2)EEG信号深度特征的获取:为了提高EEG信号浅层特征的有效性并且获得更具有泛化能力的特征,本文使用卷积神经网络(convolutional neural networks,CNN)对EEG信号的浅层特征进行深度特征学习来构造出深度特征。相对于浅层特征,EEG信号的深度特征具有更小的数据维度和更高的分类效果。
(3)分类器的构建和分类的决策:将EEG信号的浅层特征和深度特征看作一个多视角特征集。构造出多视角分类器,基于多视角分类器的输出结果来进行是否发作癫痫的决策。
融合深度和浅层特征的多视角分类算法集合浅层特征和利用深度学习技术获得的深度特征,再利用多视角学习技术进行决策。深度学习的深层次结构优化特征表示;浅层特征保留EEG信号的原始信息,减少信息损失;多视角技术有效地利用每个视角特征的独立性和视角特征之间的相关性。将浅层特征、深度特征和多视角学习技术有效结合可以充分提取EEG信号中的有效信息,提高分类器的泛化能力。
2 相关工作
本章将对本文所提方法的相关工作进行简要介绍,包括使用EEG信号进行癫痫检测的意义,以及将机器学习技术、深度学习技术以及多视角学习技术应用在EEG癫痫检测方面的进展。
2.1 癫痫检测
生物信息学、医学图像处理和生物信号处理等都是智能技术在生物医学上面的应用。生物信息学研究蛋白质和基因信息;医学图像处理主要包括分析CT、NMR等;生物信号处理就是对EEG、ECG等电信号的研究。EEG信号是人体脑部神经元活动的表现,包含着很多人体生理活动的信息,EEG信号已被广泛地应用于癫痫检测领域。癫痫检测通常表示使用自动算法对病人的生物信号进行分析来判断癫痫病人是否正在发作癫痫或者已经发作癫痫。癫痫检测的重要目标是如何尽可能快速地有效地执行此转换。近年来,多种用于癫痫检测的算法[5,16]已被提出,并达到了一定的效果。
2.2 基于机器学习的EEG癫痫检测
近些年来有很多机器学习技术被用到EEG信号的自动癫痫检测中。Wang等人[17]使用随机森林(random forest,RF)、C4.5、支持向量机(support vector machine,SVM)+RF、SVM+C4.5四种方法进行EEG癫痫检测,发现RF具有最好分类效果。Zhang等人[18]采用小波包分解提取的近似熵和样本熵作为特征,然后利用支持向量机和极限学习机作为分类器进行EEG癫痫检测。Yang等人[19]使用WPD和KPCA(kernel principal component analysis)进行特征降维,进一步使用TSK模糊逻辑系统作为分类器进行癫痫检测。这些算法都在癫痫检测方面取得了一定的效果。
随着深度学习的发展,堆叠自动编码器[20-22]、深度信念网络[23-25]、卷积神经网络[26-28]、循环神经网络[29-32]等经典深度学习算法都被有效地运用到生物医学中。近年来,已有一些工作尝试使用卷积神经网络来处理EEG信号,并且取得了不错的效果。Antoniades等人[10]通过卷积神经网络对原始EEG信号进行一维卷积来预测癫痫发作;Cecotti等人[11]通过对原始信号进行傅里叶变换来将EEG信号转换到频域,然后使用卷积神经网络进行分类;Mirowski等人[12]使用特征处理将原始EEG信号编码为像素颜色以形成二维模式,然后将编码后的数据应用于癫痫预测。
2.3 多视角学习技术
多视角学习算法是针对拥有不同视角特征的数据集发展起来的机器学习算法。由于引入的多视角协作学习机制可以有效地利用每个视角的视角独立性和学习过程中不同视角之间的相关性,因此可以获得比原始单视角数据更好的建模效果。典型相关性分析(canonical correlation analysis,CCA)[33-34]、协同训练co-training[35-36]、稀疏多视角SVM[37]等是常用的多视角算法,并且在不同多视角数据应用场景已取得了较单视角方法更好的效果。近些年来的一些工作将多视角技术应用在EEG信号的癫痫检测中。Spyrou等人[15]通过对EEG多视角特征使用张量分解来得到新的特征进行癫痫检测,相关研究结果表明提取得到的新的特征具有更好的分类效果;Jiang等人[6]提出了基于多视角学习框架和模糊系统结合的多视角EEG信号癫痫检测的方法。
2.4 TSK模糊系统
定义TSK模糊系统的模糊推理规则如下:
其中,xg是通过模糊规则将原始输入x映射到新的特征空间的向量,pg为TSK模糊系统中的规则构建出来的模糊规则的后件参数。许多算法都可以用于求解TSK模糊系统的后件参数,Deng等人[1]使用了一种有效的优化算法。在这个算法中,TSK模糊系统的目标函数定义如下:
其中,第一项期望学习到最优的pg,j来对训练样本进行分类;第二项为正则化项,给TSK模糊系统进行一定的惩罚,提高TSK模糊系统的泛化能力,即在未知的测试集上也能达到很好的效果。λ为正则化参数,用来权衡正则化项惩罚的大小。
计算∂(JMV_TSK_FS)/∂(wk)=0时的解,来获得最优的后件参数pg。pg的最优值可以通过以下公式计算得到:
3 融合深度和浅层特征的多视角分类算法
本文通过对原始EEG信号使用FFT和PWD来获取频域浅层特征和时频域浅层特征,然后对浅层特征进行深度特征提取,得到频域深度特征和时频域深度特征,最后对深度和浅层特征进行多视角模型学习。
3.1 融合深度和浅层特征的多视角分类算法
本文提出的方法包含三个核心的部分:EEG信号浅层特征的获取;EEG信号深度特征的获取;多视角分类器的学习。图1详细描述了本文方法的基本框架。
3.2 EEG信号的浅层特征获取
Fig.1 Framework of proposed method图1 本文方法框架
原始EEG信号为时序信号,由不同频率的信号累加而成。虽然具有很好的时间特性,但是并不能很好地表现出信号的基本频率特征。为了获得信号的频率特征,使用傅里叶变换将信号从时域转换到频率域。根据傅里叶变换可知,任何连续的周期信号都可以转换到频域,但傅里叶变换的基础是信号为周期信号,EEG信号越长周期性就越小,得到的频域特征越不准确。小波变换可以将信号转换到时频域中进行分析,获得各个时间点的瞬时频率,由此既保留信号的时间顺序,又因为计算瞬时频率时信号长度很短所以得到的频率更为准确。基于上述分析,本文从原始EEG信号中抽取出频域和时频域两个视角的浅层特征。
3.2.1 频域浅层特征构建
EEG信号具有很大的复杂性,被看成是不同频率信号叠加形成的。根据研究发现,EEG信号的频率主要处于0 Hz到60 Hz之间,主要分为6个频率区间:Delta-1(0~2 Hz)、Delta-2(2~4 Hz)、Theta(4~8 Hz)、Alpha(8~15 Hz)、Beta(15~30 Hz)、Gamma(30~60 Hz)。
为了在减少频域浅层特征的维度的同时又可以较好地保留原始EEG信号的信息,本文设置离散傅里叶变换后的频率采样间隔为1 Hz,选取4 Hz到30 Hz之间的频率来构建频域浅层特征[38-39]。图2即为原始EEG信号转化得到的频域浅层特征,其中横轴代表频率,纵轴代表振幅。
Fig.2 Frequency domain shallow features of EEG signals图2 EEG信号的频域浅层特征
3.2.2 时频域浅层特征构建
信号的时频特征能描述信号在各个时间点下的瞬时频率,即在保留信号的时间特征之外有效计算出信号的频域特征。小波分解是一种常用的将信号转换到时频域的方法。小波变换将傅里叶变换的三角函数基转换成小波函数基,小波函数中有两个变量:尺度a和平移量τ。尺度控制小波变换的伸缩即频率,平移量控制小波变换的平移即时间。由这两个变量控制的小波变换可以对信号逐步进行多尺度的细化,从而达到自适应时-频信号分析的要求。
WPD是小波变换的一种常用方法[18,40]。本文使用WPD来获得EEG信号的时频域浅层特征,采用的小波基函数为Daubechies(dbN)。dbN小波具有较好的正则性,随着阶次的升高消失矩阶数增大,光滑性就变得越好,频域的局部化能力越强,频带的划分效果就越好。但过大的消失矩阶数会使得时域的支撑性减弱,计算量增大,即实时性变差。本文设置小波函数的阶数N为4,同时因为转换到时频域的信号是三维的数据(通道×频率×时间),为了减少转换后特征的数量,减少计算时间,设置和频域不同的采样间隔2 Hz。设置小波变换的分解层数为6层。和频域一样,本文只考虑频率范围4 Hz到30 Hz之间的时频特征。图3为原始EEG信号转化得到的时频域浅层特征,其中横轴代表时间,纵轴代表频率,图中不同的颜色表示在相应的时间和频率下的能量的不同。能量的对照值在图右方的彩色条中表明。
Fig.3 Time-frequency domain shallow features of EEG signals图3 EEG信号的时频域浅层特征
3.3 基于深度学习的深度特征的获取
本文使用卷积神经网络对EEG信号的频域和时频域浅层特征进行自动提取。针对两个域的浅层特征,分别构建两个不同的卷积神经网络来对浅层特征进行深度自动提取,获得相应的深度特征。
CNN网络在训练时采用最后一层输出层的结果计算误差并进行反向传播,由此来进行网络的学习。因为倒数第二层计算得到的特征向量到输出层只经过一个全连接层,可以认为根据网络输出层训练优化网络结构的同时,对倒数第二层输出特征向量的表达也进行了优化,即网络在训练的同时也学习到了更好的特征表达,因此选择网络倒数第二层的输出作为网络学习到的特征。通过卷积神经网络的自动学习获得的特征,具有比原始特征更小的维度,并且得到的特征是经过非线性组合的具有更好划分能力的特征,可以使后续的分类模型具有更好的泛化效果。
图4、图5为频域和时频域深度特征提取所使用的CNN网络架构图。用k@m×n表示网络各个层的特征图,k表示该层特征图的个数,m×n表示特征图的大小。网络的二维卷积核用k×m×n表示,k是卷积核的个数,m×n为卷积核的大小;三维卷积核用k×m×n×l表示,k是卷积核的个数,m×n×l为卷积核的大小。卷积核的步长默认为1。网络的输入为各个视角特征,输出为一个向量,向量长度等于2(癫痫和非癫痫)。若样本是癫痫样本,则第一维等于0,第二维等于1;若样本是非癫痫样本,则第一维等于1,第二维等于0。
Fig.4 Deep feature extraction network with frequency domain图4 频域的深度特征提取网络
3.3.1 频域深度特征提取网络
图4为频域深度特征提取使用的CNN网络架构图,总共包括2个卷积层和3个全连接层。多通道的EEG频域视角特征是一个通道数×频率的二维矩阵,因此网络的输入为23×27的二维矩阵。网络第一层卷积层为20个4×4的卷积核,步长为1,得到20个20×24的特征图;第二层卷积层是10个8×8的卷积核,步长为1,得到10个13×17的特征图。网络接下来有3个全连接层,这3个全连接层首先将特征图转换成1×512的特征向量,再转换成1×100的特征向量,最后得到一个二分类的结果。
3.3.2 时频域深度特征提取网络
图5为时频域深度特征提取使用的CNN网络架构图,总共包括4个三维卷积层和3个全连接层。多通道的EEG时频域特征是一个时间×通道数×频率的三维矩阵,因此网络的输入为128×23×14的三维矩阵。网络各个层的详细操作和频域深度特征提取网络相同。因为输入为三维矩阵,卷积核采用三维卷积核,三维卷积操作是二维卷积操作在三维空间的扩展,基本原理和二维卷积操作相同。
两个网络统一选取tanh函数作为激活函数来引入非线性变换,因为tanh(x)∈[-1,1],且tanh函数的均值为0,所以在实际应用中具有比sigmoid更好的效果。tanh函数的表达如下:
网络采用softmax交叉熵损失函数,该函数的定义如下:
Fig.5 Deep feature extraction network with time-frequency domain图5 时频域的深度特征提取网络
softmax函数计算第j个样本属于第i类的概率aji,zji为第j个样本在第i个输出节点的输出。yj={yji|i=1,2,…,C}为第j个样本的真实标签,C是总的类别数,N是样本的总个数,L为N个样本的总平均交叉熵损失。
3.4 基于视角加权的多视角TSK模糊系统
使用浅层特征和深度特征构建成的多视角特征具有很好的表达能力和较少的信息损失,但如何高效地将这些特征用于癫痫检测是很重要的。近些年来的研究中,许多基于多视角学习的智能模型[15,36-37]已被用于癫痫EEG识别,但它们中的大多数缺乏在疾病诊断等现实应用中至关重要的可解释性。因此,在基于多视角学习的癫痫EEG检测技术的发展过程中,需要具有更高可解释性的模型。
TSK模糊系统是基于规则系统的智能模型,具有很高的可解释性。本文以TSK模糊系统为基础,构建出具有可解释性的多视角分类器用于EEG信号的癫痫检测。
3.4.1 多视角TSK模糊系统的加权机制
通过最小化式(8),可以获得每个视角的权重值wk。通过计算每个视角的权重,可以了解不同视角的重要程度,进而权衡不同视角之间的关系。
3.4.2 多视角TSK模糊系统的多视角协同学习机制
给定一个多视角癫痫数据集,多视角TSK模糊系统的多视角协同学习机制可以被定义为如下形式:
3.4.3 多视角TSK模糊系统的目标函数
基于多视角模糊系统的加权机制和多视角协同学习机制,构建出多视角TSK模糊系统的目标函数如下所示:
该目标函数共有3项组成,第一项为改进过后的多视角加权机制,wk为第k个视角的权重,m表示权重wk的模糊指数。通过引入视角权重的指数,可以在优化多视角模型中研究权重的更新规则,该模糊指数已经被深入研究并在许多机器学习算法中达到了很好的效果,例如著名的模糊C均值聚类(fuzzy C-means,FCM)等[41-42]。第二项为正则化项,对不同视角的后件参数进行约束,防止多视角的模型产生过拟合现象。λ1为正则化项的系数,用来改变正则化项对模型的惩罚大小。第三项为多视角协同学习项,该项期望各个视角获得相同的决策值。限制条件控制各个视角的权重和为1。
3.4.4 目标函数的求解
方程(10)是一个不能直接解决的非凸优化问题。为了去求解这个优化问题,本文采用一种交叉迭代的方法,这个方法还用于模糊C均值(FCM)算法中。这个迭代过程主要分为两步,更新各个视角的后件参数和各个视角的权重wk。
本文提出的多视角TSK模糊系统的具体细节在下面的算法流程中给出。
算法1基于视角加权的多视角TSK模糊系统
初始化:设置模糊规则数K,正则化参数λ1和λ2,算法收敛阈值ε以及最大的迭代次数T。每个视角的初始化权重wk设为,迭代次数l=1。
步骤1使用模糊聚类算法FCM或者其他聚类算法获得训练集中每个视角的前件参数。
步骤2使用式(4a)~式(4c)将训练集和测试集每个视角的特征映射到模糊空间,获得新特征集。
步骤3使用式(6)得到每个视角的先验后件参数。
步骤4使用式(11)更新每个视角的后件参数
步骤5使用式(12)更新每个视角的权重
步骤6如果|Jl+1-Jl|>ε或者l<T时,l=l+1并且返回步骤4;否则进入步骤7。
步骤7使用式(13)做出用于癫痫检测的多视角TSK模糊系统决策。
4 实验研究
4.1 数据集
本文采用CHB_MIT数据集进行实验研究。该数据集采集了波士顿儿童医院23个患者的EEG信号,这些来自23位患者的记录被分成24个组(其中第21组为第1个病人在几年后重新采样后添加进去的数据),每一组都包含一个患者的连续十几个小时的EEG信号记录。这些连续的信号通过256 Hz的频率采样,即一秒的信号有256的采样点。每个患者的EEG信号通过对18个点进行采集构成单通道数据集,后续处理成为23个通道的多通道数据。图6是一段时间的CHB_MIT数据集的原始数据,总共包含23个连续多通道信号。
由于数据高度不平衡,即癫痫样本数量与非癫痫样本数量之比为1∶100,如果直接使用所有数据,算法的效果会面临严重的过拟合问题。针对这个问题,本文舍弃了一部分未发作癫痫的EEG信号数据,并且对发作癫痫的EEG信号数据应用了过采样技术。使用滑动窗口将连续的EEG信号分成多个长度为一秒的信号段(根据采样频率可知1 s信号有256个采样点),通过允许两个窗口之间存在重叠的方法对发作癫痫的EEG信号进行过采样。
4.2 本文算法检测效果
k折交叉验证在确保一致的数据分布的基础上将数据划分为相同大小的k个子集。每次将其中一个子集作为测试集,其他子集用作训练集。获得k个测试结果的平均值作为最终结果。这种验证方法有效地避免了实验样品的取样偏差,从而获得了更有说服力的实验结果。为了验证本文提出的癫痫诊断算法,将每一个患者的EEG信号数据都进行5折交叉验证。
为了进行有效的评估,采用如下3个广泛应用的评价标准来进行实验分析[43-44],Accuracy、Sensitivity和Specificity定义如下:
Fig.6 Original multi-channel EEG signals图6 原始多通道EEG信号
式中,TP是将癫痫片段正确预测的个数;FN是将癫痫片段预测为非癫痫片段的个数;FP是将非癫痫片段预测为癫痫的个数;TN是将非癫痫片段预测为非癫痫的个数。Accuracy表示分类器正确分类的比例,越高代表分类器的分类效果越好;Sensitivity表示将所有的癫痫片段正确分类的比例,越高代表分类器对于癫痫片段的预测准确率越高;Specificity表示将所有非癫痫片段正确分类的比例,越高代表分类器对非癫痫片段的预测准确率越高。
本文方法得到的平均效果在表1中列出,由表可以看出所有组的平均Accuracy、Sensitivity和Specificity分别为99.08%、98.59%和99.32%。可以看出算法在准确度、敏感性和特异性上均取得较好的结果。
为了进一步分析本文提出的方法,将最近使用CHB-MIT数据集进行癫痫检测的方法[45-52]与本文提出的方法进行比较。表1列出了特征提取方法、实验设置和实验效果(NR代表文中并未提及该效果)。值得注意的是,Rafiuddin等人[45-47]并未采用交叉验证,这无法有力地证明在癫痫检测方面的性能。未采用交叉验证的原因可能是因为数据集的癫痫样本较少,采用交叉验证会使得验证集中癫痫样本过少,导致得到的效果和真实效果差距过大,Kiranyaz等人[47-49]为了避免验证集癫痫样本过少只采用25%的样本用于训练。在Yao等人[50-52]的研究中,使用了不同的过采样的方法来增加癫痫样本的数量。由于数据不平衡,大多数算法的准确度和敏感性都比较低,但是本文提出的方法在保持相同特异性的情况下,表现出了更好的准确度和敏感性,如表1所示。
Table 1 Performance of different methods on CHB-MIT dataset表1 不同方法在CHB_MIT数据集上的效果
为了确定各个视角的贡献度,本文在实验中统计了各个视角的权重。以第一个患者数据为例,4个深度和浅层特征的权重分别为0.072、0.075、0.760和0.092。其他所有患者数据的视角权重也都类似,并未出现某一视角权重过小,贡献度过小的情况。
4.3 深度特征提取方法有效性分析
为了验证本文所提方法的深度特征和浅层特征的有效性,采用不同的特征提取方法获得不同的特征,然后使用SVM、KNN、NB、DT和TSK-FLS进行建模,最后计算出各种特征的效果,绘制成表2~表4。频域和时频域的深度特征在各个分类器上的平均Accuracy、Sensitivity和Specificity效果均达到了最好;频域和时频域的浅层特征在各个分类器的平均Accuracy、Sensitivity和Specificity效果也仅次于深度特征。可以看出对原始频域和时频特征使用深度特征自动提取方法达到的深度特征都得到了较好的特征表达,获得了较好的分类效果。
4.4 多视角模型学习的有效性分析
表5比较了4个视角的特征分别使用不同的单视角分类器和本文提出的多视角TSK模糊系统的效果,发现本文提出的算法在Accuracy、Sensitivity和Specificity都取得了最好的效果。
为了验证多视角TSK模糊系统的有效性,本文使用SVM、KNN、NB和DT算法构造基于视角加权的多视角分类器,得到实验效果如表6所示。
由以上结果可以看出,本文提出的基于TSK模糊系统的多视角分类器在癫痫检测中达到了较好的效果。
4.5 深度特征提取网络的参数分析
本文对2个用于提取深度特征的CNN网络进行训练,为了确定网络的效果,递增地设置网络的迭代次数,发现2个CNN网络的效果均在一定迭代次数后达到稳定状态。将网络达到稳定状态时的迭代次数设置为最终的迭代次数,由此即可以在较少的训练时间里得到较好的分类效果。图7、图8仅仅展示第一个患者数据的网络迭代次数和最终效果的关系,其他各组和第一组大致相同。
Table 3 Sensitivity of different feature extraction methods表3 不同特征提取方法的Sensitivity效果比较 %
Table 4 Specificity of different feature extraction methods表4 不同特征提取方法的Specificity效果比较 %
Table 5 Effect of combined features on classifiers表5 融合特征在分类器上的效果 %
Table 6 Effect on multi-view classifiers表6 不同多视角分类器的效果 %
Fig.7 Performance of frequency domain network图7 频域网络的效果
Fig.8 Performance of time-frequency domain network图8 时频域网络的效果
根据实验发现频域特征在训练2 000次后趋于稳定,因此设定频域网络的训练次数为2 000。而时频域特征虽然效果随着训练的次数在上升,但是有较大的波动,考虑特征的效果和波动,将时频域特征提取网络的训练次数设置为5 000次。
4.6 多视角分类器的可解释性分析
多视角TSK模糊系统的诊断为各个视角TSK模糊系统的加权组合,模糊规则的利用方面和TSK模糊系统完全相同,因此可以通过分析简单的TSK模糊系统的可解释性,来理解多视角TSK模糊系统的可解释性。为了验证本文提出的基于视角加权的多视角TSK模糊系统的可解释性,本节对第一个患者的频域深度特征构建的TSK模糊系统进行分析,并将具体数据展示在表7中。为了分析方便,只列出规则数为5时前6维特征的数据。
通过表7的数据,可以确定每一条规则的模糊语言描述,例如:“EEG信号某一维特征的值为低、中、高”。以第一维特征为例,不同规则的前件参数分别为(0.447,0.117),(0.452,0.175),(0.545,0.181),(0.548,0.277),(0.459,0.205)。可以确定规则数对应的模糊语言描述分别为低、较低、较高、高和中。上述的模糊语言描述只是模糊规则的If部分的可能解释,因为不同的专家可能对同一规则使用不同的语言描述。为了进一步解释模糊规则的用法和重要性,图9列出一个例子的描述,该例子为一名患者的频域深度特征使用TSK模糊系统进行诊断。
Table 7 Description of fuzzy rules表7 模糊规则描述
Fig.9 Use of fuzzy rules图9 模糊规则的使用
上述分析表明,多视角TSK模糊系统是使用生成的模糊规则识别癫痫患者的可解释模型。
5 结论和展望
本研究提出融合深度和浅层特征的多视角分类算法来对癫痫EEG信号进行检测,通过实验数据可以发现,本研究提出的融合特征比传统的特征提取方法获得了更好的效果,并且使用基于TSK模糊系统的多视角分类器对融合特征进行学习,进一步提高了算法的效果。可以发现深度和浅层特征的提取方法以及多视角TSK模糊系统的引入对癫痫EEG信号的检测很有价值。
虽然研究的效果得到了提升,但是该研究还有一些不足和值得进一步深入研究的地方。比如引入的浅层特征是分布在频域和时频域的,但是EEG信号还有很多有用的特征比如统计学特征和非线性特征,如何有效利用这些特征很有意义;在多视角算法方面,多视角TSK模糊系统虽然达到了比单视角更好的效果,但是还有改进的空间。将来的工作中将对上述方向进行深入研究。