基于深度学习的癫痫脑电信号分析与预测
2019-07-31王晓丽
王晓丽
(长春大学 电子信息工程学院,长春 130022)
癫痫疾病是大量脑神经细胞群引起的脑皮质兴奋性异常的神经系统紊乱性疾病,具有突然性[1]。癫痫发作期的脑电波形会成棘波、尖波状等情况,临床医学中通常采用长时间的脑电监测来判别患者是否发病。脑电图(Electroencephalogram,EEG)是将脑部神经活动通过电位的生理活动来记录的方式,在对癫痫疾病的检测中处于不可取代的地位[2]。但在监测过程中产生大量的脑电信号数据,依靠人工的识别需要耗费大量的时间,并且判定的结果存在着主观性。因此,采用深度学习无疑是解决癫痫脑电信号自动识别的有力手段。
1 深度学习
“机器学习”统属于人工智能领域,包含有监督学习、无监督学习以及半监督学习三种。近年来,“深度学习”逐渐成为机器学习研究中的一个新的领域[3]。
图1 基本BP神经网络结构图
深度学习从基本结构看等同于深度神经网络。深度神经网络通过多层次特征学习方法,网络层数越多,越能够实现复杂函数的逼近,进而使其可以表达浅层神经网络所不具有的特征表达能力。
基本BP(Back-Propagate)神经网络结构图如图1所示,它由L1输入层、L2隐藏层和L3输出层三个部分组成。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据中隐藏的分布式特征表示[5]。因此,对研究者相关先验知识要求低,关键要数据充足,即提供了重组的输入层,算法拟合程度才能够达到最佳,再通过多次训练,就会等到更好的结果。因此,深度学习越来越多地应用于处理信息量较大的场合。
2 癫痫脑电信号分析与检测
基于深度学习的癫痫脑电信号分析与检测首先应选取研究对象,即样本。进而对其进行预处理,再提取电线脑电信号特征,然后进一步分析,最后采用分类器完成信号的分类,从而完成癫痫脑电信号的检测。其结构示意图如图2所示。
图2 系统结构示意图
2.1 癫痫脑电信号的数据源
深度学习的实现要依靠真实有效的数据源作基础,目前世界上对癫痫脑电信号研究中最为普遍的脑电数据库一共有两个。
2.1.1 波恩大学癫痫数据库
该数据库共采集了10名志愿者的数据,放于5个集合之中,分别标号为A、B、C、D、E。其中,A组和B 组的脑电数据采集于5 名健康志愿者的皮层脑电,A 组的志愿者处于意识清醒且睁眼状态,B 组的志愿者处于意识清醒且闭眼状态。C、D、E 三组脑电数据采集于5 名癫痫病灶位于海马区的癫痫患者术前的颅内脑电。数据采样频率为173.61Hz。5 个数据子集中,每个子集包含100 段脑电信号段,每段数据包含4097 个数据点,时长约23.6 秒[4]。
2.1.2 CHB-MIT Scalp EEG儿童癫痫脑电数据库
该数据库收集了23个病例的记录。其中共22名受试者,包括5名男性(3~22岁)、 17名女性(1.5~19岁),并且一名女性chb01在病例1.5年后又采集样本为chb21。每个案例包含了9到42个连续的.edf文件。在大多数情况下,.edf文件只包含一小时的数字化EEG信号,只有案例chb10是2小时长,案例chb04,chb06, chb07,chb09和chb23是4小时长。所有信号均以每秒256个样本采样,分辨率为16位[5]。
2.2 癫痫脑电信号的特征提取
提取脑电信号的特征是进行脑电信号分类的核心。对于癫痫脑电信号的特征提取主要包括时域分析方法、频域分析方法、时频域分析方法、非线性分析方法等。随着人工智能的发展,又出现了多种分析角度的癫痫脑电特征提取方法。在深度学习中,捕捉数据最重要特征的神经网络,即自编码器神经网络。
自编码器神经网络是一种无监督学习技术,利用神经网络进行表征学习。即输入的特征x1、x2…xn之间存在某种特殊的联系,但是这些联系不需要人为地进行特征提取,而是放到网络里面进行学习,最终浓缩为更精炼、数量更少的特征h1、h2…hm。其中m 图3 自编码器的一般结构 2.3.1 基于循环神经网络的癫痫脑电信号分析 RNN(Recurrent Neural Networks)循环神经网络,允许信息的持久化。但在处理长期记忆时出现的缺陷,LSTM(Long Short Term)网络可以弥补。LSTM是一种基于RNN的特殊变形,通过引入细胞状的概念,不单单只考虑最近的状态,而是通过细胞的状态来决定状态的去留。其二结构图如图4所示。 (a)RNN结构示意图 (b)LSTM结构示意图图4 RNN 与LSTM的结构示意图 通过LSTM(Long Short Term)网络可达到以下功能: (1)遗忘部分细胞状态 通过最左边的通路,也就是sigmoid函数实现。根据输入和上一时刻的输出来决定当前细胞状态是否有需要被遗忘的内容。 (2)加入新状态 新进来的主语被加入到细胞状态中,同理也是靠sigmoid函数经过tanh来决定应该记住哪些内容。此处的sigmoid和前一步的sigmoid层的w和b不同,是分别训练的层。进而形成下一时刻的细胞状态输入。 (3)当前状态的输入决定其输出 最右侧的通路,通过sigmoid函数作门,对第二步求得的状态作tanh后的结果过滤,从而得到最终的预测结果。增加了对过去状态的过滤,从而可以选择哪些状态对当前更有影响,而不是简单地选择最近的状态。 2.3.2 基于Softmax回归的癫痫脑电信号分类 随着深度学习多分类的发展,Logistic 回归模型推广为Softmax 回归形式。图5是一个典型的神经网络,由输入层、特征处理层,全连接层组成。通过Softmax分类器在全连接层的输出端得到一个输入样本的条件概率。 图5 Softmax多分类神经网络 Softmax回归的函数表达式为: (1) 对应于每个输入值x都会有一系列的概率得出,即p(y=j|x),这一过程可以用向量表示: (2) 由此可以得到Softmax的代价函数定义式: (3) 其中,1{j=y(i)}是示性函数,其取值规则为:1{值为真的表达式}=1,1{值为假的表达式}=0。Softmax回归中将x分类为类别j的概率为: (4) (5) 对于J(θ)的最小化,使用迭代的优化算法,如采用梯度下降算法,其中的偏导数求解如下: θj:=θj-αδθjJ(θ), (6) J(θ)对θj求偏导得到: (7) 最后通过迭代,使得损失函数达到最小,实现 Softmax 回归的分类。目前,Softmax 回归在深度学习的多分类问题中被广泛应用。 基于深度学习的癫痫脑电信号分析与预测在近几年走进人们的视野,对于脑电信号采用深度学习的方法目前存在以下问题: (1)深度神经网络层数的最优化,不是越多的网络层数就能得到最好的结果。 (2)非线性的大脑检测到的脑电信号输入大多数为图像数据,而采用数据点存在的数据目前仍受到一定的制约,数据的量也是造成深度学习方法无法深入的原因。本文主要就目前深度学习的脑电信号诊断癫痫作了笼统的总结与介绍,为未来采用深度学习方法诊断、检测癫痫疾病可以提供一些理论参考。2.3 癫痫脑电信号的分析与分类
3 前景展望