基于EEG 的癫痫自动检测:综述与展望
2022-03-10彭睿旻匡光涛伍冬睿邵剑波
彭睿旻 江 军 匡光涛 杜 浩 伍冬睿 邵剑波
癫痫 (Epilepsy) 是影响全年龄人群的一种由脑部神经元阵发性异常超同步电活动导致的慢性非传染性疾病[1],也是全球最常见的神经系统疾病之一.由于大脑异常电活动的起始位置和传播方式存在差异,癫痫临床表现呈现多样化、复杂化的特点.反复癫痫发作会对患者的精神与认知功能造成持续性的负面影响,甚至危及生命.因此,癫痫诊断和治疗的研究具有非常重要的临床意义[2].
1964 年,国际抗癫痫联盟首次提出了癫痫发作分类方案[3],并于1969 年对其增订.该方案指出,根据发作时癫痫患者的脑电图表现,可将癫痫疾病的发作定义成五类亚型,并明确了发作状态 (Ictal)、发作间状态 (Inter-ictal) 的头皮脑电图特征和患者的临床表现具有同等诊断意义.
脑电图(Electroenc ephalo gram,EEG) 是放置于头皮特定位置的电极采集获得的大脑内同步神经元活动产生的微伏级电信号[1].EEG 作为最常用、最经济的非侵入式脑电波检测手段,已有70 余年的研究历史,是癫痫相关疾病诊断最有效的方法,例如对癫痫发病进行识别、预测和病灶定位等.
为了克服传统诊断手段的局限性,提高医疗效率,基于EEG 的癫痫自动检测已成为行业研究热点.癫痫自动检测可细分为两个任务:癫痫发作事件检测 (Seizure event detection,SED)和癫痫发作检测 (Seizure onset detection,SOD)[4].SED 目的是从多个EEG 中尽可能准确地识别癫痫发作信号,SOD 目的是在连续脑电监测过程中,当患者癫痫发作时,系统能以尽可能短的延时 (Latency) 识别发作的开始,并描述持续时间.
临床上脑电的识读与分析主要依赖医疗工作者的视觉检测与手工标注,这也是目前基于EEG 的癫痫检测金标准[5].但是癫痫的发作时间和时长具有不确定性,从海量的脑电数据中读取发病期数据从而分析病情工作繁琐,且极大依赖检查者主观判断.因此,为了克服传统诊断手段的局限性、提高医疗效率,从1982 年Gotman[6]提出基于EEG 的癫痫自动识别方法起,已积累了大量SED 相关研究.
同时,在癫痫治疗过程中,对抗癫痫药物治疗无效的患者需要采取手术治疗,需要准确识别手术切除的致痫灶.致痫灶分为始发区、激惹灶、致痫病变区与功能缺失区,其中始发区是最有效的标志区,被看作是致痫灶的替代指标[7].临床上可通过在癫痫起始发作时,使用不同类型的示踪剂来判断始发区位置[8].SOD 也因此具有重要的临床意义.Grewal和Gotman[9]设计了一种可根据用户自身数据调节参数的癫痫发作监测系统,使得系统的敏感度达到89.7 %,平均时延17.1 s.Kharbouch 等[10]对用户敏感方法进行了特征提取的改进并使得系统在80 %的被试数据上敏感度达到100 %,时延控制在3.25~18.5 s.Sorensen 等[11]则提出了一种基于匹配追踪算法的SOD 方法使得分类敏感度达到78 %~100 %,延时控制在5~ 18 s.近年来,高采样率设备逐渐普及,研究者们发现 8 0 Hz 以上的癫痫脑电中存在的高频振荡节律 (High frequency oscillation)也可作为一种新的始发区指示标志[12—14].
无论SED 还是SOD,癫痫自动检测的核心是对癫痫波的检测.1972 年,Stevens 等[2]首次尝试从长时程EEG 信号中提取痫样棘波.此后,根据痫样棘波的特性,人们提出了基于形态学[15—16]、信号相关性[17—18]、子带分解[19]、特征工程[20—21]等的棘波检测算法,对癫痫脑电信号进行自动检测.近年来,随着人工智能的不断发展,特别是机器学习与数据挖掘领域成果的不断积累,基于机器学习的癫痫自动检测方案大量涌现[6,22—25].这类能够从数据中学习分类规则,并能随着数据的扩充而提高性能的自动化算法,是极具潜力的癫痫自动检测解决方案.该研究课题也因其理论背景和应用价值,引起了来自生物、医学、认知和计算机科学等众多领域研究者的广泛兴趣.
癫痫自动检测的核心问题可以归纳为特征提取和分类器设计两个子问题.其中,深度学习通过神经网络将特征提取与分类器设计融为一体.本文将从特征提取和分类器选择的角度比较癫痫自动检测中各个方法的优缺点,并结合该领域目前所面临的挑战,对未来研究方向进行展望,以期为该领域研究提供有益参考.
本文的主要贡献如下:
1) 对基于EEG 的癫痫自动检测算法流程进行了详细阐述,总结了各个模块中的典型方法和研究进展,针对核心研究问题给出了详细的说明.
2) 全面介绍了时域、频域、时频域和非线性分析等四类常见特征.
3) 对癫痫检测中的分类模型做了详细归纳整理.
4) 对癫痫自动检测领域未来研究方向给出了建议与展望.
本文剩余部分安排如下:第1 节详细阐述基于EEG 的癫痫自动检测流程,并对各个步骤的典型方法进行详细陈述.第2 节介绍癫痫自动检测的四类特征.第3 节介绍癫痫自动检测中的分类模型.第4 节对癫痫自动检测研究进行总结和展望.
1 癫痫自动检测流程
本节详细介绍癫痫自动检测流程,如图1 所示.该流程通常包括四个步骤:信号采集、信号预处理、特征提取、分类模型学习与评估.下面将对此四步进行逐一介绍.
图1 基于EEG 的癫痫自动检测流程Fig.1 Flowchart of EEG-based automatic epilepsy detection
1.1 数据采集与输入
癫痫发作状态的脑电图异常主要表现为棘波、尖波、棘慢波、尖慢波散发或出现各种节律等.棘波是EEG 信号中痫样放电的典型特征之一,表现为由皮质表面定向引起的表面负偏斜、上升支和下降支陡峭、整体形状如同荆棘的尖刺,是大脑皮层神经细胞异常放电在EEG 信号中引起的波形变化.棘波周期通常为 20~ 70 ms,突出于背景信号,幅度大于 20 μV,为背景信号1.5 倍以上[6].因此,临床上通常选择提取癫痫发作期的痫样棘波和尖波,并通过定量分析获取癫痫相关的病理信息.
从采集方式可将EEG 信号分为颅内EEG和头皮EEG 两类.其中颅内EEG 是通过颅骨钻孔或开颅手术等,将条形或网状电极安置在脑硬膜外并记录不同部位的脑电活动信号.头皮EEG 则是利用脑电帽在人体头皮的固定位置安置电极并记录脑电活动信号.通过上述方法采集的EEG 信号可作为癫痫自动检测的输入信号.
目前研究中,一部分研究数据来自于医院的非公开患者数据,大部分则采用公开数据集.表1 列出了目前癫痫自动识别相关研究中常见的数据集.
表1 常见癫痫数据集Table 1 Popular epilepsy datasets
1.2 数据预处理
原始的EEG 信号具有很强的非平稳性和动态性,且头皮EEG 本身幅值较小,采集程序会受到50 Hz 或 60 Hz 的工频信号影响.此外癫痫发作中伴随着意识丧失和肢体动作,采集过程中极易受到外界不可控因素干扰,因此头皮EEG 往往具有一定的随机性.为了后续对脑电信号的特征进行研究分析,首先需要在不丢失有效信息的前提下,从原始脑电信号中剔除伪迹,提高信噪比,以降低分类错误率.主要的方法包括[22]:
1) 阈值初筛:EEG 信号的特征取值,如振幅、等效曲线下面积等,超过一定的阈值时,此信号被认为是异常.
2) 专家特征:常见的伪迹包括眼电伪迹、肌电伪迹、电极移位、散发伪迹以及弥漫性快速尖锐的α波等[23].可利用专家经验对典型的干扰波特征进行筛选,从而除去相应的伪迹.
3) 滤波等信号处理:脑电的有效信息大多集中于1~ 60 Hz 之间,因此带通滤波[26]是一种常见的EEG 信号预处理方法.Oikonomou 等[25]提出一种基于卡尔曼滤波的方法,在预处理阶段增强EEG信号的信噪比,从而提高棘波检出率.但由于伪迹频段也部分重叠于目标信号,单纯的滤波无法完全消除伪迹,因此亦可使用独立成分分析[27]和主成分分析[28]等方法计算经小波分解的EEG 信号组分中的伪迹信号和脑电信号的混合矩阵,从而实现信噪分离.此外,半波处理[6]也是常见的信号处理方法,能够对EEG 信号中存在的尖峰和毛刺进行平滑.
1.3 特征提取与选择
通过对信号进行分析,提取出有效的特征作为分类依据,是实现癫痫自动检测的重要步骤.合理、典型的癫痫EEG 特征能够全面地表征EEG 的信号模式,同时有效地描述发作和正常等各种状态下EEG 信号的区别,突出棘波与背景信号的差异,从而帮助分类模型对癫痫的发作进行有效甄别.特征的好坏严重影响最终的分类性能.
一般来说,用于癫痫检测的特征可分为以下四类:针对序列波形和序列互相关性等的时域特征[6,29—31],以功率谱密度为代表的对信号能量进行刻画的频域特征[32—34],利用时频变换方法将原始EEG信号转换而成的时频域特征[35—37],以及基于非线性分析的样本熵 (Sample entropy)[38-39]、排列熵 (Permutation entropy)[40]、Hurst 参数[41]和高阶谱分析[42—44]等衡量信号不确定性的非线性特征.
特征矩阵可再经奇异值分解、主成分分析、独立成分分析和相关性分析[45]等方法进行特征重新映射提取,达到降低特征维度的目的.进行特征选择时,单因素方差分析 (Analysis of variance,ANOVA) 是最常用的手段.Ong 等[46]提出的布谷鸟搜索算法 (Cuckoo search algorithm) 能够对经过小波分解后的信号分量特征进行特征选择,使最终分类准确度提高到98.43 %~ 100 %.
1.4 分类模型学习与评估
根据癫痫的脑电特征,选择有效的分类模型进行学习和评估是癫痫自动检测的核心.常见的分类模型可按分类判断依据划分为统计分析和机器学习两种类型.
对于统计分析模型,除了直接指定信号特征的阈值判断发作状态外,也包括分布检验、相关性分析[47]等方法.通过对待测信号进行形态学分析[48]、时频分析[49]等,比较待测信号和模板癫痫发作信号对应特征的数量、分布、相关性等差异,实现癫痫自动检测.
随着人工智能的发展,机器学习模型被广泛用于癫痫自动检测,包括对手工提取的特征直接分类的传统机器学习[37,50—52]、基于神经网络的深度学习[53—58]、克服脑电个体差异的迁移学习[59-60]、融合多个特征视图的多视图学习[61]、融合多个基分类器的集成学习[62]、以及优化标注样本的主动学习[63]等.
2 癫痫自动检测中的特征
本节将基于线性和非线性分析,讨论基于EEG的癫痫信号分析中使用最广泛的4 类手工提取的特征及其计算方式.
时域特征是在EEG 信号处理中最基础的特征,主要是通过直接对原始信号的观察计算提取出相应的特征.其优势在于计算简捷,便于研究者直观理解.但由于EEG 信号本身的非平稳性,个体差异和外界干扰等都容易影响时域特征.
频域特征的依据来自于癫痫发作时EEG 的能量发生明显变化,但依然以背景EEG 是近似平稳的为假设.大部分频域特征都来自于对信号功率谱的特征研究,在进行谱特征提取时可采用多种参数估计方法,参数的准确度也影响频域特征的质量.
若考虑特征所包含的信息量,单纯的时域特征或频域特征都不能完备地对一段EEG 信号进行刻画,并且基于平稳性假设的EEG 分析也并不严谨.因此研究者便将目光投向了时频分析方法,通过时频变换等手段将非平稳的EEG 信号重新表示并提取相应特征.
随着神经科学的发展,许多研究也将大脑看作一个非线性系统,并从对系统的复杂度、持久性和同步性等变化的描述中总结了相应的非线性特征.这些特征不受到EEG 信号非平稳性的影响,同时在应对多通道关联和通道缺失等问题时也更加灵活.
表2 总结了近年来癫痫自动检测问题中涉及的四类特征及对应的参考文献.
表2 癫痫自动检测特征总结Table 2 Summary of features used in automatic seizure detection
2.1 时域特征
Katz 分形维数[69]能够表现一段时间序列的复杂程度,因此能够作为癫痫自动识别的潜在特征.曲线弧长 (Curve length,CL)[70]作为Katz 分形维数的估计量,通过计算相邻采样点之间的差异来反映信号的复杂度.对于一段具有Ns个采样点的离散EEG 信号x(n),其曲线弧长的计算方法为:
非线性能量算子 (Nonlinear energy,NE)[71]是一种对信号进行能量测度的方法,凸显信号的高频部分,同时抑制低频部分.通过对采样点的非线性能量算子取平均,可得到EEG 信号片段的非线性能量算子.连续信号x(t) 在t0时刻的NE 计算方法为:
对于离散信号,采样点xi的NE 计算方法为:
直接对原始EEG 信号进行计算,可获得振幅的均方根 (Root mean squared amplitude,RMSAmp)、极值的出现次数 (Number of local maxima and minima)[72]、过零率 (Zero crossing rate)[72]等特征.其中,对于离散信号x(n) 而言,在连续函数背景下的导数概念被差分替代,因此研究中一般通过设定阈值ε的方法近似 0 值.例如极值的定义为一阶差分小于设定阈值ε(ε=0.01 V) 的采样点,过零点需满足xi<ε和xi+5>ε.
峰度 (Kurtosis,kurt) 与偏态 (Skewness,skew) 是衡量数据分布情况的特征.其中峰度表现分布的平坦程度,偏态表现分布的对称程度,若均值大于中位数则为右偏态,反之为左偏态:
在许多EEG 研究中都用到了Hjorth 特征[73],其中包括活动性 (Activity,σ2)、移动性 (Mobility,δ)和复杂度 (Complexity,λ) 三个参数:
其中表示信号x(t) 的均值.x′(t) 表示信号x(t) 的一阶导数.表示信号x(t) 一阶导数的标准差.表示信号x(t) 二阶导数的标准差.活动性表示信号的平均功率,移动性可用于计算信号的平均频率,复杂度测算信号的带宽.直观上,这3 个量分别从振幅、斜率与斜率变化率的角度描述了EEG 信号在时域上的特点,被广泛应用.对于长时EEG 信号片段可取Hjorth 特征的最大值、均值和方差作为特征.
此外,由于EEG 也广泛被用于情感计算、对心理疾病的相关研究、认知负荷评估[74]等问题中,现有的癫痫自动检测问题也借鉴了应用于上述研究领域的特征[37,75],如能量 (Power,P)、均值 (Mean,μ)、一阶差分 (1st difference,d1) 及其标准化形式(Normalized 1 st difference,nd1)、二阶差分 (2nd difference,d2) 及其标准化形式 (Normalized 2nd difference,nd2):
2.2 频域特征
频域中最常用来刻画能量特征的物理量为功率谱密度 (Power spectral density,PSD).图2 为Bonn 数据集A (正常)、C (发作间期)、E (发作期)子集[66]各第一个样本的功率谱密度示例.发作时EEG 的PSD 与其他状态有明显差异,因此PSD 是癫痫自动检测问题中经典的频域特征.
图2 癫痫自动检测中脑电功率谱密度示例(Bonn 数据集[66])Fig.2 EEG PSD for automatic seizure detection(Bonn dataset[66])
一般利用数据窗将信号切分为具有m个采样点的N个片段,并计算对应的周期图,利用平均周期图估计信号的功率谱.对于信号x(n),若第p个片段对应的周期图为,则功率谱密度为:
此外,Gotman 等[76]将峰值频率 (Peak frequency)和主频峰值带 (Band width) 用于对新生儿的癫痫发作检测.利用Zibrandtsen 等提出的频谱边缘频率 (Spectral edge frequency,SEF) 特征[77],可以求出不同频率范围下对应的SEF (一般取总频谱功率80 %、90 %、95 %之外的边缘频率),同理利用PSD 求出该对应频率范围的频谱总功率(Total spectral power,TSP).对每一子带的PSD,可提取均值、方差和熵等参数作为频域特征[78-79].
2.3 时频域特征
仅从时域或频域提取特征并不能全面表征癫痫问题中EEG 的全部特性,且EEG 本质上并不能看作近似平稳的信号.因此一些研究通过时频变换得到EEG 信号新的表示形式并提取相应特征,进行癫痫自动检测.
将原始EEG 信号转化成时频域表示有多种方法,例如短时傅里叶变换 (Short time Fourier transform,STFT)、小波变换 (Wavelet transform,WT)[80—81]、经验模态分解 (Empirical mode decomposition,EMD)[71,82—84]、希尔伯特—黄变换 (Hilbert-Huang transform,HHT)[72]、平均振幅谱 (Mean amplitude spectrum,MAS)[85]等.图3 展示了Bonn 数据集A (正常)、E (发作期) 子集[66]各第一个样本脑电经db4 小波分解后得到的各个子波分量.其中左侧标注s的子图表示原始EEG 信号,其下方左侧标注为d1,d2,d3,d4,a4为该信号对应分解的各子波分量.发作期脑电的各个小波分量的振幅、频率等都与正常状态脑电有较为明显的差异.
图3 脑电图经小波变换后各分量示例(Bonn 数据集[66])Fig.3 Wavelet transforms for automatic seizure detection (Bonn dataset[66])
经离散小波变换 (Discrete wavelet transform,DWT) 得到的子带信号中,可以提取对应频带小波系数的均值、方差、极值、均方根、递归能量效率(Recursive energy efficiency,REE)[75,80]、模糊近似熵[81]等特征,以实现癫痫发作自动检测.经EMD分解后得到若干个本征模态函数 (Intrinsic mode function,IMF),采用IMF 的绝对值[82,86]、能量[83]、平均频率[84,87]、互信息[88]能够得到相应的时频域特征.对IMF 进行HHT 可获得其瞬时频率,其均值与方差能够用以表征时频信息[89].
2.4 非线性特征 (Nonlinear Analysis)
熵 (Entropy,En) 是能够表征脑电复杂度的物理量.研究表现发作期脑电的不确定度会明显降低[90],因此围绕与熵有关的特征提取有大量的研究.例如,Fisher 信息 (Fisher information,FI)、谱熵(Spectral entropy,SpEn)[71,91]、香农熵 (Shannon's entropy,ShEn)[92]、近似熵 (Approximate entropy,ApEn)[38,81]等:
其中,Pf为该EEG 信号的概率密度函数,Nf为频率分量个数,Ph为概率密度函数的周期图估计,φdE(r) 表示相邻两点的近似程度,r为相似距离,dE为嵌入的维度.
此外,样本熵 (Sample entropy)[93]和排列熵(Permutation entropy)[40]等也可作为特征.图4 为Bonn 数据集A (正常)、C (发作间期)、E (发作期)子集[66]各第一个样本的样本熵示例.
图4 癫痫自动检测中的脑电样本熵示例(Bonn 数据集[66])Fig.4 Sample entropy for automatic seizure detection(Bonn dataset[66])
Hurst 指数 (Hurst exponent,HE)[94]是一种衡量时间序列随机性的指标.一般来说,未发作阶段EEG 信号更具有随机性,发作期由于具有典型棘慢波,序列的局部趋势性越强,HE 更接近1.与之类似,去趋势波动指标通过对局部趋势进行拟合并计算信号与之的RMS,也能表征信号的随机性.由于发作期神经元同步放电,通道间的同步性特征也被用于癫痫自动检测研究,如Lyapunov 指数 (Lyapunov exponent) 的差异性、最大互相关指数[92,95]等.
3 癫痫自动检测的分类模型
本节讨论基于EEG 的癫痫自动检测中常见的统计分析模型和机器学习模型.表3 总结了近年研究中用到的机器学习分类方法与对应结果.
表3 癫痫自动检测机器学习方法总结Table 3 Summary of automatic seizure detection methods
3.1 统计分析
统计分析模型可对待测信号的特征统计量或与模板信号之间的分布差异、相关性等设定阈值,实现棘波检测.李小兵等[106]利用Kullback-Leibler 测度衡量EEG 信号时频分析的Choi-Williams 分布(Choi-Williams distribution,CWD) 差异,再经奇异值分解并结合阈值分析,达到超过90 % 的棘波检测正确率.宦飞等[49]通过瞬时频率的时频分析获得离散CWD,使用相关性分析计算待测EEG 信号离散CWD 的高频部分和基本棘波的中心瞬时频谱之间的相关系数,实现棘波检测.宦飞等[47]通过计算统一尺度下离散CWD 的频谱差变化并与阈值比对,实现89.5 % 棘/尖波检出率.Yadav 等[107]利用形态学分析 (Morphology analysis),统计尖峰斜率和尖峰间隔时间,与设定阈值对应比较实现棘波检测,在线检测误报率为0.1/h,平均时延9.1 s.
统计分析模型进行分类时,模型的判断依据计算简单、易于理解和实现.其缺陷在于:1) 判别严重依赖专业化的参数设置或参与比对的模板信号,而EEG 信号个体差异显著且具有非平稳性,使得这类模型的通用性受限;2) 专家特征往往是具有实际意义的物理量,这类模型无法处理特征之间的隐关系以及隐藏的深度特征,使得模型的准确性受限.
3.2 传统机器学习
常用传统机器学习模型包括支持向量机 (Support vector machine,SVM)[37,53,108—109]、线性判别分析 (Linear discriminant analysis,LDA)[51]、朴素贝叶斯 (Naïve Bayes,NB)[50]、逻辑回归 (Logistic regression,LR)、随机森林 (Random forest,RF)[54]等.Li 等[110]利用双重密度离散小波变换并提取各个分量的非线性特征,并使用ANOVA 选择Hurst参数、模糊熵等作为分类特征,采用SVM 进行分类.Reddy 等[111]计算可调Q 因子小波变换所得小波分量的中心相关熵,并采用RF、LR、多层感知机等模型进行癫痫信号识别.Jaiswal和Banka[52]提出了局部梯度模式转换的特征提取方法,并采用K 近邻、SVM、决策树等分类方法进行癫痫检测.
传统机器学习模型的优势在于模型的复杂度低、可解释性强,但需要研究人员对癫痫的生理机理和临床表现有深入理解.由于依赖专家经验,深层特征不易被观察和提取,因此模型准确性受限.此外,若对被测信号提取特征的过程耗时过长,实际场景中模型效率受影响.
3.3 深度学习
随着深度学习近年来在图像、语音、文本等领域的迅猛发展,深度神经网络 (Deep neural network,DNN) 模型在癫痫自动检测中也逐渐得到应用.提取深度特征可消除对手工特征的依赖,且在处理多通道数据时相较于传统模型有显著优势.
常用的基于EEG 的深度学习癫痫自动检测方法包括3 类:1) 卷积神经网络模型 (Convolutional neural network,CNN);2) 循环神经网络模型 (Recurrent neural network,RNN);3) 自编码器模型(Autoencoders,AE).
CNN 类模型通过池化和卷积提取输入数据的特征.根据模型输入数据的维度数分为1D-CNN和2D-CNN 两种机制.其中2D-CNN 一般将原始EEG 信号通过时频变换等方式转换成2 维图像信号并利用CNN 实现癫痫自动检测.例如,Avcu等[112]提出的seizureNet 通过傅里叶变换将原始信号转换成时频图再利用卷积层学习实现癫痫自动检测.Covert 等[113]提出时间图网络算法将原始EEG信号转换成时间图并利用5 种不同层数的CNN 网络实现癫痫自动检测.Li 等[114]同时提取信号的多尺度时、频域特征,将压缩—激励网络 (Squeeze-andexcitation networks,SENet) 嵌入CNN 模型,实现自动检测,在癫痫发作事件检测和癫痫发作期检测的实验中,都取得了很高的准确率和敏感性.Thodoroff 等[115]将原始EEG 信号利用快速傅里叶变换和电极采样位置的2 维投影合成并进行三次样条插值,得到的平滑图像后利用循环卷积神经网络(Recurrent CNN,RCNN) 实现自动检测,获得了极高的敏感性和较低的误报率.Bizopoulos 等[57]使用LeNet、AlexNet、VGGNet、ResNet、DenseNet作为检测模型对图像化的EEG 信号进行癫痫自动检测.Craley 等[116]提出PGM-CNN 模型加强对概率图模型的理解能力,并进行癫痫检测.1D-CNN适合直接对EEG 信号进行处理,具有相对于2DCNN 更直观的网络结构,且更小的运算符代价.同时,将原始EEG 信号转化为时频图像可能带来一定的信息损失,因此1D-CNN 能够更大程度地利用数据信息.常见思路是将原始信号按照时间窗切分后以1 维形式输入CNN 网络.
针对音频、视频等随时间变化的数据,常用的深度学习模型为RNN,以长短时记忆 (Long-short term memory,LSTM) 与门控循环单元 (Gated recurrent unit,GRU) 结构为主.LSTM 解决了模型学习之前时间对当前时间数据信息的影响,和反向传播时梯度消失的问题.Chen 等[63]利用3 层LSTM 网络进行特征提取后通过sigmoid 函数分类,得到96.82 %的准确率.GRU 是LSTM 的变体,将LSTM 中的输入门和遗忘门合并为更新门,降低了LSTM 模型的复杂度.Roy 等[117]设计了5层GRU 网络ChronoNet,通过softmax 函数分类得到92.84 %的正确率.
AE 是一种无监督深度学习结构,通过对原始数据的降维表示实现分类.AE 包含编码器和解码器两个部分.编码器可将高维的输入数据降维,并得到与输入数据对应的隐藏层表示.隐藏层表示重新通过解码器恢复为原始维度,从而实现对原始输入的重构.Sharathappriyaa 等[118]首先使用Harmonic 波包变换,再将子带信号进行特征提取并使用AE 进行癫痫诊断.Rajaguru 等[119]利用多层自编码器和期望最大化主成分分析方法确定输入数据的重新表示,再利用遗传算法分类,实现93.78 %的癫痫检测正确率.
相较于传统机器学习模型,深度学习模型可学习无法手工提取的深度特征或模式,以此提升最终分类效果.同时,深度学习模型融合了传统模型中特征提取与分类两步,在训练数据足够的情况下能取得更好的学习效果,且节省检测时间.然而,深度学习模型往往依赖大量数据,否则容易因参数过拟合影响模型泛化性能[56].
3.4 迁移学习
上述癫痫自动检测模型是基于训练数据与测试数据具有相同数据特征分布的假设.但EEG 信号个体差异显著,实际应用中,测试数据和模型的训练数据往往不服从独立同分布假设,因此克服个体差异的通用癫痫自动检测模型更有实际价值.迁移学习[120]是利用相关域的标注数据或知识结构,完成或改进对目标域的学习的机器学习模型.对于通用的癫痫自动检测模型,用于训练模型的数据和实际测试数据可能来自于不同的个体,其信号的分布或存在较大的差异,且训练数据量受限,因而可通过迁移学习模型提高癫痫自动检测模型的泛化性能和正确率.如何进行有效迁移以提高模型泛化性能是迁移学习考虑的重点.
基于手工提取的特征,杨昌建等[59]提出利用特征空间内大间隔直推式迁移学习的LMPROJ 方法最小化训练数据与目标数据手工提取的特征之间的分布均值差,实现EEG 信号自适应识别,分类准确率超过93 %,显著优于传统机器学习.Jiang 等[121]把测试数据和训练数据的最大均值差异融合到TSK 模糊系统模型中,对原始EEG 信号通过小波包变换、STFT和核主成分分析等得到的手工特征进行分类,检测正确率相比于无迁移学习有大幅提升.
深度学习和迁移学习也可融合,进行深度迁移学习.Zhang 等[60]对VGG16、VGG19和ResNet50三种CNN 网络参数进行迁移,并将原始EEG 信号通过时频变换转换为时频图,在跨用户的癫痫自动检测实验中平均准确率超过96 %.Zhu 等[122]引入迁移学习中的元学习 (Meta learning),在模型层面上通过记忆增强相关结构使模型通过少量样本快速学习,同时改进距离矩阵的运算,再通过经预训练的基学习器和元学习器,不断优化参数实现稳定分类.
3.5 多视图学习
多视图学习[123]基于视图一致性和互补原则,利用多个不同视图之间的差异性和相似性,提高模型分类精度.多视图学习包括协同训练、多核学习和子空间学习等类别.协同训练通过对不同视图执行交替训练,最大化视图一致性;多核学习通过使用不同的内核训练模型并关联到不同的视图,再通过内核的线性或非线性组合提高学习性能;子空间学习则通过获得多个视图的公共子空间,提高数据一致性.如何最大化视图间的信息互补和对应模型的一致性是多视图学习的难点.
在癫痫自动检测中,Tian 等[61]利用CNN 模型提取EEG 信号的时域、频域和时频域深度特征,并构建为三个视图,通过多视图TSK 模糊系统进行多视图学习,提升了相较于单一视图的分类检测效果.Yuan 等[124]通过通道感知技术,利用AE 提取多通道EEG 信号的通道特征和通道内的时频特征两类视图,实现多视图癫痫自动检测.Liu 等[125]利用用户敏感模型进行通道选择,再针对选择的通道各个子频段提取时频特征构成多视图特征.通过公共空间投影矩阵提取数值和形态学特征,并利用最大平均差异自编码器提取通道间时频域特征,实现多视图的癫痫自动检测.
3.6 集成学习
集成学习模型将多个基分类器 (弱分类器) 集合成强分类器以提高分类效果,主要包括Bagging、Boosting和Stacking 三种学习策略[126].Bagging 随机改变训练集的分布而产生多个训练子集,对应训练多个基学习器再进行集成.Boosting 在弱学习器的基础上,增大上一轮被错误分类的样本的权重并训练新模型,最终组成强学习器.Stacking 首先训练多个不同的基学习器,再把其输出作为输入训练一个新的分类模型.集成学习的难点是如何同时提高基学习器的准确性和多样性.
在癫痫自动检测中,Hosseini 等[127]对手工提取的特征进行了子空间划分,并使用基于Bagging 的集成学习模型实现癫痫自动检测.Abualsaud 等[62]通过压缩感知对原始EEG 信号进行重构,再使用Stacking 融合多个传统机器学习模型实现癫痫发作期分类.Akyol[128]使用多个DNN 基学习器分别对原始EEG 输入信号进行学习,然后将其分类结果输入下一层的元学习器进行Stacking 融合,达到较好的分类性能.
3.7 主动学习
主动学习从大量无标注样本中选择最具有分类价值的样本进行标注,从而可以通过更少的标注样本达到要求的分类效果.主动学习很适合癫痫检测,因为EEG 信号很容易获取,但在实际训练癫痫检测模型时,为信号打标签非常费时乏味,给医生带来很大负担,而主动学习可有效缓解这一问题.主动学习的核心在于如何选择对构建分类模型最有用的样本.
在癫痫自动检测中,Chen 等[63]提出了double-DNN 模型,主DNN 模型运用最小置信度估计样本不确定性,副DNN 模型根据主DNN 模型的输出计算样本的误分类代价,并通过欧氏距离估计候选样本与已知样本的差异程度确定样本的多样性,结合上述三个指标选择最有用的EEG 样本进行标注.Ramachandran 等[129]对EEG 手工特征进行分类,对于超过阈值的样本通过基于伯努利—高斯混合模型的主动学习模型重新确定其不确定度,进而不断优化分类模型,提高模型对分类边界处样本的感知能力.
4 结论与展望
癫痫自动检测,即自动识别癫痫的发作状态,能够大幅减轻医疗工作者负担,并降低医生主观判断病情的不确定性.鉴于EEG 是一种低成本、易获取且无创的临床生理信号,基于EEG 的癫痫自动检测是提高癫痫检测、治疗效率的有效手段.本文首先系统地阐述了基于EEG 的癫痫自动检测流程,并对其各个步骤中所涉及到的具体方法进行了详细、全面的调研和总结.其中特征提取与分类器是该流程的核心模块,因此本文对典型的脑电特征和常用分类器进行了详细的描述.
根据上述调研与分析,结合基于EEG 的癫痫自动检测实际应用场景需求,本文从以下几个方面对该领域今后的研究方向进行展望:
1) 使用传统机器学习方法时,提取出有效的分类特征是癫痫检测的关键.通过传统方法进行癫痫发作检测目前已经能够达到较高的检出水平,但如何区分癫痫亚型疾病,如何区别发作期与发作间期以实现对癫痫疾病的预测,仍然是值得探讨的问题.
2) 当前的癫痫自动检测效果主要受限于现有的公开数据集数量和质量.很多研究是在非公开数据集上进行的,这也导致其模型的可靠度与可重复性大大降低.因此,建立大型的高质量癫痫EEG 数据集是非常有必要的,有助于公平、透明地对比不同检测模型的效果.
3) 近年来兴起的迁移学习方法可以通过由源域向目标域迁移,利用更多源域数据,提高分类性能,为提高单一数据来源的癫痫自动检测模型鲁棒性提供新的解决思路.
4) 对于不同类别的癫痫疾病识别也需进一步探索.首先,医学研究显示,某些类型的癫痫会导致特定的肢体动作和肌肉活动,与此相关的伪迹信号应该如何剔除值得深入研究.其次,如何设计高效的分类模型进行多类癫痫识别,并提高对不同癫痫亚型的区分能力具有相当大的临床意义,特别是对于医疗资源欠发达地区而言.
5) 随着可穿戴设备的不断发展,除了现有针对EEG 信号的特征提取外,其他生理特征的融合也具有相当的研究价值.既往研究显示[144]血氧饱和度 (Blood oxygen saturation,SpO2) 与癫痫发作的终止有关.将诸如此类的其他特征指标与EEG 结合,并运用多视图等机器学习方法进行癫痫自动检测,有望进一步提高检测准确度.
6) 近年随着深度学习的迅猛发展,大量基于深度学习的自动检测方法被广泛地应用于癫痫自动检测,并取得了良好效果.但该类方法也存在许多挑战.a) 深度学习往往依赖于大量数据,但实际研究中受限于数据集,很难获得大量的训练样本,这对于模型的准确性和鲁棒性都会造成较大影响.b) 现有的公开数据集几乎都是EEG 信号片段,与实际场景中连续实时信号存在差异,在解决实际问题时,利用EEG 片段信号训练的神经网络模型可能并不能很好地适应现实场景.c) 由于实际使用中计算资源受限,轻量级的神经网络模型将会更实用.