基于新型能量算子和多尺度熵的癫痫自动检测
2023-04-07帅国彬胡伟波
帅国彬 胡伟波
(南开大学电子信息与光学工程学院微电子工程系 天津 300350)
0 引 言
癫痫(Epilepsy)是一种常见的慢性精神性脑部疾病,是由于大脑神经元突发异常放电所引起的大脑短暂性异常障碍,具有反复性和突发性[1]。脑电图(Electroencephalogram,EEG)是通过非侵入性电极从头皮采集,综合反映大脑的放电活动,是诊断癫痫的有效工具。在传统的癫痫检测中,医学专家通过观察脑电图,找出包含癫痫特征的脑电波形。这种方法不仅耗时耗力,具有强的主观性,而且脑电图中存在的大量噪声也会对医学专家的判断产生干扰。近年来,癫痫自动检测和识别技术的发展帮助医学专家简化诊断过程和提高诊断准确性。
随着对脑科学的探索,研究表明人类的大脑相当于一个复杂的非线性动力系统[2],因此,各种建立在非线性方法基础上的癫痫性发作自动检测被相继提出。Hasan[3]发现正常EEG的近似熵大于癫痫发作期EEG的近似熵,可用近似熵对脑电信号进行特征提取并分类。文献[4]对近似熵算法进行优化,提出了样本熵,将其用于癫痫检测。传统的近似熵、样本熵和模糊熵等非线性特征分类性能较差,所得到的分类结果精度较低。文献[5]利用多变量经验模态分解(MEMD)提取脑电信号特征,并使用CNN进行分类,得到了87.2%的分类准确度。文献[6]使用关联性特征选择(CFS)的提取方法,使用随机森林(RF)作为分类器,得到98%的检测准确率。Zhou等[7]提出基于快速傅里叶变换和卷积神经网络模型得到97.5%的癫痫检出率。虽然已有很多的特征提取和分类方法运用于癫痫检测中,但如何提取含有丰富鉴别信息的有效特征用于后续的癫痫检测依然是个重要的挑战。
本文提出了一种新的脑电信号特征提取算法,并进一步探讨了在癫痫性发作自动检测中的应用。癫痫检测算法的流程如图1所示。首先,利用小波变换多分辨率分析对脑电信号进行一定尺度的分解,由于癫痫特征波频段的频率范围为8 Hz~42 Hz,所以舍去其他频段的信号,保留此频段的信号。其次,进行新型Teager能量算子计算,作用是能够消除零均值噪声的影响,而且可以有效地提取信号能量,具有增强信号的能力,从而利于信号的特征提取。进而,使用多尺度熵提取脑电信号的特征信息,它将脑电信号扩展到多个时间尺度,以便在时间尺度不确定时提供额外的观察视角。在脑电图中,潜在的脑电模式是未知的,因此相关的时间尺度也是未知的。所以,本文提出多尺度熵是在未知情况下分析脑电信号的有效方法。最后通过极限学习机对不同尺度的熵值进行训练和分类。
图1 癫痫检测算法流程图
1 原 理
1.1 小波变换及多分辨率分析
小波变换是空间(时间)和频率的局部变换。信号的连续小波变换的定义为:
式中:a为变换尺度参数,b为时移参数。
多分辨率分析(Multiresolution analysis,MRA)是研究和构建小波正交基的自然框架。它的空间分解是在不同尺度下,信号经降采样和滤波处理分解,从而得到一系列正交子空间Vj。多分辨率分析只对低频空间进一步分解,对高频部分不予考虑,使频率的分辨率变得越来越高。
1.2 新型Teager能量算子
Teager能量算子(Teager Energy Operator,TEO)是一个非线性算子,可以实时跟踪和反映信号的瞬时能量。若有连续时间信号x(t),TEO的定义:
如果x(t)=Acos(ωt+θ),则有:
ψ[x(t)]=ψ(Acos(ωt-θ))=(Aω)2
(3)
若对x(t)进行采样,其采样频率为fs,基频为f,ω=2πf/fs,则连续信号x(t)的离散形式应为x(n)=Acos(ωn+θ)。TEO的离散表达式为:
ψ(x(n))=x2(n)-x(n-1)x(n+1)=(Asinω)2
(4)
若ω足够小,则sinω≈ω。因此将ω限制在ω<π/4,即f/fs<1/8时,式(4)变为:
ψ(x(n))=x2(n)-x(n-1)x(n+1)≈(Aω)2
(5)
由式(5)可知,Teager能量算子可以对被测信号相邻的3个采样点进行计算,从而能够跟踪和反映被测信号的瞬时能量。但在实际情况中,信号中往往掺杂着大量噪声,在背景噪声频率较大或者信噪比较低的情况下使用TEO计算信号的瞬时能量,产生的噪声能量会使结果出现偏差。
由于TEO算法较差的抗噪性会直接影响检测结果的准确性,因此本文提出了一种新型Teager能量算子(NTEO)。NTEO是将分辨率参数i引入TEO中,对信号前后相隔i个采样点进行采样,即x(n-i)、x(n)、x(n+i),增强了对信号频率的敏感性,从而提高了NTEO算法的抗噪性,如式(6)所示。
ψ(x(n))=x2(n)-x(n-i)x(n+i)=A2sin2(iω)
(6)
由TEO可知,当iω<π/4,即f/fs<1/8i时,式(6)变为:
ψ(x(n))=x2(n)-x(n-i)x(n+i)≈(Aiω)2
(7)
由式(7)可知,NTEO也是利用信号的三个采样点跟踪和反映信号的瞬时能量,具有TEO算法的优点。同时,NTEO通过引入分辨率参数i,增强了信号的频域特性,以应对复杂环境下噪声带来的误差。
1.3 多尺度熵
多尺度熵(MSE)是度量不同尺度因子下时间序列的复杂性。算法分为两部分:一是对时间序列进行粗粒化得到多组新序列;二是对新序列进行熵计算。步骤如下:
② 将两个向量y(i)和y(j)之间的最大模定义为两者之间的距离dm(y(i),y(j)),距离计算公式如下:
dm(y(i),y(j))=max(|y(i+k)-y(j+k)|)
(9)
式中:0≤k≤m-1。
③ 统计y(i)与y(j)之间距离d≤r的j的数目,记为Bi。对于1≤i≤n-m,定义:
④ 定义平均相似率Bm(r),公式如下:
⑤ 将维数改变为m+1,重复步骤①-步骤④,计算平均相似率Bm+1(r)。
⑥ 熵定义:
1.4 极限学习机
极限学习机(ELM)是一种针对前馈神经网络(SLFN)的新型快速学习训练算法,该算法随机对输入权重和偏置进行赋值,并且在训练过程中无须做出调整,只需要通过矩阵计算出输出权重即可。相比于传统的学习算法,ELM的优点在于学习速度快、泛化性能好,且不会陷入局部极小点。具体步骤如下:
给定任意N个样本(Xi,ti),设SLFN有K个隐藏节点,则SLFN可表示为:
式中:g(x)为激活函数;Wi为输入权重;βi为输出权重;bi为偏置。
由于SLFN的最终目的是使输出误差最小,即:
所以,存在Wi、xj、bi使得:
设H为单隐层输出矩阵,β为输出权重,T为期望输出,则用矩阵可以表示为:
Hβ=T
(16)
由式(16),利用最小二乘法,即可求出输出权重β。
2 实验与分析
本文采用的癫痫数据集来源于波恩大学脑电信号数据库。此数据集包含5类子集,标号为A-E,每类子集又分为100个脑电信号数据段,采样频率为173.61 Hz。
首先选择db4作为小波基函数对已准备好的数据集进行4层小波分解。由于版面限制,在本文中仅对A组(正常EEG)和E组(癫痫发作期EEG)数据集的第一份数据(z001和s001)进行分析和显示。结果如图2-图3所示。
图2 正常EEG信号4层小波分解重构细节图
图3 发作期EEG信号4层小波分解重构细节图
在正常和癫痫发作两种不同的情况下,脑电活动信号的节律、幅值和频率有非常大的差别。与正常EEG相比,癫痫EEG中包含棘波、尖波、棘-慢复合波、尖-慢复合波等类型的特征波。在临床癫痫检测中,主要目标就是识别EEG中是否包含棘波和尖波,这些特征波的频率范围大致为8 Hz~42 Hz。因此在研究癫痫脑电信号时,可以选择分析这一频率范围附近的信号,这样在一定程度上减少运算量,并且能够提高癫痫脑电信号的识别效果。经分析,这些特征信息主要分布在分解重构的频带D1上,因此之后对D1进行NTEO计算。
由图4和图5可以看出,正常脑电信号的Teager能量较为平缓,在-20 μA~120 μA范围内波动。癫痫患者发作期脑电信号的Teager能量在棘波处波动非常剧烈,可达1.6×104μA。由此可以让正常EEG信号的特征和癫痫患者的EEG特征更加明显,方便后续的特征提取。
图4 正常EEG信号D1频带的能量算子
图5 发作期EEG信号D1频带的能量算子
多尺度熵计算结果如图6所示,在任一尺度上,正常EEG的熵值都要大于发作期EEG的熵值。
图6 不同EEG的多尺度熵
由图4、图5和图6可以看出,新型Teager能量算子和多尺度熵可以更好地提取EEG的非线性特征,并在多个尺度范围上显示,从而提高容错率。
将数据集分为训练数据集和分类数据集,采用上述算法求出数据集在不同尺度下的熵值作为ELM的输入,并设置隐含层神经元数目为20,选择Sigmoidal函数为激活函数。经过ELM训练和分类,输出脑电信号的分类准确率及ELM的运行时间,分别为98.89%和0.05 s。
进一步,为了验证本文方法相比于传统的熵提取非线性特征算法的优越性能,在相同的实验条件下,分别采用近似熵、样本熵、模糊熵算法提取EEG信号的非线性特征,而后采用ELM进行训练和分类。从表1的对比结果可以看出,本文所使用的算法在敏感性、特异性及准确率方面都要优于其他熵算法。
表1 与传统熵算法的结果对比(%)
本文采用ELM算法进行训练和分类。ELM与BP算法不同,BP算法的输入层到隐含层权值和隐含层到输出层权值全部需要迭代求解(梯度下降法),而ELM算法中,输入层到隐含层的连接权值、隐含层的阈值可以随机确定,且设定完后不用再次调整;隐含层和输出层之间的连接权值也不需要迭代调整,而是通过解方程组一次性确定,因此比BP算法的计算速度要快。不仅如此,BP算法在学习过程中更易陷入局部极小点,导致训练和分类错误。如表2所示,在相同的实验条件下,使用BP算法迭代20 000次求出各层之间的权值,其运行时间为288.68 s,准确率为96.11%,而使用ELM不需要迭代求解,其运行时间仅为0.05 s,约为BP算法运行时间的1/5 773。
表2 与BP算法的结果对比
表3列出了本文算法与现有其他算法的结果对比。如表3所示,时频熵、完全集成经验模态分解、加权可视图算法采用的信号特征个数较少,鲁棒性较高;希尔伯特变换和深度神经网络算法采用的信号特征个数较多,复杂性较大。本文提出新的癫痫检测算法中,多尺度熵反映脑电信号在不同时间尺度下信号的复杂性特征,输入ELM中训练和分类的特征只需要复杂性这一种特征。由此可知,本文算法所使用的信号特征个数更少,且分类准确率更高。实验结果表明,本文所提出的基于新型Teager能量算子和多尺度熵算法的脑电特征提取及ELM分类,在采用单特征信号的条件下得到98.89%的分类准确率。通过与传统熵特征提取算法和其他复杂网络提取特征算法相比较可知,本文算法运行速度更快,而且分类准确率也有了较大的提升。
表3 与其他现有算法的结果对比
3 结 语
本文提出了一种基于新型Teager能量算子和多尺度熵提取脑电信号特征并使用ELM训练分类的癫痫检测新算法。新型Teager能量算子可以实时跟踪脑电信号的能量,多尺度熵将脑电信号扩展到多个时间尺度,以便在时间尺度不确定时提供额外的观察视角,从而提升癫痫检测的准确度。与其他算法相比,本研究提出一种新的脑电信号特征提取和单特征训练分类方法,具有高分类准确度,更加简捷有效。实验结果表明,本文提出的癫痫自动检测算法的分类准确度达98.89%,实现了对正常脑电信号和癫痫脑电信号的高质量分类,对临床诊断具有现实性意义。