基于机器学习的抑郁症脑电识别研究
2023-02-28骆睿鹏邹任玲孟令鹏谈宏伟刘巨涛徐澜菲胡秀枋
骆睿鹏,邹任玲,孟令鹏,谈宏伟,刘巨涛,徐澜菲,胡秀枋,曹 立
(1 上海理工大学健康科学与工程学院,上海 200093; 2 上海交通大学医学院附属第六人民医院神经内科,上海 200233)
0 引 言
据世界卫生组织不完全统计,全球约有超过3.5亿的不同程度抑郁症患者,仅中国统计出的抑郁症患者已超过3 000 万,在近20年的时间抑郁症患者约增加了120 倍。 然而,对抑郁症的病理机制的认识、尤其量化的评估或精神健康的指标以及有效的精神障碍早诊早治方法仍然缺乏,这成为抑郁症患者痊愈的主要难题。
由于抑郁症的发病隐蔽性高和大众对抑郁症不够重视,仍有不少的抑郁症患者尚未得到有效治疗。目前,对抑郁症的诊断主要依赖于临床医生的观察、问诊以及问卷量表调查,这种方法存在一定的主观性和不确定性,易导致误诊、漏诊、前后诊断不一致,延误患者最佳治疗时期。 因此,现阶段研究者尝试运用神经成像技术如脑电(Electroencephalogram,EEG)、核磁共振、脑磁图、正电子发射断层显像等来实现对抑郁症的客观评价和诊断。 其中,EEG 具有一定的优势,如设备价格低、操作简单方便、时间分辨率高等。 随着人工智能的发展,采用机器学习方法结合EEG 信号特征用于识别抑郁症的分类研究越来越受到重视。
基于机器学习对抑郁症患者和正常人的脑电信号进行识别已经有一定的研究基础。 如Cai 等学者[1]利用86 名抑郁症患者和92 名正常人的脑电数据,提取得到了一部分特征,在KNN 模型上达到了86.98%的准确率。 Hosseinifard 等研究者[2]利用45名抑郁症患者45 名正常人的脑电数据提取4 个不同波段的功率谱和4 种非线性特征等特征,利用逻辑回归分类器达到90%的准确率。 郭雨[3]利用142名抑郁症患者和72 名健康人的静息态脑电数据,在6 种不同的机器学习算法模型上最好效果均达到了80%以上的准确率。 然而,以上这些研究只考虑到脑电信号的时域或频域或动力学方面等单一特征对识别的影响,而有大量研究表明抑郁症患者和正常人之间的不同脑部区域存在不同的活动性,因此需要从多方位地引入各种特征对抑郁症识别进行相应的研究。 本文拟通过将机器学习和脑电信号应用到抑郁症诊断中,一方面可以筛查出大量潜在患者并对其进行及时有效治疗,另一方面可以更客观准确地识别抑郁症,提高医生的工作效率,减轻工作压力。 实现基于EEG 信号的抑郁症患者识别将为抑郁症诊断提供一种新的辅助工具,具有极大的研究价值。
1 实验数据集介绍及脑电预处理
本研究使用的数据集选用兰州大学可穿戴计算重点实验室公开的用于精神障碍分析的抑郁症研究数据集[4],经兰州大学第二附属医院伦理委员会批准,并获得所有受试者的书面知情同意。 该数据集包含24 名抑郁症患者和29 名健康对照者所采集的脑电数据,采用128 导联进行脑电数据采集的头皮电极位置如图1 所示,使用HCGSN (HydroCel Geodesic SensorNet)系统采集脑电数据和NetStation软件记录脑电数据,整个采集过程的采样频率设置为250 Hz,分别采集了受试者闭眼静息态和睁眼刺激态下的脑电数据(刺激态脑电实验范式是采用中国化面孔情绪图片作为刺激材料,以此诱发注意力任务下的EEG 信号。 根据情绪效价的不同,共包含恐惧、悲伤、快乐和中性4 种不同类型的面孔情绪图片)。 抑郁症和健康对照组的年龄分布以及PHQ-9评分情况统计如图2 所示。 由图2 可知,抑郁症患者满足如下条件:
图1 128 导联头皮电极位置定位图Fig. 1 Positioning map of 128-lead scalp electrodes
图2 抑郁症和健康对照组的年龄分布及PHQ-9 评分情况Fig. 2 Age distribution of experimental subjects and PHQ-9 score statistics
(1)男女比例均衡且年龄范围在16 ~56 岁分布;
(2)在接受被试前均符合DSM 的抑郁症诊断标准,且经过PHQ-9 评分问卷的调查;
(3)在接受被试前两周以内未服用任何精神类药品,排除了有严重身体疾病或不良倾向的患者。
健康对照组满足如下:
(1)男女比例均衡且年龄范围在18 ~55 岁分布;
(2)排除了患有精神疾病病史以及有精神障碍家族史的人。
由于EEG 信号在采集过程中抗干扰能力较差,会受到各种干扰信号和伪迹的影响。 因此采用Matlab 2019b EEGLAB 工具箱和Python 中MNE 软件包对从采集设备获取到的原始脑电数据进行预处理工作,主要步骤如下:
(1)导入连续的脑电数据;
(2)电极定位后选择适用的电极通道;
(3)降低采样率用以提高运行速度;
(4)使用1~45 Hz 的带通滤波器以及50 Hz 的陷波滤波器来消除电源电路中的50 Hz 工频交流电等其他干扰信号;
(5)查看脑电时域波形图中是否存在坏通道,若存在则需要对坏导进行插补;
(6)将连续的脑电数据分段为多段epoch;
(7)使用ICA 算法手动校正由眼电、眨眼、心电、肌肉活动等产生的生理性伪迹成分和其他非生理性伪迹影响的数据部分以得到较为纯净的脑电数据;
(8)手动去除漂移较大的脑电数据段;
(9)对预处理后的脑电数据进行保存。
2 抑郁症脑电特征提取和机器学习算法
本节通过提取抑郁症患者和健康对照组不同状态下的脑电信号的线性特征和非线性特征,使用随机森林[5]、逻辑回归、K 近邻[6]、支持向量机[7]四种机器学习算法模型进行分类识别,通过比较单一类型特征和多种类型特征、静息态和刺激态、不同情绪刺激态情况下的抑郁症病症识别效果,对抑郁症病症情况进行分析,并通过调整模型参数获得最优识别模型,具体技术实现路线如图3 所示。
图3 技术实现总流程图Fig. 3 General flowchart of technology realization
大脑皮层根据不同的位置一般被划分为额叶、颞叶、顶叶和枕叶,每一块区域都能够反映出人体的不同反应活动。 其中,额叶区域与注意力、记忆、个性和情感等高级认知活动有关[8],有研究者们认为额叶病变主要导致精神障碍,常表现为注意力丧失、冷漠、思维反应力和创造力都显著下降,这也是抑郁症患者的一部分病症体现。 杨勇等研究人员通过分析抑郁症患者的脑区能量占比发现,与大脑皮层中央区域和枕叶区域相比,重症抑郁症患者在经过治疗后的额叶区域能量占比表达更为强烈。
由抑郁症引起的脑电信号异常特征中,经典的以明确的α节律为主,在额叶区域具有较高的振幅,并且同样也会经常采集到δ 节律,有研究表明,与α节律的异常相比,β、δ、θ节律的变化更为明显,不同频带信号的功率谱或大脑不同区域的数据通道之间的不对称性也会显示出不同。 这些脑电信号特征可用于确定抑郁症的发作情况并评估治疗的有效性,特别是对于长期轻度抑郁症患者。 医学上根据脑电成分的波动特征将脑电信号分为5 种节律信号,详见表1。不同的EEG 节律频段对应不同的人体状态,各种EEG 节律频段都可在大脑皮层的不同区域出现,但往往在不同的生理状态下最明显的大脑区域有所不同。
表1 脑电信号各节律频段及特点Tab. 1 Frequency bands and characteristics of each rhythm of EEG signal
以上这些频段节律信号可以从不同情绪状态中获得,在不同情绪状态下,脑电信号的频率和振幅都会发生相应的变化。 本研究采用的线性特征主要由脑电信号的峰峰值平均幅度、中位振幅、最大振幅、最小振幅以及α、β、δ、θ四种脑电波节律信号组成[9]。
由于脑电信号的非线性、不规律性以及非平稳性的特点,传统的线性特征只是在时域和频域上反映EEG 的某方面特征,引入非线性动力学方法能够更加全面地对EEG 的特征进行分析。 其中,熵作为非线性特征,是可以用来表征一个系统的复杂性和不规则性。 本研究采用的非线性特征主要由奇异值分解熵、谱熵、排列熵组成[9]。
奇异值分解熵是一种通过奇异谱和信息熵相结合的分析方法,其基本思想是通过对系统的时域信号序列进行相空间重构和奇异值分解,获取其内在复杂性特征。 在信号的奇异谱分析基础上,计算奇异谱的信息,即奇异值分解熵,则可定量描述时间序列的复杂状态特征。 谱熵是用来表示输入信号能量在功率谱划分下的不确定性,若信号组成成分较为复杂时,信号对应的功率谱越分散,对应的功率谱线会增多,得到的谱熵值就会变大,因此谱熵是对信号在频域上能量分布的复杂程度的定量描述。 排列熵是一种能够检测信号突变的复杂程度的平均熵参数,其值越大就表示所对应的信号越复杂,计算过程简单并且具有很好的抗干扰能力和鲁棒性,能将无法定量描述的复杂系统简洁地描述出来。
3 实验结果与分析
在本次实验中,分类器采用了机器学习中的随机森林、逻辑回归、K 最近邻、支持向量机四种算法模型进行构建,主要对以下几种组合情况进行讨论:
(1)线性特征和非线性特征在单独及组合构成特征数据集下的识别效果对比;
(2)静息态和刺激状态下的脑电信号进行识别效果对比;
(3)恐惧、悲伤、快乐三种不同情绪刺激下的脑电信号进行识别效果对比。
3.1 单一类型特征及组合特征下的识别结果对比
为了研究不同类型特征对抑郁症患者和正常人的脑电信号分类的影响,首先分别对线性特征和非线性特征这2 类单一类型的特征进行抑郁症识别。
线性特征下的抑郁症识别结果见表2。 由表2可以看出,基于刺激态特征数据集和调优后的随机森林算法组合构建的抑郁症识别分类模型具有最高的分类准确率,达到91%。 另外,在悲伤情绪刺激态和静息态下,模型的识别准确率最高达到了70%以上。
非线性特征下的抑郁症识别分类结果见表3。由表3 可以看出,整体的识别准确率都不是很高,只有基于快乐状态特征数据集和调优后的随机森林算法组合构建的抑郁症识别分类模型的准确率能达到60%以上。
表3 非线性特征下的抑郁症识别准确率Tab. 3 Accuracy of depression recognition under nonlinear features%
考虑到单一类型的特征表征抑郁症病症信息缺乏片面性,为了充分考虑特征之间的互补性,于是将2 种不同类型的脑电特征进行组合作为判断抑郁症的特征数据集,这样就能够尽可能地涵盖抑郁症人群和健康人群中关于大脑活动模式的变化。
在上述实验的基础上,分别将线性特征数据集和非线性特征数据集进行特征组合后再对抑郁症进行识别分类,识别分类结果见表4。 表4 中,在恐惧状态、悲伤状态两种特征数据集下的抑郁症识别准确率能达到70%以上,在静息态和刺激态两种特征数据集下的抑郁症识别准确率能达到60%以上。
表4 组合特征下的抑郁症识别准确率Tab. 4 Accuracy of depression recognition with combined features%
分析以上2 组单一类型特征下的抑郁症识别结果,可以看到线性特征下的分类识别准确率要普遍高于非线性特征,这在一定程度上表明了抑郁症患者对于频段线性特征信息要更具敏感性,脑电信号的线性特征能更有效地表征出抑郁症患者的脑内活动变化。 分析单一类型特征和多种类型特征下的抑郁症识别分类效果,发现相比较于单一非线性特征的分类结果,多特征组合后的识别效果有了一定的提升,说明这2 类单一类型特征均包含表征抑郁症病症的有效信息,并且采用多种类型特征组合对于识别抑郁症有一定的辅助作用。
3.2 静息态和刺激态下的抑郁症识别对比
为了研究不同类型特征对抑郁症患者和正常人的脑电信号分类的影响,在上述对比分析基础上,为了进一步探究抑郁症患者和正常人对于静息态和刺激状态下的识别效果,于是在保证同一类型特征的基础上分别对静息态和刺激态进行识别分类,静息态识别结果如图4 所示,可以看出,静息态下的识别准确率最高能达到70%以上。 刺激态识别结果如图5 所示,可以看出,刺激态下的识别准确率最高能达到90%以上。
图4 静息态脑电信号下的抑郁症识别分类结果Fig. 4 Classification results of depression recognition under resting state EEG signal
图5 刺激态脑电信号下的抑郁症识别分类结果Fig. 5 Classification results of depression recognition under stimulated state EEG signals
从上述对比结果可以看出,抑郁症患者在刺激下相较于静息态下能表征出更显著的特征,因此在抑郁症临床早期诊断可以对就诊人进行适当性的刺激以诱发出与抑郁症状态相关的大脑区域的不同模式。
3.3 3 种不同情绪刺激下的抑郁症识别对比
为了进一步分析出刺激态下抑郁症患者对哪种情绪刺激更敏感[10],于是针对采集脑电实验范式中的不同类型情绪状态下的抑郁症识别效果进行分析。
恐惧情绪刺激下的抑郁症识别分类结果如图6所示。 图6 中,从恐惧情绪状态下的抑郁症识别分类结果中可以看出,非线性特征对于该情绪状态下的抑郁症表征比较显著,最高准确率能达到70%以上,并且在进行多特征组合下,非线性特征能有效提高线性特征下的恐惧状态下的抑郁症识别分类结果。 悲伤情绪刺激下的抑郁症识别分类结果如图7所示。 图7 中,从悲伤情绪状态下的抑郁症识别分类结果中可以看出,线性特征对于该情绪状态下的抑郁症表征比较显著,最高准确率能达到80%以上,而特征组合的方式能有效提高非线性特征在悲伤状态下的抑郁症识别效果。 快乐情绪刺激下的抑郁症识别分类结果如图8 所示。 图8 中,从快乐情绪状态下的抑郁症识别分类结果中可以看出,不论是非线性特征、还是线性特征对于该情绪状态下的抑郁症表征都不太显著,对于抑郁症识别最高准确率才达到60%左右。
图6 恐惧情绪刺激下的抑郁症识别分类结果Fig. 6 Classification results of depression recognition under fearful emotion
图7 悲伤情绪刺激下的抑郁症识别分类结果Fig. 7 Classification results of depression recognition under sad emotion
图8 快乐情绪刺激下的抑郁症识别分类结果Fig. 8 Classification results of depression recognition under happy emotion
通过对以上3 种情绪状态下的抑郁症识别结果分析,能够表明抑郁症患者对于悲观情绪下的刺激感知非常显著,对于乐观情绪下的刺激感知比较迟钝。 该结果还充分体现了临床抑郁症患者普遍的悲观消极情绪严重的情形。
4 结束语
本文研究提取了脑电信号的线性和非线性特征,使用机器学习方法对抑郁症患者进行综合分析,通过对单特征、多特征的识别对比分析,非线性特征不一定能有效提高对抑郁症病症的识别准确率,而线性特征在表达抑郁症患者和正常人的区别中有一定的优势,造成这种现象的原因可能是抑郁症患者的症状与大脑皮层的异常活动产生的特定频段电信号有关。 通过构建最优特征矩阵和调整最优参数得到了基于刺激态线性特征和随机森林算法抑郁症识别模型,其准确率达到最高91%,从而验证了机器学习方法进行抑郁症辅助诊断的适用性,能更好地识别抑郁症,可对后续抑郁症的早发现早干预早治疗提供一定的参考价值。 本文还创新性地对静息态和刺激态两种不同脑电状态下的数据集进行了对比分析,实验结果表明抑郁症患者对于外界刺激较为敏感,进而产生了不同于静息态下的脑电波成分。同时,还针对刺激态下的恐惧、悲伤、快乐三种情绪状态抑郁症识别准确率进行对比分析,结果显示抑郁症患者对于正性情绪的脑部反馈和认知出现异常,而对负性情绪产生了认知偏向,脑区活跃程度更大,更容易对负性情绪进行加工,这进一步验证了抑郁症患者存在对于正性情绪的选择性抑制,表现出难以被激活的现象,这为抑郁症的发病机制提供了电生理证据,也为后续针对抑郁症患者进行治疗采用非物理性的情感认知治疗手段提供了一定的可行性验证。