APP下载

基于自然语言和脑电的高反刍人群识别研究

2023-10-31李晨曦李宇龙王玲玲林鑫鑫苗丹民

空军军医大学学报 2023年10期
关键词:相干性全脑中性

李晨曦,李宇龙,王玲玲,林鑫鑫,戴 红,崔 迪,方 鹏,苗丹民

(空军军医大学军事医学心理学系,陕西省生物电磁检测与智能感知重点实验室,陕西 西安 710032)

反刍是指对负性刺激的持续关注,包括负性事件的原因和后果以及由此产生的消极情绪,从而导致抑郁等症状,这是一种非适应性的调节情绪方式[1-3]。根据反应方式理论,反刍会延长和加剧对负面或压力事件反应的痛苦,并增加绝望感,使初期的抑郁症状更易转变为重度抑郁[4]。研究表明,反刍和乙醇滥用、焦虑症状、广泛性焦虑障碍、社交焦虑障碍、强迫症、创伤后应激综合征、精神分裂症、边缘型人格障碍以及神经性贪食症等精神障碍相关[5]。

尽管反刍的评估量表众多,但使用最广泛的依然是NOLEN-HOEKSEMA等[1]于1991年编制的《反刍反应量表》(Ruminative Response Scale,RRS)。目前,传统的反刍研究大多使用RRS,但传统心理测试量表的局限性也非常明显,特别是在心理选拔中[6-7],由于虚假作答、社会赞许和主观倾向等问题[8-11],严重影响了反刍心理检测的效果。因此,客观测量受测者的反刍意识活动,寻找反刍思维的神经标志物以识别反刍人群,有助于提高对高反刍人群的识别率,对于精准心理选拔具有十分重要的意义。

SUTHERLAND等[12]认为反刍实际上就是因其更多的负性情景记忆而被启动的,因此,特定情景记忆可以作为启动反刍的最为有效且快速的手段。在情景记忆的研究中,WILSON-MENDENHALL等[13]提出了“情景沉浸”理论,他认为由精确语言引导的沉浸式心理想象是一种理想的范例,令受测者迅速将自己投射到各种不同情境中,这一成果在YADAV等[14]的研究中得到证实。自然语言,是人类日常所使用的语言,是交际的重要方式[15]。研究发现,自然语言特定诱发材料可更好地唤起整段情景记忆[13,16]。随着人工智能的发展,自然语言处理技术(natural language processing,NLP)已经能够实现包括机器翻译、自动汇总、情感分析和文本分类等一系列工作[17]。本课题组前期结合“情景沉浸”理论和NLP技术,构建了反刍诱发材料,经验证材料的信效度均较好,可以有效诱发受测者的反刍思维[18]。虽然刺激材料已经可以有效诱发受测者的反刍思维,但是由于量表的赞许性、掩饰性等固有缺陷,仍然需要更为客观的指标帮助识别高反刍者,从而使测量结果更加准确。

与功能核磁共振、脑磁以及近红外相比,脑电(electroencephalogram,EEG)以其高时间分辨率、经济、便携等优点,在反刍思维的神经基础的研究中被广泛使用。FORNER-PHILLIPS等[19]研究发现,具有反刍特质的人在背景记忆过程中,α和β波的功率发生异常,WANG等[20]采用EEG研究重度抑郁症患者的反刍思维的脑网络特征,结果显示患者在思维反刍的过程中,大脑网络的空间整合在时间尺度上向局部迁移,FERDEK等[21]针对抑郁反刍患者的情绪控制环路进行研究,发现高反刍者的左侧颞叶的EEG信号的能量显著高于正常受测者。这些研究说明,相比于正常人,高反刍人群的EEG具有一定的特异性,有可能为高反刍人群的早期识别提供辅助。

综上所述,本研究拟采用EEG技术,以自然语言构建的反刍量表作为反刍思维的诱发材料,探索反刍情景范式下不同被试的EEG特征差异,以期实现对高反刍人群的辅助心理测量。

1 对象与方法

1.1 对象

被试从陕西警官职业学院2 100名入学新生中筛选。首先,采用RRS和正性负性情绪量表对被试进行评估,并根据RRS分数的百分位排名(percentile rank,PR)筛选被试。RRS分数大于65%(PR>65)的被试为高反刍者,RRS分数小于27%(PR<27)的被试为低反刍者。最后,共筛选具有高反刍特质人群100名,根据自愿原则,56名[PR>65,RRS评分(63.79±6.38)分,平均年龄(22.48±7.73)岁]高反刍者自愿参与EEG实验,同时招募29名正常被试[PR<27,RRS评分(22.14±0.44)分,平均年龄(20.59±1.64)岁]。排除标准:①精神病学史;②曾在精神科住院;③目前或过去使用抗精神病药物;④神经系统疾病史;⑤为了统一,本研究仅招募右利手,排除左利手被试。该研究已获得空军军医大学西京医院医学伦理委员会批准(许可证号:KY20193304-1)。所有参与者在进行正式实验之前都签署了知情同意书,并获得了相应经济补助。

1.2 方法

1.2.1 EEG数据采集 反刍诱发刺激材料采用本课题组自主编写的基于自然语言的反刍刺激材料[18]。被试在主试引导下完成问卷测试。问卷共包括反刍刺激材料(37项,占70%)和中性材料(16项,占30%),共计53道题目。在被试完成问卷的同时,使用无线EEG设备采集EEG信号。所有题目混合随机呈现在电脑屏幕上。被试坐于实验电脑前,眼睛距刺激屏幕70 cm左右。待被试熟悉环境准备好后,阅读指导语明白后随机呈现诱发材料作答。每项刺激之间以500 ms加号间隔。要求被试使用鼠标或键盘选择“是”或“否”选项作答。每项材料作答时间不限,被试鼠标选择后题目立刻消失。为了截取被试做特定题目的EEG信号,本研究同时采集了被试的眼动信号作为题目开始和结束的时间戳。本实验流程图见图1。

EEG信号由32通道半干电极帽通过无线多通道EEG图采集系统(臻泰NT1,臻泰智能,中国)采集。采样率为500 Hz。该设备使用了国际10-20电极放置系统,FPz为参考电极,CPz为接地电极。阻抗水平设置为小于20 kΩ。在500 Hz的采样率下,以24位分辨率采集EEG的所有通道,共模抑制比为120 dB,输入阻抗为1 GΩ,输入噪声小于0.4 μV/ms。

EEG:脑电。图1 刺激材料作答及EEG记录程序流程图

1.2.2 EEG数据预处理 EEG信号预处理使用安装在MATLAB 2018b中的FildTrip(版本20221122)完成。首先检查数据质量并使用插值法处理波段信道。接着去除50 Hz工频干扰。然后,用1~100 Hz零相带滤波器对EEG图进行带通滤波。随后,根据同时采集眼动信号的时间标记(每个通道中每个参与者的53个题目)将任务EEG划分为每个题目相关的信号时间段。手动检查并删除所有干扰较大的数据。如果数据坏段总数超过5个,则数据无效。总计删除10名高反刍者的EEG数据,余下46名高反刍被试的数据进行后续的计算和分析。随后对信号进行独立成分分析,删除眼动、肌电、心电等干扰信号,以最终获得干净的EEG信号。

1.2.3 EEG信号相干性计算 本研究提取不同通道EEG信号相干性特征进行后续分析。首先将EEG信号分为theta(4~7 Hz)、alpha(>7~12 Hz)、beta(>12~29 Hz)、gamma1(>29~59 Hz)和gamma2(>59~80 Hz)5个频段,采用Matlab的“mscohere”函数计算电极对之间的相干性。“mscohere”函数使用Welch’s的重叠平均周期图方法估计幅度平方相干函数(每个窗口使用512个点,90%重叠)。对于信号x和y,Cxy(f)的相干值计算为以下函数:信号x的频谱密度表示为Pxx(f);y的频谱密度表示为Pyy(f);x和y的交叉频谱密度,表示为Pxy(f):

(1)

得到电极对之间的相干特征之后,对所有电极对的相干性值取平均,获得全脑信号上述5个不同频段的相干特征。值得注意的是,为了尽量减少体积传导的影响,本研究在计算每个波段的平均相干性之前将相邻电极的相干性设置为零。

1.2.4 支持向量机(support vector machine,SVM)分类 本研究将每个人的题目根据题目属性分成反刍题和中性题,分别提取两类题目的5个频段的全脑的相干特征,也就是说,每个人共有10个特征。接着,采用SVM的方法,对两组被试进行分类。本研究采用RBF核函数。在模型训练过程中,将本研究全部的75个被试样本(其中,反刍组46人,对照组29人)随机抽取60个样本作为训练集,15个样本作为最终的测试集。首先,在训练集中,采用5折交叉验证的方法,寻找最佳的模型参数c(损失函数参数)和g(核函数参数),然后在训练集中获得SVM二分类模型,最后将训练好的模型,在测试集上进行验证。本研究共分三种情况分别进行分类分析,分别是只用反刍题的EEG相干性作为特征,只用中性题目的EEG相干性作为特征以及将两种题目混合作为特征进行分类。

2 结果

本研究采用基于“情景沉浸”理论和自然语言处理技术编写的反刍诱发材料作为刺激材料,采集被试在阅读刍刺激材料并答题的过程中的EEG信号,通过对EEG信号进行数据检查、预处理和分段,得到53道题目对应的EEG数据,并根据题目的种类,将EEG信号分为反刍题和中性题两种,计算53道题目对应的全脑不同通道之间的相干性特征,得到2种类型题目,5个频段的EEG相干特征,最后采用SVM分类算法,对两组被试进行分类。

2.1 反刍诱发刺激材料评估

研究中使用的刺激材料采用“是”和“否”两级回答选项,回答“是”计1分,回答“否”计0分,将回答为“是”的百分比定义为刺激材料对被试反刍思维的唤醒率。本研究最终计算了75名被试在测试过程中,对题目的反应时以及回答为“是”的百分比。统计结果显示,在做反刍题时,反刍组的唤醒率显著高于对照组[(62±32)%vs(16±19)%,P<0.001),而在做中性题时,两组被试的唤醒率没有显著差异[(8±15)%vs(8±12)%,P=0.93)。对反应时的统计结果显示,在做反刍题时,反刍组的反应时长显著大于对照组[(15.73±4.62)msvs(12.82±3.14)ms,P<0.001),做中性题目时,两组被试反应时没有显著差异[(9.66±4.05)msvs(11.03±3.52)ms,P=0.14)。

2.2 两组被试的EEG特征

本研究计算了两组被试回答两类题目的theta(4~7 Hz)、alpha(>7~12 Hz)、beta(>12~29 Hz)、gamma1(>29~59 Hz)和gamma2(>59~80 Hz)5个频段全脑的相干性(表1)。统计结果显示,在做反刍题目时,反刍组的全脑相干性在beta和gamma2频段显著升高,而在做中性题目时,反刍组的全脑所有频段相干性均显著升高,这可能和被试持续沉浸在反刍情景中有关。此外,本研究还分别对两组被试做反刍题目和中性题目的全脑相干特征进行组间统计,结果显示,对照组在做中性题目和反刍题目时,全脑的相干性特征没有显著变化,而反刍组全脑相干性分别在theta、alpha、beta和gamma1频段显著降低。这也从侧面说明,反刍题目诱发了反刍组的反刍思维。

表1 反刍组和对照组在回答两种题目时的全脑相干性

2.3 基于题目属性的高反刍人群识别结果分析

提取了两组被试回答两种属性题目的全脑5个频段的全脑相干性特征后,采用SVM算法,对两组人群进行分类识别。

2.3.1 仅提取两组被试在回答中性题目时的EEG相干特征的分类结果 仅提取两组被试在回答中性题目时的EEG相干特征,并进行人群分类,结果显示,得到的SVM模型在测试集中的准确率为86.67%,ROC曲线下面积(area under the curve,AUC)为0.86(图2)。

A:SVM分类结果(测试集样本类别中0表示否,1表示是);B:ROC曲线图。SVM:支持向量机;AUC:曲线下面积。

2.3.2 仅提取两组被试在回答反刍题目时的EEG相干特征的分类结果 仅提取两组被试在回答反刍题目时EEG相干特征,并进行人群分类,得到的SVM模型在测试集中的准确率为66.67%,AUC为0.88(图3)。

A:SVM分类结果(测试集样本类别中0表示否,1表示是);B:ROC曲线图。SVM:支持向量机;AUC:曲线下面积。

2.3.3 反刍题目与中性题目混合的分类结果 将被试在回答所有题目时的EEG相干特征作为特征向量进行人群分类,结果显示,得到的SVM模型在测试集中的准确率为86.67%,AUC为0.96(图4)。

A:SVM分类结果(测试集样本类别中0表示否,1表示是);B:ROC曲线图。SVM:支持向量机;AUC:曲线下面积。

2.3.4 三种特征组合对比 最后,分别对三种模型进行评估,计算对比了三种组合特征在对两组人分类识别过程中的准确率、灵敏度和特异度(表2)。虽然,采用中性题目进行分类时的准确率和特异度较高,但是灵敏度低于两种题目混合的分类效果。综合所示,当将两种类型题目组合到一起的时候,分类预测模型性能较好。

表2 不同组合特征分类结果的评估 (%)

3 讨论

本研究基于“情景沉浸”理论和自然语言处理技术构建的反刍诱发刺激材料,采用EEG技术和SVM机器学习算法,对被试在阅读反刍材料、回答问题过程中的EEG进行采集、预处理、特征提取和分析。本研究提取被试在回答反刍诱发材料过程中EEG信号5个频段的全脑电极对之间的相干性特征,采用SVM进行人群分类和识别。研究结果显示,当将回答反刍题目和中性题目的EEG特征混合作为分类特征时,分类模型的准确率为86.67%,综合模型的灵敏度和特效度较高。研究结果表明,自然语言诱发的EEG特征可作为高反刍人群识别的特征之一,有望提高心理测量的可靠性。

在EEG研究中,电极对之间信号的相干性是研究大脑不同区域神经活动相关性常用的方法[22-23]。本研究发现,对照组在做反刍题目和中性题目时,全脑的相干性没有发生显著差异,而反刍组在做反刍题目时,全脑的相干性显著降低,同时,组间统计显示,在做反刍题目时,反刍组的全脑相干性在beta和gamma1频段显著高于对照组,这说明,诱发材料的反刍题目有效诱发高反刍者的反刍思维,从而高反刍者的全脑的同步性显著异于正常被试。本研究发现,在做中性题目时,高反刍者全脑的同步性在所有频段均显著高于正常被试,产生这个结果可能有以下两个原因:一方面,这可能是由于高反刍者本身的反刍思维模式导致的大脑“过连接”[24],反映了高反刍者大脑本身同步性的发生异常;另一方面,这可能是实验设计导致的,由于反刍题目诱发高反刍者的沉浸式反刍思维,在回答中性题目时并未完全从题目的情境中脱离出来,导致在回答中性题目过程中,大脑的同步性显著大于对照组。在后期实验过程中,应考虑将反刍题目和中性题目分开测试,以避免这种情况出现。

本研究分别将被试回答反刍题目和中性题目的EEG相干性作为特征向量,采用SVM作为分类算法,分三种情况进行不同人群的分类识别分析,结果发现仅将被试在回答中性题时的EEG相干特征作为输入特征时,准确率为86.67%,AUC为0.89,但灵敏度较低,仅为77.00%,而将被试在回答反刍题时的EEG相干特征作为输入特征时,准确率为66.67%,AUC为0.88,但灵敏度较高,当将被试在回答所有题目时的EEG相干特征作为输入特征时,准确率为86.67%,AUC为0.96,灵敏度也较高,为84.60%。以上说明,被试在进行测验过程中,中性题目和反刍题目对于反刍人群都具有一定的区分度,但是反刍题目的灵敏度很高,而中性题目的灵敏度较低。正如上述讨论所述,这可能是由于高反刍者持续沉浸在反刍思维,这也从侧面说明,本研究所采用的反刍诱发材料可以诱发高反刍人群的沉浸式反刍思维。通过对模型的评估结果可以发现,当将被试回答反刍题目和中性题目时的EEG特征混合作为特征向量时,SVM模型具有较好的预测准确率和灵敏度。

但是,本研究仍然存在一些缺点。首先,在被试的选择上,由于全部来自于警官学校,因此采集EEG的被试全部为男性,虽然有研究表明,抑郁症的发病率在性别中不具有显著差异[25],但是研究结果仍然需要进一步在女性群体中进行验证。其次,本研究提取了不同通道之间的EEG的相干性作为特征,准确率最高仅为86.67%,在后续研究中,需要探索其他的EEG特征,进一步提升分类预测的准确率。最后,后续研究应考虑将反刍题目和中性题目分开测试或者单独设立中性测试,从而避免反刍题目测试对中性题目产生影响。

猜你喜欢

相干性全脑中性
Kerr相互作用下量子相干性分布和量子信息流动
英文的中性TA
SmartKey脑力空间组织的全脑开发体验课开课
联合干涉相位和相干性幅度的极化干涉SAR最优相干性估计
乒乓球运动员在经验相关图形识别中的脑电相干性分析
非常全脑绘画
高桥爱中性风格小配饰让自然相连
FREAKISH WATCH极简中性腕表设计
CT全脑灌注成像在脑血管病变中的临床价值
一株中性内切纤维素酶产生菌的分离及鉴定