基于PH-GAT的精分患者分类预测模型研究
2024-06-18盛志林阴桂梅符永灿
盛志林 阴桂梅 符永灿
收稿日期:2023-09-19
DOI:10.19850/j.cnki.2096-4706.2024.07.023
摘 要:对目前基于脑网络的分析进行研究,研究显示,分析方法大致分为基于持续同调方法的分析和基于深度学习模型的分析。为了提高脑疾病诊断的预测能力,模型将持续同调集成到GAT模型中,使其具有“拓扑意识”。在模型的最后使用LSTM模型,目的是为了捕捉到所形成特征中的时序信息,从而提高分类预测的效果。在PH-GAT模型下,采用局部和全局的融合特征对Theta频段数据分类,分类准确率高达0.930 9。如此不仅可以发现早期诊断精神分裂症的客观、有效的影像学标志物,还可以提高脑疾病诊断的预测能力。
关键词:脑网络;持续同调;图注意力网络;精神分裂症
中图分类号:TP391;TP183 文献标识码:A 文章编号:2096-4706(2024)07-0107-07
Research on a Classification Prediction Model for Schizophrenic Patients Based on PH-GAT
SHENG Zhilin, YIN Guimei, FU Yongcan
(College of Computer Science and Technology, Taiyuan Normal University, Jinzhong 030619, China)
Abstract: This paper studies the current analysis based on cerebral network, the study shows that the analysis methods can be broadly categorized into two main approaches: analysis based on continuous homotopy methods and analysis based on Deep Learning models. In order to enhance the predictive capabilities of brain disease diagnosis, this model incorporates continuous homotopy into the GAT model, endowing it with a “topological awareness”. Towards the end of the model, the Long Short-Term Memory (LSTM) model is employed to capture temporal information embedded within the extracted features, thereby enhancing the effectiveness of classification prediction. Under the PH-GAT model, a fusion of local and global features is applied for classifying data in the Theta frequency range, achieving a high classification accuracy of 0.930 9. This approach not only enables the discovery of objective and effective imaging biomarkers for early schizophrenia diagnosis, but also enhances the predictive capabilities of brain disease diagnosis.
Keywords: cerebral network; continuous homotopy; Graph Attention Network; schizophrenia
0 引 言
脑信号数据作为一种重要的生物信号数据,对于理解大脑活动和认知过程具有关键意义。近年来,随着神经科学和计算神经学领域的快速发展,图神经网络(Graph Neural Networks, GNN)[1]和循环神经网络(Recurrent Neural Networks, RNN)[2]等深度学习模型在脑电信号数据处理中引起了广泛的关注。在本论文中,我们将着重研究脑电信号数据分析中的关键方法,包括Graph Attention Network(GAT)、Graph Convolutional Network(GCN)、Long Short-Term Memory(LSTM)以及基于持续同调的拓扑数据分析[3]。我们将探索这些方法在脑电信号数据处理中的应用,并期望能够为脑科学领域的研究和临床实践提供新的洞见和方法。
首先,GAT和GCN是两种重要的图神经网络模型,它们被广泛应用于图数据建模。在我们的研究中,我们将利用GAT和GCN来构建脑电信号数据的图结构,并通过自适应地学习节点之间的注意力权重和关系,更好地捕捉大脑区域之间的功能连接和信息传递。
其次,LSTM作为一种常用的循环神经网络,其在序列数据建模中表现出色。在本论文中,我们将探索LSTM在脑电信号数据中的应用,特别是对于时间序列数据的特征提取和长期依赖关系建模。通过LSTM的应用,我们期望能够更好地理解脑电信号数据中复杂的时间动态变化。
除了深度学习模型,我们还将研究基于持续同调的拓扑数据分析方法在脑电信号数据处理中的应用。拓扑数据分析是一种新兴的数学工具,能够捕捉数据的拓扑结构和形状信息。我们将探索如何将这种方法应用于脑电信号数据,以揭示脑网络的拓扑特征和拓扑动力学过程,从而更深入地理解脑的复杂活动。
综上所述,本论文将综合运用GAT、GCN、LSTM和基于持续同调的拓扑数据分析等多种方法,以探索脑电信号数据的深层特征和动态特性。通过这些研究工作,我们希望能够为神经科学和脑科学领域提供新的分析手段和认知机制的理解,为相关疾病的诊断和治疗提供有力的支持。
1 基本原理
1.1 图注意力网络
GAT [4]是一种基于图神经网络的模型,用于处理图结构数据。GAT通过引入注意力机制,使得每个节点能够自动学习不同节点之间的重要性,从而实现对图数据的特征学习和节点分类任务。
GAT的核心创新点在于注意力权重的计算。对于每个节点,GAT使用可学习的参数矩阵和注意力权重向量来计算与其邻居节点之间的注意力权重。注意力权重表示了节点之间的重要性,使得网络能够更关注对分类等任务更有贡献的邻居节点。注意力系数为:
(1)
为了计算注意力权重,GAT使用了LeakyReLU激活函数和Softmax归一化:
(2)
通过对邻居节点的特征加权求和,每个节点得到更新后的特征表示。GAT通常使用多头注意力机制来增强模型表达能力,最后将多个头的结果进行拼接或平均得到最终的节点表示。综合式(1)和(2),整理到一起可得到完整的注意力机制:
(3)
GAT模型具有很强的表达能力,并在图数据相关任务中具备出色的性能。它在社交网络、蛋白质相互作用网络以及脑电信号数据等领域都得到了广泛的应用。
1.2 图卷积神经网络
GCN [5]是一种图神经网络模型,用于处理图结构数据。GCN通过卷积操作在图数据上进行信息传播和特征学习,使得每个节点能够聚合其邻居节点的信息,从而实现对图数据的特征学习和节点分类等任务。
GCN的核心思想是基于图卷积操作。对于一个包含N个节点的图,GCN引入了可学习的参数矩阵来对节点的特征进行线性变换。通过对邻居节点特征的加权求和,每个节点得到更新后的特征表示。GCN的图卷积操作可以表示为以下算式:
(4)
其中 ,I是单位矩阵, 是 的度矩阵(Degree Matrix),H是每一层的特征,σ是非线性激活函数。
通过多层的图卷积操作,使得每个节点能够聚合更广泛的邻居节点信息,从而实现对节点特征的层级化表示和复杂关系的学习,层特征传播算式为:
(5)
最终,GCN可以通过节点特征向量进行节点分类、链接预测和图表示学习等任务。但是GCN无法允许为邻居中的不同节点指定不同的权重。
1.3 长短期记忆网络
长短期记忆网络(LSTM)是一种特殊的循环神经网络(RNN)[6],专门用于处理具有时间依赖性的时序数据,如脑电信号等。LSTM具有优秀的记忆能力,能够捕捉时序数据中的长期依赖关系,同时有效地解决传统RNN中的梯度消失和梯度爆炸问题。
LSTM的基本单元是一个包含输入门(Input Gate)、遗忘门(Forget Gate)、输出门(Output Gate)和细胞状态(Cell State)的结构。通过这些门控制机制,LSTM可以选择性地记忆和遗忘过去的信息,并更新当前的状态,其中遗忘门的形式方程为:
(6)
输入门的形式方程为:
(7)
(8)
以及t时刻的Cell状态(长时)方程为:
(9)
输出门的形式方程为:
(10)
(11)
LSTM通过这种门控制机制,可以学习长期依赖的时序模式,对于处理时序脑电信号等数据具有良好的效果。
1.4 持续同调
从原始数据中构建一个复形,复形是一种包含顶点、边、三角形等元素的结构,用于近似表示原始数据的拓扑特征。从复形中生成对应的单纯复形(Simplicial Complex)。单纯复形是一种由单纯形构成的拓扑结构,单纯形是一种几何元素,可以是点、线、三角形等的组合。这些单纯形满足一定的规则,比如边必须连接两个点,面必须由三条边组成等,如图1所示。
图1 不同维度单纯复形示例
对于单纯复形,我们可以计算持续同调(Persistent Homology, PH)。这一步的核心是计算不同维度的同调群(Homology Group)。同调群反映了复形中连通组件和空洞的性质。通过绘制持续同调图(Persistence Diagram)或持续同调图像(Persistence Image),我们可以直观地展示数据中的拓扑特征在不同尺度上的持续性。PH的思想是,真正的拓扑结构在不同尺度下都会存在,而噪声或随机性的影响往往只在特定尺度范围内出现,因此持续同调能够帮助我们过滤掉噪声,提取出数据中的稳定拓扑特征。
1.5 构建邻接矩阵
皮尔逊相关系数(Pearson Correlation Coefficient, PCC)[7]用于度量两个信号之间的线性相关程度,PCC定义为两变量之间的协方差和标准差的商,如式(12)所示:
(12)
2 基于PH-GAT的精分患者分类预测模型
在本模型中,采用拓扑数据分析工具来提取隐藏在脑网络复杂结构中的基本信息。持续同调(PH)[8]是拓扑数据分析中的一种数学工具,能够提取稳定的拓扑特征。采用自适应脑网络作为邻接矩阵,选择多个重要性特征进行拼接形成局部特征,再根据邻接矩阵和其对应的局部特征进行图卷积神经网络特征学习,最后可以获取到图编码特征全局表示。
将形成的基于图论的脑网络局部特征[9]、时频域特征[10]拼接作为新的特征矩阵输入到我们所搭建的GAT模块中,利用GAT对局部特征进行多头注意力分配节点权重值;再利用搭建的GCN模块进行深度图拓扑特征学习。随后,将深度图拓扑特征、图编码特征和高维拓扑特征[11]进行多尺度,多模态融合形成全局特征表示,最后将融合后的全局特征表示输入时序模型LSTM对样本进行分类预测。
在图学习阶段,提出了一个新的基于PH的图注意力网络模型PH-GAT,使用图注意力层来学习节点表示,并使用一个可学习权重的注意力池层来获得用于脑功能网络分类的图表示,所采用的池化方法使用可学习的参数,以单一的可学习标准从每个节点的表示中总结出图的表示。使用LSTM模块对所融合的时序信号特征进行分类预测,目的是为了捕捉到所形成特征中的时序信息,从而提高分类预测的效果。基于PH-GAT的精分患者分类预测模型如图2所示。
2.1 实验数据
实验采用北京回龙观医院103个首发精分病人和92个健康被试在闭眼静息状态下采集的59通道EEG数据。通过性别、年龄、受教育程度做匹配,两组被试的人口统计学、PANNS分数等临床数据统计信息如表1所示。
2.2 实验数据预处理
实验使用Python的MNE工具包对EEG信号数据做预处理。将信号过滤为Delta(1~3 Hz)、Theta(4~7 Hz)、Alpha(8~12 Hz),Beta(13~
30 Hz)、Gamma(31~49 Hz)五个频段。
每个样本数据时间长均为230 s左右,利用滑动窗口[12]截取40~200 s的数据,每个样本只截取160 s的数据信号长度。原因是在信号采集的开始或者结束时期,被试会由于注意力不集中导致信号数据出现偏差,对实验结果略有影响。再针对160 s的信号数据,利用滑动窗口,使得一个被试的数据样本被分为16个数据样本,每个数据样本的信号长度为10 s。
2.3 构建脑网络与VR复形
实验使用Python中的Giotto-TDA拓扑机器学习工具箱构建脑网络[13]和VR复形。模型中,VR过滤的最大阈值不设为固定值,通过动态判断脑网络的VR复形数不再发生变化结束构建脑网络与VR过滤。使用PD对VR过滤得到拓扑特征进行可视化表示,如图3为首发精分病人和健康被试在Beta频段的PD。
2.4 提取特征
对脑电信号数据提取相应的时域和频域特征分别计算了平均绝对值、方差等时域特征[14];对于每个样本的脑电信号,可以使用快速傅里叶变换(FFT)将信号从时域转换到频域,可以得到频谱信息,对于每个频率分量,计算其功率谱密度,即信号在该频率范围内的能量或强度。这里提取平均功率谱密度等频域特征。
提取脑网络的局部特征作为EEG信号的节点特征,对于脑网络的局部特征,计算度、介数、聚类系数和局部效率[15],参照目前相关的研究成果,实验选择20%~40%的稀疏度范围(步长为2%)[16],计算了局部特征曲线下面积(Area Under the Curve, AUC),将局部特征值在稀疏度范围内的AUC值作为每个节点的特征形成节点特征矩阵,提取节点特征并构成图结构的过程如图4所示。
对高维拓扑特征进行研究设计的过程中,由于VR滤流得到的持续图PD并不能直接进入机器学习算法中进行分类,所以,基于拓扑数据分析的现有方法,我们将持续图PD转换为持续景观图PL,贝蒂曲线BE,热核图HE,这三种图能从不同的维度观察获得的持续图PD的特点。相对于直接从复杂的脑电时间数据中提取特征进行分类,从持续图PD中提取拓扑特征具有极高的可解释性与可视化性。为了高度概况获得的三种拓扑特征图,我们使用矩阵范数(1范数与2范数)对PL、BE、HE进行总结,在VR复形的每一维获取一个矩阵范数,从而获得可用于机器学习分类的特征数值,过程如图5所示。
另外,VR滤流构造中的信息变化也是一个重要的拓扑特征表示方式,所以我们计算了拓扑图的持续熵。然后对特征公式进行推理描述、并对特征表现形式与实现方式的问题进行研究讨论并证明其有效性,表2为实验所用拓扑特征及对应参数的选择。
表2 拓扑特征参数选择
3 实验结果及分析
本文研究的实验硬件环境为Intel Core i7 10870H CPU @ 2.20 GHz 2.21 GHz,内存为16 GB,软件环境为64位windows 10,PyCharm Professional Edition 2021。
实验分为两个部分,第一部分是分别在五个频段的数据下比较每个频段的数据,单一的局部特征或是全局特征和融合后的特征在多个模型中分类准确率的表现。分别比较了GCN、GAT、LSTM、PH-GAT四个模型在局部特征、全局特征下的分类准确率,其中无论是在局部特征上的表现还是全局特征下的表现,都是PH-GAT模型效果最佳,分类效果如表3所示。
第二部分是比较了在PH-GAT模型下,分别提取局部特征、全局特征以及局部加全局的融合特征对五个频段脑电数据的分类效果。通过比较精确率、准确率、召回率以及F1分数可以得知,在PH-GAT模型下利用局部加全局的融合特征对数据进行分类的效果最佳,具体的分类预测表现如表4所示。
4 结 论
综上所述,在PH-GAT模型下,采用局部和全局的融合特征对数据的分类效果最佳,Theta频段分类准确率高达0.930 9。这是由于采用了GAT和GCN等图神经网络模型,这些模型能够捕获脑电信号之间的复杂关系和拓扑结构,从而实现对多通道脑电数据的全局建模和特征学习。为了捕获脑电信号数据的时空动态性,我们引入了长短期记忆网络LSTM,该模型能够有效地建模脑电信号数据的时序特征,从而更好地揭示大脑的动态过程。除此之外,还将持续同调方法应用于脑电信号数据处理中,通过构建脑电数据的持续同调图,揭示了脑电数据的拓扑结构和拓扑特征,从而为大脑功能的拓扑学理解提供了新的视角。
本研究的综合性方法可以为脑电信号数据处理领域的进一步研究和应用提供新的思路和方法。在未来,我们期待这些方法能够被广泛应用于脑机接口、神经科学、脑疾病的早期诊断以及脑功能的深入理解,为改善人类生活和健康贡献一份力量。
参考文献:
[1] 李路宝,陈田,任福继,等.基于图神经网络和注意力的双模态情感识别方法 [J].计算机应用,2023,43(3):700-705.
[2] ROY S,KIRAL-KORNEK I,HARRER S. ChronoNet: A Deep Recurrent Neural Network for Abnormal EEG Identification [J/OL].arXiv:1802.00308 [eess.SP].(2018-01-30).https://arxiv.org/abs/1802.00308.
[3] STOLZ B J,EMERSON T,NAHKURI S,et al. Topological Data Analysis of Task-based fMRI Data from Experiments on Schizophrenia [J/OL].arXiv:1809.08504 [q-bio.QM].(2018-09-22).https://arxiv.org/abs/1809.08504.
[4] VELI?KOVI? P,CUCURULL G,CASANOVA A,et al. Graph Attention Networks [J/OL].arXiv:1710.10903 [stat.ML].(2017-10-30).https://arxiv.org/abs/1710.10903.
[5] WU F,ZHANG T Y,SOUZA A H D S,et al. Simplifying Graph Convolutional Networks [J/OL].arXiv:1902.07153 [cs.LG].(2019-02-19).https://arxiv.org/abs/1902.07153v2.
[6] LI S,LI W Q,COOK C,et al. Independently Recurrent Neural Network (IndRNN): Building a Longer and Deeper RNN [J/OL].arXiv:1803.04831 [cs.CV].(2018-03-13).https://arxiv.org/abs/1803.04831.
[7] BENESTY J,CHEN J,HUANG Y,et al. Pearson Correlation Coefficient [M]//COHEN I,HUANG Y,CHEN J,et al. Noise Reduction in Speech Processing.Berlin:Springer,2009:1-4.
[8] WANG Y,OMBAO H,CHUNG M K. Statistical Persistent Homology of Brain Signals [C]//ICASSP 2019-2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP).Brighton:IEEE,2019:1125-1129.
[9] 曹敏娜,陈俊杰,郭浩.基于多尺度脑网络局部特征的抑郁症分类 [J].计算机工程与设计,2018,39(12):3712-3716.
[10] 胡章芳,张力,黄丽嘉,等.基于时频域的卷积神经网络运动想象脑电信号识别方法 [J].计算机应用,2019,39(8):2480-2483.
[11] CHAZAL F. High-dimensional Topological Data Analysis [M]//GOODMAN J E,O'ROURKE J,TOTH C D. Handbook of Discrete and Computational Geometry: Third Edition.Boca Raton:Chapman and Hall/CRC,2017.
[12] GAUR P,GUPTA H,CHOWDHURY A,et al. A Sliding Window Common Spatial Pattern for Enhancing Motor Imagery Classification in EEG-BCI [J].IEEE Transactions on Instrumentation and Measurement,2021,70:1-9.
[13] ALCHIHABI A,EKMEKCI O,KIVILCIM B B,et al. Analyzing Complex Problem Solving by Dynamic Brain Networks [J].Frontiers In Neuroinformatics,2021,15:1-23.
[14] 郑长坤,王海贤,顾凌云,等.基于脑电和肌电信号的下肢运动意图识别方法 [J].中国医疗设备,2021,36(5):61-66.
[15] 罗志增,鲁先举,周莹.基于脑功能网络和样本熵的脑电信号特征提取 [J].电子与信息学报,2021,43(2):412-418.
[16] NAKAJIMA J,WEST M. Dynamics & Sparsity in Latent Threshold Factor Models: A Study in Multivariate EEG Signal Processing [J].Brazilian Journal of Probability and Statistics,2017,31(4):701-731.
作者简介:盛志林(1999—),男,汉族,江西新余人,硕士在读,研究方向:智能数据分析与应用。