APP下载

无先兆偏头痛3D-CNN辅助诊断算法

2022-03-02魏本征吴宏赟李徐周洪雁飞丛金玉

计算机工程与应用 2022年4期
关键词:先兆偏头痛准确率

李 翔,魏本征,吴宏赟,李徐周,洪雁飞,丛金玉

1.山东中医药大学 智能与信息工程学院,济南250355

2.山东中医药大学 医学人工智能研究中心,山东 青岛266112

3.山东中医药大学 青岛中医药科学院,山东 青岛266112

4.山东中医药大学附属医院 脑病科,济南250014

5.山东青年政治学院 信息工程学院,济南250103

偏头痛是一种反复发作的、可致残的原发性头痛,已成为严重危害人类健康的脑部疾病之一。其临床表现为头部一侧或两侧搏动性的剧烈头痛,对外界的运动、视觉等刺激敏感,可伴有畏光、呕吐等症状[1]。2015年世界卫生组织的一项研究结果表明,偏头痛已经成为世界第三大流行疾病,也是全球第六大致残疾病,影响了约15%的世界人口[2]。在中国,偏头痛的发病率约为9.3%[3]。除高发病率外,偏头痛患者在头痛发作时还会出现暴躁、易怒等现象,严重干扰患者的正常生活[4]。临床中常见的偏头痛类型以无先兆偏头痛为主,其诊断主要由临床医生通过患者的临床表现,根据《国际头痛疾病分类(第3 版)》(International Classification of Headache Disorders,ICHD-III)[5]进行。有效和精确的诊断是无先兆偏头痛治疗至关重要的一步,由于缺乏明显的前驱症状,传统的诊断方法在鉴别无先兆偏头痛与其他原发性或继发性头痛时充满了挑战[6]。因此,为提高无先兆偏头痛的诊断准确率,降低误诊率,设计自动化的临床辅助诊断系统具有重要的临床应用价值。

近年来,随着MRI设备的快速更新以及神经影像分析方法的迅速发展,研究人员发现实现某一功能的不同脑区存在一致波动的低频信号,这些具有一致波动低频信号的不同脑区构成了静息态脑网络(resting-state brain network,RSN)[7]。而依靠血氧水平依赖信号来反映神经元活动的静息态功能磁共振(resting-state functional MRI,Rs-fMRI),尤其适合用于观察无先兆偏头痛RSN的异常情况。RSN 的异常可反映出患者大脑功能区的功能连接异常。当前,功能连接的分析主要有基于模型驱动的方法和基于数据驱动的方法[8],这些方法可从不同角度探究无先兆偏头痛患者不同大脑区域或组织的功能连接异常。虽然无先兆偏头痛的发病原因和病理机制尚不明确,但已有研究结果初步表明无先兆偏头痛患者某些与疼痛有关的RSN 存在异常,如默认模式网络(default mode network,DMN)[9]、执行控制网络(executive control network,ECN)[10]、视觉网络(visual network,VIN)[11]、感觉运动网络(sensorimotor network,SEN)[12]、右侧额顶网络(right frontoparietal network,RFPN)[13]和左侧额顶网络(left frontoparietal network,LFPN)[14]等。这些异常的RSN 可作为潜在的无先兆偏头痛影像学生物标志物用于个体化诊断。

当前,无先兆偏头痛辅助诊断已经取得了一定的进展,但其智能化程度仍然较低。一些研究者从RsfMRI数据中提取特征,训练支持向量机(support vector machines,SVM)等传统机器学习分类器,取得了良好的诊断结果。根据Rs-fMRI数据特征提取方法的不同,可分为基于功能连接的特征提取方法以及基于体素和功能连接融合的特征提取方法。基于功能连接的特征提取方法主要有:Chong等人[15]以疼痛相关的33个大脑区域为种子点,计算该区域的功能连接特征,特征降维后使用对角二次判别分析算法构建无先兆偏头痛和健康对照的辅助诊断模型,诊断准确率为86.1%。Tu等人[16]利用Dosenbach模板将大脑分为160个脑区并计算所选脑区之间的功能连接特征,经过特征筛选后训练SVM算法,最终诊断准确率达到91.4%。该研究同时还发现VIN、DMN 和SEN 等可作为诊断无先兆偏头痛的神经标志物。基于体素和功能连接融合的特征提取方法主要有:Zhang等人[17]利用自动解剖标记模板将被试的大脑划分为一系列感兴趣区域(region of interests,ROIs),计算ROIs 区域基于体素的低频振幅、局部一致性和局部功能连接特征。该研究还从多模态角度计算结构MRI的白质特征,将上述特征融合后训练SVM算法,诊断准确率为84.0%。

以上对功能连接特征的提取主要是基于模型驱动的分析方法,该方法对特征的提取依赖预先定义的脑图谱模板,不同的脑图谱模板对大脑的划分精细度不同,且ROIs 脑区的选择需要丰富的先验知识,可能影响后续的分析结果。此外,不同的特征提取方法得到的特征仍存在维度过高或冗余等问题,在训练传统分类器之前仍需再次进行筛选。

在基于数据驱动的功能连接分析方法中,独立成分分析(independent component analysis,ICA)方法无需任何先验模型即可自动从Rs-fMRI 数据中分离出有意义的RSN 和头动等噪声,目前已经广泛应用于RSN 分析,为研究病理机制提供新的视角[18]。然而将ICA应用于多被试Rs-fMRI数据分析时,其输出成分具有无序性和不可预估性等缺点,难以在不同被试间建立对应性,因此对于多被试Rs-fMRI数据分析常用组ICA方法[19]。常用的组ICA 方法有Back-Reconstruction[20]方法、Dual Regression[21]方法和组信息指导的独立成分分析(group information guided ICA,GIG-ICA)[22]方法等。使用Back-Reconstruction 方法和Dual Regression 方法恢复个体成分时,均无法保证个体被试不同成分间的独立性,且Back-Reconstruction 方法无法使用已有RSN 模板对新数据进行分析。而GIG-ICA 方法不但可以生成具有更强个体间独立性、组间对应性以及更高准确性的RSN,还可将已有RSN模板作为先验信息指导新被试的RSN生成,新被试生成的RSN 和先验信息具有较强的对应性。因此,该方法是一种提高无先兆偏头痛临床诊断准确率的有效技术方法。

近年来,各种深度学习技术在Rs-fMRI图像处理及精神疾病分析研究中取得了重要进展[23-24],其中卷积神经网络(convolutional neural networks,CNN)因能自动创建具有分层表示的多级非线性模型且能很好地捕捉图像数据中的空间结构信息获得广泛关注及应用[25]。Yang等[26]首次使用2D-CNN技术构造了无先兆偏头痛、健康对照以及有先兆偏头痛的诊断模型,但该方法将生成的3D特征转化为2D切片特征,由于2D-CNN仅在两个维度提取特征,该方法丢失了丰富的第三维度信息。与2D-CNN相比,3D-CNN可以从数据中直接提取三维特征,并对时空信息进行建模,通过组合不同的通道信息获得最终的高维特征表示[27-28]。近期在精神分裂症和阿尔兹海默症上的工作也证明了3D-CNN 处理RSN 数据的优势[29-30]。

为提高无先兆偏头痛的诊断准确率及智能化程度,基于设计的新型3D-CNN技术,本文提出了一种无先兆偏头痛智能辅助诊断算法MwoA3D-Net(3D convolutional neural network based diagnosis of migraine without aura)。该算法将GIG-ICA方法引入到无先兆偏头痛的Rs-fMRI 功能连接分析中,用于生成被试的RSN,避免因脑图谱模板不同导致的结果差异。此外,该算法可直接学习RSN的3D空间结构特征,且在算法设计时加入一系列针对医学影像小样本过拟合问题的优化策略,进一步提高无先兆偏头痛的诊断准确率。

1 数据采集与预处理

1.1 数据采集

本研究在山东中医药大学附属医院头痛门诊招募60名无先兆偏头痛患者,所有患者均被脑病科医生根据ICHD-III 标准确诊。同时选择与无先兆偏头痛组患者性别、年龄相匹配的65 名健康被试作为对照组。被试的人口学信息如表1所示。

表1 实验被试人口学统计表Table 1 Demographic of all subjects

无先兆偏头痛组纳入标准:(1)符合ICHD-III 临床诊断标准;(2)年龄在20~30岁之间;(3)扫描前3天内没有发作且未服用相关药物;(4)无MRI 扫描禁忌症;(5)无脑部器质性疾病;(6)右利手;(7)知情同意者。

无先兆偏头痛组排除标准:(1)年龄不在20~30 岁之间;(2)患有严重身体疾病或除无先兆偏头痛以外其他神经疾病;(3)有药物滥用史;(4)妊娠或哺乳期妇女;(5)有MRI扫描禁忌症。

正常对照组纳入标准:(1)年龄在20~30 岁之间;(2)无偏头痛家族史、慢性疼痛及其他神经或精神类疾病;(3)无糖尿病、心脏病、高血压以及其他慢性全身性疾病;(4)无认知障碍;(5)无药物滥用史;(6)右利手;(7)无MRI扫描禁忌症。

所有被试的影像数据均在Philips Achieva 3.0T 扫描仪上进行采集。扫描前,所有被试头部均用海绵垫固定以减少头部位移。在扫描过程中,要求受试者仰卧在MRI 设备上,保持闭眼静息状态,均匀呼吸,避免思考,但需保持清醒。Rs-fMRI 数据采用回声平面成像(echo-planar imaging,EPI)序列获取,参数设置如下:TR=3 000 ms,TE=35 ms,FA=90°,matrix=128×128,FOV=230 mm×230 mm。T1WI 结构像扫描参数设置如下:TR=8.0 ms,TE=3.8 ms,FOV=230 mm×230 mm,matrix=512×512,FA=12°。

本研究获得山东中医药大学附属医院伦理委员会批准,所有被试在数据采集前均签署书面知情同意书。

1.2 数据预处理

为减少因Rs-fMRI数据采集、被试生理学特征以及个体化差异带来的误差,影响后续的分析结果,本文采用SPM12软件(https://www.fil.ion.ucl.ac.uk/spm)和DPARSF工具箱(http://www.rfmri.org/DPARSF)完成Rs-fMRI 数据的预处理工作,预处理步骤如下。

步骤1时间校正:去除被试图像前10 个时间点的数据,并以第29层图像数据作为参考进行时间校正。

步骤2头动校正:计算被试在扫描过程中的头动位移和头动旋转角度,为减少因头动对被试数据采集的影响,将头动位移超过2.5 mm或者头动旋转角度超过2.5°的被试剔除。本研究中所有被试的头动位移和头动旋转角度均未超过上述标准。

步骤3空间标准化:将每个被试头动校正后的图像标准化到每个被试各自的结构像,随后将被试的功能像标准化到统一的模板,并重采样体素大小为2 mm 的立方体。

步骤4空间平滑:为减少机器不稳定或者生理运动所产生的干扰信号,对空间标准化后的图像进行4 mm半宽全高高斯空间平滑。

2 3D-CNN辅助诊断算法设计

对预处理后的被试数据,本文首先采用静息态脑网络生成模块生成与无先兆偏头痛相关的RSN,然后将得到的RSN用于训练MwoA3D-Net算法完成无先兆偏头痛的辅助诊断,具体流程如图1所示。

图1 MwoA3D-Net算法框架示意图Fig.1 Framework of MwoA3D-Net algorithm

2.1 静息态脑网络生成

从有噪声的Rs-fMRI 数据中精准地生成所需的RSN,是提高无先兆偏头痛诊断准确率的关键步骤之一。GIG-ICA方法的计算主要包括以下两个步骤:

(1)对所有被试数据进行组水平ICA,得到一系列组独立成分,此步骤可表示为:

其中,X=[X1;X2;…;XN]为N个被试的功能连接矩阵;S=[S1;S2;…;SM]是估计的M个组水平的独立成分。

(2)将组独立成分作为参考信息输入到基于多目标函数带参考信号的ICA算法(ICA with reference,ICA-R),计算被试的独立成分以及对应的时间序列。其多目标优化函数可表示为[22]:

式中,表示第k个被试的第l个独立成分;v是高斯随机变量;G是非二次函数;是对应的解混合矩阵;J()是的负熵;F()代表和的相似性。

最后,求解式(2)可得到:

GIG-ICA方法由GIFT工具(https://trendscenter.org)实现。基于Smith 等人[31]以大量健康被试制作的RSN模板,本文选取了与无先兆偏头痛密切相关的8个RSN作为先验信息,用于指导新被试的RSN 生成。本文所选RSN如图2所示,分别为VIN、DMN、SEN、ECN、LFPN和RFPN。将预处理后的Rs-fMRI 数据以及所选RSN模板同时输入GIG-ICA 方法,生成被试的3D 空间成分以及对应的1D 时间序列。在上述计算过程中,未设置任何阈值,因此可以完整保留所有被试的3D 空间成分信息,3D空间成分代表被试的RSN。最终,每个被试生成的8个3D RSN用于训练MwoA3D-Net算法。

图2 本文选取的8个RSN模板示意图(显示阈值为3~10)Fig.2 Eight RSN templates selected in this paper(display threshold:3~10)

2.2 MwoA3D-Net算法

MwoA3D-Net算法由RSN-Net和全连接层构成,如图1 所示。该算法的训练分两阶段进行:在第一阶段,针对每个被试的8个RSN,本文分别训练了8个RSN-Net完成对每个被试RSN的特征提取,保存8个RSN-Net最优模型并统计每个RSN 的诊断结果。在第二阶段,MwoA3D-Net 算法加载8 个RSN-Net 最优模型,以被试所有的RSN作为输入,进行前向传播并计算损失,最后使用反向传播对MwoA3D-Net算法的全连接层进行训练。

2.2.1 RSN-Net结构

8 个RSN-Net 的网络结构均相同,由4 个卷积层、4个批正则化层、3 个池化层、1 个全连接层和1 个输出层构成。模块的主要结构和功能如下:

(1)卷积层:卷积层将低层次的特征逐层地提取和组合形成更高级复杂的抽象特征,避免了传统机器学习中复杂的手工提取过程。4 个卷积层分别包含16、16、32和64个卷积核,每个卷积层的卷积核大小为3×3×3,步长为1,并由Kaiming 均匀分布初始化。本文在卷积层与非线性激活函数之间增加了3D 批正则化层,可对每个卷积层生成的特征图进行批次归一化操作,以加快模型训练时的收敛速度。

由于RSN 的激活区域在整个大脑中占比相对较高,可用较大的感受野去学习其复杂的空间特征。虽然大尺寸的卷积核可以带来更大的感受野,但直接构造大尺度的卷积核可导致模型的计算量呈指数级增长,不利于深层模型的训练。因此本文使用2个3×3×3的卷积核串联,使得卷积层具有5×5×5 的感受野,可有效提升模型对RSN空间结构特征的提取和表达能力。相比直接使用5×5×5 卷积核,此方法还可有效降低算法的参数量[32]。此外,两层卷积之间多使用一个非线性激活函数,使得模型增加了特征的非线性表达能力。本文卷积的计算公式为:

式中,l代表卷积层数;mj代表输入层的感受野;是该层的神经元偏置项;g(⋅) 为非线性激活函数;h代表卷积核;是该层神经元j与前一层神经元i的连接强度。

(2)池化层:池化层的目的主要是完成卷积层特征图的降维。本文的3 个池化层使用最大池化函数且池化核尺寸及步长均为2×2×2。

(3)全连接层:在分类任务中,全连接层通常在池化层之后起到整合局部信息的作用。RSN-Net 的全连接层拥有128个神经元,每一个神经元都与前面的池化层连接,最终生成128维的特征向量。

(4)输出层:RSN-Net的输出层拥有2个神经元用于生成类别信息,采用Softmax 分类器对模型输出的结果的类别属性进行概率量化。Softmax是逻辑回归分类器在多类别领域的推广,采用如下方式计算类别概率:

式中,gi代表第i个类别,C表示分类的类别个数。

2.2.2 全连接层结构

本文将RSN-Net输出的诊断信息进行融合后,训练MwoA3D-Net 算法的全连接层,用于完成辅助诊断任务。MwoA3D-Net 算法的全连接层拥有128 个神经元以及2 个输出神经元,同样采用Softmax 分类器对模型输出结果的类别属性进行概率判断。

2.2.3 MwoA3D-Net算法优化策略

针对深度学习中医学影像小数据的过拟合问题,本文采用如下措施解决:(1)对输入的训练数据进行3D数据增强使其产生更多训练图片供模型学习,主要包括随机概率的水平反转、高斯模糊、旋转和缩放操作。对验证和测试数据则不做数据增强。(2)使用“早停法”,即在算法训练时监控验证集的损失变化情况,如果在一定周期内损失值不下降则模型停止训练。(3)使用L1 和L2正则化技术,即在损失函数的基础上添加惩罚项,迫使算法学习较小的权重。(4)使用批正则化技术,即对所有卷积层生成的特征图进行批次归一化操作,以解决梯度消失和爆炸的问题,在一定程度上也能减缓过拟合。

3 实验与结果分析

3.1 实验设置

MwoA3D-Net 算法采用PyTorch 1.4[33]深度学习框架编写。算法在Intel 8268 CPU、NVIDIA Tesla V100 32 GB GPU 上进行训练和测试。算法学习率设置为0.001,使用随机梯度下降(stochastic gradient descent,SGD)作为优化器,动量参数为0.9,使用交叉熵作损失函数。

3.2 实验设计

为验证本文所提算法的有效性,将其与多个不同类型的分类器做性能对比实验。首先与传统机器学习方法构造的分类器对比。本文应用GIG-ICA 方法为每个被试生成8个RSN后,使用双样本T检验获取RSN的个体差异,经PCA 算法降维后采用SVM 算法作为分类器完成辅助诊断。其次与深度学习方法中的2D-CNN 以及3D-CNN算法模型进行对比。本文对比的2D-CNN算法有AlexNet和CNN with Inception网络[26],3D-CNN算法有MB-CNN[30]以及3D ResNet18[34]。其中,MB-CNN主要用于解决阿尔茨海默症和轻度认知障碍的诊断问题,3D ResNet18 使用的3D 卷积可有效学习时空的三维特征信息。

为进一步验证所提算法的设计优势,本文做了不同的消融实验。一是,研究验证使用4种不同的过拟合优化策略对诊断结果的影响。二是,针对不同的池化函数做了对比实验和分析。三是,对RSN 的诊断准确率做了比较研究。

为了测试算法的鲁棒性及泛化性能,基于5折交叉验证方法,本文将所有数据随机平均分为5 份,每次取其中1 份数据作测试集,剩余4 份数据作训练集。同时本文对4 份训练集再随机均分为5 份,取其中的1 份作验证集,剩余4份作训练集。最终,每折数据训练集、验证集、测试集的比例为16∶4∶5。

3.3 评价标准

本文采用准确率(accuracy,ACC)、灵敏度(sensitivity,SEN)和特异性(specific,SPEC)指标评估本文所提算法的性能。上述指标计算公式分别为:

式中,TP为真阳性总数;FP为假阳性总数;TN为真阴性总数;FN为假阴性总数。

3.4 结果与分析

3.4.1 无先兆偏头痛辅助诊断性能测试

MwoA3D-Net 算法以及其他对比算法在无先兆偏头痛辅助诊断任务上的实验结果,如表2所示。根据实验结果可知,MwoA3D-Net 算法具有最高的诊断准确率,为98.40%,在灵敏度和特异性指标上也显示出优越性。MwoA3D-Net算法的准确率比SVM算法高6.40个百分点,比AlexNet 和CNN with Inception 等2D-CNN分别高5.36 个百分点和2.24 个百分点,与Kam 等人提出的MB-CNN 相比高17.20 个百分点,与3D 算法中常用的3D ResNet18相比高18.40个百分点。

表2 算法模型性能比较结果统计表Table 2 Performance comparison of different methods %

由于直接将分类器应用于原始Rs-fMRI数据时,存在Rs-fMRI 数据噪音信息大以及Rs-fMRI 空间复杂性高等问题,当前的研究方法都是从Rs-fMRI数据中提取功能连接等特征,然后构造分类器以实现无先兆偏头痛的辅助诊断。其中,计算功能连接特征多依赖于预先定义的脑图谱模板,需要对大脑的区域进行手动选择。这种人为选择脑区的处理方法,易受主观因素影响,后续研究结果常会出现较大偏差。为克服此问题,本文采用一种较为客观的方式,即使用GIG-ICA方法计算被试的功能连接特征。

为克服训练时由数据量少引发的过拟合现象,本文采用4 种过拟合处理技术以提高MwoA3D-Net 算法性能。根据实验结果可知,MB-CNN虽能完成3D RSN的分类任务,但该算法未采取任何解决过拟合问题的措施,故其在本研究中得到的实验结果很不理想。3D ResNet18 虽有残差结构保证了网络可以增加深度来改善图像分类性能,但受限于RSN 的图像尺寸小以及数据量少等因素影响,该算法的实验结果也较差。将生成的3D RSN数据转换为2D切片数据后,随着训练数据量的激增以及采用过拟合优化策略,2D-CNN,如AlexNet和CNN with Inception 网络,取得了比MB-CNN 和3D ResNet18高的结果。

3.4.2 过拟合优化策略测试实验

本文对4种过拟合优化策略做了实验研究,实验结果如表3 所示,分别是批正则化、3D 数据增强、L1 和L2正则化以及“早停法”。该实验结果表明,4种不同策略均具有一定的有效性。其中,引入“早停法”的优化策略对实验结果的提升较大。“早停法”是设置一定的次数阈值,如果模型的统计指标在阈值次数内仍然未改善,则直接停止模型的训练,该策略优点是在较差情况下也可获得较优的训练模型。其他的过拟合优化策略,关注于改进模型的训练过程,对实验结果的提升较小。

表3 过拟合优化策略性能测试结果统计表Table 3 Performance comparison of different overfitting optimization methods%

池化函数对MwoA3D-Net 算法性能影响的实验结果如图3所示。从图3中可以看出,基于最大池化函数的池化层在3个指标上,均较基于平均池化函数的池化层有所提高。分析其原因,是由于最大池化函数可保留特征中的最大值,特征中的最大值可能是异常的功能连接强度,因此使用最大池化函数会提升模型的性能。而平均池化函数对异常的功能连接特征进行了平均,虽保留了特征中的大量信息,但是噪声也较大,导致这种大量的特征信息对模型性能的提升较弱。

图3 池化层函数性能测试结果示意图Fig.3 Performance comparison of different pooling operators

3.4.4 RSN辅助诊断无先兆偏头痛贡献率比较研究

本文同时对8 个RSN 的诊断准确率进行了对比分析,结果如图4所示。从图中可以得出,本文所选的RSN均具有较强的辨别性,其中诊断贡献率最高的RSN 为LFPN。LFPN包括内额额叶和尾状核等区域,主要负责语言的处理[35],但该网络在无先兆偏头痛患者中研究较少,尚未引起研究者的重视。优选后的LFPN等RSN可作为潜在的影像学生物标志物,用于无先兆偏头痛的个体化诊断。

图4 RSN诊断准确率比较结果示意图Fig.4 Comparison of accuracy of different RSN

4 结束语

为提高无先兆偏头痛的诊断准确率,本文设计了一个基于改进3D-CNN 的无先兆偏头痛智能辅助诊断算法MwoA3D-Net。该算法采用GIG-ICA 方法生成被试的RSN,可有效避免因脑图谱模板不同而导致的结果差异。此外,该算法可直接学习RSN 的3D 空间结构特征。针对医学影像小样本过拟合问题,本文也利用一系列的优化策略进行解决。研究结果表明本文算法的诊断准确率以及智能化水平较高,具有潜在的临床应用价值。虽然MwoA3D-Net算法取得了较好的效果,但仍存在模型参数量较大,提取的功能连接特征缺乏对瞬时功能变化的捕捉等问题。在后续的工作中可以将动态脑网络与RSN结合,设计更优的深度学习算法,进一步深入研究LFPN等RSN,提高无先兆偏头痛的辅助诊断性能。

猜你喜欢

先兆偏头痛准确率
中西医结合治疗早期先兆流产临床观察
警惕!这8种梦境可能是重大疾病的先兆
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
先兆流产,别害怕
高速公路车牌识别标识站准确率验证法
镇脑宁神胶囊治疗血瘀质型偏头痛80例
穴位埋线治疗发作期偏头痛32例
以先兆型偏头痛为主要临床表现的CADASIL(附1例报告)