迁移学习和空间协方差模型在研究脑萎缩和白质高信号关系中的应用
2019-01-18吴玉超吴水才
吴玉超,林 岚,宋 爽,吴水才
(北京工业大学生命科学与生物工程学院,北京 100124)
0 引言
白质高信号(white matter hyperintensity,WMH)指使用T2WI序列或液体衰减反转恢复序列(fluid attenuated inversion recovery,FLAIR)扫描大脑时,白质(white matter,WM)区域中出现的斑点状或不规则片状的高强度信号。它与认知功能受损有关,与脑WM病变、脑WM疏松直接相关,是脑小血管病的一种表现形式。根据病因学及组织病理学的差异,WMH常被分为2种类型:一种为出现在皮质下WM内的深部WMH,一般影响皮质下短纤维;另一种为出现于相邻侧脑室的脑室周边WMH,一般与脑深部小血管毗邻,影响皮质间联络纤维。WMH的发病机制到目前为止仍不明确,其体积、部位与认知功能损害的关系也还存在争议。与MRI相结合的尸检研究结果显示,WMH与局部血流量减少造成的WM纤维脱髓鞘和血管周围的空间扩张有关[1]。WMH在中老年人神经影像中出现的概率与大脑老化程度直接相关,64岁时其概率为11%~21%,而82岁时可高达94%[2-3]。同时,WMH不仅常出现在大脑正常老化过程中,还与一些神经系统疾病和精神病高度相关,如躁郁症和抑郁症患者大脑影像中出现深部WMH的概率是正常人的2.5~3倍[4-5]。阿尔茨海默病所导致的大脑皮质萎缩和神经损害与WMH间存在显著相关[6]。在心脑血管高危患者中,WMH的出现也极为广泛[7]。尽管WMH的成因比较复杂,脑小血管病仍是一种重要的病源学解释[8-9],WMH常见于小血管病变所致的皮质下缺血性脑血管病。对于脑小血管病,一种常见的危险因素是高血压。而对于与年龄和血管危险因素相关的小血管病,控制血压可预防脑梗死或脑出血的发生。通过前期对动物模型和人脑的研究,我们发现脑卒中前,高血压会导致大脑的加速老化[10-11]和脑网络结构的改变[12]。对于WMH,高龄和高血压都是其独立危险因素。由于认知老化的过程可能是通过灰质(gray matter,GM)萎缩来进行调制的[13],了解 WMH与GM萎缩间的关系十分必要。当前,对它们间关系的理解仍不够明确。
为进一步探讨患有高血压的老年人和健康老年人大脑中存在的脑萎缩与WMH体积间的关系,明确WMH的危险因素和发病机制,我们在本研究中提出了一种基于迁移学习和空间协方差模型的方法对其进行分析。
1 资料与方法
1.1 研究对象与数据获取
41名健康中老年人(健康对照组)和41名确诊患有高血压的中老年患者(高血压组)被用于本研究。受试者均为右利手,其具体特征见表1。所有受试者在实验前均了解本试验的目的,同意并签署知情同意书。健康对照组与高血压组间有着严格的年龄、性别及教育程度匹配。受试者纳入规则主要根据下面的评判标准:临床痴呆量表评分为0分;当前无神经系统疾病,无家族精神疾病史;简易精神状态检查量表(mini-mental state examination,MMSE)评分≥28分;汉密尔顿抑郁评定量表≤10分(无抑郁症表现)。在MRI常规检查中没有发现脑内病变。
表1 实验对象特征表
研究中所用MRI数据采集于美国亚利桑那大学附属医院。所有受试者均同时采集脑部T1WI和T2WI图像。采用GE公司生产的3.0TSignaExciteMRI扫描仪进行图像采集。首先,通过SPGR扫描序列获得204层连续冠状面T1WI。成像参数:重复时间(repetition time,TR)5.3 ms,回波时间(echo time,TE)2 ms,反转时间(invert time,TI)500 ms,翻转角 15°,层厚 1 mm,体素大小 1 mm×1 mm×1mm,矩阵 256×256,视野(field of view,FOV)256 mm×256 mm。其次,采用FLAIR序列获得60层T2WI。图像采集参数:TR11002ms,TE122ms,矩阵 256×256,FOV256mm×256 mm,层厚2.6 mm。采集的原始图像为DICOM格式,利用MRICro软件将T1WI和T2WI转换为NifTi格式。最后,T2WI被刚体配准到T1WI的空间。
1.2 基于种子点的WMH体积测量
WMH一般是位于大脑深部和脑室旁WM区域的斑点状或不规则片状的边缘模糊的高信号病变,常对称分布,它的体积大小一般被认为可以用来表征病变负荷的严重程度。因此,本研究首先采用英国伦敦大学的Friston教授等开发的SPM8软件包,根据脑组织的先验概率和图像灰度信息,将T1WI中的大脑组织分割成GM、WM和脑脊液3个部分。然后将T1WI中获取的WM分区映射到T2WI中,得到T2WI中的WM分区。基于人工划分的WMH,通过机器学习的方法从图像灰度直方图中得到分割阈值。从WM分区中获取种子点,采用模糊连接算法进行模糊聚类,并迭代更新种子,直到算法最终收敛。随后,基于形态学变换的方法进一步细化对WMH的分割并计算出WMH的体积。由于大脑体积存在一定差异且分割出的WMH体积不满足正态分布,本研究将WMH体积转换为全脑体积的百分数,并对其进行自然对数转换。
1.3 灰质密度图(gray matter density map,GMDM)提取
GMDM可以定量分析灰质结构的微小变化,发现隐匿性灰质结构的损伤,为大脑GM分析提供了全面、客观的分析结果。首先,手动校正所有图像的参考点到邻近的位置。基于SPM8软件包获取T1WI的GM分区。通过DARTEL工具箱[14],利用李代数和流场论对图像进行非线性配准,采用对流场取幂的方法获得微分同胚的变形场,生成最优模板。在配准的过程中,将每个体素点的体积变化信息存储在雅可比行列式中。空间标准化被用来消除大脑的形状和大小的差异,将GMDM都标准到MNI(Montreal Neurological Institute)脑模板空间。其次,对GMDM进行调制。将图中各体素灰度值乘以该点的雅可比行列式,如果该点的值大于1,表示原图对应点是放大的;如果该点的值小于1,表示原图对应点是缩小的。最后,应用半高宽8 mm的高斯平滑核对图像进行平滑,取得图像的体素大小为1.5 mm×1.5 mm×1.5 mm。这样,可以根据某体素单位体积内的密度变化来显示脑组织的形态学改变,从而能够检测出大脑局部的形态特征和脑组织成分的差异。
图1 AlexNet网络基本架构[16]
1.4 基于AlexNet迁移学习的特征提取
GMDM中包含着大量的脑形态信息,通过卷积神经网络(convolutional neural network,CNN)模型进行自动特征提取可以进一步加深对GM萎缩和WM病变关系的理解。整个特征提取基于MATLAB 2017a环境的神经网络工具箱中的深度学习工具。CNN模型[15]是以图像作为网络输入,通过滤波器组可在各个卷积层自动提取输入图像的显著特征。从低层到高层,卷积层所能表征的特征越来越抽象,越来越能表现图像具体主题。近年来,随着CNN模型在图像识别、目标检测等领域取得了很大的成功,并产生了多种经典的CNN网络模型。这些经典模型由上百万张图片训练而成,网络中部的卷积层可以较好表征图像通用特征。因此,本研究认为将GMDM通过经典网络进行迁移学习处理,就可以从网络的中间层获取敏感度更高的大脑形态学特征。研究中采用的经典网络是2012年图像识别大赛中夺魁的AlexNet[16]。它是一个具有5个卷积层、3个最大池化层和3个全连接层的深层网络。整个网络由65万个神经元构成,约有6千万个参数,具体网络架构如图1所示。图中,conv3对应的特征图是采用384个3×3的卷积核和池化过程对conv2的输出获得的,神经元的数目为 64 896(13×13×384);conv4 是对 conv3 进行一次线性修正后,直接采用384个3×3的卷积核卷积得到的,神经元的数目为 64 896(13×13×384);conv5是对conv4进行一次线性修正后,再通过256个3×3的卷积核卷积生成的,神经元的数目为43 264(13×13×256)。MRI是三维的医学图像,并不能直接用AlexNet进行处理,因此从GMDM中选择了可以包含全脑体积的68层横断面图片,采用AlexNet对每一层的图片进行处理,获取该层形态特征。之后将68层的特征图拼接成一个四维的特征向量。对应于conv3、conv4和conv5,特征向量的维度分别为13×13×384×68、13×13×384×68 和 13×13×256×68。
1.5 基于尺度子配置模型(scaled subprofile model,SSM)研究脑形态学特征与WMH体积间关系
多变量空间协方差分析方法被用来获取与脑WM病变相关的GM形态学空间协方差模式。本研究采用的是SSM模型[17-18]。具体分析步骤如下:(1)对迁移学习提取的形态学特征进行预处理,即数据的自然对数变换与对象和特征体素均值的去除。(2)通过主成分分析产生了一系列的主成分。(3)运用Akaike信息判据法[19]找出最能与经过自然对数变换的WMH体积相关的主成分,创建一个线性组合模式。这样可以得到与脑WM病变相关的GM形态学空间协方差模式,并获得每个对象的对该模式表达程度的主题评分。
2 结果
对于全数据集合,比较了4种不同类型输入数据(平滑调制后的GMDM、conv3的特征图、conv4的特征图和conv5的特征图)对模型拟合优度的影响,它们的拟合优度分别为0.32、0.39、0.37和0.38。与原始的GMDM相比,基于AlexNet迁移学习获取的特征图在构建模型中均具有更好的模型拟合优度。其中,基于conv3的特征图构建的模型是由第一、第三和第五这3个主成分线性组合而成,它的拟合优度可以达到39%。这表明,WMH的体积差异有39%可以由conv3特征图所构建的与WMH体积相关的GM形态学空间协方差模式来解释。
随后,进一步进行了分组比较(如图2所示)。相对于健康对照组,conv3特征图所包含的与脑白质病变相关的形态学空间协方差模式可以更好地预测高血压组的WMH体积(R2=0.43)。
3 讨论与总结
本研究主要取得了3个方面的结论:(1)确定了一个四维(13×13×384×68)的与 WMH 体积相关的形态学空间协方差模式。AlexNet网络在设计中使用最大池化代替平均池化,避免了平均池化的模糊化效果,并且AlexNet中步长比池化核的尺寸小,池化层的输出之间会有重叠和覆盖,提升了特征的丰富性。AlexNet网络非常适合于特征优化,提取的特征相比原GMDM具有更好的特征表达,模型的拟合优度有15%~20%的改善。(2)基于conv3构建的模型拟合优度为39%。这说明大脑的GM萎缩和WM病变的发展并不是相互独立的,而是存在一定的关联。GM萎缩可能与皮层下WM的微结构改变有一定相关关系,它们可能对理解大脑老化及其进展有着重要价值。(3)发现对于高血压患者这种关联更为紧密。长期高血压可导致颅内血液循环障碍,同时引发GM萎缩和WM病变。
图2 提取的形态学空间协方差模式对WMH体积的预测
当然,本研究还存在一定的局限性。首先,Alex-Net输入的是RGB图像,而GMDM中每个体素对应的灰度值是一个实数。因此,在数据转换过程中会损失一定的形态学信息,一定程度上降低了模型敏感度,减弱了CNN特征提取的优势。在后期的研究中,需要考虑如何减少数据转换带来的信息损失。其次,尽管识别出了一个联系脑形态学特征和WMH体积的空间协方差模式,但对该模式的可视化上还存在2个方面的问题:(1)CNN卷积过程中的池化处理会对图像进行降维处理,最终获得的特征模式是低分辨力(13×13)的图像,难以从肉眼上直接分辨受影响的脑区。一种潜在的解决方案是借用全卷积网络中的反卷积层思想,对空间协方差模式进行上采样,可将其恢复到与输入图像相同大小的尺寸。(2)CNN在相当意义上是由每一个卷积层包含的滤波器组组成。通过让这些滤波器组对特定的模式有高的激活,以达到分类/检测等目的。Conv3包含384个卷积核,SSM后得到的空间协方差模式也包含384个特征图。这些特征图对形态学特征模式的表达存在差异,如何对它们进一步理解来发现较为重要的一些特征图并加以显示是我们需要进一步考虑的问题。最后,本研究中只包含了高血压组和健康对照组,并没有根据高血压控制状态对高血压组对象进行进一步区分。未来的研究中可以通过对高血压组对象进一步细分,深入研究长期服用高血压控制药物对GM萎缩和WM疾病关系的影响。