基于格兰杰因果分析的MCI脑网络分类研究

2018-11-15崔会芳周梦妮阎鹏飞

太原理工大学学报 2018年6期

崔会芳，周梦妮，王彬，相洁，曹锐，阎鹏飞

(太原理工大学计算机科学与技术学院，山西晋中 030600)

轻度认知障碍(mild cognitive impairment，MCI)是指有轻度的记忆和认知损害，但尚未达到痴呆状态，是正常衰老和阿尔兹海默症(Alzheimer's disease，AD)之间的过渡状态[1]。已有研究表明，每年大约有10%～15%的MCI患者转化成AD患者，而正常老年人的转化率大约为1%～2%[2].因此，准确诊断MCI对尽可能早治疗和推迟疾病的恶化非常重要。

MCI的传统研究及诊断方法主要包括：量表检查、认知测验、神经影像学检查、生物学标记物检查等，这些检查方法在实现过程中存在较多不足。目前，机器学习方法结合功能磁共振影像(functional magnetic resonance imaging，fMRI)数据分析的研究方法已广泛应用于MCI诊断中。梁红等人计算了无向脑功能网络的节点属性，并将异常的属性值作为分类特征，运用支持向量机(support vector machine，SVM)算法，对正常人(normal control，NC)、早期轻度认知障碍(early mild cognitive impairment，EMCI)和晚期轻度认知障碍(late mild cognitive impairment，LMCI)进行了分类研究[3]。接标等提出了一种新型图核并应用于MCI分类中，使用SVM分类方法对NC，MCI，EMCI和LMCI进行分类研究[4]。郭圣文等提取大脑皮层形态结构特征并选择重要特征，使用SVM对NC、稳定型MCI患者、转化型MCI患者进行分类研究，得到了较好的分类效果[5]。迈阿密大学的MOHAMMED et al建立了被试的结合MRI体积和神经心理学评分信息的模型，并从中提取特征，使用线性判别分析分类器对NC，EMCI，LMCI，AD四组被试进行了分类研究[6]。印第安纳大学医学院的TRZEPACZ et al使用海马体积、年龄、受教育程度等信息作为特征对NC，EMCI，LMCI，AD进行了分类研究[7]。北卡罗来纳大学教堂山分校的CHEN et al构建了基于灰质和白质的脑区功能连接，并提取特征进行特征选择，对NC和MCI进行了分类研究[8]。

无向脑网络通过构建脑功能区域间的功能连接来探究特定脑功能区域间交互作用。尽管如此，功能连接从某种程度上说只可以反映出交互作用的脑区，而有效连接却可以反映出交互脑区间的信息流向与强度。因此，通过有效连接构建有向脑网络能够更好地了解大脑皮层脑区间的交互模式。目前，格兰杰因果分析(granger causality analysis，GCA)被广泛应用于有向功能连通性分析中[9]。该方法在分析脑功能网络时不需要任何先验知识，强调脑区间相互作用的时间顺序，能够直观地反映脑区或神经元之间的信息传递的方向性。尽管如此，有向脑网络拓扑属性分析在MCI分类中应用较少,伊朗的KHAZAEE et al根据有向脑网络拓扑属性对NC，MCI，AD进行了分类研究，并取得了较好的分类效果[10]。目前，还没有依据有向网络拓扑属性对NC，EMCI，LMCI进行分类的研究。

本研究在静息态fMRI数据上运用GCA方法构建了NC，EMCI，LMCI的有向脑网络，并计算了网络拓扑属性。在特征选择部分，使用双样本t检验筛选出组间差异显著的拓扑属性作为特征；在分类部分，使用SVM算法在3组被试中进行两两分类研究以此来辅助MCI的诊断；最后还对3组被试进行了单因素三水平的方差分析，进而确定了MCI在早期和晚期形成过程中具有显著性差异的脑区。该研究的结果为MCI的早期和晚期诊断提供了新的视角。

1 数据采集

本研究采用的静息态fMRI数据来源于阿尔茨海默症神经影像计划(Alzheimer's disease neuroimaging initiative,ADNI)数据库(http://adni.loni.ucla.edu/).该数据库旨在通过分析各种医学成像数据来研究老年痴呆疾病的发病机理及预防治疗手段，此数据得到研究者广泛使用。其中包括33例EMCI被试，32例LMCI被试以及30例NC被试。被试的年龄、性别、MMSE评分、CDR评分如表1所示。组间单因素方差分析结果显示三组被试在年龄、性别上无显著差异，MMSE，CDR评分有显著差异。

表1 被试基本信息Table 1 Basic information of participants

在对静息态fMRI数据的采集过程中，被试均被要求闭眼静躺在磁共振扫描仪中。数据采集使用飞利浦(3T)MR扫描仪，扫描参数：slice thickness=3.3 mm;echo time (tE)=30 ms;repetition time(tR)=3 000 ms;48 slices.

2 研究方法

2.1 fMRI数据分析

本研究对采集到的静息态fMRI数据进行了以下分析步骤：数据的预处理，提取时间序列，对时间序列进行GCA分析以构建有向脑网络。

数据预处理主要使用了DPARSF(data processing assistant for resting-state fMRI)工具箱[11]。首先，去除被试所采集数据的前10个时间点；然后进行时间校正和头动校正，剔除水平头动大于1 mm或者转动大于1°的被试；接下来的正规化操作将图像映射到3 mm体素的MNI标准空间，并去除线性漂移；然后进行了空间高斯平滑，频率为0.01～0.08 Hz的低频滤波，以降低低频漂移以及生物噪音；最后去除了白质和脑脊液等协变量。

对预处理完的fMRI数据，采用神经影像学研究中广泛使用的自动化解剖学标签(anatomical automatic labeling，AAL)模板[12]，将全脑体素分割为90个感兴趣的区域(region of interest，ROI)，其中左右半脑各45个。接着对AAL模板中的90个脑区提取时间序列，以方便进一步的有向脑网络构建，每个脑区被视为脑网络中的一个结点。

2.2 格兰杰因果分析及有向脑网络构建

对90个脑区的时间序列，通过GCA方法计算两两脑区之间的有效连接强度值，得到一个90×90的有向脑网络连接矩阵。首先，使用REST(resting-state fMRI data analysis toolkit)工具箱(http://restfmri.net/forum/)[13]计算得到每对脑区间的多变量格兰杰因果系数；接着，通过设置合理的自回归模型阶数，对90个脑区间的格兰杰因果关系进行计算。任意两个广义平稳的时间序列(均值和方差不随时间变化而变化)X和Y之间的格兰杰因果关系可以通过自回归模型来定义[14]：

(1)

(2)

在进一步的阈值化过程中，选取合适的阈值，将有向图邻接矩阵转化为只包含0和1的布尔矩阵，并且设置对角线元素均为0以排除自回归的影响[15-16]。在阈值化后，有向图中可能存在一些孤立节点或子图未连接到主图中，使整个网络无法形成一个连通图，这给一些图属性(比如特征路径长度)的计算带来了困难[10]。为此，之后的添加边操作将分离的子图连接到了主图当中，使整个网络形成一个连通图。但是，添加边会使每个被试当中边的数目不一致，因此在添加一条边之前，在连通分支数不变的前提下，将主图中权值最低的边剪掉。即若有向图中有n个连通分支，则先将主图中权值最低的n条边剪掉，再添加n条边将n个连通分支连接到主图中。

2.3 有向脑网络特征计算

根据每个被试的有向脑网络的邻接矩阵，本研究计算了11种局部网络特征，包括度(入度和出度)、介数中心性、局部效率、局部全局效率比、流系数、全局流路径、K核中心性、PageRank中心性、节点强度等；10种全局网络特征，包括同配性、聚类系数、全局效率、平均变化系数、传递性、特征路径长度等。所以，每个被试共有90×11+10=1 000个网络特征，均使用脑连接工具箱(brain connectivity toolbox，BCT)[17]计算。

2.4 特征选择及分类

基于局部特征和全局特征的计算产生了大量的原始特征。一方面，考虑到高维度的特征空间将增大模型的复杂度，而且会增大分类器训练和测试的时间；另一方面，原始特征集中可能含有冗余或不相关的特征，这可能会降低分类器的性能。因此，在分类之前有必要进行特征选择以降低特征空间维度。为此，我们使用了双样本t检验进行特征选择[18-19]，筛选出3个被试组间两两具有显著性差异的特征用于分类。

随后的分类过程使用SVM算法对NC，EMCI和LMCI进行分类。SVM分类器的主要思想是寻找一个超平面，使两组类别不同的高维数据尽可能地远离分类超平面。其分类准确率与预测精度均高于同类算法，如聚类分析、判别分析、神经网络等方法。其特色在于通过核函数实现特征空间映射，有效地解决了分类中普遍存在的小样本、非线性、高维数和局部极小点等问题[20-21]。

3 结果

3.1 特征选择结果

根据双样本t检验对NC，EMCI和LMCI进行两两比较分析，筛选出了p值小于0.05的特征用于进一步的分类，特征结果如表2—表4所示。

表2 NC vs EMCI特征选择结果Table 2 Result of NC vs EMCI feature selection

表3 NC vs LMCI差异Table 3 NC vs LMCI feature selection

表4 EMCI vs LMCI差异Table 4 EMCI vs LMCI feature selection

3.2 SVM分类结果

基于特征选择结果，使用SVM分类算法对NC和EMCI，NC和LMCI以及EMCI和LMCI三对被试组进行分类研究，结果如表5所示，NC vs EMCI，NC vs LMCI以及EMCI vs LMCI的分类准确率分别为88.24%，94.12%，81.25%，并且三组分类的灵敏度均达到了100%，可以发现NC vs LMCI的分类效果最好，准确率达到94.12%。受试者工作特征曲线(receiver operating characteristic，ROC)如图1所示。

表5 SVM分类结果Table 5 Results for SVM classification between every pair of three groups

图1 有向网属性的分类ROC曲线Fig.1 Classification ROC curve of the directed network measures

3.3 差异脑区结果

对双样本t检验筛选出的组间有显著差异的特征进行组间单因素三水平方差分析，寻找出比较过程中两两间均具有显著性差异的网络特征。结果显示，在所有全局特征中，NC，EMCI和LMCI三组间均无明显差异(p>0.05).局部特征中，显著性差异(p<0.05)表现在颞叶区(颞中回、梭状回、海马旁回)、额叶区(三角部额下回、岛盖部额下回、中央旁小叶)、顶叶区(楔前叶、顶上回、缘上回)以及枕叶区(枕中回)。表6为具有显著差异的全部脑区信息，从中可以看出，三组被试的右侧颞中回脑区在出度、度、节点强度均表现出显著差异，左侧楔前叶在入度和K核中心性特征上表现出显著差异，另外三组被试在前扣带和旁扣带脑回、豆状苍白球也表现出显著差异。

表6 组间单因素方差分析差异脑区信息(p<0.05)Table 6 One-way ANOVA results:brain regions with significant difference on network features

如图2所示，三组被试在局部特征入度、K核中心性、出度、PageRank中心性、流系数显示差异的脑区信息，由于篇幅限制，未将全部局部特征差异脑区信息一一列出。

图2 组间方差分析差异脑区信息差异Fig.2 One-way ANOVA results: brain regions with significant difference on network features

4 讨论

本研究运用有向脑网络拓扑属性对NC，EMCI和LMCI三组被试进行分类，与其他对MCI患者与正常人的分类研究相比，在没有增加其他类型数据的情况下，实现了更好的分类效果。梁红等计算了无向脑功能网络的节点属性，并将异常的属性值作为分类特征，运用支持向量机算法，对NC，EMCI和LMCI进行了分类研究，实现了NC vs EMCI，NC vs LMCI，EMCI vs LMCI分类准确率分别为75.33%，83.79%，78.92%[3]。接标等使用一种新型图核对NC和MCI以及EMCI和LMCI进行分类研究，得到的分类准确率分别为82.6%和67.7%[4].迈阿密大学的GORYAWALA et al使用被试的MRI体积和神经心理学评分信息，使用线性判别分析分类器实现了NC vs EMCI，NC vs LMCI， EMCI vs LMCI分类准确率分别为85.6%，90.8%，70.6%[6].印第安纳大学医学院的TRZEPACZ et al使用海马体积、年龄、受教育程度等信息作为特征对NC，EMCI，LMCI及AD进行了分类研究，得到了对EMCI，LMCI的平均正确预测率分别为62.6%、72.7%[7].北卡罗来纳大学教堂山分校的CHEN et al对NC和MCI进行了分类研究，得到了NC与MCI分类准确率为78.70%[8].本文研究的分类准确率分别为88.24%，94.12%，81.25%，并且三组分类的灵敏度均达到了100%.三组的分类效果均优于以上研究。其中NC和LMCI的分类效果最好，准确率达到94.12%，可能意味着在AD病理发展中，和正常老年人相比，LMCI患者大脑的网络拓扑结构已经发生了较为显著的改变。

单因素方差分析结果显示，差异显著的的许多脑区与之前MCI疾病研究发现的敏感脑区结果一致。在颞叶部分，NC，EMCI和LMCI三组被试的左右颞中回、左右梭状回、左侧海马旁回在局部属性上都表现出显著差异(p<0.05)，与之前MCI疾病许多相关研究发现一致[3-8]。KHAZAEE et al通过有向脑网络拓扑属性分析发现MCI患者的颞中回的多个局部属性值均与正常对照组存在显著差异，hub节点分析结果显示左侧海马旁回是正常老年人脑网络中的hub节点，但在MCI患者中缺失[10]。武政等人研究发现MCI患者的左右颞中回、右侧梭状回区域灰质体积发生了明显改变[22]。

在额叶部分，三组被试的右侧岛盖部额下回、左侧三角部额下回、左侧补充运动区、左侧嗅皮质、左侧中央旁小叶在局部属性上表现出显著差异(p<0.05)。梁红等通过无向脑网络拓扑属性分析发现MCI患者右侧岛盖部额下回的局部属性与正常人相比有显著差异[3]。接标等通过构建无向脑网络的图核发现MCI患者的左侧三角部额下回、左侧补充运动区、左侧嗅皮质与正常对照组相比有显著差异[4]。郭圣文等分析脑皮层特征发现MCI患者嗅皮质与正常对照组相比有显著差异[5]。CHEN et al通过研究灰质、白质脑区间的动态功能连接发现MCI患者的岛盖部额下回、嗅皮质、中央旁小叶等脑区与其他脑区间的功能连接与正常对照组相比有显著的差异[8]。KHAZAEE et al通过有向脑网络拓扑属性分析发现MCI患者的左侧补充运动区与正常对照组存在显著差异[10]。FRISONI et al研究指出在AD病变过程中，患者的感觉运动皮层功能逐渐缺失[23]，BRIER et al，XIA et al研究也显示AD患者感觉运动区发生了功能性改变[24-25]。武政等通过无向脑网络拓扑属性分析发现MCI患者的岛盖部额下回、三角部额下回、嗅皮质等脑区的局部属性值与正常人相比有显著差异[22]。

在枕叶部分，三组被试的左右枕中回在局部属性上表现出显著差异(p<0.05)。CHEN et al通过研究灰质、白质脑区间的动态功能连接发现MCI患者枕中回与其他脑区的功能连接发生了显著改变[8]。

在顶叶部分，三组被试的左侧顶上回、右侧缘上回、左侧楔前叶在局部属性上表现出显著差异(p<0.05).接标等人通过构建无向脑网络的图核发现MCI患者的左侧顶上回与正常对照组相比有显著差异[4]。GORYAWALA et al研究发现NC与LMCI患者左侧顶上回皮质体积有显著差异[6]。本研究中左侧楔前叶在入度、K核中心性表现出组间显著差异。CHEN et al通过研究灰质、白质脑区间的动态功能连接发现MCI患者楔前叶与其他脑区的功能连接发生了显著改变[8]。PEREZ et al[26]研究指出在AD病变过程中左侧楔前叶发生病变，可能与患者情景记忆被破坏有密切的联系。武政等[22]通过无向脑网络拓扑属性分析发现MCI患者的顶上回、缘上回、楔前叶等脑区的局部属性值与正常人相比有显著差异。

此外本研究还发现了其他具有组间显著差异的脑区，包括右侧前扣带和旁扣带脑回[3,22]、左侧豆状壳核、右侧豆状苍白球，这些差异与已有的研究结论较为一致。说明MCI患者的认知功能障碍并非由少数脑区受损导致，而是全脑多个脑区均有不同程度的损伤。使用有向脑网络属性进行分类实现了更好的分类效果，进一步证实了MCI的信息传递异常是有方向性的。这些发现都有可能成为MCI的生物学监测指标及评估病情严重程度的一个客观依据。

5 结论

本研究采用基于格兰杰因果分析的方法，构建了NC，EMCI和LMCI三组被试的静息态有向功能脑网络，利用统计学方法对有向脑网络拓扑属性进行特征选择，将具有显著组间差异的属性值作为分类特征，使用SVM机器学习算法对任意两组被试进行了分类研究，实现了较好的分类效果。说明本研究的方法可以更准确地度量MCI患者脑网络的拓扑结构变化，从而更好地辅助MCI的诊断，以便及早发现病情。