脑网络分析方法及其应用
2021-09-20黄嘉爽丁卫平张道强
黄嘉爽,接 标,丁卫平,张道强
(1.南通大学信息科学技术学院,南通 226019;2.安徽师范大学计算机与信息学院,芜湖 241002;3.南京航空航天大学计算机科学与技术学院,南京 211106)
引 言
人类社会和自然界中互相关联元素之间的复杂关系,如科学合作网中各个作者的合作关系,蛋白质交互网络中蛋白质分子之间的物理接触等,通常可以通过网络结构表示。这些天然存在的网络并不是无规则的也不是随机的,而是具备一定的拓扑结构。分析这些网络的拓扑信息,可以帮助理解网络的整体功能、性能以及网络元素的行为[1⁃2]。
人的大脑也具有网络结构。从微观尺度看,大脑由1014个神经元组成,这些神经元之间相互的信息传播形成了人脑的生物运作系统,从宏观尺度看,大脑由诸如视觉、运动等多个功能区组成,功能区之间的相互作用,构成了人类大脑的认知、情感、记忆等复杂活动[3]。然而,无论从微观还是宏观,脑网络的结构都具备社团化、高聚集性等复杂网络的典型特征[4]。同时,研究已经表明脑网络与社交网络等复杂网络类似,存在一些连接量非常高的节点,这些节点在保证大脑连接模式具有有效性的同时,也使得网络具备了“小世界属性”[5]。
脑网络的结构与人类的认知功能和脑疾病存在密切联系,这种联系通常是多样且复杂[6]。例如,研究表明脑网络中的模块度与人的智力水平存在一定的联系,在智商测试中得分越高的被试,其网络处于高模块化状态的时间较多[7]。研究也发现脑网络中的新皮层、丘脑和小脑内部的连接强度与音乐创造力相关[8]。同时,一些脑疾病也被认为与脑网络结构的改变有关。例如,Yao 等人[9]通过联合分析功能网络和结构网络的连接强度发现,在精神分裂患者的功能连接网络中,符合结构网络三阶连接限制的部分连接边,其连接强度要显著低于正常被试,并且随着患病年龄的增加,其连接强度持续减少。Wang 等人[10]也发现相较正常被试,精神分裂症患者存在功能连接的两个脑区物理距离较远的现象。这些研究表明分析脑网络结构可以为人类探索大脑工作方式、研究神经性退化疾病的病理机制、改善心理疾病及大脑损伤的诊断治疗提供有力的工具。
图1 给出了脑网络分析的典型流程,其主要包含3 个部分:网络构建、网络表示以及网络分析。网络构建是脑网络分析的基础,其主要将脑影像或者脑生理信号数据抽象表示为易于数学表达的图结构。网络表示是脑网络分析中的特征表示及学习过程,其通常将原始的图结构数据转化为一组向量。网络分析是脑网络研究中最核心的步骤,其可分为:组间差异分析、关联分析、个体分类预测和多模态脑网络分析4 类。研究者通常根据不同的研究目的,选择最为合适的网络构建、网络表示以及网络分析方法。本文也将基于上述框架,回顾近些年国内外在脑网络分析中的研究成果。
图1 脑网络分析基本框架Fig.1 Framework of brain network analysis
1 网络构建
脑网络数据由两个最为关键的元素组成:节点和连接边。通过定义这两个元素,研究者可以使用图结构表示关联区域之间丰富的结构信息。然而,在脑网络构建中存在数据来源广泛、连接信息不确定等问题[11]。因此,如何针对特定问题构建合适的脑网络仍是一个值得关注的问题。
1.1 节点定义
脑网络中节点通常代表着大脑的部分区域,这部分区域的大小和位置,决定脑网络分析的尺度和对象。作为脑网络分析的首要步骤,节点的定义直接影响着后续的分析研究。目前也有大量研究涉及如何定义脑网络的节点。具体来说,从数据来源上可以分为两种,一种是依靠脑电设备构建的脑网络,其节点定义为获取信号的原始电极,通常节点数在几十到几百不等。脑电可以捕获瞬时的脑部异常放电,因此由脑电信号构建的脑网络常被应用于脑疾病的识别研究[12];另一种是从影像数据中构建脑网络。这种节点定义的方式不再受制于硬件,相关的研究可以分为以下几种:(1)最为常见的是依据结构先验模板信息。例如MNI152、自动解剖标记模板(Automated anatomical labelin,AAL)和Harvard⁃Ox⁃ford 等,这些模板依据选定人群的脑影像数据,将结构上临近的区域定义为节点[13]。该类方法虽然便捷,但一般仅考虑结构信息,因而被归为一个区域的部分,并不具有同一个功能。因此并不适用于涉及脑功能的分析任务。(2)基于功能的模板,使用该模板可以克服使用结构先验模板带来的功能区域定位不准确的问题,而如何获取这类功能模板为目前脑图谱研究的热点。例如,中国科学院自动化研究所脑网络组研究中心通过联合分析多种模态的影像数据,同时考虑空间结构和功能一致性信息,提出了一种新的功能模板,其将大脑分为了210 个皮层区域和36 个皮层下区域[14]。按照这类模板构建的脑网络在对于涉及功能变化的脑疾病研究中具有较好的性能。(3)基于数据驱动的方法,即根据数据本身定义节点。例如,Yan 等人[15]基于脑影像空间信息独立的假设,使用成组独立成分分析的方法去定义节点,其将每个独立成分所对应的激活区作为节点,并将构建脑网络用于识别精神分裂患者。该方法不仅能定位到组间差异最大的区域,而且通常具有消除噪声信号的能力,可以提高疾病识别的准确率。Zhao 等人[16]通过将模板信息和监督字典学习方法融合,寻找可以反映个体特征且具有解释意义的脑部区域作为脑网络节点,并将其同时应用任务相关脑网络的构建。此外,研究者借助大规模网络分析方法,也可以将图像中每一个体素都作为节点,构建体素级别的全脑功能网络,该方法可以避免分割脑部区域的问题,并充分使用脑影像数据,但是因其节点数可以达到104级别,通常需要较大的计算成本,并不适用于复杂的问题分析[17]。
1.2 连接边定义
连接边定义了节点对之间的某种联系,这类联系可以反映大脑结构和功能信息,是脑网络分析最重要的对象。目前研究者对脑网络连接边的定义做了一系列研究。从连接的物理意义上简单分类,通常可以将连接分为结构连接和功能连接,其分别对应为结构脑网络和功能脑网络。结构连接主要体现的是节点和节点之间的结构信息(例如,节点间纤维束的体积和个数等),其通常源于磁共振图像(Mag⁃netic resonance imaging ,MRI)或者弥散张量成像图像(Diffusion tensor imaging,DTI)。当使用MRI图像时,该连接体现的是空间上的联系紧密程度。当使用DTI 图像时,连接通过追踪节点和节点之间的白质纤维束来构建。这种结构连接通常被认为在较短的时间内是稳定的[18]。功能连接主要体现脑区之间的活动一致性,其构建源于脑电图(Electroencephalogram,EEG)数据和功能磁共振图像(func⁃tional magnetic resonance imaging,fMRI)数据。这些数据通常以时间序列的形式存在,即每一个节点存在一个等长的时间序列,通过计算节点对之间时间序列的相关性,从而确定节点对之间的功能连接关系。
功能连接按照所表示节点对之间关系的不同,可以分为无向连接、有向连接两类,对应网络分别是无向网络和有向网络。同时根据连接边有无权重值,可分为加权连接和无权连接,从而组合出4 种不同的网络,其中最为常见的是无向加权网络,该种网络通常计算时间序列的相关系数而赋予每一个连接边相应的权重。该网络通常是一个全连接网络(即任意节点间都存在连接边),为简化后续分析,通常需要对网络进行稀疏化。研究表明稀疏化操作对后续的分析具有很大影响[19]。在各种稀疏化方法中,采用阈值是一种简单而且常用的方法,但到目前为止,仍没有一个最佳的标准确定相应的阈值,需要采用交叉验证遍历所有可能的阈值来确定最优的一个,这会极大增加计算时间。最近,研究者尝试使用一些数据驱动的方式来克服该问题。例如,Jie 等人[20]提出使用多阈值的方法,采用多核学习方法联合考虑在不同阈值下网络的拓扑结构信息。通过该方式可以提升脑网络表达拓扑结构信息的能力,进而提高模型对阿尔兹海默症的识别准确率。Váša 等人[21]则试图通过定义概率阈值的方式去获取组间差异更为显著的网络,并应用于精神疾病的分析中。Yang 等人[22]基于脑网络的层次结构,提出使用Structural Graphical Lasso 模型依靠数据去主动学习脑网络结构,并将其应用于小鼠脑网络的构建。Zhao 等人[23]通过在稀疏学习中引入原有的模板结构信息的方式,去引导脑网络的构建,并在人脑连接组计划数据集上验证了方法的有效性。这类数据驱动的连接边定义方法相较传统的连接边定义方法具有如下优势:(1)更加准确地描述脑网络的拓扑信息;(2)借助标签信息,提高脑网络拓扑结构的判别信息;(3)加入结构先验信息,可以更加符合具体的分析任务。
有向网络相比无向网络多了连接的方向信息,从而可以反映脑区之间的因果联系。这种方向信息需要依靠特定的数据驱动模型获取。例如,Kiebel 等人[24]提出使用动态因果模型(Dynamic causal mod⁃eling,DCM)来构建有向脑网络,该模型基于贝叶斯推理模型联合考虑了神经活动、神经血管耦合、血液动力学状态和血氧反应等信息,用以描述节点对之间的因果关系。这种有向网络可以反映脑部环路活动的异常。例如,Alderson 等人[25]通过对阿尔兹海默症患者的有向脑网络的分析发现,患者脑部的皮质⁃丘脑⁃皮质处理环路的中断可能是导致后侧默认网络活动功能障碍的原因。除了常用的贝叶斯推理模型外,Anzellotti 等人[26]提出了信息连接(Information connectivity,IC),该连接并不直接使用脑区之间的时间序列测量脑区之间的相关性,而是考虑将两者之间对同一刺激模式的分类精度作为衡量两者之间相似性的指标,即认为对同一刺激具有相似反应的脑区存在连接。该种脑网络适用于对任务态功能磁共振数据的分析。目前无论是有向图还是无向图,均属于简单图的范畴,也是目前最为常用的脑网络构建方式。
1.3 高阶脑网络的构建
目前越来越多的研究者尝试构建一些高阶的脑网络去提升脑网络表示结构信息的能力。常见的高阶脑网络有3 种:超图脑网络、动态脑网络和多层脑网络。
传统的无向和有向网络,通常只考虑了两个节点之间的关系,而大脑作为一个复杂系统,通常需要多个脑区的协同工作才能完成一个特定任务。因此,Jie 等人[27]提出利用超图去刻画更复杂的多个脑区间的关系,相应的网络称之为超网络。如图2 所示,超图与简单图最大的不同在于连接边不在仅仅只描述两个节点之间的关系,而是关注两个或者两个以上的节点元素间的关系。通过该模型可以更有效地刻画脑区与脑区之间的高阶联系。常见的超边构建方法主要利用了稀疏回归模型[28]。简单来说,即对每一个节点的时间序列,使用余下节点的时间序列进行重构,最后回归系数非零的节点,被认为与该节点同属于一个超边。此外,Xiao 等人[29]也提出可以根据连接的权重变化来构建相应超网络超边的方法。超图脑网络目前被应用于脑疾病的分析中。相比简单图,其可以反映更为高阶的由疾病引起的脑网络连接结构变化信息,因此应用超图脑网络也可提升模型对脑疾病识别的准确率。
图2 超图示意图[26]Fig.2 Schematic of hyper-graph[26]
动态脑网络相比静态脑网络增加了一个时间维度,因此可以反映脑网络结构的动态变化信息。随着研究的深入,研究者发现相比传统的静态脑网络,动态脑网络对脑疾病引起的脑部结构变化更敏感,可以作为生物标记物辅助诊断脑疾病[30]。传统的动态脑网络构建均是基于滑动时间窗方法,即将一个完整的时间序列划分为若干个等长窗口片段,随后计算每个片段上的脑网络矩阵,最后这些连续的脑网络矩阵就构成了动态脑网络。图3 显示了经典的动态脑网络构建流程。值得注意的是,在划分窗口时,窗口间可以存在重叠,这样可以更好地捕获瞬时的脑网络结构变化。在构建脑网络的过程中,通常涉及3 个参数:时间窗大小、更新步长、时间窗类型。目前的研究结果显示对这3 个参数的选择并没有“金标准”,通常需要根据具体任务设定[31]。除去经典的时间窗构建方法,一些模型驱动的动态脑网络构建方法也被陆续提出,例如时变向量自回归模型[32]、马尔可夫模型[33]。这些模型可以为构建动态脑网络提供一个统一的框架,也在一定程度上缓解了动态脑网络构建方法受制于时间窗大小的限制。目前动态脑网络已被广泛应用于对脑疾病和脑认知功能的分析中,例如,Ozdemir 等人[34]通过构建动态脑网络,发现连接的动态形成在认知、记忆和学习过程中起着关键作用。Geng 等人[35]分析了听觉言语幻觉患者的动态脑网络,发现该类患者相比正常被试在“网络拮抗”大脑状态中花费的时间更少,并且切换到这种大脑状态的概率更低。
图3 动态脑网络构建示意图Fig.3 Schematic of dynamic brain network construction
多层脑网络可以刻画节点之间多样的关系,其每一层均是一个传统的脑网络,用以表示节点之间的特定关系。多层脑网络常用于多模态脑网络的分析[36⁃38],例如图4 所示,该多层脑网络有结构层和功能层组成,其中两层的节点一致,但是节点之间的连接却有不同模态信息定义,其中结构层由DTI 数据构建,而功能层则由fMRI 数据构建。这种多层脑网络模型通过一个统一的模型联合分析结构和功能两个模态的信息,可以探索模态之间的相互联系,从而克服单独分析结构和功能数据带来的信息丢失。例如,Battiston等人[39]使用结构和功能两种模态信息构建多层脑网络,通过定义多重中心度值发现大脑的结构和功能的核心,用以分析大脑的信息处理过程。除去分析多模态数据,多层脑网络也可以用以分析多频段数据,即每一层表示在特定频段下,节点之间的联系[40]。例如,Guillon 等人[41]选取delta(2~4 Hz),theta(4.5~7.5 Hz),alpha1(8~10.5 Hz),alpha2(11~13 Hz),beta1(13.5~20 Hz),beta2(20.5~29.5 Hz)和gamma(30~45 Hz)4 个频段构建多层脑网络,并计算多重参与系数提取生物标记物,用以识别阿尔兹海莫患者。
图4 多层脑网络示意图[37]Fig.4 Schematic of multilayer brain network[37]
2 网络表示
网络天然的是一种结构化的数据,如何准确有效地表示这些结构信息是目前的研究热点。目前,脑网络表示的方法可分为4 类:基于图特征表示、基于连接边模式的特征表示、基于子图模式的表示和基于深度学习的脑网络表示。
2.1 基于图特征表示
图论是一门研究图特征的古老学科。正如前文所述,脑网络属于一种典型的复杂网络,具备复杂网络中特有的性质,因此可以直接使用图论中性质对脑网络进行表示。例如,节点度、聚类系数和局部效率等可以直接衡量网络的功能整合与分离等性质[4]。得益于这类方法的便捷性和有效性,其被成功应用于疾病和认知状态分析任务[42]。此外,借助复杂网络中类如社区结构、重要节点和小世界属性等特殊结构也可以很好地表示网络特性。例如,借助于社区结构分析,研究者已经使用如谱聚类,最小割等将大的网络分为各个社区(子网络),而社团之间的成员差异可以通过归一化互信息(Normalized mu⁃tual information)来衡量。已有研究表明这类社区差异也能很好地指示精神类脑疾病的病理机制[43]。借助于重要节点(指的是在网络中连接强度很大的节点,通常在网络信息传播起关键作用)分析,可以指示一些脑疾病所引起的脑部结构变化或者认知状态的变化。例如,Kaplan 等人[44]发现重要节点结构的破坏可能会引起某些中枢神经系统的慢性疼痛疾病。Zhu 等人[45]通过分析小世界特性(通常表现为高聚类性和短最短距离性),发现缺血性脑白质病变患者相比正常被试存在明显的小世界特性减弱。
基于图特征的脑网络表示方法其优势在于简单便捷,通常无需复杂的计算过程。然而,这些图特征也有其天然的缺陷,即对一些细微异常结构的表征能力不强。以常见的节点度为例,其反映单个节点与其余节点之间的连接关系,仅使用一个值描述节点的拓扑结构信息。这样极易造成局部拓扑结构信息的丢失。
2.2 基于连接边模式的特征表示
基于连接边模式的特征表示方法主要关注脑网络节点对之间的连接关系。连接边作为构成网络的重要元素之一,本身也蕴含着丰富的信息。在使用连接模式表示脑网络信息时,将网络中的每一条连接边作为独立的变量是最为简单的方法。然而,这种方式的缺点在于脑网络具有较高特征维数(通常是节点数的平方级),相对于分析任务的样本数来说,是典型的“高维小样本问题”。因此,研究人员利用机器学习方法筛选特征。例如,Yahata 等人[46]使用基于L1 约束的典型相关模型(L1⁃CCA),从原有的所有连接边中,选择出16 条与疾病存在高度关联的连接边。Relión 等人[47]在稀疏模型中通过引入组约束条件,加入了网络的结构信息,鼓励模型尽量选择出与同一节点相连的边。借助这类方法,研究者往往能发现一些隐藏的与疾病相关的连接边模式。
基于连接边模式的特征表示方法相比基于图特征的脑网络表示方法,其反映拓扑结构信息的能力更强,因此将其应用于脑疾病的识别可以获取较好的性能。然而,其缺陷在于只关注节点对之间的两两关系,而忽略了多节点之间更为复杂的联系。
2.3 基于子图模式表示
目前,有研究表明一些特定的子图结构对脑疾病具有重要的指示作用。例如,Fei 等人[48]利用多条连接边构成的子图模式表示脑网络。该方法主要启发于图挖掘中的频繁子图,通过寻找两组被试之间差异最大的频繁子图模式,构建成一组字典,随后将网络数据用一组指示向量(0 和1)表出。得益于这个思路,Zhang 等人[49]进一步在图挖掘的过程中模拟了脑网络中信息扩散过程,提出了如图5 所示的有序子图模式。该模式要求挖掘出的子图连接边权重呈现递减的模式,在提供结构信息的同时,充分使用了连接边的权重信息。近来研究者发现特定子图模式的分布也可有效反映脑网络的结构特征,与频繁子图模式不同,这种特定的子图模式通常由3~5 个无标号节点构成的多个不同构子图组成。通过统计特定子图在被试脑网络的数量,构成一组与子图模式等长的特征向量。Wei 等人[50]便基于这种分布模式分析了大脑信息处理的过程,并发现多个可以解释大脑信息流处理过程的重要模块组。
图5 有序模式示意图[49]Fig.5 Schematic of ordinal patterns[49]
基于子图模式的脑网络特征表示方法其优势在于具有较强的局部拓扑结构信息刻画能力,因此可以很好反映脑疾病引起的局部结构异常。然而,该类方法有两个缺陷:(1)计算复杂度较高,该算法需要预先进行频繁子图挖掘,当子图的节点数上升时,该算法计算复杂度将会呈现指数上升;(2)该类算法中的子图挖掘和识别判断过程相互独立,不是一个端到端的学习过程,其在一定程度上会影响对脑疾病的识别效果。
2.4 基于深度学习表示
深度学习技术也被成功运用于脑网络的表示。目前深度学习在脑网络表示的应用主要可分为两类:基于传统卷积操作的脑网络表示方法和基于图卷积的脑网络表示方法。在前一类中,研究者主要将传统图像中的卷积操作应用于脑网络的连接矩阵上,但是值得注意的是,不同于图像数据,脑网络是一种图结构数据,其每个顶点的相邻顶点数目都可能不同,因此其并没有平移不变性,即无法如传统图像那样用一个同样尺寸的卷积核来进行卷积运算。为克服该问题,研究者提出了两类方法:设计适用于脑网络的卷积或者将脑网络转化为可以适用于传统卷积的数据。例如,Kawahara 等人[51]设计出一种专门针对脑网络的卷积操作,该卷积不同于传统图像卷积的矩阵窗口设置,而使用了行卷积和列卷积,即对连接矩阵的整行或者整列进行卷积操作,通过组合多个卷积操作,原始的脑网络数据可以由一组向量表示。Mao 等人[52]将这种行卷积的思路设计了基于节点的行滤波卷积网络,并将其运用在精神分裂症的识别中。此外,Ktena 等人[53]提出对脑网络进行频域卷积,从而克服空间域中没有平移不变性的问题。该方法主要使用了图上的傅里叶变换,将图上的卷积操作转化为频域空间中简单的乘法过程。在将脑网络转化为可以适用于传统卷积的方法中,基本的思路就是将原始的网络节点顺序进行重排,该重排过程可以将相互连接的区域排列在同一区域,从而卷积的平移操作得以顺利进行[54]。同时,研究者也将深度学习方法用于获取动态脑网络的表示。例如,Jie 等人[55]定义了一种新型的卷积核获取各个动态网络中的连接权值,采用对时间序列直接卷积的方式,取代传统的滑动时间窗中简单的皮尔逊相关值。Wang 等人[56]利用长短期记忆网络(Long short⁃term memory,LSTM)捕获动态网络之间的时序关系,用于学习更具判别信息的表示。
基于深度学习的脑网络表示方法是目前的研究热点,借助深度学习框架强大的特征学习能力和端到端的学习过程,其在识别脑疾病的应用中可以获得较好的结果。然而,该方法目前也存在缺少解释性的缺陷。具体来说,目前多数深度学习还是黑箱系统,在针对脑疾病的识别任务中,无法找到稳定的生物标记物解释病理机制。
3 脑网络分析及应用
基于第2 节介绍的网络表示技术,研究人员针对具体的应用任务提出了多类网络分析方法。目前,较为常见的分析及应用任务可以分为组间差异分析、关联分析、个体分类预测和多模态网络数据分析4大类。
3.1 脑网络组间差异分析
组间差异分析主要基于特定的假设,寻找对照组(例如正常人和病人之间,以及不同任务的个体间等)个体差异性。例如,通过分析对照组之间的网络结构差异,研究者可以假设并验证一些病变区域,找寻具有病理解释功能的生物标志物。
脑网络组间差异分析中最常使用统计分析方法,其主要依靠差异显著性检验去发现组间存在差异的特征变量。该类分析方法目前广泛地应用于对脑疾病患者与正常被试的脑网络分析中,例如,Tom⁃son 等人[57]抽取了脑网络中每条连接的权重,并对这些权重使用双样本二项式瓦尔德测试进行差异显著分析,发现相比正常人,一型神经纤维瘤患者的脑网络呈现前后侧连接数减少,两侧连接强度减弱。Leroux 等人[58]对精神分裂患者的功能和结构网络分别使用了协方差分析(Analysis of covariance,AN⁃COVA),验证了精神分裂症患者语言网络异常的假设。这些研究能够在一定程度上帮助理解大脑的运作机制,以及脑疾病的病理。但是这类方法通常只能考虑单变量因素,无法适用于多变量脑网络特征的分析。
3.2 关联分析
关联分析是脑网络分析中另一种常见的分析方法,与组间差异分析不同,其更为关注网络结构与关联对象之间的隐含关系。关联对象可以是不同模态的数据,也可以是行为认知得分、基因数据等。例如,通过挖掘结构性网络和功能性网络之间的潜在关系,可以更好地帮助研究者理解大脑的运作方式[59]。通过分析网络的结构属性和认知得分的关系,研究脑部结构如何影响人的性格[60]。常见的关联分析通常可以根据输入变量分为单变量关联分析和多变量关联分析。
在单变量关联分析中,最为常用的方法是计算网络结构属性与关联对象之间的相关系数。一般认为相关系数小于0.25 的为弱相关,0.25~0.5 的为一般相关,0.5~0.75 的为适中相关,大于0.75 的为强相关。例如,Westphal 等人[61]发现脑网络中的模块度与情景记忆的能力存在一般相关。然而这样的分析方法只适用于单变量分析,而当分析多变量与这些关联对象之间的复杂关系时,往往需要借助机器学习中的技术。
在多变量的关联分析任务中,最常使用的方法是回归模型和典型相关模型。在回归模型方法中,与网络关联的对象通常是一个确定的值(如:认知得分、临床变量值等)。为选择出与关联对象最为相关的网络特征,通常需要利用特征选择方法,随后通过模型预测得分。例如,路子祥等人[62]借助支持向量回归机融合了节点特征和连接边特征成功预测阿尔兹海默症患者的认知得分,并发现了与疾病存在密切关联的脑区。Dubois 等人[63]使用t⁃test 特征选择方法,并利用弹性网模型,分析了脑功能网络与一般智力之间的潜在联系。不同于回归模型,典型相关分析研究的是两组变量之间的相关关系,其通过最大化两个新变量之间的相关性,达到揭示原始两组变量之间隐含关系的目的。例如,李蝉秀等人[64]利用稀疏典型相关分析探索了脑网络结构与基因信息之间的隐含关系,并成功发现脑网络中多个脑区的聚集性与诱发老年痴呆的基因存在密切联系。这种多变量关联分析任务多数都是数据驱动的方法,因此可以在分析模型中嵌入先验知识,从而获取较好的结果。
3.3 个体分类预测
个体分类预测主要借助一些模式识别和机器学习的技术,完成对脑疾病的诊断和预测。相对于组间差异性分析和关联分析,个体分类预测任务的侧重点在于能以数据驱动的方式学习有关疾病的知识,并自动地完成对个体的疾病分类和预测。这类研究成果可以直接指导或者辅助临床医生诊断疾病,因而越来越受到研究人员的重视。
基于在第2 节中讨论的网络表示,大量的机器学习方法已被成功地运用在脑网络分类研究中。表1总结了目前具有代表性的分类方法并给出在一些脑疾病上的分类性能。从表1 中可见,在深度学习发展以前的方法多数都使用了支持向量机(Support vector machine,SVM)。SVM 是一种经典的学习方法,其基本思想是寻找最大间隔的超平面,并通过核方法,使其对研究的任务具有良好的非线性泛化能力。其分类流程以文献[65]为例,从脑网络中提取聚类系数作为特征,随后使用基于高斯核的支持向量机对病人进行预测。对于提取的特征,可以直接输入分类器,也可以进行特征降维后再输入分类器,例如文献[68]中使用了Fused Lasso 对原始特征进行了选择,文献[72]使用了主成分分析对原始特征进行了压缩。除了向量核(如高斯核),为了更好地利用网络的结构信息,图核也在脑网络分类问题中被使用,例如在文献[20]中,研究者利用图核计算网络之间的成对相似性,从而在针对轻度认知障碍患者的识别任务中获得更好的分类性能。另外,随着深度学习技术在自然图像分析领域的广泛应用,研究者也将其运用在对脑疾病数据的分类上。正如前文所述,深度模型具有强大的特征学习能力,使用深度学习往往可以学习到更具判别力的特征,从而获取优于传统方法的分类精度。值得注意的是,在表1中,有些传统方法的精度要优于深度学习方法,这可能的原因是这些传统的方法都是在小数据集上训练和测试,而深度学习的方法都是在较大的数据集上进行实验。大样本医学数据获取一直是领域内的棘手问题,目前大多数大样本的医学数据集都是来自多个医院,其存在数据异质性问题,会降低深度学习模型的分类精度。与此同时,表1 中大多数方法均是使用了功能网络,这是因为结构网络一般都是稀疏网络(通常稀疏在0.1~0.2),相比功能网络,包含的信息较少,仅仅适用于某些特定疾病的诊断。
表1 脑网络模式分类分析方法及性能Table 1 Classification methods and performances in brain networks
续表
3.4 多模态网络数据分析
相对于单一模态的网络分析,多模态的网络分析能够充分利用各个模态的信息。在脑网络分析中,常见的多模态数据主要指结构脑网络和功能脑网络两种。目前的研究表明,相比仅仅使用单一模态,融合多个模态的信息可以获取更好的分类精度[83]。常见的融合方式有后置融合和前置融合两种。后置融合主要在决策层融合,例如Dyrba 等人[84]使用了多核融合技术,将功能脑网络和结构脑网络各自的核矩阵通过加权融合的方式融合为一个核矩阵,并使用了传统的SVM 获取最终的分类结果。前置融合主要指在输入阶段,通过模型的设定,将两个模态的信息融合在一起,例如,Huang 等人[85]设计了一种图结构模型,其每个节点的特征由脑功能网络定义,而节点与节点之间的连接由结构脑网络定义,随后通过图上的扩散融合自然地将两个模态信息融合。此外,多模态脑网络分析与传统多模态数据分析的最大区别在于结构和功能脑网络之间存在其天然的联系。研究表明结构通常可以影响功能,因此可以进一步探索两个模态之间的关联信息。例如,Mišic' 等人[87]通过偏最小二乘的方法分析了两者之间的联系,并发现了多个存在密切联系的子网络及重要节点。Goñi 等人[88]直接用结构连接的连接边强度预测功能连接,发现部分区域存在高度的一致性。这种关联信息同时可以用于脑疾病的诊断,例如,Huang 等人[37]就通过设计了一种共生子图模式捕捉结构和功能网络之间的关联信息,并用于额叶癫痫和颞叶癫痫的识别中。这些研究从不同视角来了解脑的功能和结构,以及潜在的关联,为脑分析提供了崭新的方法。
4 总结与展望
脑网络为理解人脑的认知过程、脑疾病的病理机制提供了新的工具。本文主要介绍了近些年在网络的构建、表示、分析方面的典型工作。大脑作为人类最复杂的系统,目前使用脑网络探索其活动和内在的运作模式依旧存在很多尚待解决的问题。
在脑网络构建研究中,其问题主要在于如何获取网络中的高阶结构信息。目前已有研究者提出了动态网络、多层网络等更为复杂的构建脑网络的方法,相比传统的静态网络和单层网络,分析这类更为复杂的网络往往可以获得更具解释性的结果[89]。然而,目前构建这类复杂脑网络的方式仍比较单一,且多数需要很强的先验知识,而没有数据驱动的方法。因此,设计能够根据具体任务自动学习脑网络高阶复杂结构的模型仍是需要解决的问题。
在脑网络表示研究中,如何准确表示图结构中的信息,不仅是脑网络中待解决的问题,也是机器学习中的热门研究方向。在机器学习中图嵌入技术可以使用长度任意的向量表示每个节点的结构信息,相比于传统图论方法只有一个值表达节点的网络局部拓扑信息,其表达的信息更为准确。目前随着图嵌入技术融合深度学习技术在传统社交网络分析任务中的成功运用,也为其拓展到脑网络分析上提供了新的思路[90]。然而,目前深度学习在脑网络表示上的应用仍然存在不少问题,其一,深度学习依赖大样本的数据集,但是大样本医学数据集的获取目前还无法解决。因此如何使用深度学习方法在较小的数据集上训练出稳定的模型,是未来的研究热点。其二,深度学习模式虽然具有强大的特征学习能力,但是多数模型是个“黑箱系统”,无法对学出的特征给出解释。然而在脑网络的应用中,通常需要模型给出合理的医学解释。因此针对脑网络分析开发一种可解释的深度模型也是未来的研究方向。
在脑网络分析和应用研究中,尽管目前已经有大量将脑网络应用于脑疾病和认知状态分析的研究。但是目前将脑网络实际应用于临床诊断中还存在不少挑战。其主要原因在于多数的研究仍然停留在单一中心的有限样本以及仅关注简单两分类问题(例如,区分病人和健康人的研究),并无法适应实际临床需求。随着诸如人脑连接组项目等大型数据库的建立,如何解决多中心数据分布不统一,并利用大数据的方法去获得更具临床或者生理解释意义的信息也是急需解决的问题[91]。此外,在针对脑疾病的研究中,区分疾病的不同亚型,以及分析疾病的预后影响也是临床应用中最为关注的问题[92]。