APP下载

多频段脑功能网络融合的阿尔茨海默病分类

2021-02-05王中阳信俊昌汪新蕾王之琼

小型微型计算机系统 2021年1期
关键词:频段节点分类

王中阳,信俊昌,汪新蕾,王之琼,4 ,赵 越

1(东北大学 计算机科学与工程学院,沈阳 110169) 2(东北大学 医学与生物信息工程学院,沈阳 110169) 3(辽宁省大数据管理与分析重点实验室,沈阳 110169) 4(沈阳东软智能医疗科技研究院有限公司,沈阳 110179)

1 引 言

阿尔茨海默病(Alzheimer′s Disease,AD)是继心脏病、肿瘤和脑血管疾病之后一种老年人较多发的疾病[1].有研究表明了AD患者大脑网络的功能和结构可以利用静息态核磁共振(Resting-state functional Magnetic Resonance Imaging,rs-fMRI)研究,并且研究结果显示患者的脑功能网络连接发生了改变.这些研究主要是通过一定的脑模板将患者的大脑分成多个感兴趣区域(Region of Interest,ROI),并计算这些ROI间的血氧饱和依赖信号(Blood Oxygen Level Dependent,BOLD)信号相关系数来建立一个功能网络.而后利用图论的方法实现这个功能网络的拓扑特征分析[2,3].这些研究认为脑功能网络揭示了不同大脑区域间功能的传递,可以为AD的研究提供新的视角.在此基础上,已有研究将网络拓扑特征与机器学习方法相结合,以实现AD的计算机辅助诊断.

而现阶段BOLD信号相关性的计算通常是基于滤波去噪后的全频信号计算的.在通常的研究中把这个范围保留在0.01 Hz-0.1 Hz之间,然而这个频率范围较为宽泛[4-6].而Achard等人[4]利用离散小波变换应用于fMRI时间序列,分析发现,在0.007-0.45Hz的频率范围内,不同的大脑功能网络的“小世界”属性都有着显著的不同[5].研究发现利用分频的方式建立不同下的脑功能网络,可以实现对大脑功能网络结构特征的多样化描述,并且这种多频段的利用可以提高AD分类的准确性[6].

因此,本文提出了基于多频体网络融合模型的AD患者与健康对照组(Healthy Control,HC)间的分类研究.通过建立大脑多频段的体素级网络模型结构,并将计算得到的不同频段下的拓扑特征进行整合,并将整合后的特征用于机器学习方法进行分类.首先,对数据进行预处理,对于每一个受试者,保留0.01-0.2Hz信号;其次将离散小波变换用于fMRI时间序列,得到体素在不同频域下的信号,而后计算信号的相关性得到不同频段下的相关性矩阵;接着,通过图论方法计算所有矩阵的特征;最后将这些特征进行选择与整合,并将其用于支持向量机(Support Vector Machine,SVM)来实现不同患者的分类研究.通过ADNI(Alzheimer′s Disease Neuroimaging Initiative)数据库中获取的数据进行实验验证结果了所提出方法的效率和有效性.

本文的主要贡献如下:

1) 将脑功能网络的规模从脑区级变为体素级,将小规模的脑网络分析转变为大规模的脑网络分析充分利用了全脑体素的特征信息;

2) 提出了一种多频段的网络模型,考虑了脑功能网络特征在不同频段下的变化;

3) 通过整合不同频段下体素的拓扑特征变化,实现了阿兹海默症患者与正常对照组间的分类.

2 相关工作

在脑功能网络分析中,2005年,Salvador等人[7]通过一个先验的脑图谱(Anatomical Automatic Labeling,AAL)将大脑分成 90 个区域,首次构建了静息状态下正常被试的大脑功能网络.

而后在利用脑区信息进行换分的脑功能网络研究受到了很大的关注,如Wang等人[8]采用图论分析和统计分析的方式研究了槟郎成瘾者、烟酒成瘾者与健康人群间的脑功能网络差异.而随着神经影像技术的最新进展,脑功能网络的规模也在不断增加,研究从较大的脑区发展到了体素级.网络中定义的节点数量随着脑功能网络尺度的定义从几十发展到了几万.如Zweerings等人[9]从体素级的角度分了抑郁症患者的脑功能我拿过来差异,发现患者听觉皮层和丘脑以及后扣带回之间的连接减弱.Lusher等人[10]构建了一种快速生成高分辨率脑连接性图的新方法,降低了体素级网络构建的难度,使得建立具有几百万节点的脑网络成为了可能.

研究中发现随着功能网络尺度的逐渐增大,脑功能网络中表现出来的特性也越来越丰富,这些特性为人类脑功能网络中新的连接模式研究提供了更多支撑.

当脑疾病产生后,这些拓扑属性会产生哪些变化,以及网络拓扑结构的变化能否为神经疾病的诊断提供新的参考等已经成为了脑功能网络在疾病中研究中的重要内容.计算机辅助诊断(Computer-aided Diagnosis,CADx)方法[11]为脑功能网络拓扑结构的变化提供了新的方式.该方法通常利用机器学习算法分类.将单个脑区的功能拓扑特征或者脑区间的相关性特征作为分类特征.如Zhu等人[12]提出了一种新的非负判别功能连接性选择方法,以提取精神分裂症患者与健康对照者之间脑功能连接性的变化,实现了精神障碍患者的分类.Yang等人[13]认为如果将多个时间点数据添加到脑成像应用中,可以更好地揭示纵向分析中的疾病进展模式.因此提出了一种基于多任务学习的功能认知障碍纵向分类方法.可见基于脑功能网络的CADx方法有着一定的使用价值和研究价值.

3 方 法

3.1 预处理

对获取到的fMRI数据使用统计参数映射软件包(Statistical Parametric Mapping Software Package,SPM12)[14].进行时间片校正和头动校正来完成预处理.首先,对每个样本中的序列图进行扫描层间采集时间延迟的校正,使一个TR中各层的获取时间相同.而后进行头动校正,消除头部不由自主的轻微运动带来的影响.接着对BOLD信号进行滤波处理,在尽可能降低干扰的同时保留较多的信息,因此,保留0.01-0.2Hz内的信号作为有效信号.

3.2 多频脑网络模型

在以往的网络模型建立中,通常利用BOLD时域信号间的相似性,然而由于已知的研究中不同频段下的BOLD信号有着明显的差异.因此本文利用多频段网络模型来实现更加有效的脑功能网络的连接模式描述[15].

利用离散小波变换将预处理后的BOLD信号逐层分解[16].将这些rs-fMRI图像经小波变换后得到的不同频段下的信号x1,H[n],x2,H[n],…,xK,H[n],也就是对fMRI 图像进行分频段处理所产生的一组每个频段下所有脑区的信号频域图,记为:

φ={x1,H[n],x2,H[n],…,xK,H[n]}={φ1,φ2,…,φK}

(1)

φ中的每个矩阵描述了一幅图像在不同的区域间信号的功能连接.其中,将rs-fMRI图像小波变换产生的第m个的结果为:

(2)

根据每个rs-fMRI图像在第m个上得到的分频结果,对分频得到图像的各个节点之间的匹配关系进行计算,确定在该下的脑网络中边的表示,采用互信息的方法来计算各个节点之间的相关关系,即:

(3)

其中,p(x,y)是图像φ中X和Y两个节点产生的序列的联合概率分布函数,而p(x)和p(y)分别是节点X和Y产生的序列的边缘概率分布函数.

同时可以将式(3)等价表示为两个序列的熵的形式,即:

M(X,Y)=H(X,Y)-H(X|Y)-H(Y|X)

(4)

其中,H(X,Y)为X,Y两个序列的联合熵,H(X|Y)和H(Y|X)为条件熵.

通过上式计算出任意两个节点序列之间的互信息值后,设定阈值k来判断两个节点之间的匹配关系,建立每个下的脑功能网络.因此图像中每两个节点之间的关系有着多个的描述,即得到的脑网络中任意两个节点之间存在着多条边,因此构成了一个可以描述多频信息的多频脑网络.

3.3 拓扑特征计算、选择和整合

对于每一个受试者,利用脑连接工具箱(Brain Connectivity Toolbox,BCT)计算不同下的拓扑特征[17].这些特征包含两部分,分别是图像的全局特征和局部特征[18].其分类情况如表1所示.

表1 脑网络全局特征和局部特征Table 1 Global and local features of brain networks

特征提取后得到的特征模型中可能存在某些特征受其他特征制约的现象.因此,通过特征选择算法从已提取的特征中选出较优的组合来提升分类的效果.由于每一个受试者用于机器学习的特征向量中包含了多个网络下的多个特征,因此需要能处理较大维度特征的特征选择方法.

在多频网络模型中,利用Khazaee等人[18]采用的Filter 和wrapper用于特征的选择,首先,利用特征选择Filter算法,即fisher算法,根据个体识别能力对所有特征进行分类.然后选取识别能力最强的前一半特征,并应用wrapper特征选择算法对其进行识别.采用前序特征选择法和10折交叉验证实现了wrapper算法.

而后然后通过K个下特征的线性组合来整合出一个多特征向量,即

(5)

4 结果与讨论

4.1 实验数据和参数

本实验基于MATLAB R2017b进行,实现fMRI图像的预处理及AAL模板匹配、多频脑网络的构建以及AD分类准确率参数分析等,通过实验验证了提出方法的准确性和有效性.

表2 ADNI数据集详情Table 2 Details of ADNI data set

实验数据来自ADNI数据库,共获取了184例静息态功能性磁共振数据样本,其中包含92例AD病人数据和92例正常对照组(Normal control)数据.数据详情如表2所示.

表3 实验参数取值Table 3 Values of experimental parameters

在实验中通过与未分频网络模型进行对比来验证算法的有效性.实验参数如表3所示,表中加黑参数为实验中的最优参数.每次实验只改变表中一种参数.

4.2 实验结果分析

实验中对比了分频与未分频的网络模型,并且为了对比体素级脑网络与脑区级的差异,将每个受试者的采集数据匹配到了AAL脑模板上,同时根据数据分析,从每个fMRI数据中提取了15000个体素点作为对比.对比结果如表4所示:

表4 模型对比结果Table 4 Classification performance of proposed methods

如表4所示,所提出的分频模型的分类性能比未分频模型好得多.体素级多频脑功能网络的分类准确率为85.5%,而对比的未分频体素级脑功能网络的分类准确率分别为73.4%.结果表明,所提出的脑网络分频模型在计算脑网络相似度时能取得较好的结果,从而能更好地辅助AD患者的诊断.

此外,通过实验可知,未分频模型的AUC值为0.69,而所提出模型的AUC值为0.82,也说明了所提方法在辅助诊断阿尔茨海默病中的准确性和有效性.

4.3 分频数量对分类性能的影响

为了验证提出方法中将rs-fMRI图像分所产生的最优结果,分别将rs-fMRI图像分成1-9个用于脑网络分类的计算(1为未分频),并分别将不同个数得到的模型用于SVM分类器中进行AD和NC的分类,图1表示不同个数对分类准确性的影响.

图1 分频数量对分类准确率的影响Fig.1 Classification accuracy of frequency bands

如图1所示,在选择其他参数的最佳值的前提下,当频段数为5时,AD的诊断准确率最高,分类准确率为85.5%.当频段数为4时,分类准确率略小于最高值,为83%.

4.4 网络连接系数k的影响

k表示构建多频脑网络过程中比较互信息值时的阈值,为了评价这个参数对分类性能的影响,分别使用不同的参数值来计算分类精度.已知研究中通常的连接密度在[20%,70%]时分类效果最好,因此设置阈值k=[0.2-0.7]的连接网络来获取多频脑网络.其结果如图2所示.

图2 网络连接密度对分类准确率的影响Fig.2 Classification accuracy of network density coefficient k

可知,k取0.4时诊断结果最优.

4.5 分频模型的性质

由上述实验可知,最优的分频数量为5.目前已有的的研究证明了脑功能的网络中存在着小世界属性,因此需要讨论获取的5个频段下是否存在属性的变化[19].

表5 不同频段下正常人群的小世界属性Table 5 Small world properties under different frequency bands of HC

表6 不同频段下AD患者的小世界属性Table 6 Small world properties under different frequency bands of AD

4.6 特征对分类准确性的影响

本文使用了Khazaee等[17]提出的局部特征和全局特征等多种图特征结果如表7所示.

表7 分频模型在不同特征下的准确率Table 7 Accuracy of multiband under different features

实验中,每个局部特征包含多个值,全局特征包含一个值.通过特征的选择,可以看到不同的特征对分类的准确性有较大的影响.利用上述参数对每一组特征测试分类的性能.在每个分类中,除了只使用一个图度量作为特征集外,算法的所有步骤都被执行.特征集包含5个频段的特征.为了考察分类能力,每次仅使用一种图尺度进行分类.由表5中可知局部特征略优于全局特征,而局部和全局特征的组合经过选择可以达到最优的组合.

为了研究图特征对分类准确性的影响,每次利用一个特征分析其分类准确性,如表7所示中.采用Betweenness centrality时,脑区级分类准确度为77.3%,脑区级为78.7%.其次是Pagerank centrality,脑区级分类准确度为76.2%,脑区级为78.2%,这两种特征达到了单一特征的最高值.分类的准确与否是特征的重要度量指标.一个网络特征的分类性能代表了网络的节点与其他具有相似程度的节点连接的趋势.虽然没有一个单独的特征在分类中达到较高的准确性,但所有特征的集合提供了85.5%的准确度.这一结果表明,单独使用一个图特征可能不足以描述脑网络变化的各个方面.

实验结果表明,网络的中心度特征(Betweenness centrality,Pagerank centrality等)在作为单个特征进行识别时,取得了最佳的性能.AD患者的Betweenness centrality或Pagerank centralityd等特征表现出脑功能网络的中心性发生了显著变化.而由于阿尔兹海默患者脑功能网络变化的复杂性使得需要利用多个特征来实现网络的全方位描述.

5 结 论

现有的脑功能网络基于时域信号匹配,忽略了不同频段下脑信号的差异.本文从多频段融合的角度构建了体素级脑功能网络,充分考虑了不同频段下的频域信息以及脑区内部信息.脑网络的局部拓扑结构证明,分频下的脑功能网络特征与未分频网络相比能在一定程度上提高分类的准确性.并且体素级脑网络由于有着更高的维度,更多的特征以及更多的脑区内传递结构也有着更好的分类效果.

猜你喜欢

频段节点分类
基于RSSI测距的最大似然估计的节点定位算法
分区域的树型多链的无线传感器网络路由算法
基于图连通支配集的子图匹配优化算法
gPhone重力仪的面波频段响应实测研究
基于点权的混合K-shell关键节点识别方法
按需分类
教你一招:数的分类
说说分类那些事
推挤的5GHz频段
LTE扩张计划