APP下载

基于一般线性模型的功能磁共振成像回归量正交化

2017-09-03戴和谱何妍妍

计算机应用 2017年6期
关键词:共线性参数估计右手

戴和谱,刘 刚,何妍妍

(上海电力学院 自动化工程学院,上海 200090)

基于一般线性模型的功能磁共振成像回归量正交化

戴和谱,刘 刚*,何妍妍

(上海电力学院 自动化工程学院,上海 200090)

(*通信作者电子邮箱lukelg@gmail.com)

针对功能磁共振成像(fMRI)模型回归量之间存在共线性的问题,提出了一种正交化的方法。首先,确定感兴趣以及待正交的回归量;其次,从待正交回归量中减去与感兴趣回归量相关的部分,使模型中共线的回归量正交分解为相互独立的部分,以此来消除共线性的影响。此外,还讨论和分析了正交化对一般线性模型的影响。最后,分别使用一些合成数据和当前一个流行的fMRI数据分析软件包——脑功能磁共振图像软件包(FSL)进行实验。实验结果表明,正交化方法可以消除模型中的共线性,并且提高感兴趣回归量的显著性,从而实现准确的脑功能定位,可以应用于对脑的基础研究和临床治疗。

功能磁共振成像;共线性;一般线性模型;正交化;脑功能磁共振图像软件包

0 引言

近年来随着医学影像技术的迅速发展,在磁共振成像技术基础上发展起来的功能磁共振成像(functional Magnetic Resonance Imaging, fMRI)[1-3]技术,由于其能够无创伤性地对脑功能进行准确的定位, 并且具有较好的可重复性和可行性,因此得到了广泛的关注和研究。fMRI主要是基于核磁共振成像信号的血氧水平依赖性(Blood Oxygenation Level Dependence, BOLD)[4],通过改变局部脱氧血红蛋白和氧合血红蛋白的相对含量引起磁共振信号的变化,从而可以有效地检测到大脑皮层不同功能区域的激活信息,获得准确的空间定位,有助于对脑的基础研究和临床治疗[5-7]。因此,对fMRI数据进行准确的分析是实现脑功能精确定位的基础和前提。

常见的一种分析fMRI时间序列的方法是采用一般线性模型(General Linear Model, GLM)[8-9]。简单地说,它是将观测信号通过单个或者多个解释变量的线性组合来构成的模型,这种方法给研究人员进行数据分析提供了极大的灵活性和丰富的选择性。然而,即使在最简单的fMRI实验模型中,回归量之间也往往存在一定的关联,即共线性[10]。例如在一个fMRI实验中,反馈总是紧随刺激2 s之后出现,由于血流动力学反应的模糊效应,刺激和反馈的回归量将会高度相关。这会影响后续模型中回归量的参数估计,从而得到不确定甚至错误的结论。因此,消除模型回归量的共线性成为一个亟待解决的问题。

Andrade等[11]针对fMRI数据分析中回归模型协变量相关的问题,提出移除协变量之间冗余的部分。具体地说是从其中一个回归量减去与之相关且乘以一个特定系数的回归量,但是最终所得到的参数估计结果是不明确的。之后,Erdeniz等[12]针对决策变量:奖励预测误差(Reward Prediction Error, RPE)和奖励结果(Reward Outcomes, RO)之间内在的共线性问题,提出采用正交化的方法来解决。利用统计参数图(Statistical Parametric Mapping, SPM)软件自带的正交化方法对RPE和RO信号进行正交化处理,得到它们对应的表示合成BOLD信号的脑区激活。最近, Mumford等[13]也指出正交化可以解决fMRI模型中的回归量共线性问题,并阐述了正交化可能对一般线性模型回归量参数估计的影响,但没有给出具体的正交化方法,只是通过均值中心化来说明正交化的作用,这对于一些复杂的模型不太适用。此外,上述研究主要是从理论上介绍,缺乏真实的数据实验。

基于上述研究存在的不足,本文具体提出了一种正交化方法,通过将fMRI时间序列的一般线性模型中共线的回归量正交,消除其中一个回归量对另一个回归量在结果变量中的影响。当执行正交化后,共线的部分将分配给特定的回归量,从而提高该回归量的显著性,其结果也更符合真实情况。最后,本文分别采用一些合成数据和当前一个流行的fMRI数据分析软件包——脑功能磁共振图像软件包(Functional magnetic resonance imaging of the brain Software Library, FSL)进行实验,实验结果表明,正交化可以消除一般线性模型的共线性,并提高感兴趣回归量的显著性。

1 基于fMRI数据的一般线性模型

在对fMRI时间序列进行分析时,通常采用一般线性模型,它假设体素k上同一任务的时间序列或不同任务序列的实验数据是一些未知参数βi的线性组合:

(1)

Yk=Xβk+εk

(2)

其中:Yk是数据组成的列向量;βk是未知参数组成的列向量;εk是误差项组成的列向量。经过这样的转换后,原本对Yk作统计分析,现在改为拟合出βk后,得到了许多关于的图像,然后再对它们进行统计分析,脑功能激活图实际上就是根据对参数的统计推断而得到的。一般线性模型主要用来解决两个问题:一是对模型的未知参数进行估计;二是对估计得到的参数作假设检验,以此来判断回归量的显著性。下文对此进行具体的介绍。

1.1 模型参数的估计

建立一般线性模型的方程(2)后,通常采用最小二乘法来求解参数β的估计值。β^满足等式:

Se=min{(Y-Xβ^)T(Y-Xβ^) }

(3)

XTXβ^=XTY

(4)

如果X满秩,那么XTX可逆,则参数β的估计为:

β^=(XTX)-1XTY

(5)

其误差为:

(6)

(7)

式中:Se是方程(2)最小二乘法拟合后得到的残差;n是X的行数;p是X的列数,也即X的秩。

1.2 假设检验

(8)

其中,tn-p是自由度为n-p的t分布。例如,对于假设H:cTβ=d,可以通过式(9)计算t值或p值来检验。

(9)

一般显著性检验的原假设形式为H0:cTβ=0。当检验某个变量的显著性时,首先计算其具体观测值的统计量t值,然后再通过比较选定的显著性水平和计算得到的t值的大小来判断是否显著。若t>tα(n-p)(其中α为显著性水平),则拒绝原假设,表明该变量对结果有显著效应;若t≤tα(n-p),则接受原假设,此时β=0,表明该变量对结果没有影响。

对于X不满秩的情况,XTX无法直接求出,此时需要用求伪逆的方法计算,但上述方法仍然适用。

2 共线性的影响

对fMRI时间序列的一般线性模型进行分析时,模型的回归量之间往往存在一定的共线性,这会对后面的参数估计产生不良的影响,甚至导致出现错误的统计推断。例如,如果模型中两个解释变量X1和X2具有共线性,那么它们中的一个变量就可以由另外一个变量表征。这时X1和X2的参数并不反映各自与结果变量之间的结构关系,而是反映它们对结果变量的共同影响,所以各自的参数已失去了原来的意义,甚至可能会表现出反常的现象,比如估计参数结果本来应该是正的,但实际结果却是负的。其次,对于存在共线性的模型,其参数估计量方差会变大,根据式(8)计算可知其显著性检验统计量t变小,从而检验接受原假设H0:cTβ=0的可能性增大,这样会使本来影响很大的因素误判为不显著,使模型失去可靠性。此外,由于参数估计量的方差变大,因而对样本值的反应十分敏感,即当样本观测值稍有变化时,模型参数就有很大差异,致使模型难以应用。因此,消除模型共线性对于正确理解fMRI数据参数估计的解释有重要的影响。

3 正交化

图1 正交化示意图

通过计算推导得到规范后正交化的公式为:

(10)

对于一般线性模型,它具有这样的一个基本性质:只有仅属于该回归量的部分才会影响该回归量的参数估计值。利用维恩图表示上述正交化的过程,如图2所示。两个共线的回归量X1和X2,当检验模型回归量的显著性时,仅属于X1的部分决定估计参数β1,仅属于X2的部分决定估计参数β2。当把X2关于X1正交化后,X1和X2之间共享的部分全部分配给X1,此时等效于处理两个独立的部分X1和X2,如图2(c)所示,对于X2来说,正交化前后模型仅属于X2的部分是相同的,因此其参数估计值不变,而对于X1,由于正交化后X1和X2之间共享的部分全部分配给X1,即属于X1的部分发生变化,其参数估计值也会随之改变。

图2 正交化维恩示意图

4 实验结果与分析

实验环境设置如下:电脑选用i5- 4460,3.2GHz处理器,12GB内存,Linux发行版CentOS6.5系统,编程语言为Matlab。为了验证本文提出的正交化方法的有效性,分别采用合成数据以及真实数据来进行实验。

4.1 合成数据

合成数据主要通过建模一个刺激过程和主体的反应来验证正交化的作用。由于刺激和响应这两个事件发生得极为相近,因此一般线性模型中刺激和响应的回归量将会高度相关。

图3所示为一个共线性的例子(纵坐标仅表示数值大小,无量纲单位),根据第一章假设检验相关理论知识,分别计算出模型的检验统计量t值,如表1所示。其中带三角形的实线表示刺激,带正方形的实线表示模拟主体刺激2s后的响应。图3(a)为创建的合成BOLD信号,它包含刺激和响应相关的效应。将图3(a)中的刺激和响应分别与血流动力学响应函数进行卷积,得到卷积后的信号曲线,如图3(b)所示。从图3(b)中可以看出,刺激和响应之间存在严重的共线性。因此尽管信号与刺激和响应都相关,但根据表1可知,实际上只有刺激的检验统计量t值显著,这显然是不符合真实情况的。

回归量原始(Original)正交化刺激量(Stim⊥Resp)正交化响应量(Resp⊥Stim)单独测刺激量(Stim)单独测响应量(Resp)刺激量(Stim)4.314.319.689.46—响应量(Resp)2.408.992.40—8.29

当对信号中的响应量感兴趣时,就要消除刺激量的共线性影响,如图3(c)所示,它表示刺激量与响应量正交后的图形。由于只是对刺激量进行正交化,响应量的曲线没有变化,它的解释也不发生改变,但是显然刺激量曲线和响应量不再相关。此外,由表1可以看出,正交后响应量的统计量t值增大,而刺激量的t值保持不变,究其原因主要是正交后,两个共线回归量之间共享的部分已经全部分配给响应量,其单独表示信号的部分较正交之前增多,而对于刺激量,由于正交化前后仅属于刺激量的部分不变,其统计量t值也保持不变,但此时它的解释发生改变。

图3(d)表示与图3(c)相同的情况,仅仅只改变刺激量和响应量正交的顺序,即将响应量关于刺激量正交,此时刺激量的检验统计量t增大,而响应量则不变。此外,由表1可知,正交化后刺激和响应回归量的显著性t值与单独检验其中一种回归量显著性t值基本相同,说明正交化后的结果更加符合真实情况。

4.2 真实数据

实验数据由SiemensTrioTim3.0T磁共振机器扫描获得,采用标准正交头线圈,先进行常规扫描,扫描序列包括T1加权像(T1WeightedImaging,T1WI)、T2加权像(T2WeightedImaging,T2WI)、磁共振血管造影(MagneticResonanceAngiography,MRA)、解剖像(对脑组织的容积扫描,层数为160,层厚度lmm)。功能序列采用平面回波扫描序列,基本的扫描参数有:TR(Repetition Time)为重复时间;TE(Echo Time)为回波时间;Slices为层数;FOV(Field Of View)为扫描视野,根据需要扫描的范围确定其值。相应扫描的具体参数取值为:TR=2 000 ms,TE=50 ms,Slices=35,FOV为280 mm×280 mm,这些都是自下而上间隔扫描。功能扫描分为静息、左手指运动、右手指运动三部分完成。首先进行静息扫描,扫描过程中受试者平躺于扫描床上,不做任何任务,闭眼休息。之后为运动扫描,运动任务为左、右手指运动,实验范式采用组块(Block)设计,为静息—左手指运动—右手指运—静息—左手指运动—右手指运动,每个Block持续80s,一共4个Block。在扫描的过程中,受试者闭上双眼,肘部伸直,双手平放于扫描台上,配合操作者的口令完成静息—运动交替的过程,整个扫描过程中受试者头部保持不动。

FSL[14-15](http://fsl.fmrib.ox.ac.uk/fsl/fslwiki/)是一种常见的处理fMRI数据的软件,它能够允许用户指定回归量进行正交化。利用FSL对采集的图像进行处理,经过一系列的头动校正、与标准模板配准、标准化、高斯平滑等预处理过程以及统计分析后,最终得到与左、右手指运动对应的脑激活区域。由于左、右手指运动任务彼此之间存在一定的相关性,因此,当检测左手指运动任务的脑激活区域时,将右手指运动任务关于其进行正交化;同理,检测右手指运动的脑激活区域时,则将左手指运动任务与其正交,然后再分别与之前未作正交化的结果进行对比分析。

左、右手指运动任务及分别正交化后的实验结果如图4~6所示,表2~4分别为对应图4~6左、右手指运动任务主要激活区域的定位。

图4 左手指运动任务和右手指运动任务脑激活图

图5 左手指运动任务关于右手指运动任务正交化后脑激活图

图6 右手指运动任务关于左手指运动任务正交化后脑激活图

根据实验结果图4可知,左手指运动任务激活区域主要对应大脑的右半部分,右手指运动激活区域主要对应大脑的左半部分。在实验过程中,左、右手指运动任务之间相互影响,当只对其中一种任务的激活区域感兴趣时,就需要消除另一种任务对它的影响,即通过正交化来消除二者之间的相关性。图5、6中的黑色圆圈部分分别表示执行正交化后与未做正交化脑激活区域的不同。从表2~3可以看出,将左手指运动任务关于右手指运动任务正交化后,右手指运动的激活区域与之前相比发生变化,激活体素数增多,而左手指运动的激活体素数保持不变。这是因为经过正交化后,左、右手指运动任务变成两个独立的回归量,原来由左、右手指运动共同表示的激活区域现在全部由右手指运动表示。虽然左手指运动回归量的估计参数保持不变,但它现在表示减去两者共线之后的部分,其解释发生改变。

同样地根据表2、4可以知道,当检验右手指运动激活的区域时,改变回归量正交化的顺序,此时左手指运动的激活体素数发生变化,而右手指运动的激活体素数保持不变。正交化只是改变其中一个任务回归量的参数估计,而对另一个回归量的参数估计没有影响,但值得注意的是,此时模型中该回归量的参数解释发生改变。

表2 左手指运动任务和右手指运动任务

表3 左手指运动任务关于右手指运动任务正交化

表4 右手指运动任务关于左手指运动任务正交化

5 结语

共线性的出现会降低基于功能磁共振成像的一般线性模型结果的效力,甚至产生不可靠的参数估计。实验结果和数据分析表明,本文提出的正交化方法能够有效地消除共线性的影响,得到更加准确的结果。通过正交分解共线的回归量,并把它们之间共享的部分分配给感兴趣的回归量,从而提高该回归量的显著性。然而,本文研究中还存在一些需要进一步深入探讨的地方,譬如正交化的顺序会影响显著性检验的结果,因此,对于两个以上的回归量如何采取合适的方法消除共线性等需进一步研究。

)

[1]RAICHLEME.Abriefhistoryofhumanbrainmapping[J].TrendsinNeurosciences, 2009, 32(2): 118-126.

[2]BANDETTINIPA.What’snewinneuroimagingmethods? [J].AnnalsoftheNewYorkAcademyofSciences, 2009, 1156: 260-293.

[3]VANEIJSDENP,HYDERF,ROTHMANDL,etal.Neurophysiologyoffunctionalimaging[J].Neuroimage, 2009, 45(4): 1047-1054.

[4]KIMSG,OGAWAS.Biophysicalandphysiologicaloriginsofbloodoxygenationlevel-dependentfMRIsignals[J].JournalofCerebralBloodFlow&Metabolism, 2012, 32(7): 1188-1206.

[5] 苏春秋,邱小红,马蔚吟,等.脑功能磁共振成像原理及其在神经外科学中的应用[J].中国医学装备,2015,12(3):57-60.(SUCQ,QIUXH,MAWY,etal.Researchontheprinciplesoffunctionalmagneticresonanceimaginganditsapplicationintheneurosurgery[J].ChinaMedicalEquipment, 2015, 12(3): 57-60.)

[6] 麦筱莉,储成凤.手运动相关脑功能皮层功能磁共振成像原理及临床应用[J].中国医学影像技术,2004,20(2):294-297.(MAIXL,CHUCF.Handmotionrelatedcerebralcortex:basisandclinicalapplicationoffunctionalMRI[J].ChineseJournalofMedicalImagingTechnology, 2004, 20(2): 294-297.)[7] WAGER T D, ATLAS L Y, LINDQUIST M A, et al. An fMRI-based neurologic signature of physical pain [J]. New England Journal of Medicine, 2013, 368(15): 1388-1397.

[8] FRISTON K J, HOLMES A P, WORSLEY K J, et al. Statistical parametric maps in functional imaging: a general linear approach [J]. Human Brain Mapping, 1994, 2(4):189-210.

[9] POLDRACK R A, MUMFORD J A, NICHOLS T E. Handbook of Functional MRI Data Analysis [M]. Cambridge: Cambridge University Press, 2011: 191-200.

[10] 鲁茂,贺昌政.对多重共线性问题的探讨[J].统计与决策,2007(8):6-9.(LU M, HE C Z. Discussion on the problem of multicollinearity [J]. Statistics and Decision, 2007(8): 6-9.)

[11] ANDRADE A, PARADIS A L, ROUQUETTE S, et al. Ambiguous results in functional neuroimaging data analysis due to covariate correlation [J]. Neuroimage, 1999, 10(4): 483-486.

[12] ERDENIZ B, ROHE T, DONE J, et al. A simple solution for model comparison in bold imaging: the special case of reward prediction error and reward outcomes [J]. Frontiers in Neuroscience, 2013, 7: Article 116.

[13] MUMFORD J A, POLINE J B, POLDRACK R A. Orthogonalization of regressors in fMRI models [J]. PloS One, 2015, 10(4): e0126255.

[14] JENKINSON M, BECKMANN C F, BEHRENS T E, et al. FSL [J]. Neuroimage, 2012, 62(2): 782-790.

[15] SMITH S, BANNISTER P R, BECKMANN C, et al. FSL: new tools for functional and structural brain image analysis [J]. Neuroimage, 2001, 13(6): 249.

This work is partially supported by the National Natural Science Foundation of China (61203224), the Innovation Program of Shanghai Municipal Education Commission (13YZ101).

DAI Hepu, born in 1989, M. S. candidate. His research interests include medical image processing.

LIU Gang, born in 1977, Ph. D., professor. His research interests include image segmentation and image registration, pattern recognition, machine learning.

HE Yanyan, born in 1992, M. S. candidate. Her research interests include medical image processing.

Orthogonalization of regressors in functional magnetic resonance imaging based on general linear model

DAI Hepu, LIU Gang*, HE Yanyan

(CollegeofAutomationEngineering,ShanghaiUniversityofElectricPower,Shanghai200090,China)

Concerning the collinearity problem between the regressors in functional Magnetic Resonance Imaging (fMRI) model, a method of orthogonalization was proposed. Firstly, the regressors of interest and the regressors to be orthogonalized were determined. Then, the related part with regressos of interest was removed from the regressors to be orthogonalized, and the collinear regressors of the model were orthogonally decomposed into independent parts to eliminate the effect of collinearity. The influence of orthogonalization on General Linear Model (GLM) was also discussed and analysed. Finally, the experiments were carried out through some synthetic data and a current popular fMRI data analysis software package — Functional magnetic resonance imaging of the brain Software Library (FSL).The experimental results show that, the method of orthogonalization can eliminate the collinearity in the model and improve the significance of the regressors of interest to achieve accurate brain functional localization. The proposed method of orthogonalization can be used for the basic research and clinical treatment of brain.

functional Magnetic Resonance Imaging (fMRI); collinearity; General Linear Model (GLM); orthogonalization; Functional magnetic resonance imaging of the brain Software Library (FSL)

2016- 11- 25;

2016- 12- 23。

国家自然科学基金资助项目(61203224);上海市教委科技创新项目(13YZ101)。

戴和谱(1989—),男,湖北黄冈人,硕士研究生,主要研究方向:医学图像处理; 刘刚(1977—),男,山东聊城人,教授,博士,主要研究方向:图像配准与分割、模式识别、机器学习; 何妍妍(1992—),女,浙江义乌人,硕士研究生,主要研究方向:医学图像处理。

1001- 9081(2017)06- 1793- 05

10.11772/j.issn.1001- 9081.2017.06.1793

TP391.4

A

猜你喜欢

共线性参数估计右手
基于新型DFrFT的LFM信号参数估计算法
误差分布未知下时空模型的自适应非参数估计
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
左手和右手
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
举左手还是举右手
左手和右手