基于非参数Bootstrap检验的fMRI脑激活区域检测
2018-08-22董珊曾卫明石玉虎
董珊,曾卫明,石玉虎
(上海海事大学信息工程学院,上海 201306)
0 引言
最近,Eklund等人研究发现,过去最常用的fMRI软件SPM、FSL和AFNI存在重大瑕疵,导致误报率高达70%,可能造成约有4万份论文的研究成果存在疑虑[1]。这其实涉及到一直存在于统计学中的问题,即显著性检验中多重校正问题[2]。假设全脑由10万个体素组成,为了得到与某个认知功能相关的脑区定位,通常要对每一个体素进行一次统计分析,按p=0.05计算,但这可能会得到5000个假阳性的体素,从而出现统计学上的多重校正问题。
在以往的研究中,一般使用参数统计方法,例如Bonferroni校正[3]、FDR校正[4]以及随机场理论。例如SPM基于高斯随机场理论,假设数据在空间变异上有着确定的模式,统计量的分布可以用平滑后的随机场来模拟[5]。通过计算真实的统计图的平滑度,估计脑内体素(或团块)在特定的统计水平下随机产生的可能性。而Eklund等研究表明,如果数据不符合高斯随机场理论的潜在假设,即fMRI信号的空间平滑在大脑中一致,或者空间自相关函数符合特定曲线(二次指数),则非参数检验方法比传统的参数检验方法更可靠[1]。这意味着非参数检验方法在fMRI上关于减少假阳性率方面具有重要的研究意义。
由Nochols Holmes等提出的一种非参数检验方法——置换检验[6],可以较为有效地控制假阳性错误率。该方法主要优点是检验对数据本身的特征并不需要前提假设。置换检验对设计矩阵中的变量进行多次随机分配,例如将某个刺激条件和控制条件对调,对照分组之间进行对调。每次都将得到一张全脑伪彩色图,该图中存在一个最强点值(每个体素的显著性不同,颜色代表强弱)。再提取每次随机分配后得到的最强点值,得到一个分布直方图,称之为Pmax。通过Pmax即可判断真实情况下每个体素的显著性。若某体素的统计值不低于其余95%体素的值,则认为它经过校正体现为激活状态。
Bootstrap检验也是比较流行的一种非参数检验方法,但在fMRI领域中研究较少。在统计学中,Bootstrap检验是从给定训练集中有放回的均匀抽样。每当选中一个样本,它等可能地被再次选中并被添加到训练集中。在以往的研究中,如利用Bootstrap处理fMRI数据GLM模型中参数假设错误[7],cluster水平显著性检测[8],fMRI组分析脑图敏感性分析[9]等均是利用Bootstrap本身的特点,以此来解决fMRI上出现的统计学问题。但遗憾的是,并没有研究利用Bootstrap提出一种新的非参数方法应用于fMRI研究。本文将基于Bootstrap检验提出一种新的非参数体素激活检测方法,研究表明,该方法能尽可能地减少体素假阳性率。
1 数据获取
本文采用Geraint Rees实验室采集的听觉数据[10],为Block Design任务态数据,block为6次扫描,共由16组block组成。实验条件从休息状态开始,采用休息和听觉刺激连续交替,每分钟呈现60次双音节。功能数据从图像4开始采集,且由于T1效应,将丢弃前几次扫描这些全脑BOLD/EPI图像是在修改后的2T西门子MAGNETOM视觉系统上采集的。每次采集由64个连续切片组成,扫描分辨率为64×64,片内分辨率为3mm×3mm。采集时间为6.05s,扫描重复时间(RT)为7s。
fMRI数据具有一定的时间相关性,因此实验将参考数据扫描间隔时间设定为7秒,以6次扫描为一个block,以此来确定抽样时间间隔,并分为听觉刺激态和休息态。对一个体素而言,刺激态和休息态体素值存在差异(如图1),该差异将于最后的激活图中显现。
图1 单个体素BODL信号图,包括休息(A),激活(B)
2 Bootstrap检验
2.1 实验方法
根据单个体素激活图像特征,刺激态和根据单个体素激活图特征,刺激态和休息态有明显的BODL信号差异。理论上来说,一个体素存在3种情况:(1)该体素在所有抽样样本均体现激活状态;(2)该体素在部分样本出现激活状态(3)该体素在所有抽样样本均不体现激活状态。设定阈值,若某一体素出现激活状态的频率大于阈值,则认为该体素处于激活状态,从而减少假阳性发生率。将阈值设为(1-p)即某体素激活状态频率超过(1-p),则认为该体素处于激活状态。实验步骤如下:
(1)将休息态和刺激态进行分组 A1,A2,A3,A4 和B1,B2,B3,B4;
(2)利用 Bootstrap方法随机抽样,A'∈{A1,A2,A3,A4},B'∈{B1,B2,B3,B4},组成 m 个新的样本 A={A'1,A'2,A'3,A'4},B={B'1,B'2,B'3,B'4},同一个数据抽样频率均小于50%;
(3)每次统计出体素值大于2的体素,得到一张激活图;
(4)设置p值,统计激活频率大于(1-p)的体素,即至少在(1-p)*m张激活图中呈现激活的体素。
2.2 实验结果
本实验方法使用Python实现抽样、调用MATLAB预处理脚本(包括头动校正、配准、分割、标准化、平滑)以及频率统计等功能。在Mac OS系统下运行,处理一个抽样数据需要花费5分钟,运行完一个样本1000次抽样需要大约3天时间。本实验使用MRIcron软件中的ch2better模板,得到图2结果。从图2可以看出,与听觉有关的脑激活区域较集中,其他区域基本没有小团激活体素,实验结果理想。
图2 SPM激活图像(a)与Bootstrap检验激活图像(b)的比较激活图
3 Bootstrap检验组分析
3.1 实验方法
上述方法在Mac OS系统下运行,处理一个抽样数据需要花费5分钟,运行完一个样本1000次抽样需要大约3天时间。本方法将在上述基础上进行改进,以减少计算量。通过Bootstrap抽样组成20个样本,可以将这些样本看成独立的个体。又因为这20个样本都是从同一个样本抽样而来,消除了由于不同个体对实验刺激的敏感性不同而带来的差异问题。这种情况下,根据以往效应回归模型研究结果[11],可假设研究样本都拥有共同的真实效应量,即可以排除由于每个研究个体的背景、年龄、教育程度、心理因素等不同而导致的各个真实效应量不同,适用于固定效应模型。具体实验步骤如下:
(1)将休息态和刺激态进行分组 A1,A2,A3,A4 和B1,B2,B3,B4;
(2)利用 Bootstrap方法随机抽样,A'∈{A1,A2,A3,A4},B'∈{B1,B2,B3,B4},组成 20个新的样本 A={A'1,A'2,A'3,A'4},B={B'1,B'2,B'3,B'4},同一个数据抽样频率均小于50%;
(3)结合 SPM 软件,使用固定效应(Fixed Effect)模型对于这20个样本进行组分析。
3.2 实验结果
由于1000个抽样样本过于庞大,过多样本进行组分析仍会造成运行时间过长,过程过于复杂等情况。且本研究发现单样本组分析过程中,20个抽样样本已可以得到较好的研究结果。图3为SPM与Bootstrap test单样本组分析结果的脑激活图像比较。
图3 SPM激活图像(a)与Bootstrap检验组分析图(b)的比较
通过图3对比,可以看出,改善后的方法在激活体素上有一定程度上减少,但体素个数减少不明显。
4 定量分析
以下将对于实验结果比较做定量分析。表1为SPM、Bootstrap检验和Bootstrap检验组分析对听觉数据处理得到的脑激活体素情况,其中p=0.001,抽样总数m=1000。
从表1中可以看出,Bootstrap检验没有明显的校正阈值。这是因为在不同的抽样样本中经过处理后,每个体素校验值都不同,无法得到一个确定的阈值,但可以用阈值大于2和频率大于99.9%相结合方法来得到校正阈值。此外,为了验证参考信号的有效性和正确性,本文统计了SPM和Bootstrap检验两种方法增加和较少的体素点与实验设计block块之间的皮尔森相关系数分布直方图,实验结果如图4所示。增加的体素点与block相关性较低,减少的体素点与block相关性较高。其中SPM和Bootstrap检验两种方法相同的体素个数为649,后者增加的体素个数为91,减少的体素个数为166。
表1 三种方法结果比较
图4 SPM和Bootstrap检验比较增加和减少体素点的相关系数的分布直方图
5 结语
本文针对fMRI研究上的假阳性率问题,基于Bootstrap检验提出一种新的非参数多重校正方法。研究结果分析表示,与SPM相比,基于Bootstrap检验单样本和单样本组分析能得到更好的体素激活结果,一定程度上减少假阳性率。同时,也解决了fMRI某些实验采集样本过少,数据不符合假设分布而使得研究结果不理想的问题。当然,研究也存在很多不足之处。首先,本研究发现,不同的实验步骤会造成部分激活体素的差异,例如先进行Bootstrap抽样再进行预处理和先预处理再进行Bootstrap抽样相比,就实验结果来看,后者实验结果明显好于前者。这给我们带来一个新的研究思路,预处理对实验数据的影响究竟有哪些,实验数据是否进行预处理等问题都需要进一步研究。其次,在进行Bootstrap抽样时,若取得同一个数据频率越高,实验结果往往更差,其中的原因值得令人思考。