利用三维脑核磁共振图像与RBF核支持向量机检测人脑轻度认知障碍
2015-03-11王水花张煜东杨建飞施建平
王水花, 张煜东, 杨建飞, 施建平
(1.南京师范大学 计算机科学与技术学院,江苏 南京 210023;2.南京大学 电子科学与工程学院,江苏 南京 210046;3.江苏省三维打印装备与制造重点实验室,江苏 南京 210042)
0 引 言
阿尔茨海默病(Alzheimer disease,AD)是不可逆的神经退行性疾病,目前无有效疗法。随着病程发展,AD患者病情逐渐恶化最终致死[1]。轻度认知障碍(mild cognitive impairment,MCI)一般均视作AD的早期阶段,第1年大约有12%的MCI患者转化为AD,在第6年约80%的MCI患者转化为AD。随着我国社会的老龄化,及早发现MCI并给出早期诊断配合早期干预,可降低AD患病率[2],提升老年人生活质量[3]。
磁共振成像(magnetic resonance imaging,MRI)利用核磁共振原理,根据能量在不同物质结构中有不同的衰减,可通过外加梯度磁场检测电磁波,从而描绘物体原子核的位置和种类,得到物体内部的磁共振(magnetic resonance,MR)图像[4-6]。目前,众多学者陆续发现 AD/MCI与脑的内侧颞叶、双侧海马、杏仁核、内嗅皮层、胼胝体、扣带回等多个部位强相关[7-9],且其他部位亦可能与AD/MCI相关。因此,本文未选择提取感兴趣区域方法(region of interest,ROI),而是将整个三维脑MR图像作为研究对象,保证信息的完整性。在技术上,通过50例MCI患者与50例正常对照组 (normal control group,NC)作为训练数据,以支持向量机(support vector machine,SVM)作为模型,建立MCI的自动检测器,从而实现AD的早期诊断。
由于三维脑数据量过大,采用主成分分析(principal component analysis,PCA)方法降低特征维数,从而减轻后续计算量。提取的主成分(principal component,PC)表征了受退行性疾病影响的脑内回路的自然属性[10]。另外,将核技术引入SVM中,即采用核支持向量机(kernel support vector machine,kSVM)作为MCI与NC的二分类器,以在NC中检测出MCI。同时为了增强检测器的泛化性能,采用K折交叉验证方法[11]。
1 数据获取与预处理
本研究所用数据来源于互联网上的公开数据库Open Access Series of Imaging Studies(OASIS)(P50AG05681,P01AG03991,R01AG021910,P50 MH071616,U24RR021382,R01MH56584))[12-13]。该数据库包含从18岁到96岁的NC/MCI/AD案例。从中选择了50例NC与50例MCI患者。其中,NC与MCI的50例患者中,男女患者各为25例;NC的年龄范围73.18±8.15,MCI患者的年龄范围为74.57±6.64;NC的临床失智评估为0,MCI为0.5;每个样本均有独立扫描的3或4次T1加权MR图像。所有样本均为右利手。
1.1 三维脑MR图像及预处理
对每个样本,所有的独立扫描,均需经过运动校正并配准后,得到一幅均方平均的三维图像。随后,该三维图像空间规范化至Talairach坐标空间,并去除非脑部分。最后,所有图像分割并平滑[14-15],得到一幅4灰度的三维图像:0表示背景,1表示脑脊液,2表示灰质,3表示白质[16]。
1.2 目标数据
临床失智评估(Clinical Dementia Rating,CDR)作为目标数据。CDR是一项量化痴呆症状的标准[17],通过6个不同项目来评估患者的认知与机能表现,包括记忆、定向、判断与问题解决能力、社区活动能力、家居爱好、自我护理等。本研究按照惯例,将CDR为0视作NC,CDR为0.5视作 MCI[18-19]。
2 算法流程
2.1 主成分分析
主成分分析是将原来的具有一定相关性的P个特征,重新组合成一组新的互相无关的综合指标,以代替原来的指标。PCA是一种有效的特征压缩技术,它能减少高维向量中的互相关成分,输出一个只有很低维数且保持原信息的向量[20]。
过程如下:首先选择新特征F1,即原始特征集合的第1个线性组合,计算其方差,记为Var(F1)。若其值越大,则表示新特征F1包含的信息越多。在所有的线性组合中选取的F1应是方差最大的,故称F1为第1主成分。若第1主成分不足以代表原来P个指标的信息,再考虑选取F2,即选原始特征集的第2个线性组合。为有效反映原始信息,F1已有的信息就无需出现在F2中,即F1与F2必须满足Cov(F1,F2)=0,则称F2为第2主成分,依此类推可以构造出第3、第4,…,直至第P 个主成分[21]。
2.2 支持向量机
SVM在解决小样本、非线性的高维函数拟合与模式识别中表现出许多特有优势[22]。假设样本集为{(xw,yn)|xn∈Rρ,yn∈{-1,+1}},n=1,…,N。其中,yn为输出,对应二分类问题;xn为输入,是一p维矢量。假设在p维空间中存在一个超平面,可最大边距分割为2类,该超平面可表示为:
需要选择合适的w与b,使得:
实际中,由于范数运算涉及平方根运算,在不改变结果的前提下,(2)式可化为:
(3)式为二次规划优化问题,可用Lagrange乘子与标准二次规划算法求解[23]。
2.3 核支持向量机
由于实际中的样本数据具有非线性特征,2类样本容易彼此纠缠在一起,此时超平面无法完美分类。可将输入向量x映射至高维向量空间Φ(x),从而使得2类样本在更高维空间Φ(x)中分开。对于一般的多维输入问题,难以事先确定映射x→Φ(x),为此引入核函数:
Mercer定理证明了满足Mercer条件的核函数能对应于某一变换空间的内积。
Mercer定理 令X是Rn上的一个紧集,K是X×X上的连续实值对称函数,则积分算子Tk半正定等价于K(·,·),可表示为X×X上的一致收敛序列,即(6)式。
其中,λi>0为Tk的特征值;φi(x)为对应于λi的特征函数;L2为二次可积函数空间。满足 Mercer定理的核函数成为Mercer核[24]。由于RBF核具有优秀的性能,目前已被广泛应用,因此本文选择 RBF核[25]。
2.4 K折交叉验证
如果训练集本身同时作为验证集,则估计误差是“样本内(in-sample)”误差,无法反映模型对新的样本的分类能力。为此,选择交叉验证方法,可估计“样本间(out-of-sample)”误差。K折交叉验证将训练样本平分为K个子集,使用其中K-1个子集进行训练,剩下的单个子集作为测试。依此轮流,可得对K个子集分别进行验证的K个分类结果,综合可得模型在整个样本集上的分类结果。默认情况下,K值为10。
K值一般不做优化,有研究者将K在指定范围(如3~20)内变化,选择分类器最小误差所对应的值为K值。事实上该法欠妥,这样得到的结果无法反映模型本身的样本间误差[26]。
2.5 算法流程
本文算法流程如图1所示。
图1 本文方法流程图
算法步骤如下:
(1)特征提取。对选择的100例脑三维MR图像通过PCA提取主成分,CDR作为目标数据。
(2)K折交叉验证。模型设置为RBF-kSVM,记录每次的混淆矩阵。
(3)汇总样本间误差,以更准确地评估模型性能。
3 实验与讨论
编程语言采用 Matlab2013a,在主频为3GHz、CPU为Intel Core i3、内存为2GB的HP Pavilion g6笔记本电脑上运行。
实验程序可在任意一台安装Matlab的电脑上运行。
预处理的过程与结果如图2所示。图2b为经过脑图配准与均方平均后的结果;图2c为取脑掩模,即去除非脑部分后的结果;图2d为分割结果。
图2 三维脑MR图像及其预处理
3.1 主成分分析
三维脑MR子图像的PCA结果如图3所示。选择前90个主成分,相比于原始三维图像的维数176×208×176=6 443 008,这90个PC仅占用90/6 443 008=1.397×10-5的特征,就可覆盖98.406 1%的总方差。
图3 三维脑MR图像PCA结果
3.2 十折交叉验证
选择十折交叉验证,将原始数据分为10折,每次选择9折为训练集,剩余1折为验证集。采用了分层(stratification)思想,即每折中 MCI与NC的分布为5/5,每折总患者数目为10。汇总所有折次的混淆矩阵结果,求和后即得到整体混淆矩阵。
3.3 模型比较
选择 RBF-kSVM[27-28]作为本文模型,参数σ设为1.1,具体过程见3.5节。与前向神经网络(forward neural network,FNN)、决 策 树 (decision tree,DT)、SVM、齐次多项式kSVM(homogeneous polynomial kSVM,HP-kSVM)、非齐次多项式 kSVM(inhomogeneous polynomial kSVM,IHP-kSVM)作比较。参数均通过试错法选择最优参数。模型结果比较见表1所列。
表1 模型结果比较 %
由表1可知,RBF-kSVM敏感度为84%,远远高于其他方法,这表明该方法漏诊率远远低于其他方法。尽管RBF-kSVM方法的特异度78%稍低,导致稍高的误诊率,但即使NC被误诊为MCI,后续可选择其余辅助手段(如MMSE问卷评估等)进一步确诊。
3.4 运行时间分析
本文算法的每个步骤运行时间如下:预处理消耗时间最长,达到45min,原因是原始数据量较大,为48GB;PCA耗时35s;模型训练耗时2.1s;分类耗时0.1s。在实际临床诊断中,由于分类器均事先设置好,所以对新病人仅需耗时0.1s即可完成自动辅助诊断。
对比别的算法发现,分类器的训练,FNN耗时最长,为35.7s;DT次之,为11.2s;SVM 与3类kSVM耗时接近,均在2.0s左右。这是因为FNN训练的反向传播(back-propagation,BP)算法速度较慢,而用于SVM训练的序列最小优化算法(sequential minimal optimization,SMO)速度较快。
3.5 参数分析
如何设置模型的参数σ是一个难题。本文将σ的范围从0.1至2.5逐步改变,步长设为0.1,考察十折交叉验证结果的准确度,选择最优准确度所对应的σ。
图4显示了这一过程,当σ=1.1时,对应得到最佳准确度,由此可以确定σ=1.1对应的RBF-kSVM模型最佳。若数据集改变或者扩大,该参数可能需要微调。
图4 确定最优σ的值
4 结束语
本文提出了一种基于RBF-kSVM的MCI检测系统,该系统首先读取三维脑MR图像并预处理,其次通过PCA降低特征维数,随后采用RBF的核支持向量机作为分类模型。十折交叉验证显示该系统的敏感度为84%、特异度为78%、准确度为81%,优于现行的其他方法。
今后的研究方向主要是:① 在预处理过程中加入图像去噪、图像复原[29]、图像增强[30]等步骤,以增强图像信噪比;② 尝试运用其他分类与检测方法,如深度学习、集成学习等;③ 考虑AD患者的检测,将二分类问题扩展至三分类问题;④ 通过各种途径获得更多样本案例,以进一步检验算法的可靠性。
[1] Hahn K,Myers N,Prigarin S,et.al.Selectively and progressively disrupted structural connectivity of functional brain networks in Alzheimer's disease:revealed by a novel framework to analyze edge distributions of networks detecting disruptions with strong statistical evidence[J].Neuro-Image,2013,81:96-109.
[2] 李 昕,童隆正,周晓霞,等.基于MR图像三维纹理特征的阿尔茨海默病和轻度认知障碍的分类 [J].中国医学影像技术,2011,27(5):1047-1051.
[3] Alexander G E,Bergfield K L,Chen K,et.al.Gray matter network associated with risk for Alzheimer's disease in young to middle-aged adults[J].Neurobiology of Aging,2012,33(12):2723-2732.
[4] Brookes M J,Vrba J,Mullinger K J,et.al.Source localisation in concurrent EEG/fMRI:applications at 7T [J].NeuroImage,2009,45(2):440-452.
[5] Zhang Y,Wang S,Ji G,et.al.Genetic pattern search and its application to brain image classification [J].Mathematical Problems in Engineering,2013,2013:580876.http://dx.doi.org/10.1155/2013/580876.
[6] Zhang Y,Wang S,Ji G,et.al.An MR brain images classifier system via particle swarm optimization and kernel support vector machine [J].The Scientific World Journal,2013,2013.doi:10.1155/2013/130134.
[7] Kubota T,Ushijima Y,Nishimura T.A region-of-interest(ROI)template for three-dimensional stereotactic surface projection(3D-SSP)images:initial application to analysis of Alzheimer disease and mild cognitive impairment[J].International Congress Series,2006,1290:128-134.
[8] Pennanen C,Kivipelto M,Tuomainen S,et.al.Hippocampus and entorhinal cortex in mild cognitive impairment and early AD [J].Neurobiology of Aging,2004,25(3):303-310.
[9] López M M,Ramírez J,Górriz J M,et.al.SVM-based CAD system for early detection of the Alzheimer's disease using kernel PCA and LDA [J].Neuroscience Letters,2009,464(3):233-238.
[10] Wang S,Dong Z.Classification of alzheimer disease based on structural magnetic resonance imaging by kernel support vector machine decision tree[J].Progress in Electromagnetics Research,2014,144:171-184.
[11] 张煜东,吴乐南,王水花.专家系统发展综述 [J].计算机工程与应用,2010,46(19):43-47.
[12] Ardekani B A,Figarsky K,Sidtis J J.Sexual dimorphism in the human corpus callosum:an MRI study using the OASIS brain database [J].Cerebral Cortex,2012.doi:10.1093/cercor/bhs253.
[13] Ardekani B A,Bachman A H,Figarsky K,et.al.Corpus callosum shape changes in early Alzheimer's disease:an MRI study using the OASIS brain database [J].Brain Structure and Function,2014,219(1):343-352.
[14] 张煜东,吴乐南,韦 耿.基于粒子群神经网络的细胞图像分割方 法 [J].电 子 测 量 与 仪 器 学 报,2009,23(7):56-62.
[15] 张煜东,吴乐南,韦 耿.基于PCNN的改进Split-merge图像分割 [J].数据采集与处理,2010,25(3):353-357.
[16] Jacova C,Schulzer M,Money J,et.al.Cross-sectional validation of a new instrument for the measurement of treatment response:the Clinical Meaningfulness in Alzheimer Disease Treatment(CLIMAT)scale[J].Alzheimer's and Dementia,2009,5(4):184.
[17] Williams M M,Storandt M,Roe C M,et.al.Progression of Alzheimer’s disease as measured by Clinical Dementia Rating Sum of Boxes scores[J].Alzheimer's & Dementia,2013,9(1):S39-S44.
[18] Marcus D S,Wang T H,Parker J,et.al.Open access series of imaging studies(OASIS):cross-sectional MRI data in young,middle aged,nondemented,and demented older adults[J].Journal of Cognitive Neuroscience,2007,19(9):1498-1507.
[19] Melissant C,Ypma A,Frietman E E E,et.al.A method for detection of Alzheimer's disease using ICA-enhanced EEG measurements [J].Artificial Intelligence in Medicine,2005,33(3):209-222.
[20] 张煜东,吴乐南,吴含前.工程优化问题中神经网络与进化算法的比较 [J].计算机工程与应用,2009(3):1-6.
[21] 汪海波.特征提取与主成份分析的合成孔径雷达图像的分类方法研究 [J].计算机应用与软件,2012,29(12):298-301.
[22] De Brabanter K,Karsmakers P,De Brabanter J,et.al.Confidence bands for least squares support vector machine classifiers:a regression approach[J].Pattern Recognition,2012,45(6):2280-2287.
[23] Ortiz A,Górriz J M,Ramírez J,et.al.LVQ-SVM based CAD tool applied to structural MRI for the diagnosis of the Alzheimer’s disease[J].Pattern Recognition Letters,2013,34(14):1725-1733.
[24] 涂 歆,严洪森.基于扩展的径向基函数核支持向量机的产品销售预测模型 [J].计算机集成制造系统,2013,19(6):1343-1350.
[25] 张煜东,朱 庆,王水花,等.一种径向基函数神经网络的参数求解方法 [J].计算机测量与控制,2010,18(12):2812-2814.
[26] 张煜东,霍元铠,吴乐南,等.降维技术与方法综述 [J].四川兵工学报,2010,31(10):1-7.
[27] 李 琪,卢荣胜,陈 成.基于1-分类支持向量机的机器视觉缺陷分类方法 [J].合肥工业大学学报:自然科学版,2012,35(10):1311-1315.
[28] 毕卫华,谭晓慧,王 伟,等.RBFN及SVM在边坡稳定可靠度分析中的应用 [J].合肥工业大学学报:自然科学版,2011,34(7):1035-1039.
[29] 张煜东,吴乐南.用改进的Paik型Boltzmann机实现图像复原 [J].光学精密工程,2009,17(7):1737-1744.
[30] 张煜东,吴乐南,李铜川,等.基于PCNN的图像直方图均衡化增强 [J].东南大学学报:自然科学版,2010,40(1):64-68.