APP下载

阿尔茨海默病影像组学关键方法研究进展

2019-10-23贺江琳王远军

中国医学影像技术 2019年10期
关键词:组学特征提取灰度

贺江琳,王远军

(上海理工大学医学影像工程研究所,上海 200093)

阿尔茨海默病(Alzheimer disease, AD)是一种慢性神经系统退行性疾病,临床常表现为记忆丧失、认知功能下降、失语等[1]。2000—2017年老年痴呆相关死亡率在我国65~74岁人群中增高了31.00%,75~84岁人群中增高了57.00%,85岁以上人群中增高了86.00%[2]。AD是导致老年痴呆最常见的病因,准确诊断AD、尤其是早期诊断具有重要临床意义。

目前诊断AD的方法主要有精神衰退记录、测量区域直方图强度[3],监测海马体积完整性[4]、追踪白质纤维束[5]、多模态MRI值融合测量及纹理分析等。随着影像组学方法的出现[6]与发展,基于大量医学影像数据与机器学习等技术提出了AD的分类预测方法[7],为有效诊断与个性化治疗AD提供借鉴。现有影像组学方法包括基于机器学习的影像组学和基于深度学习的影像组学。基于机器学习的影像组学方法基本工作流程包括图像采集、图像分割、特征提取与选择、分类与预测,见图1;基于深度学习的影像组学方法省略了图像分割与特征提取等步骤,通过端到端模式将图像直接作为模型输入,最终得到分类结果。

1 基于机器学习的AD影像组学方法

现代医学正朝着个性化和精准医疗方向发展,诊断、预后和预测治疗反应是3个主要途径。在AD诊断预测研究中,基于影像组学方法将影像学特征和患者的临床信息等相结合,并建立模型对疾病进行个性化评估,可采集不同模态图像(如MR、CT、PET等),而所获图像的时间和数量也与分析对象及方法有关。对获取的图像,需进行不同图像序列和模态的空间配准、降噪、图像分割和感兴趣区域提取等预处理。

1.1 特征提取 在ROI中提取的主要特征包括一阶统计特征、形状特征、纹理特征及小波特征。其中纹理特征用于计算体素之间的统计相关信息,可从灰度共生矩阵、灰度游程矩阵、灰度区域大小矩阵和局部灰度差分矩阵中计算获得,常用纹理特征见表1[8]。

1.2 特征选择与降维 为减少模型训练时间、避免模型过度拟合、提高模型泛化能力,需对所提取的大量影像学特征进行选择或降维。

选择特征时,一是对特征进行相关性分析,以确定特征与AD的关系;二是对特征进行冗余度分析,避免模型构建过程中的多重共线性问题。特征选择方法分类见图2[9]。影像组学中常采用平面特征选择方法。过滤式方法以排序技术为选择变量的标准,使用适当排序准则对变量进行评分,并设定阈值筛选变量,其中最有效的是Wilcoxon、最小冗余最大相关性、Relief和互信息特征选择[10-11]。过滤式方法适用于非常高维的数据集,计算简单、速度快,但忽略了数据之间的相互依赖性以及与分类器的交互。包裹式方法计算量较大,常用的有遗传算法和粒子群优化算法[12]。嵌入式方法,如支持向量机(support vector machine, SVM)、递归特征消除、决策树、最小绝对收缩与选择算子(least absolute shrinkage and selection operator, LASSO)、Generalized LASSO、弹性网络正则化等[12-14],是在学习过程中搜索最佳特征子集。应根据现有数据的样本分布和分类方法来筛选特征。

特征降维可减少存储空间和计算时间,消除多重共线性,提高学习模型性能,利于数据可视化。目前影像组学在AD研究中多采用主成分分析方法[15]进行降维,也有部分研究[16]采用其他方法,如偏最小二乘法。

1.3 分类评估 主要通过分类模型来验证与评估所选特征是否具有良好的分类性能。近年用于对AD进行分类预测的模型包括 SVM、随机森林(random Forest, RF)、K近邻(K-nearest neighbors, KNN)、Bayesian网络、Logistic回归及对角二次判别分析等[17-19]。分类过程中采用的实验数据一般分为AD组、轻度认知障碍(mild cognitive impairment, MCI)组和正常对照组, MCI患者又可细分为36个月内进展为AD者(progressive MCI, PMCI)和36个月内稳定者(stable MCI, SMCI)。可通过准确率、敏感度、特异度、ROC曲线下面积等指标评估分类模型的诊断效能。表2中列举了部分基于机器学习的分类评估方法及其实验数据和分类准确度。

既往研究[15,20-26]对于正常对照组/AD组的分类准确度一般为80.00%~95.00%,对AD组/MCI组、MCI组/正常对照组、SMCI/PMCI、AD组/MCI组/正常对照组的分类准确度普遍在60.00%~80.00%。基于SVM模型对AD的分类研究最为广泛。比较多种分类方法的性能有一定难度,主要原因在于:①患者分类选择标准不统一;②图像预处理方法不同;③特征提取与选择方法不同;④交叉验证程序不完全一致。因此,评价某种分类方法时,需综合考虑多种因素。

表1 纹理特征[8]

注:SRE:短行程优势;LRE:长行程优势;GLN:灰度不均匀性;RLN:行程长度不均匀性;RP:行程百分比;LGRE:低灰度行程优势;HGRE:高灰度行程优势;SRLGE:短行程低灰度优势;SRHGE:短行程高灰度优势;LRLGE:长行程低灰度优势;LRHGE:长行程高灰度优势;GLV:灰度方差;RLV:游程方差;SZE:小区域优势;LZE:大区域优势;ZSN:区域大小不均匀性;ZP:区域百分比;LGZE:低灰度区域优势;HGZE:高灰度区域优势;SLZGE:小区域低灰度优势;SZHGE:小区域高灰度优势;LZLGE:大区域低灰度优势;LZHGE:大区域高灰度优势;ZSV:区域方差

图1 影像组学工作流程

图2 特征选择方法分类[9]

2 基于深度学习的AD影像组学方法

近年来深度学习技术受到广泛关注,有学者[27]提出基于深度学习的影像组学方法,采用端到端的学习方式,省略了图像分割、特征提取及特征选择的过程,需要大量医疗数据进行训练。Farooq等[28]将38 024幅MRI分成25.00%测试集和75.00%训练集,应用著名的Google Net和Res Net模型对AD进行分类,准确率达99.00%以上。由于缺乏足够的训练数据,Islam等[29]采用2个改进的基于深度卷积神经网络模型(Inception-v4和Res Net)对AD进行多类分类时出现了过度拟合问题,模型对轻度及中度AD的分类准确度分别为62.00%和33.00%。

Lu等[30]提出多尺度神经网络框架,采用迁移学习方法和集成分类器策略对1 051例FDG-PET代谢成像数据进行实验,以提高小样本对深层神经网络的训练能力,发现集成分类器使用不同验证集可提高模型稳定性及鲁棒性,从而在统计上提高模型的分类性能。Jain等[31]采用1个预先训练的VGG-16网络进行迁移学习,并将其作为特征提取器。尽管VGG-16是针对ImageNet数据库中的自然图像进行训练的网络,但通过迁移学习,可用来对医学图像进行分类,且当实验数据较少时,迁移学习可有效提高模型的学习性能。Wang等[32]开发了3D-DenseNet模型对AD和MCI进行自动检测,较少的网络参数降低了网络训练的难度,可在一定程度上避免过度拟合问题。此外,Spasov等[33]综合考虑sMRI、认知测验、患者临床信息和APOe4基因信息,在PMCI与SMCI的二分类实验中得到86.00%的ACC,在现有的研究中居于前列。

基于深度学习的AD影像组学分类结果普遍优于基于机器学习方法,但在基于深度学习研究中,模型需要大量图像进行训练和测试,以获得更高的分类精度。然而大量标记良好的医学影像数据不易获得,其成本较高,且标记工作量大。针对上述问题,有学者[31]认为可将在足够大的数据集中学习到的通用特性迁移到其他数据集,模型的泛型特性具有可移植性。

3 小结

影像组学是目前研究热点之一,通过提取高维影像学特征来表征ROI,为预测疾病提供影像学参考依据。现有研究主要采用基于机器学习的方法诊断及预测AD,分类对象为AD组、PMCI、SMCI及正常对照组,实验数据大多基于ADNI数据库中的MRI,部分研究采用FDG-PET图像、脑脊液生物标志物(如淀粉样蛋白),或综合考虑影像学数据、临床特征以及基因信息等。其对AD/NC的二分类问题最为常见,分类准确度一般在80.00%~99.00%,优于其他二分类问题。介于AD组与正常对照组之间的MCI组是高度可变群体,部分MCI患者可恶化为AD,故对SMCI与PMCI的鉴别与诊断十分重要。目前SMCI与PMCI的分类准确度偏低,多种生物标记物可能有助于提升。今后可考虑添加其他MR序列(如fMRI、DTI)或检查方法(PET和CSF生物标志物检测及神经心理学评分和遗传信息),以提高分类精度。在AD分类方法中,基于深度学习方法获得的分类准确度普遍高于机器学习方法,但需要大量训练数据,而目前记录完备、诊断准确的标准化医疗数据稀缺。对医疗数据的信息挖掘以及有效学习方法有待继续深入研究。

表2 基于机器学习的分类评估

注:NC:正常对照;AD:AD患者;SDPSO:切换延迟粒子群优化算法;RROI:ROI特征初步提取;Ensemble:集成学习;SAR:空间解剖信息正则化;PNN:概率神经网络

(1)数据标准化:影像组学的关键步骤之一是特征提取,所提取特征取决于具体获得的影像数据,影响参数众多,图像采集与重建的参数标准化对影像组学分析具有必要意义。

(2)建立大数据库与数据共享:在学习算法中,提取的特征数往往远大于样本数,易造成模型过度拟合;基于CNN的分类方法不需要分割和特征提取,但也需要大量训练数据的支持,故建立和共享大数据库十分必要。

(3)高维小样本机器学习方法研究:针对目前的困难,提高小样本高维特征数据的分类算法精度甚为必要,一方面可缓解大数据短缺,另一方面对于高维特征的分类问题研究也能够减少计算量。

猜你喜欢

组学特征提取灰度
采用改进导重法的拓扑结构灰度单元过滤技术
影像组学在肾上腺肿瘤中的研究进展
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
Arduino小车巡线程序的灰度阈值优化方案
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案