基于影像组学的人工智能在脑胶质瘤MRI诊断中的应用
2019-09-21李惠明张军
李惠明 张军*
胶质瘤是成人中最常见的原发性脑肿瘤[1],高级别胶质瘤的放化疗后中位生存时间仅12.8个月[2],胶质瘤的分级诊断、放化疗后影像学评估、对胶质瘤生存期的预测一直是临床及科研工作者关注的重点。MRI是目前临床上诊断及评估脑胶质瘤最重要的方法,但有时胶质瘤的影像表现不典型会使得诊断及其与一些非肿瘤组织(例如瘤周水肿和治疗后改变)的鉴别变得困难,人工诊断及评价胶质瘤需要耗费大量的时间和精力,而基于影像组学的人工智能(artificial intelligence,AI)技术诊断胶质瘤有助于提高诊断效率。
1 AI及影像组学概述
AI是人类智能在机器上的模拟,即让计算机“学习”和“解决”问题。目前阶段的AI十分依赖于大数据,医学影像学的大数据即影像组学。影像组学是高通量地从医学影像中提取大量特征,采用自动或半自动分析方法将影像数据转化为具有高分辨率的可挖掘数据集[3]。相较于仅仅从视觉层面解读医学影像,影像组学可深入挖掘影像的生物学本质,并提供临床决策支持。影像组学工作流程如图1所示。采用不同算法可以实现计算机“学习”影像组学的大数据,将影像学特征整合至预测模型,提高整合效率和精确度,进而实现AI“诊断”。
1.1 工作流程 主要包括图像预处理、图像分割和特征提取。预处理包括图像去噪、图像增强等操作。图像分割是基于像素的特征(如颜色、形状或纹理)将图像划分为不同区域以挖掘信息,精确地将胶质瘤瘤体的不同成分进行分割,不仅可以辅助分级诊断与鉴别诊断,还可以为评估治疗反应、预测生存期提供重要的证据。图像分割通常分为手动分割、半自动分割和全自动分割[4]。一般采用图像质量参数或Dice系数对图像分割结果进行评价,分割结果近似完美时Dice系数值无限趋近于1。单纯应用AI技术进行图像分割发展得较为成熟,采用多种算法结合的方式进行分割可得到较为精准的分割结果。图像分割后同一区域内的图像应具有相似的图像特征,需将定量图像特征提取出来并分析整合。常用的图像特征包括形状、纹理等。形状特征的提取与图像分割工作有部分的重叠。纹理特征是一种全局特征,有助于判断肿瘤内部异质性。纹理特征包括一阶和二阶统计量。一阶统计量直方图可用于描述图像中像素的灰度纹理分布,但一个直方图可能对应于几个图像,图像精度不足。灰度共生矩阵(gray-level co-occurrence matrix,GLCM)是二阶统计量的数值矩阵,可认为是两个像素灰度级对的联合直方图。其他算法模型,例如马尔可夫随机场(Markov random field,MRF)、模型法、小波变换等在图像特征提取方面也具有较好的效能。
1.2 分类器及模型 在图像分割和特征提取之后,应将上述结果推入数学或统计模型输出最终分类结果。机器学习(machine learning,ML)是实现分类器功能的重要方法,分为监督学习(原理见图2)和无监督学习。监督学习的主要模型有随机森林(random forest,RF)、人工神经网络(artificial neural networks,ANN)、支持向量机(support vector machine,SVM)、逻辑回归(logistic regression,LR)等。 ANN 是受生物神经网络启发而开发的一种经典的机器学习方法,由输入层、隐藏层和输出层构成,当隐藏层发展到多层时便称之为深度学习 (deep learning,DL)。近年来基于DL的AI技术在胶质瘤诊断中的应用发展迅速,其中卷积神经网络(convolutional neural networks,CNN)应用较为广泛。SVM特别适合用于处理分类问题,基于不同的图像特征建立的SVM模型可实现多种分类目的,是目前胶质瘤分级诊断中应用最广泛的分类器,多项研究证明SVM分类性能优于其他分类器(见表1)。
图1 影像组学工作流程图
图2 机器学习之监督学习示意图
表1 AI对胶质瘤分级诊断的研究及其诊断效能
无监督学习的输入数据无标记,输出结果也未知,目的不是为了产生一个分类系统,而是让计算机自己训练找出数据集的规律性。其中最庞大的分支为聚类,基于聚类算法的无监督学习模型也可以实现胶质瘤的分级诊断。贝叶斯网络以概率为核心代表疾病和症状之间的概率关系。Hu等[13]应用贝叶斯网络将脑胶质瘤增强T1WI图像特征整合至分类诊断预测模型中,也实现了对胶质瘤的分级诊断[准确度92.86%,受试者操作特征曲线下面积(AUC)0.957 7]。
LR是一种尤其适用于解决两分类问题的分类器模型,其中当应用“L1正则化”生成一个稀疏权值矩阵后该模型也可以用于特征选择。对于胶质瘤分级诊断,有研究[7]应用训练后的LR、SVM及RF模型,最终分类结果的AUC分别为0.901 0、0.886 6、0.921 3,由此可见,胶质瘤的高低级别分级诊断这种两分类问题应用逻辑模型也可得出较为满意的结果。
1.3 数据库及数据解析 影像组学的数据库应该是多中心高通量的、整合的数据库,不仅涵盖影像学的图像及信息,还需要包括临床数据、病理学数据等,尤其是分子水平的信息,并在专业人士的指导下实现数据共享,以求更加规范、安全使用数据库信息。对于数据库内大数据解析,则需要相关的高级统计学及计算机专业人才,以便大数据得到最充分的应用[14]。
2 AI在胶质瘤诊断中的应用
2.1 分级诊断 胶质瘤的分级诊断以及对瘤体不同成分(如出血、水肿等)的评估对于提供治疗决策和预测预后至关重要[15]。目前AI领域已经有大量的工作涉及胶质瘤高低级别的分级诊断(表1)。基于AI的计算机辅助诊断系统 (computer-aided diagnosis system,CAD)可以辅助放射科医生的诊断工作。Hsieh等[16]研发的CAD应用GLCM提取纹理特征,用以预测高低级别胶质瘤 (AUC 0.89,准确度87%),应用该系统后放射科医师诊断准确度有明显提高(AUC从0.81提高至0.90),证明该CAD不仅能够辅助区分高低级别胶质瘤,还能够提高放射科医师诊断的准确度,为AI走向临床奠定基础。
2.2 鉴别诊断 不典型胶质瘤有时与其他肿瘤难以鉴别,例如颅内淋巴瘤、转移瘤等。Artzi等[17]回顾性分析439例胶质母细胞瘤和脑转移瘤病人的MRI特征,基于SVM等分类器建立预测模型,SVM模型预测组平均敏感度为0.86,AUC为0.96,并可以进一步鉴别胶质母细胞瘤和脑转移瘤亚型。Zacharaki等[18]对MR影像进行特征提取、特征选择后,实现不同类型如胶质瘤、转移瘤及脑膜瘤等鉴别诊断,其准确度、敏感度和特异度分别为85%、87%和79%。Kunimatsu等[19]开发基于纹理特征的算法,通过对脑胶质瘤及原发中枢神经系统淋巴瘤T1WI增强影像进行纹理分析,实现辅助胶质瘤与原发中枢神经系统淋巴瘤的鉴别作用,该算法在训练集内的AUC最高可达0.99。
2.3 预后分析 肿瘤异质性发生在分子水平,但异质性可以通过医学影像中观察到的纹理宏观反映,不同异质性的肿瘤预后可有明显差别。为了研究胶质母细胞瘤病人肿瘤异质性与病人生存时间的关系,Liu等[20]分别从长期生存和短期生存胶质瘤病人的T1WI增强影像中提取了3种类型的纹理,随后使用SVM学习不同纹理类型与肿瘤异质性的关系,预测结果证明可以通过纹理特征评估肿瘤的异质性程度,从而预测病人生存周期,但研究表明仍需要对算法进行进一步优化来提高对于生存周期分组的准确性。Emblem等[21]进一步将确诊胶质瘤病人的生存期分为4组 (6个月,1、2、3年),基于肿瘤MR影像直方图特征训练SVM,测试组的SVM测试结果AUC为0.794~0.851,结果证明SVM可以实现根据影像精确预测生存期。
2.4 疗效监测 恶性胶质瘤术后须放化疗治疗[22],但目前存在的一个问题是无法预测病人放化疗后的疗效反应。Kickingereder等[23]从复发胶质母细胞瘤病人的影像中提取了4 842个特征用以生成预测模型,用以对实验组病人的无病进展生存期和总生存期进行分层。另一个较大的问题是难以区别治疗后肿瘤进展 (true tumor progression,TTP)和假性进展(pseudoprogression,PSP)。 Qian 等[24]根据这一临床现状,应用稀疏字典学习模型区分TTP及PSP的影像特征并用实验组加以验证,平均准确度为0.867,AUC 0.92。由此可见,该模型有望辅助临床TTP及PSP的早期诊断,辅助监测胶质母细胞瘤的治疗效果。另外,传统MRI定性方法难以确定高级别胶质瘤的浸润边缘,而Chang等[25]开发了一个全自动系统,纳入36例具有病理结果的MR影像训练CNN模型,发现CNN可生成细胞密度图谱,从而实现无创性识别胶质瘤浸润边缘,这十分有利于病人的病情评估、胶质瘤治疗的疗效监测以及外科手术的进行。
2.5 分子水平诊断 影像基因组学表明影像特征与肿瘤基因、蛋白质和分子改变息息相关[26-27],但其中隐含的信息仅依靠人眼并不能够完全捕获。AI算法可以辅助高效、精准地挖掘影像的潜在信息,从而将宏观影像特点与微观基因表达类型相关联,可更加精确地指导临床,实现胶质瘤的个体化治疗,且较人工诊断具有明显优势。胶质瘤常见的基因突变有异柠檬酸脱氢酶 (isocitrate dehydrogenase,IDH)、表皮生长因子受体 (epidermal growth factor receptor,EGFR)等[1],不同的分子亚型在肿瘤的好发位置、治疗敏感性等方面各有不同。
IDH1突变被认为与胶质瘤的生存期关系密切。Wu等[28]应用基于影像组学的分类模型预测IDH1突变状态的胶质瘤,结果显示RF具有较高的预测性能(平均准确度0.885,AUC 0.931)。α地中海贫血伴智力低下综合征(X-linked alpha thalassemia mental retardation syndrome,ATRX)基因表达对于低级别胶质瘤分子分层具有临床意义。Ren等[29]基于液体衰减反转恢复(FLAIR)序列提取影像特征建立SVM预测模型,预测ATRX(-)的病人的准确度、AUC、敏感度、特异度分别为91.67%、0.926、94.74%、88.24%,亦证明该SVM预测模型可实现无创性预测低级别胶质瘤ATRX基因表达。O6-甲基鸟嘌呤-DNA甲基转移酶(O6-methylguanine-DNA methyltransferase,MGMT)的甲基化与胶质瘤的瘤周水肿相关[30]。MGMT有助于DNA修复,甲基化MGMT则会抑制DNA修复,从而导致胶质母细胞瘤对化疗药耐受。Korfiatis等[31]根据这一理论依据提取相关影像学纹理特征,结合SVM及RF分类器实现了预测胶质母细胞瘤MGMT甲基化状态,亦证明影像学有可能成为简便易行的无创性胶质母细胞瘤MGMT甲基化的生物标志物。染色体1p/19q联合缺失的胶质瘤的影像表现具有一定的特点[32],且1p/19q联合缺失的低级别胶质瘤病人治疗反应好,生存期更长。Akkus等[33]应用CNN预测MR影像中胶质瘤的1p/19q染色体表型状态,预测结果敏感度93.3%、特异度82.22%、准确度87.7%。
3 问题与展望
AI技术代替人工实现高效精准地从多模态影像中挖掘大量特征并进行定量分析,建立影像数据与临床特征关系,定量分析微观分子与基因变化,为脑胶质瘤的个体化诊断及评估提供了新发展方向。但目前的AI仍停留在以影像组学大数据为基础的“机器智能”的水平,尚有许多算法与模型有待进一步优化与探索,而数据库尚不完备等问题仍然存在。相信随着医学影像学数据的不断积累和标准化,以及各类图像分割、特征提取等方法的迅速发展,AI技术实现真正的“人工智能”将会走向临床实现辅助诊断和精准医疗。