影像组学技术及其在肿瘤精准放疗中的应用*
2018-12-03闫梦梦综述王卫东郎锦义审校
闫梦梦 综述,王卫东,郎锦义 审校
610041 成都,四川省肿瘤医院·研究所,四川省癌症防治中心,电子科技大学医学院
影像组学是一种大数据图像分析方法, 通常收集的是计算机断层扫描成像(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)和正电子发射型计算机断层显像(positron emission tomography,PET)等医学影像[1]。超声因具有易操作、成像快、价格低和安全等优势, 使不少研究者尝试将超声应用于影像组学。目前影像组学的技术流程已十分清晰(如图1),但其中的一些步骤,如多中心验证、数据的标准化、算法的可重复性和可靠性等仍有进步空间。影像组学推动了肿瘤精准放射治疗的进程,基于影像组学的放疗新技术已提高了某些癌症的局控率和患者生存率[2]。
1 影像组学技术流程
1.1 图像收集
影像组学的图像收集多是源于CT、MRI和PET图像。临床上通常使用CT检查肺部病变,但MRI的时效性要优于CT[3],故MRI越来越多地应用于肺癌的辅助诊断和疗效评估。PET有其独特优势,相对于常规CT图像,PET提供的定量特征信息更全面。无论哪种成像方式,影像数据都应结合临床病例信息或基因、病理数据[4]。
Larue等[5]人认为定量图像分析缺少明确的标准,主要表现在设备成像和图像重建的参数设置,计算出来的图像特征的数量远超研究的病人数量等方面。Li等[6]分析了收集的MRI图像特征,认为MRI影像组学特征结合基因检测技术,可用于预测乳腺癌的术后复发。 Zhang等[7]认为乳腺肿瘤的鉴别诊断时,从超声图像中提取的量化特征有诊断意义。
1.2 感兴趣区域分割
感兴趣区通常是指病灶部位,有三种分割方式:手动勾画,人机交互勾画和全自动勾画。临床常使用手动勾画,近些年多种分割算法应用于靶区勾画,但人工跟踪分割算法仍被用作金标准。目前的自动勾画和半自动勾画算法各有优劣,自动且高精度分割算法为未来发展方向。
图1影像组学的流程
Figure 1. The flow work of radiomic
1.3 特征提取和统计分析(模型构建)
勾画好靶区后,即可提取肿瘤特征。常用的特征有强度、形状、纹理和小波等。每类特征都有数十种以上的信息,要提取更有效的特征信息,需对特征进行统计分析。常用的分析方法有重测信度分析,主成分分析,相关性分析和聚类分析。
Parmar等[8]设计了两个独立的放射培训组(310例)和实验组(154例),从464例肺癌患者的治疗前CT图像中提取了共440个放射特征进行算法评估,确定基于特征选择方式WLCX (稳定性=0.84±0.05, AUC=0.65±0.02) 的Wilcoxon测试和随机森林分类器(RSD=3.52%, AUC=0.66±0.03)具有高预测性和稳定性。
相同类型的特征会有不同的预测功能。例如,很多图像可以提取纹理特征,分析患者CT的纹理特征可提高肿瘤疗效评估的准确率,纹理特征在术后预测肺癌早期复发时,也有统计学意义[9-11]。一些研究证实,基于CT的三维体积的定量特征能更早展示肿瘤变化[12-15]。
1.4 分类与预测(模型应用)
影像组学提取具有代表性的图像特征作为新的生物标记,对临床辅助决策、治疗效果和预后跟踪有重要的意义。目前,其主要应用在辅助诊断和疗效预测。现有研究大多基于CT和MRI图像,入组病例多为肺癌、头颈癌、结肠癌和前列腺癌[17-18],许多研究表明PET在肺癌的诊断和预测中有独特的优势[19-21]。
Aerts等[16]通过提取肺部和头颈部肿瘤患者的CT图像定量特征,认为影像组学可用于肺癌和头颈部肿瘤的预后识别。Shiradkar等[20]提出了一种基于影像组学制订放疗计划的框架,在定位前列腺癌时,比普通方法有更高的准确率。但这项研究的样本数量过少,还需进一步验证。Coroller等[21]从肺腺癌患者CT图像中提取的影像组学特征显示, 一些特征预测远转移和生存率的准确率很高。Parmar等[8]通过研究头颈部患者的CT图像特征发现,特征选取的数目、图像降维方式和分类器的选用一定程度上影响影像组学预测效果。
影像组学技术高效、安全、无创且无痛。目前主要用来做辅助诊断和疗效评估,作为新兴技术,它跳过了肿瘤异质性的障碍,有望成为临床辅助诊断和治疗工具。
2 影像组学在精准放疗中的应用
影像组学蕴含的定量特征信息为肿瘤精准放疗的整个过程提供了新的视角、新的方法和新的能力。基于影像组学的放疗新技术对有些类型的癌症已提高了局控和患者生存率。如立体定向放射治疗(SBRT)用于NSCLC,精准的高剂量极大地提高了局控和整体生存率[22-26]。一些研究表明,对无法手术的患者和高龄患者,SBRT能够精准定位靶区,已成为一种实用的治疗方式[27-31]。而PET/CT检查已成为新的实体瘤疗效评估标准的重要参照,其影像组学特征在预测患者SBRT后的局控方面有重要意义。对精准放疗的应用主要表现在:
2.1 辅助诊断良恶性肿瘤
许多影像组学特征可反映不同肿瘤类型。例如,通过CT密度直方图诊断恶性肺结节,弥散加权MR成像的定量特征诊断内部抑制水分子活动的肺部恶性肿瘤。
2.2 肿瘤侵袭性
精准放疗要求精确定位靶区范围,靶区的确定与肿瘤的侵袭与转移相关联。有研究发现NSCLC患者的CT图像直方图和分型维度等特征可定性描述肿瘤的侵袭与转移[27]。
2.3 肿瘤基因表型预测
影像组学图像的定量特征与肿瘤基因和蛋白质水平改变有关,结合病理数据有很好的基因表型预测能力。Aerts等[16]发现,CT纹理特征参数可定性反映基因表达模式。
2.4 放疗计划
影像组学对放疗方案的制定有辅助和检验的作用,Larue等[5]发现一些定量图像特征会相互依赖,做放疗计划时,应采用标准化的方式和合适的特征。为了减少危机器官的剂量并增加癌变部位剂量,Shiradkar等[20]制作了基于影像组学标签的前列腺癌放疗计划框架,效果明显。
2.5 预后预测
近期许多研究发现,影像组学特征在术后预测方面有很高的准确率,这使肿瘤的精准放疗又进一步。Parmar等[8]通过机器学习的方法,优化了特征选择方式,从而确定了两个具有高准确度的预测模型。CT三维多平面重组技术为观察靶区提供了新的视角,其体积特征对观察肿瘤病理变化有重要意义[13-14]。而不同的图像特征的预测效果可能会有所不同,这时要考虑特征的提取方法、特征的稳定性和分类器的选用[8]。
3 问题与展望
影像组学的处理流程日趋完善,成效可观,但相关技术和算法的优化仍是挑战,主要表现在技术的可重复性,大数据的利用和数据共享等方面(如图2)。
3.1 可重复性
基于影像组学建立起来的模型是否具有普遍适用性至关重要,其中包括影像获取的标准化、特征提取的标准化和高通量特征的稳定性。影像组学的图像收集主要是通过CT、PET和MRI,近期亦有对超声图像的研究。但是不同厂商的设备在获取图像时的参数设置可能不同,同一台设备的不同参数也会使图像产生差异。故从图像中提取的特征信息的抗干扰性和稳定性也就决定了影像组学模型的适用性。不同的影像设备图像获取和成像算法标准可能不同,造成灰度、小波等图像特征的差别很大。此外,数据的过度拟合,对边缘模糊的肿瘤分割方式等都会降低特征的稳定性。
图2影像组学面临的主要挑战
Figure 2. The challenges of radiomic
不同于传统简单的响应方式,高级图像特征更复杂,且对癌症类型、图像获取参数和图像噪声等的变化更敏感。一些研究检验了高级图像特征的稳定性和鲁棒性[32]。Hunter等[33]人检验了NSCLC患者的图像特征的可重复性。他们确定了一系列可重复的(一致性相关系数>0.9)、非冗余的(平均相似距离>0.1)和有效的图像特征。Leijenaar等[34]发现大多数PET衍生的图像特征都有较高的可重复性(71%)和稳定性(91%),表明影像组学的进一步研究是有根据的。Gillies等[35]人描述了一个乐观而清晰的放射学的未来前景,并强调了影像组学的最大挑战:再现性、数据共享和标准。
3.2 大数据
临床数据庞大,而可用数据相对较少。影像组学不仅要分析数据,还要存储数据。通过影像组学特征提取软件可以获取成千上万的特征, 但通常临床研究中的病例只有数百例,特征数量和病例的比例悬殊, 在数据分析中面临所谓的“维度灾难”的问题[36]。此外,还要对研究人员可能会问到的问题和所需数据类型分类,平衡临床上数据收集的效率和实用性。这要求高性能计算机服务器和高人力投入。机器学习可解决大数据的问题,但仍有挑战:可用数据相对较少,难以建立因果关系的映射。它虽然能给出关于疾病的分析结果,却不能给出推理证明。机器学习基于大数据建立模型,应用于影像组学的辅助诊断、疗效评估和预后分析等方面。例如,利用机器学习确定病人基因类型和靶向药物从而避免使用穿刺活检;基于皮肤癌图像数据,通过迁移学习技术建立深度学习网络模型,精准分类皮肤癌。Aerts等[16]利用机器学习的方法,将1 019例肺癌和头颈癌患者的影像和病理数据结合起来,定量分析降维后的图像特征。结果显示影像组学标签的预后价值明显。
机器学习,或者说强化学习的关键在于数据与结果间的映射。即如何让强化学习模型评价自己得出的结果的优劣,并不断进行强化学习,来提升分类的准确度和预测的精确度。这需要解决三个问题:一是量化特征与标签(如肿瘤疗效)的匹配,二是如何让模型评价自己的得出结果,三是如何让模型根据自己的评价结果提高准确度。
3.3 数据共享
建立基于影像组学的生物标志物,最大的挑战是多个中心之间共享图像数据和元数据。多中心试验具有不同的患者群体,可创建足够大的数据库以获得统计能力[34-36]。数据共享是所有生物医学研究中的共同挑战,除了克服文化、行政、管理和个人问题之外,还有数据保护、大数据传输等技术问题[36-40]。
影像组学早期用于评价放疗效果,而目前结合临床信息已能用于肿瘤分型、鉴别诊断、临床决策和疗效监测等方面,推动了肿瘤的精准放疗。我们相信,随着人工智能算法的演进,影像组学模型将对靶区的定位更加精准,且对放疗效果的预测更加准确。
作者声明:本文第一作者对于研究和撰写的论文出现的不端行为承担相应责任;
利益冲突:本文全部作者均认同文章无相关利益冲突;
学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统学术不端检测;
同行评议:经同行专家双盲外审,达到刊发要求。