APP下载

深度学习技术在前列腺癌影像学诊断中的应用

2022-04-19杨瑞郑庆源倪鑫淼杨松陈志远刘修恒

医学综述 2022年5期
关键词:前列腺癌磁共振前列腺

杨瑞,郑庆源,倪鑫淼,杨松,陈志远,刘修恒

(武汉大学人民医院泌尿外科,武汉 430060)

前列腺癌是一种中老年男性高发的恶性肿瘤,近年来发病率逐年升高。据统计,2019年美国新发前列腺癌17 460例,占所有新发肿瘤病例的20%,死亡31 620例,占所有肿瘤死亡病例的10%[1]。2011年我国新发前列腺癌35 477例,居男性肿瘤发病率的第6位[2]。图像信息对前列腺癌的诊断具有重要意义,其中经直肠前列腺彩色多普勒超声可作为前列腺癌的筛查工具,磁共振检查被广泛用于评估前列腺癌,而病理学检查和Gleason评分更是前列腺分级的重要依据[3]。近年来深度学习技术在医学领域得到了较快发展,其可通过有监督或无监督的方式从图像数据中提取特征,用于图像的分类或分割。深度学习技术可以在如下几个方面辅助影像科医师工作:①减少影像科医师的工作量;②通过评估图像中先前未被人类评估过的新特征,提高图像判读质量;③提高决策的可重复性;④缩短图像判读时间[4]。基于深度学习网络的图像分类或分割任务在某些方向已达到了较高水平,展示了深度学习技术在辅助诊断中的应用前景。现就深度学习技术在前列腺癌影像学诊断中的应用予以综述。

1 传统影像学技术及面临的问题

1.1磁共振检查 磁共振检查的常规序列可提供前列腺的解剖结构信息,弥散加权成像、动态增强成像和磁共振波谱成像明显增强了磁共振检出前列腺癌的能力。相较于其他影像学检查,前列腺磁共振检查具有更高的软组织分辨率,能够更好地指导前列腺癌分期[5]。磁共振检查也被用于监测前列腺癌局部治疗后的复发。虽然前列腺影像报告和数据评估系统一定程度上促进了前列腺癌磁共振诊断的标准化,但前列腺增生、前列腺炎和前列腺出血等异常信号会影响前列腺癌的诊断[6]。

1.2超声检查 超声检查的价格低廉,培训成本较低,因而超声引导下的前列腺穿刺活检被广泛应用,但是一项纳入3 912例患者的研究显示,只有25.4%的低回声结节被超声引导下的穿刺确诊为前列腺癌[7]。由于前列腺癌的发生和发展依赖于血管生成,而彩色多普勒超声和能量多普勒超声能够发现血流信号异常组织,因此这两种成像模式有可能帮助人们更准确地诊断前列腺癌。但分辨率低仍限制了超声检查诊断早期前列腺癌能力的进一步提高[8]。近年来,新的超声技术(如超声造影和超声弹性成像)在区分前列腺癌和前列腺良性病变中展现了较好的应用前景[9-10]。

1.3病理学检查 病理学检查是确诊前列腺癌的金标准。病理学报告的Gleason评分因与临床预后有较好的相关性而被广泛应用[11]。病理学、磁共振和超声检查均需要专业医师对图像进行解读,不同医师读片水平的差异以及同一医师不同时间工作状态的差异可影响疾病的诊断。虽然各种先进技术的应用使上述检查方法的准确率不断提高,但只要是人工判读,这一现象就难以完全避免。

2 深度学习技术概述

深度学习是一类模式分析方法的统称,是机器学习的一个新的研究方向。机器学习是人工智能的一个分支,是人工智能的核心技术和实现手段。深度学习可通过多层处理,将“低层特征(如图像中的点、角和边界)”转化为“高层特征(如图像的标签)”,从而进行目标的分类和识别。相较于传统的浅层学习,深度学习更加强调模型深度和特征学习的重要性[12]。卷积神经网络是深度学习在图像处理中应用最多的网络,主要由卷积层、池化层、全连接层和激活函数等组成。所谓的层指的是某种特定的计算方法或函数,其可以接收数据并进行计算,然后输出。其中卷积层是卷积神经网络的核心,其通过构造多个卷积核,在输入图像上滑动并进行卷积操作,以达到提取图像特征的目的。池化层又称为降采样层,通过合并一定范围内的数据减少运算量。全连接层则可以整合卷积层或池化层中具有类别区分性的局部信息,使输出信息向高层特征靠拢。激活函数可以赋予神经网络足够的非线性,使其可以更好地模拟各种数据的内在规律[13]。确定网络的训练方式和优化函数后,整个网络即可通过随机梯度下降算法,利用反向传播进行训练。训练好的神经网络会形成自己的网络结构文件和权重文件,这两个文件是神经网络预测同一类型未知数据的依据。卷积神经网络进行图像处理的流程见图1。

图1 卷积神经网络的构架模型

3 深度学习技术在前列腺癌影像学诊断中的应用

3.1深度学习技术在前列腺磁共振成像中的应用

3.1.1前列腺癌检测和分类 在前列腺癌的临床诊治过程中,准确识别低危和高危前列腺癌能够避免过度诊疗或延误治疗。由于低危前列腺癌患者需要进行长期监测,一个好的无创评估系统非常重要。美国医学物理家协会、美国国家癌症中心和国际光学工程学会在2017年启动了一个在磁共振图像上进行前列腺癌检测和Gleason评分预测的公开比赛(https://www.aapm.org/GrandChallenge/PROSTATEx-2),以促进前列腺癌检测算法和Gleason评分算法的进步。Seah等[14]构建了一个卷积神经网络检测前列腺癌,该网络考虑到了前列腺磁共振图像和自然图像的不同,即磁共振图像具有范围较大的窗宽和窗位,但是检测目标(前列腺和前列腺癌)的边缘模糊,这一点与自然图像有较大区别。受影像科医师在读片时往往需要调整窗宽和窗位的启发,研究者将这一信息输入网络,最终在前列腺癌检测中取得第2名的好成绩。Wang等[15]设计了一个端到端的卷积神经网络,该神经网络包含两个子网络,其一用于表观弥散系数序列和T2W序列的配准,其二即为卷积神经分类网络。研究在360例患者中间运用5折交叉验证的办法训练并评估了端到端的卷积神经网络模型,最终模型识别高危前列腺癌的灵敏度达到0.89。Wang等[16]比较了深度学习算法和非深度学习算法区分前列腺癌的能力,共纳入172例患者的T2W序列前列腺磁共振图像,其中前列腺癌患者79例、前列腺增生患者93例,最终深度学习模型受试者工作特征曲线下面积为0.84,而非深度学习算法为0.70。Schelb等[17]利用深度学习技术检测和分割磁共振图像上的高危前列腺癌,证实了深度学习算法与前列腺影像报告和数据评估系统(prostate imaging-reporting and data system,PI-RADS)的效能相似。Zhong等[18]收集了140例患者的磁共振图像和病理图像,比较了基于迁移学习的深度学习模型、不利用迁移学习的深度学习模型以及PI-RADS V2识别前列腺癌的能力,结果显示,基于迁移学习的深度学习模型与PI-RADS的鉴别能力比较差异无统计学意义(P=0.89)。Yang等[19]收集了160例患者的前列腺磁共振T2W序列和表观弥散系数序列,构建了两个并行的深度卷积神经网络,将这两个卷积神经网络提取的最终特征输入一个基于支持向量机算法的分类器中,最终实现了前列腺癌的自动识别。

3.1.2前列腺的分割 前列腺的体积与前列腺特异性抗原密度密切相关,而前列腺特异性抗原密度是判断前列腺癌的指标。前列腺腺体体积被用来确定前列腺增生患者具体的手术方式。因此,准确测量前列腺体积有重要的临床意义。既往多采用前列腺超声或前列腺磁共振测定前列腺的前后径、左右径和上下径,根据公式换算出前列腺体积。当前列腺形状不规则时该计算方式存在较大误差。将每张磁共振图像上的前列腺腺体分割出来,根据像素大小和层厚计算前列腺体积,得到的结果可能更准确。如果能够利用深度学习技术实现磁共振图像上前列腺的准确分割,则有可能更加准确、便捷地获取前列腺体积。Zhu等[20]建立了一个三维的含有密集连接模块的深度学习网络用以分割前列腺。三维结构使网络能够充分利用上下层图像之间的关系,密集连接模块则充分利用了浅层信息和深层信息。在最终验证集上,该网络得到的用来评估模型效能的平均Dice相关系数达到0.82,而作为比较的常用网路U-net和V-net的Dice相关系数分别为0.68和0.76。鉴于三维卷积神经网络需要消耗大量的计算资源,Alkadi等[21]开发了一个2.5维的网络,在保证模型效能的同时减小了数据量,从而降低了模型对硬件计算能力的要求,最终获得的模型的效能与Zhu等[20]的研究接近。Tian等[22]进行了磁共振图像上前列腺的分割研究,提出的网络名为PSNet,在测试集上平均Dice相关系数为0.85,与之对照的U-net的平均Dice相关系数为0.83。

受益于公开的前列腺磁共振数据库,前列腺癌的检测、高危和低危分类算法得到了长足的发展。不少深度学习系统的分类效能已经接近或达到了目前在临床广泛应用的前列腺癌评分体系PI-RADS,但是这些新方法仍然有待大规模的外部验证。相较于从网络结构、损失函数和数据输入维度等入手,也有研究从磁共振图像和自然图像入手进行探索,将磁共振图像可调节的窗宽窗位信息加入网络,更适用于磁共振图像的特征提取,从而更好地进行分类任务。未来深度学习在前列腺磁共振成像中的应用重点包括:①纳入更多的磁共振序列进行分析。目前模型多纳入的是T2W和表观弥散系数序列,也有部分模型只纳入了T2W序列。动态增强成像和磁共振波谱成像均能提高前列腺癌的检出率,将这些序列纳入分析或许可进一步提高神经网络识别前列腺癌的准确率。②卷积神经网络构架的改变。部分研究将分析不同序列的子网络并联,将最终的结果输入分类器;也有部分研究将不同的子网络串联,直接生成最后的结果。以上提示可通过改进神经网络的构架进一步提高检出效能。另外,最终分类器的选择也有待进一步探索,支持向量机在现阶段得到了广泛应用,但是其他分类器的效能目前相关报道较少。③结合多组学数据。疾病的诊断并不单单依据磁共振检查或某一项指标,而是对各种不同形态数据和信息的综合分析。如果基于磁共振的前列腺癌诊断的深度学习模型能够将这些不同形态的信息和检查结果纳入分析可能进一步提高诊断效能。

3.2深度学习在前列腺病理学检查中的应用 作为一种被广泛使用的前列腺癌组织学分级方法,病理学检查提供的Gleason评分是确定前列腺癌治疗方案的重要指标。Bulten等[23]尝试利用卷积神经网络识别病理学图片中的良性和恶性斑块。从1 243例前列腺癌病例中收集了5 759个穿刺样本并以此训练模型,最终得到的模型鉴别良恶性与病理科专家的判定有较好的一致性(Kappa=0.918),模型在训练集中的受试者工作特征曲线下面积为0.99,测试集中为0.984,两个外部验证集中分别为0.980和0.988,证明模型有较好的鉴别效能。Arvaniti等[24]的研究纳入了641例用苏木精-伊红染色的前列腺癌患者的病理学图片作为训练集和测试集,245例由专家注释的病理学图片作为验证集。由于组织芯片的图片分辨率较高,研究者将原始病理图片分成许多小块进行训练,每个小块被标注为良性、Gleason 6分、7分、8分、9分和10分。训练好的模型可以给出病理图像上每一个像素所对应的Gleason评分,据此则可以得到整体的Gleason评分。用Kappa一致性检验评估深度学习模型与病理学家给出的Gleason评分的一致性,结果显示模型与两位病理学家之间的Kappa系数分别为0.75和0.71,而两位病理学家之间的Kappa系数为0.71,提示模型可以更加客观和重复地进行病理图像Gleason评分预测。Yang等[25]发现,Gleason评分依赖于良好的病理制片,但制片过程往往需要较长时间。为了解决这一问题引入了多光子成像显微镜,通过这一设备获取未染色的前列腺组织的亚细胞图像,并根据这一图像训练深度学习网络进行自动化的Gleason分级。在测试集中,这一模型的准确度达到81.13%。虽然结合多光子显微镜和深度学习的准确率相较目前广泛使用的苏木精-伊红染色制片、病理医师阅片的准确率并不具有明显优势,但其诊断更为快捷。很多研究者在病理图像上的前列腺癌诊断和分级这一领域进行了不同的尝试,Kott等[26]构建了两个神经网络,分别对图像进行粗分类和细分类,粗分类鉴定图像的良恶性,细分类鉴定肿瘤的Gleason分级。这两个神经网络均应用到了深度残差卷积神经网络,得到的模型进行粗分类的准确度为91.5%,细分类准确度为85.4%。Lucas等[27]则利用Inception-3训练像素级标注的前列腺癌病理学图片,最终模型识别良恶性的准确度为92%,灵敏度和特异度分别为90%和93%。综合来看,不同研究者从不同角度采用不同的方法解决了病理学图片的分类和分割这一问题,且准确度和精确度较好,但目前仍然缺乏各种方法之间的横向比较和独立的大规模验证。

3.3深度学习在前列腺超声检查中的应用 由于超声检查的信噪比较低,成像易受气体、骨骼影响,在超声图像中应用深度学习技术有一定的困难。但超声仍然是当前图像引导前列腺活检或近距离粒子植入时首选的影像学检查方法,有研究者在深度学习和超声成像上进行了探索。Anas等[28]应用2 238张经过标记的经直肠前列腺超声图像作为训练数据,利用深度学习技术训练了一个模型对超声图像中的前列腺进行分割。模型最终的平均表面距离误差为1.1 mm,Hausdorff距离误差为3 mm,提示网络可对前列腺进行准确的分割。Feng等[29]探讨了基于超声造影数据构建神经网络检测前列腺癌的效能,最终模型诊断前列腺癌的准确度为90%,精确度为91%。Lei等[30]根据交叉熵损失函数和基于批次的Dice损失函数构建了新的损失函数。针对超声图像中前列腺顶部和底部可能出现的分割误差,引入了基于多方向的轮廓细分模型,融合了基于横向面、矢状面和冠状面的信息;针对超声图像信噪比低的问题,应用不同的滤波器进行图像预处理,并将预处理的图像作为多通道样本置于网络中进行训练。最终模型在44例患者的超声图像上进行了验证,深度学习模型的Dice相关系数为0.92,Hausdorff距离为3.9 mm,平均表面距离为0.6 mm,证实了模型的优越性。Karimi等[31]提出了两种策略以提高困难图像分类的精度:首先采用一种自适应的抽样策略,可以使训练过程更多的关注难以分割的图像;其次,研究训练了一个卷积神经网路的集合,应用卷积神经网络预测结果的不一致性来识别带有不确定性的图像内容,然后根据统计模型的先验形状信息对不确定部分进行分割。这一方法所获得的Hausdorff距离为2.7 mm,Dice相关系数为0.93。

目前将深度学习技术应用于前列腺超声影像的研究较少,而研究也主要集中于前列腺腺体分割。由于超声影像的特殊性,往往需要对传统的网络结构做较大优化,并且引入其他临床先验知识才能达到较好的分割效果。由于超声检查对前列腺癌的灵敏度不高,深度学习在超声图像上检测前列腺癌的报道较少见。

4 结 语

以上研究展示了深度学习技术较高的应用价值和广阔的应用前景,但是深度学习技术在医学领域的应用依然面临多重挑战。医学伦理要求任何在临床应用的新技术的有效性和安全性必须得到充分的检验。另外,影像学中的“同病异影”和“异病同影”现象使单纯依据影像学数据来判断疾病具有一定的风险性。医学人工智能的一个发展方向是模仿人类诊断疾病的过程,扩展现有的人工智能网络体系,纳入更多样本和更多维度的数据,如每例样本各个时间点的影像学数据、生化检验数据、物理检查数据和体格检查数据等,构建出真正能够理解人类疾病发生发展过程的人工智能。另外,深度学习技术在前列腺癌诊断方面,无论是基于磁共振检查、病理还是超声数据的研究均是基于自有数据库或公开数据库,缺乏大样本量的外部验证,这也是未来的研究方向。综合来看,以深度学习为代表的人工智能技术在前列腺癌诊断中具有广阔的应用前景,但仍需要进行深入的研究。

猜你喜欢

前列腺癌磁共振前列腺
超声及磁共振诊断骶尾部藏毛窦1例
韩履褀治疗前列腺肥大验案
治疗前列腺增生的药和治疗秃发的药竟是一种药
前列腺癌复发和转移的治疗
关注前列腺癌
认识前列腺癌
磁共振有核辐射吗
前列腺癌,这些蛛丝马迹要重视
治疗前列腺增生的药和治疗秃发的药竟是一种药
磁共振有核辐射吗