人工智能辅助超声诊断肝病变的研究进展
2021-03-26王妍洁罗渝昆
王妍洁,宋 青,韩 鹏,罗渝昆
1 解放军医学院,北京 100853;2 解放军总医院第一医学中心 超声诊断科,北京 100853
人工智能(artificial intelligence,AI)这一术语最早于1956年提出,旨在利用计算机模拟人脑信息处理过程从而进行科学问题的解决[1]。随着关键数据处理方式的变革、核心建模方式的提出及计算机技术的迅速发展,人工智能技术与医疗(尤其是医学影像领域)的融合不断加深,为临床疾病诊治提供了帮助[2-3]。腹部超声可获得肝实质及包膜、肝内外血管及胆管情况、实时血流灌注特点等信息,具有便携、低成本、实时及非电离成像等优势。作为疾病“前哨兵”,超声对于肝弥漫性病变程度的评估及异常占位性病变的定位、定性具有很好的诊断效能。人工智能技术,特别是深度学习(deep learning,DL)技术在辅助超声诊断肝病方面的研究日新月异,本文就人工智能技术辅助超声诊断肝病变的研究进展进行综述。
1 人工智能辅助超声诊断非酒精性脂肪肝
非酒精性脂肪肝(non-alcoholic fatty liver disease,NAFLD)发病率近年来逐渐增高。据统计,非酒精性脂肪肝在我国成年人中的发病率为15%~30%,成为威胁国人健康的第一大慢性肝病[4]。传统二维超声对于脂肪肝程度的判定主要依靠观察者的肉眼判别,征象包括实质回声细密、远场回声衰减、肝肾对比度增加及肝内血管模糊表现等[5]。观察者间一致性较差。因此,迫切需要一种能够定量而又无创的方法对脂肪肝的严重程度进行分级。Han 等[6]以磁共振质子脂肪密度分数(MRIderived proton density fat fraction,MRI-PDFF)为对照标准,对204 名受试者的射频数据进行训练,建立了用于诊断NAFLD 有无的分类器和用于预测MRI-PDFF 的脂肪分数估算器,结果显示诊断分类器的效能评估均超过90%,预测脂肪分数在整个MRI-PDFF 范围内的平均偏差为0.8%,证实基于超声射频数据进行非酒精性脂肪肝诊断及脂肪分数量化是准确可行的。Byra 等[7]通过对肝图像进行高层特征提取,建立了基于迁移学习的网络模型,使用特征和套索回归方法对照肝活检以评估脂肪变性程度,其曲线下面积(area under the curve,AUC)达0.977,优于传统灰度共生矩阵法和肝肾指数法。Cao 等[8]采用包络信号法、灰度法和深度学习索引法对四分类肝图像进行后处理和ROI 分析,三种方法区分有无NAFLD 二分类的诊断AUC 值均在0.85 以上,其中深度学习指数AUC 值可达0.933。但该研究缺乏病理或其他影像学标准对照,仅依据3 名医师主观判别NAFLD 程度,这或许解释了其对于鉴别轻、中度NAFLD 效能较差的原因。Chen 等[9]使用基于VGG-16 模型的深度学习算法和基于超声熵成像的反向散射统计分析,对肝脂肪变性进行分级预测,结果显示两者在识别中、重度脂肪肝的AUC差异有统计学意义,后者效能略优于前者,且后者还可提供与微结构有关的物理信息,这为临床辅助诊疗提供了一种不同的思路。
近期,有研究提出了一种基于四种不同迁移学习预训练的组合式深度学习算法,其对肝是否存在NAFLD 的二分类准确性非常高(AUC 达0.999 9)[10]。但目前只做到二分类,且数据样本仅包含55 名需减重手术的严重肥胖患者,轻、中度NAFLD 患者的纳入量少,选择偏倚对模型效能或有影响。
2 人工智能辅助超声诊断肝纤维化及分级预测
肝纤维化是机体应对多种长期慢性损伤(如慢性乙型肝炎)后产生的累及全肝的免疫性损伤修复反应,其病理改变示纤维组织异常增生,至终末形成假小叶(即肝硬化阶段)。“肝炎-肝纤维化-肝硬化-肝癌”四部曲中肝纤维化与肝硬化的治疗方案不尽相同,正确区分疾病进展情况有利于指导临床治疗方案的选择。早期研究使用基于模糊逻辑算法的纹理分析测算超声图像中的数字定量特征,从而实现分类输出[11]。Gao 等[12]使用灰度梯度共生矩阵和灰度共生矩阵对肝二维超声图像进行纹理分析,采用多层前馈神经网络作为分类器,对肝纤维化进行五分类预测,对不同分类的预测正确率均>70%,其中S0 和S4 分类准确率更高达100%,但灰度检测法受到不同仪器及时间增益补偿的影响较大。高永振等[13]利用背向散射回波射频时间序列分析原理,提取7个特征参数建立分类模型,对正常肝和肝硬化的二分类准确率为87.5%。Acharya 等[14]基于曲波变换方法提取熵特征,利用局部性敏感判别分析,对正常、肝纤维化和肝硬化三分类的预测准确率为97.33%。Cheng 等[15]分析了160 组大鼠肝纤维化超声射频数据,采用基于双向长短期记忆网络模型定量预测不同分期肝纤维化程度,线性回归显示其与病理金标准具有良好的相关性(R2>0.93)。
付甜甜等[16]结合灰阶超声和二维剪切波弹性新技术作为输入端对图像数据进行训练,使用Let-Net-5 深度学习网络模型对肝纤维化进行二分类和三分类的不同分级预测,其中二分类最好结果可达91.8%。Xue 等[17]基于超声图像灰度和弹性模量相结合的迁移学习模型对肝纤维化进行分期预测,二者相结合对肝纤维化各分期(S4、≥ S3 和 ≥S2)的AUC 分别为0.950、0.932 和0.930,性能优于传统血清学检测。
赵万明[18]对321 名慢性乙型肝炎患者的超声图像进行分析,筛选了121个影像组学特征对肝纤维化分期进行预测,结果示模型对于早期纤维化的AUC 值可达0.88,证实基于迁移学习和影像组学的网络模型对肝纤维化具有较好的表征能力。除了对肝整体实质变化情况进行特征提取学习之外,有研究基于手动勾画高频超声图像肝包膜轮廓模型,对肝硬化进行早期预测[19]。Liu 等[20]进一步提出了区域肝包膜自动检测及特征分析的网络模型,最大AUC 值可达0.97。
3 人工智能辅助超声自动检测及识别肝内局灶性病变
肝局灶性病变在临床常见,不同病理类型的病变对应的超声图像具有不同的影像学特征。临床处理良性病变倾向于定期复查,而恶性病变需要尽早进行干预处理[21]。早期区分超声图像中肝局灶性病变性质的计算机辅助诊断主要基于灰度纹理,即对病灶内部和周边对比提取有意义的纹理特征进行分析。Virmani 等[22]提出基于支持向量机的小波纹理描述符用以区分正常肝、肝硬化及HCC 图像,其检测正常肝和肝硬化的总分类准确度为88.8%,检测HCC 病变的敏感度为86.6%。此外,原发性肝细胞肝癌和肝转移癌的二分类输出模型,囊肿、血管瘤和恶性肿瘤的三分类输出模型,以及囊肿、血管瘤、肝细胞肝癌、转移性癌和正常肝组织的五分类输出模型,均有尝试[23-26]。
深度学习基于大量人工神经元网络分层,对图像数据进行自动学习和特征提取,因其卓越的性能,近年来被广泛应用。Schmauch 等[27]使用了50 层残差神经网络的深度学习算法,对367 张肝局灶性病变的图像进行良恶性分类,平均AUC 值约0.935,区分病变的AUC 值约0.916。Xi 等[28]基于596例超声数据建立的残差网络模型,在病变模型的综合测试精度为0.84,与两名超声医生判定结果相当。一项多中心研究基于2 143例患者的24 343 张二维超声图像数据,建立了用于肝局灶性病变良恶性预测的深度卷积网络模型,其AUC 值可达0.924,模型诊断准确性与超声造影和增强CT 相当,稍逊于增强MRI[29]。目前多种深度学习模型对肝占位性病变良恶性二分类预测的效能不错,但尚无与病理学相关的更为详细的分类预测,而病变的不同病理类型往往对应着不同的治疗方案和策略选择。因此,期待在未来出现更为精细的预测模型。
有研究针对超声引导下微波消融肝损伤范围界定问题,利用猪肝消融区域的1 640个反向散射射频信号建立卷积神经网络,提出的两种模型在监测热损伤方面的AUC 均高于0.85,优于单纯二维超声图像,且模型评估的消融区域与大体病理图像有很好的相关性[30]。
4 结语
大部分肝病已经纳入人工智能辅助诊断领域,为临床诊断工作提供了便利。但超声与人工智能融合发展仍存在一些问题:1)超声是应用高频率声波作为信息载体,提供图像灰度信息供操作者进行疾病诊断参考的影像学手段。因其物理学特点,超声图像时有各种伪像存在,包括高斑点噪声、低对比度、模糊边界、低信噪比和强度不均匀性等,限制了图像质量[31]。2)与具有标准化切面及扫面间隔的CT/MRI 等成像方式相比,超声图像获取高度依赖于操作者,不同操作者间一致性稍差,不同机器、不同调节模式(如2D 增益、机械指数、时间补偿增益等) 的成像结果差异,对于高度依赖输入图像质量的人工智能模型来说具有较高挑战性。3)目前大多研究均基于单中心数据样本进行建模分析,其模型应用的普适性有待进一步提高。
目前,人工智能辅助超声病变图像识别及分类尚处于起步阶段,其效能还有待验证。临床信息、病史数据的输入有望与单纯图像信息相互补充,提高模型预测诊断准确率。总之,人工智能与超声诊断相互融合,对于减轻临床医生烦杂的工作量、促进规范化的临床诊疗、提高观察者一致性具有十分重要的意义。