人工智能在医学影像CAD中的应用
2019-03-19潘亚玲王晗琦
潘亚玲 王晗琦 陆 勇*
“人工智能”(artificial intelligence,AI)术语在1956年达特茅斯学院研讨会上首次被提出并采用[1],其通过模拟人脑的逻辑思维、学习记忆及推理过程,旨在制造一种辅以最简化人工操控就能以人脑类似的方式进行思考和反应的智能系统[2]。深度学习(deep learning,DL)是当前最具应用前景的机器学习(machine learning,ML)算法,是革新AI+医学影像即计算机辅助诊断 (computer aided diagnosis,CAD)的关键技术。本文拟介绍一些基本的ML方法和算法,并对基于DL的CAD研究进展予以综述。
1 ML
ML是AI的子集,能够凭借经验学习识别和预测新数据,分为有监督学习、无监督学习及强化学习三类[3]。有监督学习用带标记的数据训练模型,适于分类、回归问题,但所需训练数据多,人工添加标记耗时长且费用高。无监督学习不必人工标记训练数据,训练期间无指导分类正误的反馈信号且不知数据将被归为哪几类,是一种更贴近人脑学习的ML。强化学习介于两者之间,不直接反馈正误信号而是给予奖惩措施,反复训练模型,动态调整参数,直到分类准确度最大化为止。传统的ML算法如支持向量机、人工神经网络、贝叶斯网络、决策树、K-最近邻、自适应增强、随机森林、模糊逻辑及聚类等[4],均依靠人工经验浅层提取简单特征如线条、颜色等。DL规避了传统学习算法对人工定义、提取特征的依赖,自动提取立体、抽象的深层特征,实现端到端的特征学习[5]。DL神经网络是一种含多个隐含层的人工神经网络[6],隐含层节点数过多,训练时间延长,泛化能力降低。当各类别训练数据不平衡时,预测结果会偏向样本量多的类别,出现过拟合问题[3]。扩充数据量、选择适当隐含层节点数、减小模型复杂度、降维、权值衰减及数据增强有利于避免过拟合[7]。卷积神经网络(convolutional neural network,CNN)是一种特殊的深度神经网络,由卷积层、池化层、全连接层构成,卷积层稀疏化局部连接和权值共享大幅度减少参数数量,而池化层下调对输入值扰动的敏感性,提升模型的鲁棒性[8]。根据CNN各层的层数和性质,将其分为不同的网络拓扑结构。近年来,迁移学习(transfer learning,TL)冲破训练数据量对ML的长期禁锢,实现自然图像与医学图像模型间及同成像技术不同疾病或同疾病不同成像技术模型间权重参数的转移[9-10]。TL不是从零开始训练网络,而是以前馈方式修正被其他数据训练过的模型的低网络层权重,再用现有数据训练调整高网络层权重[9]。结合TL训练CNN可以缩短训练时间,降低对数据量和处理器的要求,提高诊断准确性[10]。
2 CAD
数以万计的影像数据为AI在医学影像中的发展创造了良好条件。为提升影像诊断的准确性和时效性,减轻医生高负荷工作强度,避免误诊晚诊对病人造成不良临床结局,CAD应运而生。截至目前针对不同疾病国内外开发了各种成像技术的CAD,主要涉及肺、乳腺、心脏、颅脑、肝脏、前列腺、骨骼等部位。
2.1 肺多数关于肺CAD的研究是对胸部X线和CT上的肺结节和肺间质性病变进行检测。由于肺纹理、肋骨及锁骨对病灶的遮挡,应用胸部X线CAD时易漏诊肺小结节,故消除骨性结构干扰能够增加肺结节检出数量。Yang等[11]使用拓扑结构为CamsNet的级联结构深度CNN抑制骨组织,在约0.194 mm像素大小的胸片上平均骨抑制率达83.8%,能够生成高质量、高分辨率的胸部软组织影像。与X线不同,CT有良好的密度分辨力及消除解剖结构重叠的断层作用,可清晰显示病灶及其毗邻结构,但断层影像内肺小结节与血管断面的形态特征和灰度分布相似,故利用CAD鉴别两者,滤除假阳性结节,是优化CT对肺结节CAD的关键[12]。近年来,CNN在肺非实性结节检测上有突破性进展。Ciompi等[13]提出的多流多尺度CNN对肺部结节(实性结节、非实性结节、部分实性结节、钙化结节、叶间裂周围结节、分叶状结节)CT预测结果和医生诊断结果的一致性,与2名医生间诊断结果的一致性相近;尺度为3的CNN和医生识别各类型肺结节的平均准确度为69.6%,而2名医生识别各类型肺结节的平均准确度为72.9%,此研究发现适度增大CNN尺度有利于分辨不同类型的肺结节和血管断面。除肺结节外,针对肺间质性病变的CAD也是目前的研究热点。Anthimopoulos等[7]设计的基于CNN的CT肺间质性病变CAD,将肺间质影像表现分为正常、磨玻璃影、微小结节、实变影、网格影、蜂窝状影、磨玻璃网格影,平均分类准确度为85.61%,但CNN易混淆网格影、蜂窝状影及磨玻璃网格影,尚不能良好分辨纹理特征类似的肺间质性病变。Christodoulidis等[10]尝试借助多源迁移学习方法训练CNN,将各数据源训练的不同CNN的权重参数汇成一个权重参数集,再训练集合各权重参数的CNN,使CNN分类肺间质性病变的平均准确率提升2%。Shin等[14]发现留一法交叉验证能显著提高拓扑结构为AlexNet-TL和GoogLeNet-TL的CNN对正常、肺气肿、磨玻璃影、纤维化、微小结节等肺间质性病变的分类准确度,与五折交叉验证相比,留一法将AlexNet-TL和GoogLeNet-TL分类准确度分别由0.46、0.57提升至0.867、0.902,但其计算量也大幅度增加。
2.2 乳腺自2008年开始,美国医保人群中约74%的钼靶影像采用了传统乳腺钼靶CAD系统。Lehman等[15]报道107名医生在使用传统CAD前后对乳腺癌检出的敏感度和特异度均无显著性差异,表明乳腺癌高危人群未能从传统乳腺钼靶CAD中获益。近年来,基于CNN的乳腺钼靶CAD在致密型乳腺中检出乳腺癌的准确度有所提升。Al-Masni等[16]研发的乳腺钼靶CAD通过深度CNN提取病灶特征,全连接神经网络预测病灶良恶性,其判断乳腺肿块位置和良恶性的准确度分别为99.7%和97%,对胸肌附近及腺体高密度区域的肿块检出有独特优势。乳腺结构类型和腺体密度影响CAD对乳腺病变的检出,与欧美女性不同,我国女性以小乳房、致密型乳腺为主,因此有必要建立我国女性的标准乳腺钼靶数据库,研发适合中国女性的乳腺钼靶CAD。当缺乏乳腺钼靶标记数据时,结合迁移学习能够取得较好的分类效果。Chougrad等[17]发现ImageNet预训练赋值的CNN分类乳腺肿块的准确度明显高于随机初始化赋值的CNN。除乳腺肿块外,DL可用于钼靶乳腺动脉钙化检测,评估冠心病发病风险[18]。CNN有助于解决动态增强MRI上乳腺脂肪和纤维腺体组织的分割问题。Dalm等[19]用拓扑结构为3CU-net的CNN分割乳腺脂肪、纤维腺体及非乳腺组织的平均Dice系数为0.933,基于3C U-net与手动分割结果测量的乳腺密度相关性为0.974,表明3CU-net可以较好地分割MRI乳腺纤维腺体,有利于乳腺密度评估和乳腺纤维腺体类型判断。
2.3 心脏 心脏MRICAD研究主要是自动分割左心室以测量左室容积、射血分数、室壁厚度等指标[3]。心脏运动伪影、心室腔信号不均、心尖影像分辨力低、心腔信号和形状具有个体差异使得精准分割左心室较难。Avendi等[20]联合CNN与形变模型在MRI左室短轴切面自动分割左心室,CNN检测定位左室腔,栈式自编码器勾画左室形状,以左心室形状参数为形变模型初始化值,有效抑制轮廓回缩和边界泄露,分割左心室的Dice系数为0.94。心脏超声CAD研究包括超声心动图标准观察切面自动识别、切面组织结构定位及分割。标准观察切面自动识别是心脏超声CAD评测心脏结构和功能的基础。Madani等[21]使用不同型号超声设备采集的超声心动图训练的CNN,识别12个二维标准观察切面和各1个M型、脉冲多普勒及连续多普勒标准观察切面的平均准确度为98%,显示CNN能够较准确地识别多个超声心动图标准观察切面。
2.4 颅脑 颅脑CAD研究主要包括MRI用于神经胶质瘤的分级、阿尔茨海默病(Alzheimer’s disease,AD)与轻度认知障碍的鉴别、精神分裂症的诊断。低、高级别神经胶质瘤的治疗方案和临床预后不同,有效鉴别两者对临床决策制定有重要价值。脑胶质瘤的形态多变,瘤周水肿和肿瘤占位效应易致邻近组织结构移位扭曲,造成定位分割脑胶质瘤的难度增高。Pereira等[22]使用CNN分割脑胶质瘤,通过多位点采样数据增强,3×3小卷积核减少权重数量,分割瘤体+瘤周水肿、瘤体、瘤强化区的Dice系数分别为0.88、0.83、0.77,并发现CNN对识别分割周围结构移位扭曲的脑胶质瘤有优势。Hsieh等[23]发现通过增强T1WI识别胶质瘤时结合局部和全局影像特征,可以提高CAD对胶质瘤分级的准确率。多数研究通过量化MRI各脑区皮质厚度、容积、形状来开发AD的CAD[24]。FDG-PET能显示静息状态下特定脑区葡萄糖代谢水平,从而揭示AD的特异性改变,将MRI和FDG-PET影像特征相结合,有利于增加CAD对AD检测的敏感度。Lu等[24]联合T1WI和FDG-PET训练的多模态多尺度深度神经网络识别1~3年内与3年进展为AD的轻度认知障碍病人的准确度分别为86.4%、82.4%,其识别临床疑诊为AD病人的敏感度为94.23%,识别非痴呆人群的特异度为86.3%。精神分裂症与广泛的脑功能连接障碍有关,CAD通过分析功能MRI脑功能连接的变化诊断精神分裂症。Zeng等[25]报道的稀疏约束深度判别式自编码网络能够发现精神分裂症病人的皮质-纹状体-小脑回路调节异常,识别高维神经影像上的微小隐藏图案,跨多个独立影像位点预测精神分裂症。
2.5 肝脏 肝脏CAD研究主要是基于动态增强CT和MRI分类肝脏肿块,诊断肝细胞癌。Yasaka等[26]将肝脏肿块分为A-E 5类:A典型肝癌;B除典型和早期肝癌外的恶性肿瘤;C不确定性肿块或肿块样病变包括早期肝癌和增生结节及除血管瘤和囊肿外的肝良性肿块;D肝血管瘤;E囊肿。CNN由6个卷积层、3个最大池化层及3个全连接层构成,三相(平扫+动脉+延迟期)CNN、双相(动脉+延迟期)CNN、平扫相CNN、动脉相CNN、延迟相CNN鉴别A-B与C-E类肿块的受试者操作特征曲线下面积(AUC)分别为 0.92、0.88、0.61、0.78、0.81,三相 CT影像训练的CNN识别准确度明显高于单、双相CT影像训练的CNN,三相CNN检测5类肿块的敏感度分别为71%、33%、94%、90%、100%,显示 CNN检测肝囊肿、肝血管瘤的敏感度高,对其他类型肿块的检测敏感度相对较低。Kim等[27]参照肝脏影像报告及数据系统设计的CAD可以分割识别动态增强MRI上的肝脏肿块,测量肿块大小,判断肿块有无包膜和廓清表现,CAD与医生对76%~83%肝脏肿块的诊断结果一致,而医生对78%的肝脏肿块诊断结果一致,CAD与医生对肝细胞癌风险评估有较好的一致性。
2.6 前列腺 MRI是前列腺癌特异性抗体升高病人术前诊断和评估的常规检查方法。T2WI、扩散加权成像(DWI)、动态增强(DCE)MRI是前列腺癌多参数 MRI (multiple parameters MRI,mp-MRI)CAD研究的主要序列,少数研究同时加用磁共振波谱(MRS)和扩散张量成像(DTI)序列[28]。 目前商用的前列腺癌mp-MRICAD的诊断效能较低。经临床评估发现,近期商用的前列腺癌C AD(W atson ElementaryTM)[29]检测前列腺癌的敏感度为46.81%,特异度为75.44%,MRI设备和成像配置会影响CAD对前列腺癌的检出。当病灶直径≥10 mm或Gleason积分>6,医生使用mp-MRICAD后,对前列腺癌诊断的敏感度增高而特异度差异无统计学意义[28]。ImageNet预训练的深度CNN在T2WI横断面上识别前列腺癌、前列腺炎和良性前列腺增生的准确度明显高于基于尺度不变特征变换和词袋模型的CAD[4]。
2.7 骨骼 骨骼CAD研究主要涉及膝关节骨性关节炎和脊柱关节炎诊断、脊柱椎体定位排序、骨龄预测及骨肉瘤自动分割。Tiulpin等[30]报道的基于膝关节X线的深度连体CNN识别膝关节骨性关节炎的AUC为0.93,其根据Kellgren-Lawrence分级提供反映膝关节骨性关节炎严重程度的示意图,间接指出DL的分类依据,初步解释了DL过程。Griffith等[31]发现与肉眼评估相比,CAD能够定量分析强直性脊柱炎活动期MRI椎体骨髓水肿和强化信号,有利于识别脊柱关节炎活动期和评估炎症反应程度。Forsberg等[6]利用DL方法在T1WI、T2WI正中矢状面上自动检测和标记排序颈腰椎椎体的平均准确度为99.6%~100%和96.0%~97.0%,标记排序出错的椎体多为第一骶椎和正中矢状面显示不完整的椎体,DL自动标记排序椎体的准确度较高,有望帮助医生对椎体病变快速定位。青少年骨龄自动预测是骨肌CAD研究最热门的方向。Lee等[5]运用LeNet-5和ImageNet预训练的GoogLeNet TL网络实现骨龄全自动化预测和自动结构化骨龄报告生成,预测5~18岁女性和男性骨龄的准确度分别为57.32%、61.40%,与G-P图谱法人工阅片的兴趣区相比,提供的注意图显示青春期前CNN预测骨龄的识别部位主要在腕部和指骨中远端,青春期多位于指骨,青春期后则在腕部。近来,关于CT影像骨肉瘤自动分割有了新进展。Huang等[32]提出的多监督全卷积神经网络骨肉瘤分割算法,采用多个特征通道上采样,提取影像局部和全局特征,在CNN内加入有监督的边输出层指导网络学习多尺度特征,其分割CT骨肉瘤的Dice系数和敏感度分别为87.80%、86.88%,分割效果优于U-net、全卷积网络、整体嵌套边缘检测,且对混合型骨肉瘤分割有一定优势。
3 病理学
病理学的DL研究包括有丝分裂检测和计数、个体细胞识别和分割、胶质瘤分级、上皮和基质分割、原发性乳腺癌检测、前列腺癌诊断等[33]。近来,DL在乳腺癌前哨淋巴结转移检测方面取得了突破性进展。Ehteshami等[34]模拟临床病理切片诊断过程,将32种乳腺癌前哨淋巴结转移检测DL算法与病理医生诊断结果比较,有5种DL算法和无阅片时间限制的病理医生检测前哨淋巴结转移的AUC分别为0.960、0.966,差异无统计学意义;GoogLeNet(研究代码为HMS和MITⅡ)检测前哨淋巴结转移的准确度显著高于11名限定于2 h内完成阅片的病理医生,前者AUC为0.994,后者最高为0.884,其在乳腺癌前哨淋巴结转移检测任务中表现突出。尽管DL方法对前哨淋巴结微转移和宏转移的检出率高,但对孤立乳腺癌细胞的识别率低[33]。Litjens等[33]使用全卷积神经网络CAD在没有漏诊前哨淋巴结转移的情况下,成功筛除了44%的阴性切片,基于CNN的数字化病理切片CAD有望在人工判读之前,正确排除阴性切片,减少医生阅片数量。
4 小结与展望
多数研究致力于通过DL方法不断提升CAD对单脏器特定病变识别和分类的准确度。部分研究报道基于DL的CAD对单脏器特定病变的诊断准确度不低于甚至高于人工阅片[13,30,34]。临床上影像医生对首诊病人要描述(包括定位、定性)其扫描所见范围内所有脏器和组织的全部异常表现,对确诊的恶性疾病病人要观察其邻近组织和脏器受累情况从而确定疾病临床分期,因此针对单脏器特定病变的CAD与实际影像诊断要求存在出入。为实现AI研究成果临床转化,CAD研究应逐步向多脏器全病种CAD方向过渡。DL特别是CNN在图像识别和分类方面蕴藏巨大潜力[34]。DL的泛化学习能力可能会加速多脏器全病种不同成像模式CAD的发展,有望帮助影像医生精确快速地诊断疾病和自动生成结构化影像报告。不断克服过拟合问题,建立高质量标注的影像数据库,丰富DL理论,攻克DL建模难题,破解DL黑箱之谜,努力推动AI向前发展[8]。相信在不久的将来,AI必将改变现有影像诊断模式,可与影像医生共同携手迈向精准影像诊断时代。