基于人工智能的乳腺影像诊断综述
2020-07-23郑元杰宋景琦
郑元杰 宋景琦
( 山东师范大学信息科学与工程学院,250358,济南 )
1 引 言
乳腺癌属于最常见的癌症种类,在女性癌症死亡率中占比最大.2018年,全球癌症统计[1]公布的数据显示,全球乳腺癌的发病率为11.6%,是女性最常罹患的癌症,占癌症相关死亡的6.6%.研究发现,科技进步尚未显著降低乳腺癌患者的发病率,但是,对患者进行早期的检查可以显著降低乳腺癌患者的死亡率[2].基于影像学的乳腺癌临床检查方法有很多,常用的方法包括乳腺超声、核磁共振(Magnetic Resonance Imaging, MRI)、乳腺钼靶摄影(钼靶)、对比增强能谱乳腺摄影(Contrast-Enhanced Spectral Mammography, CESM)等.因此,医院每年都会产生大量不同模式的乳腺癌影像,然而影像的读取和判别会耗费大量的人力.近年来人工智能技术在图像处理方面取得了巨大的发展,许多学者将其应用到医学影像方面,以此来给医生的诊断提供帮助,基于人工智能的医学影像分析技术正在改变医疗诊断的格局[3].
2 乳腺癌诊断常用的影像学方法
乳腺癌检查方式的不同得到的影像也大不相同,可以得到的信息也不同,不同的成像方式也各有优劣.乳腺超声的成像原理是人体不同器官和组织的声阻抗和衰减特性不同,当超声射入人体内,机器根据接收的回声强弱显示人体器官的超声图像[4].超声检查的操作比较简单,可以方便地从4个象限得到乳房的影像.并且这种方法经济实惠、无辐射、无损伤,在乳腺癌普查中有广泛的应用.但是超声检查的敏感性不高,很难检测出乳腺里的微钙化点.核磁共振的原理是利用电磁波穿过人体,电磁波与组织中的质子相互作用产生信号,经过后续处理得到组织的位置和种类,据此原理检测设备能够绘制出物体内部的结构图像[5].核磁共振有较高的敏感性和准确性,对乳腺癌的分期和术后追踪有较大意义,但是其价格比较昂贵.乳腺钼靶摄影的影像采集相对简单,对早期乳腺癌的微钙化点的成像比较清晰,是临床上首选的检查方法之一[6].然而需要用X射线对患者进行照射,所以这种检查方法具有辐射性.并且钼靶影像对于腺体丰富的乳腺的检测准确性不高.CESM利用碘的K边缘效应,通过注射碘造影剂消除组织对肿瘤的遮盖,实现对病灶的显示[7].CESM能得到多幅乳腺的图像,具有较高的敏感性和特异性,是一种具有良好应用前景的技术[8].然而病人在进行CESM检查前,需要注射造影剂,如果患者对造影剂过敏,则不能进行CESM检查.此外CESM也对患者有一定的辐射.以上各种检查方法各有利弊,所以临床上经常结合多种影像来对乳腺癌进行确诊.图1是常用的几种乳腺癌检测方式得到的影像图,可以看出不同的成像方式得到的图像存在很大差异.
(a) 乳腺钼靶摄影;(b) 乳腺超声影像;(c) 乳腺MRI;(d) 乳腺CESM图1 乳腺癌检测的常用影像
3 人工智能介绍
1955年,“人工智能”这个词被约翰麦卡锡定义为“制造智能机器的科学和工程”[9].人工智能(Artificial Intelligence,AI)作为计算机科学的一个分支,是对人的意识、思考过程和处理问题的模拟,以完成传统上与人类智能相关的任务,如学习和解决问题的能力[10].它是许多不同训练技术的总称,主要包括机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)[11].人工智能致力于设计计算机程序,分析数据中有用的信息,对数据进行深入挖掘,采用回归、分类等数据操作,对现有数据进行解释和对未知数据进行预测.目前人工智能技术已在计算机视觉、自然语言处理、视觉内容识别、医学辅助诊断等方面取得了突破性的进展.
3.1机器学习机器学习(Machine Learning, ML)是人工智能的一个分支,机器通过训练学习,从数据中提取描述数据的最佳特征,建立对未知数据进行处理的模型[12].ML按照模型的功能分类可以分为预测性模型和解释性模型,其中预测性模型是指学习数据中的规律,利用这个规律对未知数据进行判断;解释性模型是指提取数据中的特征并对其分析,寻找其中的规律,帮助人理解模型.按照训练方法分类,ML可以分为:监督学习、无监督学习和强化学习.监督学习是利用人为标记好的数据并根据基础数据训练模型,最终输出预测或分类的结果;无监督学习算法,根据无标记的训练样本,解决模式识别中的各种问题;而强化学习算法,是在简单的奖励反馈的基础上达到回报最大化或实现特定目标[13].在监督学习方法中,人工神经网络(Artificial Neural Network, ANN)、支持向量机(Support Vector Machine, SVM)和随机森林(Random Forest, RF)是最常用的方法[14, 15].最典型的无监督算法就是聚类,如K-均值算法(K-Means)、主成分分析(Principal Component Analysis, PCA)、矩阵分解(Singular Value Decomposition)等.成熟的ML算法有很多,解释性比较好的模型一般在预测效果上不是很好(例如线性回归),而预测性比较强的模型解释性又比较差(例如神经网络).目前,计算机还远远没有达到与人一样的学习能力,但在一些实际的应用中ML己经取得了很好的效果,并超过了人类的能力.人们也在不断地丰富ML理论,并在实际应用中使用ML完成不同的任务.其中,ML在医学图像领域的研究己经取得了不错的成果,如计算机能够自动检测医学图像中的病灶、自动将病变区域的肿瘤分割出来、通过分析肿瘤的特征将肿瘤进行分类等.
3.2深度学习深度学习是ML的一个子集,而ML又是人工智能的一个领域,它使计算机能够在不经过硬编程的情况下,使用大数据集来学习和检测数据[16].Hinton等人在2006年《Science》上的文章中提出深度学习的概念,他指出可以用逐层训练的方式来解决深度网络训练困难的问题[17].卷积神经网络 ( Convolutional Neural Network, CNN) 是深度学习中最成功的网络结构,尤其是在图像处理方面取得了巨大成功.基于深度学习的网络中常用的层是输入层、卷积层、池化层、全连接层、输出层等.
输入层将输入数据馈送至卷积层,可以合并一些转换,如特征缩放和数据增强等[18].卷积层又叫特征提取层[19],是卷积神经网络的核心,主要完成特征提取任务,表现为利用可训练的二维卷积滤波器和偏差参数计算输入特征映射的卷积结果.每个滤波器组在输入图像上的每个位置检测一个特定的特征[20].卷积操作主要模拟的是人的大脑识别图像的过程,我们在看到图像时,并不是对整幅图像同时识别,而是首先对于图像中的局部特征进行感知,然后对局部进行综合考虑,从而得到全局信息.卷积核在输入图像上不断移动并进行卷积操作,从而得到特征图.特征图上每个位置的值对应于卷积核在输入图像上的相应局部特征[21].每一个卷积层都包含多个卷积核,通过卷积操作就可以得到图像的多种不同特征图.虽然这样能够得到许多不同的特征,但是这也使得通过卷积层后参数量急剧增加.为了简化网络参数,降低数据的维度,在卷积层后面加入了池化层.池化层主要是对输入的数据执行下采样操作,从而得到一个低分辨率的输出特征映射,这能够使它对上一层特征位置的微小变化具有鲁棒性,因此能够改善网络性能.常见的池化方法包括最大池化、平均池化等.全连接层是相邻两层的每个神经元之间都完全连接的一种结构,这一层一般位于池化层和输出层之间.分类输出层是一个分类器,经过全连接层的特征会传入输出层,最终通过输出层输出分类结果或者概率,常用的分类器有soft-max和SVM等.当预测结果和真实值之间产生误差(即预测误差)时,在输出层利用损失函数(代价函数)来计算预测误差,用来衡量预测值和真实值之间的差距,通过多次迭代来减小误差,提高预测精度和分类效果.
4 人工智能在乳腺癌影像分类中的应用
人工智能在自然图像分类处理中有较好的结果,医学影像分析中也有许多分类的需求,因此将人工智能应用在医学影像分类中也是一个研究的热点.人工智能在乳腺影像分类方面涉及的影像包括超声影像、MRI影像、乳腺钼靶影像、CESM等.
4.1人工智能在乳腺超声影像中的应用乳腺超声影像具有安全、便携及低成本等特点,因此成为乳腺癌检查中的一种应用非常普遍的手段.基于人工智能的乳腺超声影像的分类技术也越来越多地应用在临床诊断中,该技术作为辅助手段,在乳腺癌筛查和检测中具有重要意义,不仅可以为放射科医生节省时间,而且可以弥补其一些经验和技能的不足.
4.1.1 机器学习在乳腺超声影像中的应用 在早期的超声检查中利用的是模拟信号,当获得超声影像时,需要将模拟信号先转化为数字信号.Chen等人[22]手动选择数字化超声影像上可疑的肿瘤区域,然后提取图像的纹理信息,利用具有自相关特征的神经网络分类器对肿瘤进行良恶性分类.他在文献[23]中还提出利用带有动量的误差反向传播算法,训练多层感知器神经网络对乳腺超声影像鉴别诊断.Chang等人[24]提出了一种高精度的超声计算机辅助诊断系统.该系统根据肿瘤周围斑点像素的纹理信息,利用SVM对乳腺肿瘤超声影像进行分类.同时实验也比较了散斑增强纹理特征、非散斑增强纹理特征和常规全像素纹理特征在乳腺超声诊断中的分类效果.结果表明,散斑现象虽被认为是超声影像中的噪声,但是可以作为一种有用的特征来指导计算机进行辅助诊断.文献[25]计算了病灶周围最小边界矩形区域的22种灰度共生矩阵的统计量,并在所有方向上将相同距离的纹理描述子进行平均以降低特征空间的维数,然后利用最小冗余最大相关性准则的互信息技术对特征空间进行排序,采用fisher线性判别分析方法对纹理特征的判别能力进行评估,迭代地将特征加入到分类过程中,直到所有特征都被考虑在内.文献[26]利用剪切变换能提供高维数据的稀疏表示,并且在不同的尺度上具有方向灵敏度的特点,提出了利用剪切变换提取纹理特征描述子的方法.为了客观地评价剪切特征的性能,还提取了基于曲线、轮廓线、小波和灰度共生矩阵的纹理特征描述子进行比较.然后将所有这些特征输入SVM和AdaBoost两个分类器,以评估算法分类的性能.Lin等人[27]开发了一个具有较强泛化能力的模糊小脑模型神经网络计算机辅助设计(Computer-Aided Design, CAD)系统.该系统是一个高性能的分类器,能够在超声影像上将乳腺结节分类为良性或者恶性.文献[28]提出了一种将相位一致性方法与局部二值模式相结合的面向局部纹理的特征描述子,然后利用SVM对超声影像中良性肿瘤和恶性肿瘤进行分类.文献[29]在多实例学习的框架下,提出了一种基于稀疏表示的乳腺超声影像分类方法.其算法在对图像进行增强和分割后,利用同心圆算法提取全局和局部特征,然后将超声影像的分类问题转化为基于稀疏表示的多实例问题,将稀疏和多实例学习问题进一步转化为用相关向量机求解的传统学习问题,与其他方法相比在分类精度上取得了明显的优势.
4.1.2 深度学习在乳腺超声影像中的应用 近几年,也出现了许多利用深度学习对超声影像进行分类的方法.深度学习方法的主要优点是减轻了设计具体特征和分类框架的负担,因为深度学习模型直接从数据中产生一组变换函数和图像特征.Cheng等人[30]利用叠加去噪自编码器具有较好的自动特征探测机制和抗噪声能力的特点,将其用于鉴别乳腺超声病变.这种自编码器能够处理各种成像方式下医学影像数据的固有噪声,所以取得了不错的效果.Han等人[31]将超声影像数据在GoogLeNet下进行训练,以区分良性肿瘤和恶性肿瘤.该方法虽然需要放射学家标记感兴趣的区域,但对良恶性病变的分类效果良好.Shin等人[32]提出了一种具有适当训练损失选择的联合弱监督和半监督训练方案.该方法以混合的方式使用弱注释数据集和较小的强注释数据集来克服过度拟合的情况.实验结果表明,该算法能以较少的标注工作量对乳腺超声影像进行定位和分类.在文献[33]中,作者为了进一步提高深度多项式网络的分类性能,提出了一种叠加深度多项式网络算法,并将该网络算法应用于乳腺超声数据集和前列腺超声弹性成像数据集的肿瘤分类任务中,并取得了不错的效果.文献[34]利用预处理的深层卷积网络从预先标注的感兴趣区域中提取特征,并用于训练SVM分类器来区分非恶性病变与恶性病变以及良性与恶性病变,经实验证实,利用CNN提取的特征进行训练的分类器与人工设计的特征进行训练的分类器分类效果相当.文献[35]利用一个用于工业图像分析的通用深度学习软件对乳腺超声影像进行分类,并将其性能与具有不同乳腺成像经验的医生进行了比较.结果表明,该软件可以在乳腺超声图像中诊断乳腺癌,其精度可与人类读者相媲美,速度也能达到实时分析.
4.2人工智能在乳腺核磁共振中的应用乳腺核磁共振是另一种临床上常用的用于检测乳腺病变的成像方法,可在乳腺超声的检查结果不确定时作为辅助手段给医生提供参考信息.乳腺MRI能通过图像处理和运动校正技术来自动增强乳腺影像,因此在乳腺癌检测中得到了广泛的应用.今天在全世界范围内人工智能已经渐渐渗透到医学界,放射学家已经或即将直接参与人工智能的使用[36].
4.2.1 机器学习在乳腺核磁共振中的应用 研究人员利用机器学习来处理乳腺MRI数据方面取得了许多成果,这些方法在不同程度上都能提高乳腺癌诊断的准确性.在文献[37]中,Nie K等人探讨了利用乳腺病变的定量形态学特征进行诊断预测的可行性,探究了磁共振成像中计算机化特征与病变表型的相关性.该方法从自动病灶分割、定量特征提取、人工神经网络诊断特征选择、病灶分类等方面对43例恶性病变和28例良性病变进行了系统的研究,获取病灶的8个形态学参数和10个灰度共生矩阵纹理特征并对所选特征进行良恶性鉴别诊断.Newell D等人[38]采用ANN建立诊断模型,对乳腺病变的形态学特征和增强动力学参数进行定量分析,来区分良恶性肿瘤.该方法对每个肿块获得8个形状边缘参数和10个增强纹理特征,而对于表现为非肿块样强化的病变,只获得纹理参数,其结果表明定量诊断特征可用于乳腺肿块的计算机辅助诊断.Yuan Y等人[39]构建了由钼靶影像和MRI影像组成的多模态数据集,手动标记钼靶影像的种子点或MRI影像上的感兴趣区域,然后用计算机自动分割肿块并提取病变特征.采用线性逐步特征选择的方法选择特征子集,用贝叶斯人工神经网络进行融合,得到恶性概率的估计值,结果表明钼靶影像和MRI影像组成的多模态特征的方案在鉴别恶性和良性病变方面优于单模态的方法.Shannon C等人在文献[40]中定义了一种能够捕捉乳腺病变纹理时空变化的新的MRI特征描述子,并将之称为纹理动力学特征,以区分良恶性病变.作者通过对乳腺MRI影像的研究,定性和定量地证明了纹理动力学特征在鉴别良、恶性病变方面优于信号强度、动力学和病变形态特征.用概率增强树、SVM等分类器进行分类的效果显示使用纹理动力学特征能够得到不错的分类效果.文献[41]采用基于运动学和面积结合的区域生长方法对肿瘤区域进行了自动分割,并利用模糊C均值聚类法对分割区内初始增强较大的时间信号曲线进行识别,最后将Tofts药代动力学模型的参数与常规曲线分析进行了比较,结果显示基于模糊C均值聚类的特征动力学曲线模型分析提供了有效的乳腺肿瘤分类方法.文献[42]利用Minkowski泛函的拓扑特征向量对乳腺动态MRI的病变进行动态表征,然后将这些特征向量与样本外扩展技术相结合,采用不同的线性和非线性算法进行降维,最后通过监督学习和支持向量回归对小病灶进行分类.文献[43]利用DEMONS变形算法确定乳腺区域,然后利用动力学特征和模糊C均值聚类方法对MRI影像的可疑组织进行识别,根据旋转不变和多尺度BLOB特征对所有乳腺肿瘤进行检测,最后对肿瘤进行分类.文献[44]通过将动力学和曲线下面积颜色图相交生成的综合颜色图用于检测潜在的乳腺病变,并应用区域生长算法对肿瘤进行分割,采用改进的模糊C均值聚类方法识别出最具代表性的分割肿瘤的动力学曲线,然后采用常规曲线分析或药代动力学模型对其进行表征.采用三维形态特征(紧密度、边缘和椭球拟合)和纹理特征(灰度共生矩阵)对病灶进行定性描述,结果表明结合三维乳腺MRI的运动学和形态学特征,是一种潜在的鉴别良恶性病变的有效和稳健的算法.文献[45]采用了一种由预处理步骤来识别胸壁线的气胸界面边界和曲线拟合的乳腺分割方法,然后利用Chan-Vese模型水平集分割方法对乳腺肿块进行分割,最后采用SVM分类器结合ReliefF特征选择,将提取的形态学特征和纹理特征融合到分类,取得了较好的分类结果.文献[46]将一种计算机辅助检测方法应用于乳腺区域的分割,并在每个MRI病例影像上显示可疑的肿瘤.文章计算了18个动力学特征,然后采用不同的特征组合对基于SVM的分类器进行了训练和优化,结果表明所提出的定量背景实质增强特征为MRI中乳腺肿瘤的动力学特征提供了有价值的补充信息,能够提高分类的准确性.文献[47]采用“多点智能开放”算法对病灶进行分割,并在病变分割的基础上计算出5个形态学特征.算法利用基于对比度增强曲线对每一个体素计算动态特征,同时除了自动选择较小的“最可疑区域”的平均值外,还计算整个分割区域的动态特征的平均值和标准差,使用RF算法对良恶性病变进行分类,并将该系统性能与现有方法进行了比较.文献[48]提出了一种将多种ML的技术集成来对乳腺MRI影像分类的方法.这些技术包括用于处理不平衡数据的欠采样技术、用于特征选择的Relief算法、用于提供数据多样性的子空间方法和用于提高分类器性能的Adaboost方法.文章使用手动分割感兴趣区域,并提取了各种形态、纹理和gabor特征,将形态学特征与各种纹理或gabor特征相结合,建立了特征子空间,经过在数据集测试表明文章提出的方法显著降低了假阳性分类率.文献[49]利用多参数正电子发射层析成像/磁共振成像强度的特征用于病变分割,提取形状特征、动力学和时空纹理特征,并将其输入RF分类器用于病变分类.
4.2.2 深度学习在乳腺核磁共振中的应用 随着深度学习技术的发展,许多研究者将深度学习应用到乳腺MRI的 CAD 系统中.卷积神经网络是一种常用的深度学习模型,文献[50]提出了一种基于人工鱼群优化(Artificial Fish Swarm Optimization, AFSO)算法训练的神经网络分类器.该分类器的基本思想是利用AFSO算法来搜索神经网络中突触权值的最佳组合,利用基于统计纹理特征的最优特征集对可疑病变进行分类,所得到的分类效果优于文中所列举的其他分类算法.文献[51]提出了一种将减影磁共振影像的最大强度投影包含进卷积神经网络来对病灶进行分类的方法.在三个MRI表现上选择每个病灶周围的感兴趣区域,利用预训练的VGGNet深度学习网络从感兴趣区域中提取CNN特征.在训练三个SVM分类器时,利用这些特征将病变分为恶性或良性,在统计显著性水平上取得了不错的效果.文献[52]使用深度学习方法来提取超快速动态增强MRI和T2加权信息,结合患者信息和扩散加权成像获得的表观扩散系数值,利用RF分类器进行最终的病变分类.文献[53]提出了一个三维CNN和一个多尺度的课程学习策略,该方法考虑整个乳腺图像而不是单个病变,在整个乳腺MRI上对肿瘤进行整体良恶性分类.文章提出的方法不依赖于肿瘤分割,这使得训练数据的标注比现有的目标检测方法更加有效.文献[54]提出了一种新的乳腺癌分类的深度混合方法.该方法首先通过一种硬性视觉注意算法自适应地从原始影像中选择一系列的粗区域,然后对每个粗区域进行基于软性注意机制的异常部位检测,然后建立一个递归网络来决定对图像区域进行分类,并预测下一步要研究的图像区域的位置.文献[55]提出了一种使用预先训练的卷积神经网络提取和汇集中低水平特征的方法,并将其与用传统CAD方法计算的手工绘制的放射特征融合.在评估病变恶性程度方面,这种基于融合的方法在三种临床成像模式(动态增强MRI、数字乳腺摄影和超声)的预测性能比以往的乳腺癌CAD方法有显著的改进.此外,该方法避免了图像预处理的需要,因此计算效率也比较高.
从以上回顾来看,研究人员利用人工智能的方法对乳腺MRI影像进行处理,以达到使用机器就能够对乳腺肿瘤的良恶性进行分类的目的.这些方法中主要以ML为主,并且已经有许多方法已经应用到实践中,深度学习方法由于在最近几年刚刚兴起,并且其解释性差,在临床上还没有得到广泛应用.
4.3人工智能在乳腺钼靶摄影中的应用乳腺钼靶摄影是最常用的乳腺癌的筛查手段,可协助医生及早发现乳腺癌,从而显著降低其死亡率.基于人工智能的乳腺钼靶诊断系统,可以为放射科医生的诊断提供参考性建议,对提高诊断的准确性和敏感性起到了尤为重要的作用.因此,人工智能在乳腺钼靶的应用与发展也成为研究的热点.
4.3.1 机器学习在乳腺钼靶摄影中的应用 乳腺钼靶影像是临床上检查乳腺癌时应用最普遍的一种图像,利用人工智能对乳腺钼靶影像的研究也非常广泛.例如,Azar A T r等人[56]将多层感知器、径向基函数和概率神经网络三种分类算法应用于乳腺癌的检测和分类.并且文章从灵敏度、特异性、准确性等方面对该结构的性能进行了评价.Aswini K M等人[57]提出了一种基于关联规则挖掘的数字化钼靶影像肿块分类方法,该方法提取统计纹理特征并利用关联规则挖掘感兴趣区域进行良恶性分类,实验表明该方法能提高分类的准确性和效率.有的学者[58]将小波变换作为纹理分析的一种多分辨率分析工具来提取钼靶影像的多分辨率分析特征,并采用多项式分类算法判断乳腺钼靶影像中的肿块是否异常.还有的文献[59]利用离散小波变换去除乳腺钼靶影像中的噪声后,从感兴趣区域中提取20个灰度共生矩阵特征作为分类算法的输入,并使用了七种不同的分类器来对肿瘤的良恶性分类.文献[60]则结合了离散小波变换算法和一种改进的灰度共生矩阵方法,用于分割乳腺影像并提取特征,并利用径向基函数神经网络将肿块分类为良、恶性.Azizi N等人[61]提出了一种基于遗传算法的钼靶影像分类方法,它将SVM分类结果作为适应度函数多目标函数的一部分,选择了最优的特征子集后,利用高斯核函数和SVM分类器对病变进行分类.文献[62]研究了一种新的用于乳腺肿块分类任务的特征选择方法.文章根据肿块形状、毛刺、对比度等特征计算了181幅图像特征,并采用基于序列前向浮点选择的特征选择方法来选择相关的特征,最后利用SVM模型对其分类性能进行了分析.在文献[63]的研究中,作者对一些经典特征(如高阶统计、离散小波变换和小波分解)进行统计观测,提出了一个基于新特征集的钼靶影像微钙化点侦测CAD系统,并采用离散小波变换进行预处理, t检验方法进行评价和特征约简,在敏感性方面取得不错的效果.文献[64]的方法是利用图像增强技术对乳腺钼靶影像进行预处理,然后提取包含肿块和正常乳腺组织的感兴趣区域,并利用序列前向选择和序列浮点前向选择来进行特征选择,最后采用K近邻分类器、线性判别分析、二次判别分析和SVM分类器进行分类,并对其进行检验.结果表明,该系统具有较好的灵敏度和特异性.文献[65]开发了一个基于多实例学习范式的乳腺癌分类系统.在提出的框架中,作者首先自适应地将钼靶影像分割成许多区域,然后从每个区域提取纹理特征,最后使用多实例学习算法从每个区域提取特征向量,以便将钼靶影像归类为正常、良性或癌症.文献[66]提出了一种乳腺钼靶影像肿块自动分割与分类的方法.该方法首先用链码提取感兴趣区域,然后用粗糙集方法增强感兴趣区域,之后用改进的矢量场卷积方法从感兴趣区域中分割肿块区域,并从肿块区域及其周围提取特征.这些特征被作为RF、SVM、遗传算法SVM、粒子群优化SVM和决策树分类器的输入来对钼靶影像中的肿块进行分类.文献[67]的分类方法是提取出钼靶影像中固定大小的感兴趣区域的图像块,手工提取图像块进行训练,通过聚类技术从高度密集的区域提取图像块进行测试.对于与钼靶影像相对应的所有提取的斑块,计算不同阶次的Zernike矩,并将其存储为特征向量.利用SVM对提取的感兴趣区域肿块进行分类.文献[68]将高斯混合模型与模糊逻辑系统相结合,提出了一种基于模糊高斯混合模型的计算机辅助诊断系统,并将其用于乳腺钼靶影像中的肿瘤分类.文章采用混淆矩阵分析法对所提出的模型进行了性能测试,结果表明,所提出的模糊高斯混合模型能提高乳腺癌影像诊断的准确性和可靠性.在文献[69]中,作者提出了一种新的计算机辅助技术,将基于切比雪夫矩和haralick灰度共生矩阵的局部纹理特征和基于gabor的纹理能量测度等全局特征进行融合,设计了一种SVM分类器对乳房钼靶影像中的肿块进行分类.文献[70]首次将时间序列分析应用于乳腺钼靶影像分类.该方法将动态时间规整作为相似性度量,将乳腺钼靶影像的感兴趣区域分为正常和异常两类.
4.3.2 深度学习在乳腺钼靶摄影中的应用 深度学习技术在钼靶摄影筛查方面已经有了较多研究成果,传统的机器学习方法没有深度网络,仅能提取浅层特征,而深度学习在钼靶摄影筛查的准确性方面中已经接近经验丰富的放射科医师的水平.在文献[71]中,作者提出了一种基于图的半监督学习的诊断系统.该系统包括四个模块:数据加权、特征选择、分割协同训练数据标注和CNN分类.CNN通常需要大量的标记数据进行训练和参数微调,而文章提出的方案只需要训练集中的小部分标记数据就得到了不错的分类效果.文献[72]设计了一个基于深度特征的乳腺肿块分类框架,该框架主要包括卷积神经网络和决策机制,将训练后的深度卷积神经网络从原始图像中自动提取强度信息和深度特征,并对基于不同特征的分类器结果进行联合分析,确定测试图像的类型.该方法借助于两种特征可视化方法,从不同层次提取的深层特征在分类性能和诊断仿真方面都取得了很好的效果.文献[73]采用了一种迁移学习策略,并证明了深度卷积神经网络和迁移学习策略在乳腺钼靶影像肿块检测中的可行性.该方法首先使用自然图像来训练深度卷积神经网络,然后修改深度卷积神经网络的最后一个全连接层,并使用乳腺钼靶影像的感兴趣区域对深度卷积神经网络进行训练,最后将其分为异常和正常两类.文献[74]提出了一个基于最成功的目标检测框架之一的计算机辅助诊断系统,即更快的R-CNN.该系统不需要任何人为干预就能实现检测和分类乳腺钼靶影像中的恶性或良性病变.文献[75]提出了一种基于区域深度学习技术的新型计算机辅助诊断系统.该系统可以在一个框架内同时处理检测和分类问题,主要包括乳腺钼靶影像预处理、深度卷积网络特征提取、带置信度的肿块检测和完全连接神经网络的肿块分类四个主要阶段.通过五次交叉验证试验表明,该系统无论是在检测肿块位置的精度上还是在区分良、恶性病变的准确性上都取得了不错的效果.文献[76]提出了一种对乳腺钼靶影像进行分类的多尺度卷积神经网络训练的课程学习策略.文章首先训练基于CNN的图像块分类器,对乳腺钼靶影像中病变的分割掩膜进行分类,然后利用所学的特征初始化一个基于扫描的模型,该模型对整个图像进行决策,并对结果数据进行端到端的训练.文献[77]将钼靶影像分类问题分解为三个阶段:肿块检测、肿块分割和肿块分类.对于检测,作者提出了一系列的深度学习方法来选择基于贝叶斯优化的假设.对于分割,文章使用深度结构化输出学习,然后通过水平集方法进行细化.最后,在分类方面,文章提出了一种深度学习分类器,该分类器通过对手工绘制的特征值进行回归训练,并根据乳腺肿块分类数据集的注释进行精细调整.在对恶性或良性肿块进行整体分类上,该方法的敏感性和特异性的结果都不错.文献[78]提出了一种在单一预测中考虑了轴位和侧斜位中的影像,并且可以预测四种输入大小的乳腺钼靶影像的卷积神经网络来分类乳腺癌的方法.该模型根据患者而不是图像来分割数据,经试验证明,其诊断准确率高于医学专家.文献[79]的方法是先对乳腺影像进行数据增强,并对预训练的ResNet50卷积神经网络进行了改进以生成病变区域,然后进行假阳性约简和轮廓细化,同时对预先训练的VGG16网络进行微调,以对乳腺钼靶影像进行分类.从以上来看,人工智能在钼靶图像的应用比较广泛,无论是基于ML的方法还是基于深度学习的方法都有丰富的成果,这些方法能够提高放射科医生诊断的准确性并能帮助他们做出决策.
4.4人工智能在对比增强能谱乳腺摄影中的应用对比增强能谱乳腺摄影(CESM)是近年发展起来的一种乳腺成像技术.CESM依靠注射造影剂后的双能量采集来提高乳腺摄影的灵敏度.CESM是一种很有前途的乳腺癌诊断方法,近年来也有一些研究探讨如何将人工智能应用在CESM影像,以对乳腺肿瘤进行分类.Danala G等人[80]开发了一个CAD系统对CESM影像中的乳腺肿瘤进行良恶性分类.该方法采用多层地形区域生长算法对肿瘤区域进行自动分割,然后提取了图像的4类共计108个特征,最后利用基于多特征融合的ML分类器对肿瘤进行分类,该方法充分利用了CESM影像的特点,将低能图与重组图像的最优分割进行相互映射,因此得到了不错的分割结果.在文献[81]的研究中,作者提出一个浅层深度卷积神经网路(SD-CNN),其中浅层CNN用来学习从低能图到重组图像的非线性映射,然后使用来自公共数据库的89个钼靶案例来生成“虚拟”重组图像.而深层CNN则用来从低能影像、重组或“虚拟”重组图像中提取特征,用于将病例分类为良性与恶性.文献[82]对CESM的低能量和重组图像手工标记出病变的边界,并从中提取一组形态和纹理特征,使用带有特征选择的ML算法和统计分析来减少、选择和组合特征,然后利用选定的特征,使用SVM构建预测模型对病变肿瘤进行分类,并将分类性能与2名乳腺放射学医生的诊断预测进行了比较.文献[83]提出了一种基于感兴趣区域内像素点的多项式拟合技术.该技术能获得一个新的病灶特征集用于区分正常和癌变病例.该方法使用的特征较少,因此这些特征不需要降低维数就可以将其应用于分类器,最后利用k近邻和人工神经网络对肿瘤图像分类.Perek S等人[84]比较了微调预训练网络和完全训练卷积神经网络对CESM乳腺肿块进行良恶性分类.文章通过将BIRADS文本特征以特征融合和决策融合2种方式合并为网络的附加输入来改进每个分类网络.在分类上,该方法也从影像中提取明显正常的乳腺组织来引导具体分类取得了不错的分类效果.与其他技术相比,CESM一次检查能得到更多病人的影像信息,诊断准确性更高.然而CESM影像没有得到广泛的应用导致这类数据较少,人工智能在CESM图像的研究成果还比较少.
5 分析和总结
本文回顾的目的是评估人工智能在乳腺影像中的实际应用.为了实现这个目标,我们回顾了传统的机器学习和深度学习在乳腺超声影像、乳腺MRI、乳腺钼靶影像和乳腺能谱图像中的应用.利用传统的机器学习对影像处理的方法,无论是对哪种模态的图像处理,大致可以分为图像预处理、图像特征提取与选择和图像分类三个过程.在这些过程中,不同的文章采用的方法也大不相同.图像预处理过程有的是进行图像增强,有的是提取图像的ROI,有的是人工手动标记图像轮廓等.图像特征提取中使用较多的图像特征有图像直方图、形态学特征、纹理特征、几何特征等.图像分类方法中使用最多的是SVM方法,另外基于ANN、K-NN、决策树、随机森林的分类方法也使用比较频繁.而深度学习方法大多是在对图像预处理后,基于CNN的图像分类,有的方法还将CNN与SVM相结合对图像进行分类.从以上分析来看,不同的方法有很大的差异,其中一些方法被广泛地使用,一些被较少地使用,而另一些则在低频率中使用.
6 结论和展望
本文综述了人工智能在乳腺影像诊断中的应用和研究,总结了人工智能在乳腺超声影像、核磁共振影像、钼靶影像和对比增强乳腺能谱影像诊断分类上的应用.这些成像方式在成像模式上的多样性为医疗诊断提供了丰富的信息,研究人员应用人工智能的方法将这些影像中的有效信息提取出来,从而可以为临床医生的决策提供帮助,在一定程度上能够减少诊断错误.在技术方面,人工智能可以取得比较好的结果仍然依靠数据,但由于医学影像的特殊性,获取大量有效的数据非常困难.另外医疗数据的结构化也有一定困难,这就使得人工智能在现阶段难以广泛地应用于临床实践.另一方面人工智能还是无法代替医生的职能,例如医师对患者的交流、安抚等方面.综上所述,人工智能技术用于乳腺癌影像诊断取得了一定成就,但也存在许多困难和挑战,相信只要不断完善人工智能技术,将来定会在乳腺影像诊断方面发挥更大的作用.