计算机辅助系统在乳腺钙化性病变X线摄影诊断中的应用
2019-12-25蔡雅丽蔡盛施敏敏陈向荣柳培忠黄永础
蔡雅丽,蔡盛,施敏敏,陈向荣,柳培忠,3,黄永础*
1.福建医科大学附属泉州市第一医院影像科,福建泉州 362000;2.华侨大学工学院,福建泉州 362021;3.华侨大学医学院,福建泉州 362021; *通讯作者 黄永础 huangyc79319@163.com
乳腺癌是女性发病率最高、增长最快的癌症之一。据世界卫生组织统计,全球每年超过120万女性新患乳腺癌,50万女性死于乳腺癌,其发病率以每年2%~8%的速度递增[1]。美国癌症协会2019年提供的数据显示,美国2018年新增女性乳腺癌患者27万例,死亡4万例[2];中国平均每年新增乳腺癌16.9万例,死亡4.5万例。中国乳腺癌的发病率增长速度快,发病年龄呈年轻化趋势[3]。
微钙化是乳腺癌最为重要和明显的病理征象。特别对于早期“隐匿性”的乳腺癌,微钙化通常是唯一的标志,亦是早期乳腺癌的重要标志。乳腺X线摄影是乳腺癌/病变检测的常用方法,在对微钙化的检查较乳腺彩色多普勒超声及乳腺MRI检查具有更高的敏感性。但由于微钙化与周围血管、导管等复杂的组织结构相似,常存在漏诊等情况。本研究拟研究计算机辅助系统在乳腺钙化性病变X线摄影诊断中的应用,为乳腺癌的早期诊断提供参考。
1 资料与方法
1.1 研究对象 回顾性分析2018年1—9月于福建医科大学附属泉州市第一医院进行乳腺X线摄影检查、诊断,并经手术病理证实的316例病例,其中经病理证实为含钙化病灶112例,不含钙化病灶204例。纳入标准:①女性;②经手术病理证实;③行双侧乳腺头尾位及内外侧斜位X线摄影;④影像图片质量合格,临床资料完整。排除标准:①既往有乳腺手术史(包括病变切除、假体植入);②影像图片质量不佳、临床资料不全者。本研究经我院伦理委员会批准,患者自愿签署知情同意书。
1.2 乳腺X线图像采集 采用Siemens数字化乳腺X线机拍摄双侧乳腺头尾位及内外侧斜位片。标准化压迫乳房,压迫板压力60~200 N。每例样本均由具有多年工作经验的专业放射学医师进行甄选。去除患者的病理信息、姓名、性别、年龄、出生日期、病历号、影像号及乳腺X线检查日期等。将病理资料分为两组,选取216例乳腺X线摄影图像作为计算机检测算法的训练样本(含钙化病变62例、不含钙化病变154例),用于建立检测算法模型并进行回顾性分析;选取100例乳腺X线摄影图像作为计算机检测算法和2名放射学专业医师钙化检测能力对比的测试样本(含钙化病变50例、不含钙化病变50例)。每例乳腺X线摄影图像数据样本大小为4084×3328。
1.3 计算机辅助钙化病变的检测方法 计算机辅助钙化病变检测方法见图1。包括乳腺X线图像预处理、感兴趣区(ROI)分割、特征提取以及分类器设计等。原始正常和钙化图像经过预处理步骤以提升对比度和去除噪声干扰;观察灰度直方图找出颜色区间,利用K-means算法分割ROI,统计灰度共生矩阵和局部二值化纹理特征,对比支持向量机(support vector machine,SVM)、随机森林(random forests,RF)、自适应提升算法(adaptive boosting,AB),得到最优钙化图像检测算法。
1.3.1 乳腺X线图像预处理 利用塔形方向滤波器组对图像进行多尺度分解滤波以过滤大部分噪声[4];再利用局部直方图均衡化对乳腺区域进行图像增强,对乳腺局部对比度较低的区域进行非线性拉伸,图像中的每个像素值得到重新分配,使得灰度直方图峰顶部分对比度增强,谷底部分对比度降低。
图1 乳腺钙化病变计算机辅助检测算法流程
1.3.2 ROI提取 利用K-means聚类算法多阈值方法将乳腺图像分割为多个目标区域和背景。通过多阈值分割确定钙化点所在的ROI区域。但是分层过细会引入过多的假阳性区域[5]。为进一步降低假阳率,后续将得到的ROI区域利用特征分类器进行分类。
1.3.3 图像特征提取分析 该算法主要采用图像纹理和形状特征,包含图像中各像素间的空间分布关系,利用局部二值模式算法的旋转不变性和灰度不变性等特点提取局部纹理特征,利用的灰度共生矩阵提取包括能量、熵、对比度、相关度等形状特征。结合局部二值模式与灰度共生矩阵的特征提升乳腺钙化算法检测效果[6]。
1.3.4 机器学习算法 在pycharm软件上采用python3.6实现机器学习算法编程。本研究使用SVM、RF和AB的机器学习方法。
1.4 医师诊断方法 分别由从事乳腺X线摄影诊断约1年的低年资住院医师和从事相关工作约5年的低年资主治医师在规定时间内对100例测试样本进行钙化区域的诊断分析。
1.5 统计学方法 采用SPSS 20.0软件,通过与病理结果进行对照,利用受试者工作特征(ROC)曲线分别评价3个分类器算法及2名放射科医师对病变检测的准确度。计算曲线下面积作为衡量标准。同时计算该方法对于该诊断方法的敏感度、特异度、准确度,采用χ2检验进行比较。P<0.05表示差异有统计学意义。
2 结果
从事乳腺X线影像学诊断工作约1年的低年资住院医师钙化检测的准确率为80.0%;从事乳腺X线影像学诊断工作约5年的低年资主治医师的准确率为85.0%。SVM、RF和AB算法均可较好地区分正常样本和钙化样本,检测的精确率分别为90.0%、81.5%和87.5%,ROC曲线下面积分别达0.9372、0.8526和0.9272;2名医师的ROC曲线下面积分别为0.8250、0.8750(表1、图2)。SVM算法和从事乳腺X线诊断工作5年的低年资主治医师准确率比较,差异有统计学意义(χ2=5.380,P=0.02)。SVM算法和低年资住院医师准确率比较,差异有统计学意义(χ2=4.729,P=0.029)。
表1 SVM、RF和AB算法的钙化检测结果比较
图2 SVM、RF和AB三种算法的ROC曲线
3 讨论
3.1 计算机辅助系统在乳腺钙化性病变X线摄影中的诊断价值 乳腺癌是常见的女性恶性肿瘤,发病原因未知且难预防,故早期诊断和早期治疗是治愈乳腺癌、降低病死率的关键。乳腺钼靶X线摄影是目前乳腺癌诊断的首选方法[7]。微钙化是乳腺钼靶X线摄影图像中最重要、最明显的病理征象之一。因此,微钙化点的检测对于乳腺癌的早期诊断具有重要意义。目前对于钙化点的检测多依赖于医师观察乳腺X线图像,对医师经验要求较高,且日常图像数量巨大,易造成视觉疲劳。本研究提出的计算机辅助检测技术能够较好地帮助传统的乳腺医师阅片,尤其是一些低对比度的细小钙化点。这类钙化点通常密度较低,与致密的腺体背景重叠,医师难以识别。同时计算机诊断技术可节省诊断时间,提高诊断准确率[8]。本研究能 够初步达到很好的结果,智能地找到微钙化区域,最 后与病理学进行对照,为医师提供第二参考点。
3.2 计算机辅助系统与其他研究结果的差异 近年,研究者利用计算机辅助技术对乳腺钙化进行检测与诊断。对于乳腺X线图像检测钙化点的研究方法大体分为3类:①基于图像增强方法。李凯等[9]提出借助直方图均衡化和局部均衡对暗调图像进行操作,对原始图像实现微钙化分割的方法,但是如果直接对图像进行局部均衡化处理方法变换后图像的灰度级减少,某些细节消失,会造成失真现象。②基于深度学习的方法,左东奇等[10]提出了一种基于深度学习算法的钙化点提取法,通过改变卷积层和全连接层节点的数量,使得特征提取更加精细,最终提取钙化特征。但在有限数据量的应用场景下,深度学习算法不能够对数据的规律进行无偏差的估计。深度学习为了达到很好的精度,需要大数据支撑。③基于机器学习的方法。谭婉嫦等[11]提取的每个微钙化特征的诊断效能,基于SVM分类器对图像的每块区域进行检测,以确定是否包含微钙化点。但该研究未对前期数据做预处理,检测效果未达到最佳。本研究充分分析既往研究的经验成果,在有限数据量下,入选样本包含病理证实为恶性及良性病灶,尽量选取X线摄影所见钙化分布及形态多样性样本。原始正常和钙化图像经过预处理步骤以提升对比度和去除噪声干扰。利用K-means算法分割ROI,算法简单易实现。在特征选取方面,统计灰度共生矩阵和局部二值化纹理特征,钙化特征选取很详细,全面反映了钙化的统计学、分布和纹理特征。与谭婉嫦等[11]的研究相比,本研究将SVM、RF、AB进行对比,得到最优钙化图像检测算法。
3.3 计算机辅助系统3种比较算法结果差异分析 SVM使用核函数将原本低维度难分开的数据映射到高维空间,用超平面尽可能宽的明显间隔分开数据特征的分类器;RF是一种包含多个决策树的分类器的集成学习方法,并且其输出的类别是由个别树输出的类别的众数而定;AB是一种流行的加权提升算法,每轮降低分对样本的权重,增加错样本的权重,使得分类器在不断迭代过程中改进。3种算法效果分类差异较小。SVM综合效果最佳,适用于二元分类和小样本模型,如果用SVM处理多元分类的问题,则需要一对多的框架,而这种框架通常要消耗更多的内存。本文利用自适应核学习相关向量机提高乳腺钙化点检测效率。而RF和AB分类模型更适用于多元分类。经观察发现,大多数钙化点形态接近圆形,且存在簇状分布。选用能量、熵、对比度、相关度等纹理特征, 能够很好地检测出强背景中的弱小钙化点,且检测结果贴近于钙化点真实的病灶[12]。
3.4 计算机辅助系统算法的不足与展望 本研究算法中采用的乳腺X线影像资料在病理组成上尚不够平衡,微钙化特征样本选取尚未达到最佳,并存在特异度不高、准确度不够理想的缺点,这也是目前钙化检测技术普遍存在的缺陷。本研究结果具有较好的普遍性。仅需改变训练数据,选取具有代表性的数据,即可具备理想的泛化能力。今后将进一步延伸应用至其他器官X图像的钙化检测。今后的研究除反映图像的特征信息,引入患者体重指数、年龄等信息,并进行良恶性分析的研究。将机器学习和深度学习等人工智能算法引入医学诊断将进一步提升诊断准确度。计算机辅助乳腺X线钙化病变检测算法充分利用图像增强算法,图像分割算法以及机器学习分类算法,实验结果证明具有重要意义,可为乳腺X线摄影放射科医师提供良好的第二观感,可为乳腺癌的早期诊断提供参考。