ABVS图像冠状面汇聚征特性的量化及其应用
2021-11-22严丽霞沈鑫梦黄备建汪源源
文 川,严丽霞,沈鑫梦,马 煜,黄备建,汪源源
1.复旦大学信息科学与工程学院,上海 200433;
2.复旦大学附属中山医院超声科,上海 200032
乳腺癌是当前世界女性发病率最高且死亡率第二高的癌症[1],早期筛查与诊断是增加治疗成功率和降低死亡率的关键。乳腺癌的影像学诊断方法包括超声、乳腺X线摄影、磁共振成像等。其中,超声检查具有无创、无辐射、价格低廉、可实时成像等优点,在临床上应用较为广泛。但是传统二维超声成像只显示医师选择的一个截面,缺少三维空间信息,基于该二维图像进行诊断的效果依赖于医师选择成像截面和分析判别的经验。超声自动乳腺全容积扫描(automated breast volume scanner,ABVS)作为一种三维超声成像手段,能够获得完整的标准化的三维空间信息[2],可以显示任意的二维截面包括乳腺冠状面,从而为临床分析提供更充分的参考依据。
近年来,随着模式识别技术的发展以及计算机存储计算能力的不断提升,基于三维的ABVS图像的计算机辅助诊断(computer-aided diagnosis,CAD)系统在乳腺肿瘤的识别及鉴别诊断方面应用日益增多,并且CAD工具不断完善[3]。基于机器学习的特征提取是CAD系统中常用的方法,常用的特征有形态学特征[4]、梯度直方图特征[5]、纹理特征[6]等。深度学习方法也有效应用于乳腺肿瘤良恶性判别领域。Byra等[7]采用预先训练的超分辨率测试序列(visual geometry group,VGG)提取肿瘤特征,然后利用Fisher判别分析,获得的最高曲线下面积(area under curve,AUC)为0.847。Zhou等[8]提出一种多尺度特征组合网络用于ABVS图像肿瘤的分割与分类的多任务学习框架,在107例患者中进行良恶性分类的准确度为74.1%。Wang等[9]将一种改进的多视角卷积神经网络应用于ABVS进行乳腺肿瘤良恶性判别,最终灵敏度为0.886,特异度为0.876。
汇聚征是乳腺冠状面的超声图像特有的形态表征,表现为肿瘤周围结构组织向肿瘤位置放射状聚拢的趋势。徐皙婷等[10]基于140例肿瘤提出ABVS冠状面特有的汇聚征征象在恶性肿瘤中的出现率明显高于良性肿瘤。良性肿瘤具有汇聚征征象的原因主要是放射状瘢痕、复杂的硬化病及术后变化等,恶性肿瘤具有汇聚征征象的原因主要是侵袭性乳腺癌、导管癌和小叶癌[11]。文欢等[12]的研究表明,汇聚征与浸润性癌病理组织学分级之间存在显著相关性。但目前对于这一性质的分析主要是从定性的角度进行,也就是影像科医师观察所有冠状面图像并判断是否存在汇聚征,人工工作量较大。此外,定性判别中仍存在一定的主观性,特别是对于并不明显的汇聚状性质缺少客观的分析方法。因此,对冠状面图像中肿瘤周围纹理汇聚性质的定量化分析成为自动检测汇聚征的基础。所谓的“量化”,指的是“对汇聚性质的定量化的描述”,即通过对图像的自动分析,给出用来描述汇聚征是否存在的一些主要特征指标。这些指标将可以用于自动判别是否存在汇聚征,以及辅助判别肿瘤的良恶性。
现有的肿瘤周围纹理汇聚性检测算法一般包含两个步骤:肿瘤轮廓定位和肿瘤周围放射状组织向中心区域收敛程度的评估。肿瘤的准确分割有利于特征提取,Wang等[13]利用超像素分割检测出肿瘤的轮廓。Dong等[14]利用矢量差积(vector field convolution snake,VFCs)算法从矩形区域中分割出中心区域,Panigrahi等[15]将基于区域可缩放模型(region-based active contour driven by region-scalable fitting,RBACM-RSF)与具有空间偏差较正的多尺度高斯核C-均值聚类相结合提取乳腺超声感兴趣区(region of interest,ROI),Zhou等[8]将一种新的两阶段3D检测网络应用于自动全容积超声乳腺图像中,设计相似性损失函数可有效区分肿瘤和背景。在肿瘤周围放射状组织向中心区域收敛程度的评估方面,Tan等[4]将用于X射线分析的局部方向分布(local orientation distribution,LOD)算法用于统计冠状面肿瘤附近区域的线浓度,以此作为汇聚性质的表征。Huang等[16]引入旋转结构元素(rotating structuring element,ROSE)和stick算法得到中心区域中每个像素的方向,分析其分布特点以确定是否存在汇聚征。Chang等[17]利用高斯拉普拉斯算子来定义特征,并将其作为肿瘤分级的潜在预测因子。以上方法主要是针对包含汇聚征的图像进行特征提取,并以此作为恶性肿瘤判别的特征之一,但对于不确定是否具有汇聚征的样本并没有相应的量化方法。此外,仅对“有汇聚征”和“无汇聚征”进行判别也无法有效分析那些主观评价中介于二者之间的图像。
本研究提出了一种ABVS图像冠状面汇聚征特性量化的新方法,来评估乳腺肿瘤周围放射状组织向中心区域收敛程度。特别是对于主观难以判别是否存在汇聚征的图像,也可以给出其肿瘤周围汇聚程度参考数值。方法由两部分组成。首先,基于相位一致性特征和主动轮廓法对ABVS图像冠状面进行肿瘤的自动分割,其次,设计了定量描述汇聚征的几种特征。最后,通过多组实验验证了所提出的量化指标在描述汇聚征这一特性时的有效性。
1 资料和方法
本研究所使用的临床数据包含195例超声乳腺自动全容积图像,采集自复旦大学附属中山医院超声科,采集时间为2018年1月—2019年12月,属于回顾性研究。采用的超声仪器型号为德国Siemens公司的Acuson S2000 ABVS系统,探头型号14L5BV,探头频率为5~14 MHz,扫描深度20~60 mm。每次扫描获取318帧横切面图像,以DICOM格式保存。原始横切面图像两个方向的空间分辨率分别为0.07 mm/像素和0.21 mm/像素。195例ABVS图像均包含肿瘤,其中临床医师认为肿瘤周围有汇聚征性质的图像64例,无汇聚征的131例,图像中的肿瘤位置和轮廓均由经验丰富的影像科医师进行标定,经过统计,肿瘤的直径在15~40 mm的范围内。
1.1 ABVS图像预处理
患者扫查获取的原始ABVS图像在横向和纵向具有不同的空间分辨率,在图像上表现为肿瘤空间性状的变形,因此建立模型之前首先要对ABVS图像不同方位的像素空间分辨率进行调整,使之和实际乳腺大小相对应。利用原始ABVS图像中的空间像素信息记录,我们将空间像素间距离调整为固定的0.21 mm,经过重建后的图像大小为790像素×724像素,每例患者包含294~573张图像数量不等。对于每个病例,进行肿瘤汇聚征特征分析时,取包含肿瘤的冠状面图像,数量60~200张。一个经过重建后典型的包含汇聚征的病例图像如图1所示,在图像冠状面上呈现出明显的指向肿瘤中心的汇聚状条纹。
图1 典型的包含汇聚征的ABVS图像
1.2 肿瘤区域分割
肿瘤区域分割是肿瘤汇聚征特性分析和性质判别的基础,是整个CAD系统的十分重要的一步。为了自动精确分割ABVS图像中的肿瘤,对于每个病例重建后的冠状面图像,首先手动框选一个大小为256像素×256像素、包含肿瘤区域的矩形框,然后使用了基于局部相位信息方法自动提取图像ROI[18],并在此基础上进行了改进,分割出肿瘤边界后,取肿瘤边界的矩形框外扩2倍得到每个肿瘤的最终ROI,进行汇聚征特性的量化。
局部相位信息方法自动提取图像ROI算法主要包含几个步骤:首先利用各向异性扩散滤波器[18]和自适应直方图均衡算法[19]降低超声图像噪声,增强肿瘤区域和外部之间的对比度,对预处理后的图像沿着6个方向(0°、30°、60°、90°、120°、150°)分别采用4个尺度的log-Gabor方向滤波器进行滤波,计算每个尺度和方向下每个位置处的方向能量,找到每个位置处能量最大的方向,将其方向能量在所有尺度下的平均值定义为最大方向相位,图像中所有位置的最大方向相位组成最大方向相位图。对预处理后的图像和最大方向相位图相加得到的图像进行二值化处理及形态学处理,获得肿瘤分割结果的多个候选区域。对候选区域进行筛选得到最后的分割结果。在肿瘤分割过程中,少部分的图像对比度较低,可能造成分割的错误,为了充分利用三维空间的相关性信息来增加分割过程的鲁棒性,在对每帧图像进行分割并得到最终结果之前,增加其前后帧图像对分割结果进行约束。具体地,利用候选区域的排序方程[20],并加入约束项∩表示当前帧的候选区域与前一帧分割结果的面积重合率。计算公式如下:
对于每一个候选区域,计算其E值,将E值最大的区域作为肿瘤分割的结果。1例浸润性乳腺癌患者的ABVS图像冠状面的一帧图像的肿瘤分割结果如图2所示。
图2 基于局部相位信息的肿瘤分割结果
此外,对于极少量无法正确自动分割的图像,在用于后续的汇聚征分析时,采用经验丰富的医师手动标注的分割结果。
1.3 汇聚征性质的定量化描述
ABVS冠状面的汇聚征表示图像中肿瘤周边条索状的纹理呈指向肿瘤中心的分布趋势。因此,为了分析肿瘤汇聚征在ABVS图像上的分布,利用算法提取图像中符合汇聚征特点的图像区域,最后设定参数评估所提取区域的长度、指向性和连续性等性质,并将这些评估参数作为图像特征。
根据相关研究[17,20],使用二阶方向算子可以有效提取图像中任意点的“线方向”。因此,我们使用二阶高斯核作为滤波器提取ROI中任意点的线方向。特别地,考虑到不同的线宽对方向提取的影响,实验中我们使用了(σ等于2~10)共9个尺度的算子计算单个像素点的不同尺度的最大能量值。同时,考虑到计算复杂度和角度估计的精准性,使用了Karssemeiger[21]提出的线性邻域算子,利用3个角度的高斯核函数来估计线方向,最终得到能量最大值Wσ计算公式:
式中,σ表示不同高斯核的尺度,3个独立的线算子Wσ构成一组正交基。其中Wσ(θ)表示角度为θ、尺度为σ的二阶高斯算子与图像I卷积后获取的最大能量值,其具体计算公式:
因此,将(4)式代入(2)式,可以得到Wσ(θ)的极值点。为了融合3个尺度下的滤波器的输出结果,我们将每个像素能量最大值作为该像素点处的能量值,依次遍历ROI内全部像素点可以得到最大能量图,基于如图3A的冠状面图像获取的最大能量图如图3B所示。作为对比,有研究[4]计算了最大能量图的部分一阶统计量作为汇聚征的描述特征,但是一阶统计量的计算会破坏图像中空间分布信息,而本实验为了更好地描述汇聚征的特性,对最大能量图做了进一步的处理。
在最大能量图(图3B)中,我们首先根据能量阈值进行预处理,得到图3C,同时为了去除孤立点,进行一次形态学开运算,并将肿瘤分割结果显示出来得到图3D中结果,可以看到,图中大部分线状连通域得以保留。考虑到汇聚征的长条索状分布特点,我们对每个连通候选区域的外接矩形长宽比、方向和候选区域面积做定量描述,作为筛选指向肿瘤的条索状连通区域的条件。首先根据分割结果得到肿瘤外接圆和圆心位置,定义每个连通域的外接矩形长宽比为Ω,定义外接矩形的长边与肿瘤的外接圆心到矩形中心连线的夹角为θ,通过对Ω和θ的不同阈值进行筛选,得到最终指向肿瘤中心的长条索状连通域的分布,图3E是Ω0=2,θ0=20°时筛选出的连通域结果表示。假设以(Ω0,θ0)为条件进行筛选后和筛选前的连通域总面积分别为S(θ<θ0,Ω>Ω0)和S′,连通域数目分别为Γ(θ<θ0,Ω>Ω0)和Γ′,定义3类描述汇聚征的特征:
实验中,我们发现不同的Ω0取值对结果影响较大,因此分别计算了Ω0为2和3、θ0=20°时,图像的特征FΩ1,FΩ2,以及Ω0=4、θ0=10°时,图像的特征FΩ3。
除了上述的条索状连通区域之外,我们还定义了另一种基于边缘线指向性的描述子,用来表征筛选后连通域图像图3D中的细节边缘中指向肿瘤区域的比例。首先使用Canny算子做边缘检测,如图3F所示。然后计算边缘点对应的方向,筛选出边缘点与肿瘤外接圆中心连线方向与边缘点方向之间夹角小于π/6的边缘点,如图3G所示。再根据连通区域点的数量,去除包含点数较少的短线,如图3H所示。最终统计筛选前后边缘点数量L′和L的比值作为特征:
图3给出了1例冠状面ROI处理的完整步骤示意,从中可以看到,本研究提出的特征描述方法具有良好的汇聚征描述作用。
图3 汇聚征特征提取过程示意
1.4 量化特征的分析
为了验证量化特征的有效性,设计了3个不同层次的实验。
首先,验证所定义的量化特征在判别图像中有无汇聚征时的效果。对于单个特征,计算其用于区分有无汇聚征的受试者工作特征(receiver operating characteristic,ROC)曲线,并计算AUC值。对于所有6个特征,利用它们建立机器学习模型,对含肿瘤的冠状面图像中是否存在汇聚征进行分类判别。实验中以医师的标注作为金标准,分别尝试了支撑向量机(support vector machine,SVM)和自适应增强(adaptive boosting,Adaboost)两种分类器模型,并使用留一法交叉验证和十折交叉验证两种方式来评估模型的性能,使用灵敏度、特异度及AUC作为参数指标。
其次,通过统计学分析,检验各量化特征取值随肿瘤良恶性的分布差异。以患者为单位将不同患者样本按照良恶性分组表示,统计内容包括分组的均值、标准差。
最后,采用所提取的特征做肿瘤良恶性的分类判别,分别测试了只用单个特征及同时使用6个特征对肿瘤良恶性判别的效果,以AUC作为参数指标,分析分类性能。
2 结 果
2.1 汇聚征识别的结果
为了验证提出特征对于ABVS图像冠状面汇聚征描述的有效性,最直观的实验就是辨别病例图像有无汇聚征。从195例病例中选取了206张有医师明确标识的图像组成样本数据集,其中有汇聚征的68张,无汇聚征的138张。对206张图像计算6个汇聚征特征,并依次计算采用每个单独特征进行汇聚征识别的ROC曲线的AUC(图4)。
图4 不同特征对于有无汇聚征判别的ROC曲线
对于所提出的所有6个特征,利用SVM和Adaboost分类算法对含肿瘤图像有无汇聚征进行判别,使用留一法和十折交叉验证进行验证,实验结果如表1所示,ROC曲线如图5A、B所示。
表1 本文算法与已有算法实验结果对比
图5 利用所有量化特征判别乳腺肿瘤周边是否有汇聚征的ROC曲线
2.2 汇聚征量化特征与肿瘤良恶性的相关性分析结果
表2中统计了本文提出的6个特征在良恶性肿瘤之间的数值分布差异,可以看到6个特征在良性组和恶性组的数值分布差异较大,利用双侧t检验可以看到,每个特征在两组之间差异有统计学意义(P均<0.05)。
表2 6个量化特征与肿瘤良恶性的统计分布±s
表2 6个量化特征与肿瘤良恶性的统计分布±s
分组 FΩ1 FΓ FS FΩ2 FΩ3 FL良性 0.105±0.035 2.558±0.760 460±179 0.066±0.025 0.047±0.019 0.146±0.025恶性 0.060±0.039 1.366±0.901 239±187 0.034±0.027 0.024±0.014 0.109±0.021 P值 <0.001 <0.001 <0.001 <0.001 <0.001 <0.001
2.3 肿瘤良恶性判别的结果
已有研究[10-11]表明,乳腺肿瘤的良恶性和ABVS图像冠状面上呈现的汇聚征密切相关。分析本文提出的汇聚征定量化特征对乳腺肿瘤良恶性判别的意义可以检验该量化方法的有效性。首先探究单个特征单独用于肿瘤良恶性判别的结果,其ROC曲线如图6所示。可以看到单个特征对肿瘤良恶性进行区分的AUC为0.68~0.75,说明其数值可以在一定程度上反映肿瘤的性质。基于所有6类特征,利用SVM分类算法进行肿瘤良恶性判别,AUC为0.75。
图6 不同特征对乳腺肿瘤良恶性进行判别的ROC曲线
3 讨 论
ABVS描述了全乳房的扫描信息,对于乳腺肿瘤的定性分析具有十分重要的意义。汇聚征是ABVS图像冠状面特有的条索状的高回声区域沿肿瘤发散的形态。传统对于汇聚征的定义主要是基于主观的观察,本文设计了几类特征来定量描述这一性质,并通过对有无汇聚征分类、肿瘤良恶性分类的应用,验证了所提出的定量化描述的有效性。
本文提出的汇聚征定量化描述方法主要有几个方面的优势。首先是全自动计算,无须人工的参与,模型较简单。其次是利用汇聚征的视觉特点计算多种量化特征,对于汇聚征的描述更准确和全面。但是,由于ABVS是三维的图像,而本文提出的特征描述算法是针对二维冠状面的处理,如果引入三维空间的操作有望进一步提升性能。此外,特征计算过程中逐像素点的遍历在图像尺寸较大时仍存在计算速度下降的问题,在计算量方面仍可以进一步优化。
针对乳腺肿瘤ABVS图像冠状面呈现的汇聚征的描述问题,提出了两大类共6个特征描述子,一类是基于肿瘤区域外连通域进行形状、方向、面积的特征描述子。第二类是基于边缘检测出的点集与肿瘤中心连线的夹角的特征描述子。为了验证特征描述子的有效性,从有无汇聚征分类、特征值的取值分布对比,用6个特征描述子做良恶性分类判别3个方面进行验证。以往的研究[4,16-17]中只考虑有/无汇聚征这两种情况,但是对于介于二者之间的图像表征并没有明确的定义。本研究中提出的特征正是为了解决这个问题,对图像中存在汇聚征的可能性从多个特征的角度进行了定义。统计学分析的结果表明,这些特征的取值和汇聚征是否存在、肿瘤的良恶性均存在相关性,说明这些特征可以用于描述汇聚征存在的可能,为自动检测和判别汇聚征提供了可用的参考依据。