APP下载

基于B超图像的甲状腺良恶性结节识别

2013-11-24张振宇万丹丹

网络安全与数据管理 2013年2期
关键词:灰度边界恶性

张振宇,万丹丹

(河北大学 电子信息工程学院,河北 保定 071000)

甲状腺结节在临床中十分常见,通过高分辨超声发现,人群甲状腺结节的患病率为19%~67%,其中,甲状腺癌占5%~15%[1]。由于甲状腺结节的发病原因未知,只有尽早地发现、确诊,才能提高甲状腺癌的治愈率。B超具有无创、动态和廉价等特点,已成为甲状腺结节术前检查的首选方法[2]。当前,医学图像的临床分析主要通过医生对图像的定性判别来完成。使用的特征和诊断标准不同,缺乏图像特征的定量度量以及视觉感知上的差异,导致不同医生对于同一病例的诊断结果存在差异。

超声图像的分类已被广泛应用于肝脏、乳腺等处的不同疾病的计算机辅助诊断中。但由于甲状腺癌生物学特性多变,多源性多种性质结节并存,从临床表现和影像学特征上与良性病变常难以区别,使得普通超声成像在甲状腺疾病的诊断上价值有限,因此,目前针对超声图像的甲状腺结节良恶性识别的研究也相对较少。此外,现在的多数图像识别方法都是以神经网络作为分类器对图像进行分类,而且针对病灶特征的提取不全面,导致分类结果不甚理想。支持向量机(SVM)是统计学习理论最年轻、最实用的内容,现已成为继神经网络之后新的研究热点。本文将临床鉴别甲状腺结节良恶性的依据进行分类、量化,并选择出类间距最大的5个向量作为支持向量机的输入向量组合,对样本进行识别分类。

1 甲状腺结节超声图像的特征提取

在临床应用中,医生一般根据表1列出的特征来判别甲状腺结节的恶性和良性[3]。由表1可知,恶性结节图像和良性结节图像在形状、边界、回声和钙化等特征上都存在不同,结节的良、恶性可以依据这些特征的差异区别开。

表1 甲状腺结节良恶性鉴别点

1.1 病灶区域选择

本文中所用的病灶区域图像均由医学专家划定,这样可以近似认为病灶区域图像中心就是甲状腺结节的中心。结节(无论良性或恶性)与正常组织的物理特性是有所不同的(如纹理、亮度等),所以它们的图像与周围正常组织的图像也是不同的。利用这一特性,可以把结节轮廓提取出来。

1.2 特征量化

1.2.1 形状特征

良性结节的形状主要是圆形、椭圆形,而恶性结节形状往往是不规则的,因此,采用紧致度、不规则度分别对其进行量化。

紧致度(Compactness)度量了结节轮廓形状与其等价圆的相似程度,定义为等价圆与形状周长比的平方:

其中,A为结节区域面积,P为结节轮廓周长。当结节轮廓为圆时,紧致度值为1,否则小于1。

不规则度 (Irregularity)用来度量结节形状的不规则程度。首先将圆形视为规则形状,然后比较结节形状与圆之间的重合程度(差异程度),即:

此外,纵横比 DWR(Depth-Width Ratio)也是临床中甲状腺结节超声检查常用的一个特征,它在一定程度上反映了结节的生长情况,如果结节的纵横比小于1,则结节的恶性程度相对较低。纵横比定义为结节的纵向长度与横向宽度之比,即:

1.2.2 边界特征

恶性结节的边界特征是不清晰的,可以是微小分叶的、有角的以及毛刺状等。对结节边缘的清晰程度,采用边界上点的锐度(Acutance)进行量化。

用一维高斯偏导核与结节边界的垂直和水平坐标进行卷积,求取结节边界上各点的法向方向。对于边界上每一点P,设其法向方向上边界内、外与点P距离i的像素灰度分别为 g(i)、h(i)(i=1,2,…,10),定义 P点处的边缘锐度为:

结节的整体边缘锐度定义为边界上所有点归一化锐度的均值:

其中,dmax为结节边界上各点锐度绝对值的最大值。锐度Acu的最大值为1。

1.2.3 边缘特征

关于恶性结节的边缘特征是有包膜和声晕。边缘特征的量化可以利用结节边界邻近区域的灰度分布进行计算。采用半径为12像素的圆盘结构对结节区域上的二值图像进行腐蚀和膨胀操作,分别得到位于结节内、外部的两条带状区域。

设边界内、外带状区域内像素个数分别为n1、n2,灰度均值分别为 u1、u2。用类间方差(Intervariance)度量结节邻近边界的内、外区域之间灰度的统计差异:

InterVar越大,则结节边界内、外邻近区域的灰度越可能存在统计意义上的差异。通过进行归一化处理,使其与灰度绝对值无关,定义平均可分性(Average separability)为:

其中,TotalVar为边界内、外带状区域所有像素灰度的方差。平均可分性的最大值为1。

1.2.4 衰减特征

后方回声采用衰减系数进行量化。在结节区域后方灰度变化最大的方向上选取一个矩形区域,其高和宽与结节边界框的高和宽相等。衰减系数AC(Attenuation Coefficient)定义为结节区域和其后方区域灰度均值的比值:

其中,utumor为结节区域灰度均值,upott为后方区域灰度均值。

1.2.5 回声模式

内部回声可能有高回声、等回声、低回声、混合回声和无回声等情况,回声的高低是甲状腺结节相对周围组织的回声强度而言的。可以采用相对亮度RB(Relative Brightness)进行量化,即结节内部区域灰度均值与结节外部区域的灰度均值之比:

RB在一定程度上与成像仪器和设置参数有关。

1.2.6 钙化特征

在高频超声图像上,钙化可分为微钙化(≤1 100 u的针尖样强光点)、粗钙化(>1100 u的强光团)和弧形钙化(肿块表面弧形或环形强光带后伴声影)3种类型。经临床证实,恶性组中钙化检出率明显高于良性,而且大部分为微钙化。针对此种特性,采用钙化度(Calcification)进行量化。

设钙化≤1 100 u的强光点内像素个数为v1,微钙化点的个数为n,结节内像素点总数为v,钙化度定义为:

过腔的特征主要有音调的依附性、或0性(即可去过腔)、音乐材料的以主调和级音为主性、构式的多样性、音数的不定性、起音的眼位性、乐音进行的级进性、节奏的顿逗性等。下面仅以音调的依附性、音数的不定性、结构的类型性和构式的多样性三点为例。

1.3 特征选择

前面提取了紧致度、不规则度、纵横比和锐度等9个特征,但不是所有的特征都能有效地用于后续的识别。特征选择是为了能够更好地对超声图像进行分类,排除那些对图像识别贡献很小或没有贡献的特征,以达到减少运算量、降低特征空间维数的目的。为了将良性结节和恶性结节的特征进行直观的对比,采用计算类间距的方法,统计各个特征量不同类别的均值和方差,并在此基础上计算出类间距。对于某一个特征x而言,第i类和第j类类间距离D为:

其中,μxi为第 i类特征向量的均值,μxj为第 j类特征向量的均值,σxi为第 i类的特征向量的方差,σxj为第 j类的特征向量的方差。各类特征的类间距如表2所示。

表2 各特征的类间距

类间距D越大,则表示该特征对于分类识别的能力越强。由表2可以观察到有5个特征的类间距大于1,分别是不规则度、衰减系数、纵横比、紧致度和钙化度,说明这5个特征对于甲状腺结节的良恶性识别能力较强。其中,不规则度特征的类间距为1.954 7,表明结节不规则度是区分结节的良恶性最有效特征。本文提取不规则度、衰减系数、纵横比、紧致度和钙化度作为特征向量组合,对样本进行识别。

2 支持向量机原理

SVM是基于统计学习理论发展而来的一种新的机器学习方法[4]。其基本思想是:通过分析相关性找到空间映射函数,将输入向量映射到高维特征空间,在映射后的空间中寻找一个最优的分界面(超平面)。在寻找最优分界面时,依据结构风险最小化原则,得到的最优分界面不但能将两类无错误地分开,而且使两类分类间隔(Margin)最大,并巧妙地利用原空间的核函数代替高维特征空间中的点积,避免了复杂计算。

SVM的分类算法如下:

设线性可分的训练样本集为:

D维空间中分类分界面的方程为:

对式(13)进行归一化,使得训练样本集满足:

在此约束条件下对αi求解下列函数的最大值:

这是一个不等式约束下二次函数寻优的问题,存在唯一解。容易证明,通常解中只有少部分αi不为零,则其对应的样本就是支持向量。求解上述问题后得到的最优分界面分类函数为:

式(17)的求和实际上只对支持向量进行,b是分类阈值,可用任意一个支持向量求得。

SVM的算法流程如图1所示。

K(xi,xj)被称为核函数,SVM的基本核函数主要有线性核函数、多项式核函数、径向基函数和Sigmoid函数:

线性核函数:K(xi,xj)=xiTxj;

多项式核函数:K(xi,xj)=(γxiTxj+r)d,γ>0;

径向基函数:K(xi,xj)=exp(-γ‖xi-xj‖2),γ>0;

Sigmoid 函数:K(xi,xj)=tanh(γxiTxj+r)。

3 实验

本文训练样本共有70张图像,其中恶性39张,良性31张。这些图像来自20岁到45岁病人,采集的时间为2011年12月1日到2012年9月1日。这些图像都是经过医院专家诊断且经过术后病理证实的病例。所用的超声诊断仪为Philips iU22及HDI 5000 Sono彩色超声诊断仪,探头频率为7 MHz~12 MHz。由本文第二部分可知,提出的系统有调节参数C和核函数两个参数需要确定,这两个参数对分类精度至关重要。

为了确定使用何种核函数,将样本集分为两组,分别用这4种核函数对训练样本进行学习分类。4种不同的核函数的分类识别结果如表3所示。

表3 使用不同核函数的分类结果

从表3可以看出,非线性的分类器(如多项式核函数和径向基函数等核函数)具有较高的准确率,线性的分类器结果稍差,而Sigmoid函数由于不具有稳定性,导致分类结果不很理想。其中,径向基函数的识别准确率最高,本篇选择径向基函数作为核函数进行分类。

经过验证,C=100,σ=0.5时,诊断系统处于最佳状态。

甲状腺结节良恶性的诊断需要综合运用临床、影像和病理学等知识和技术手段,早发现、早治疗仍然是现阶段有效提高恶性结节治愈率的主要措施。本文将各类特征进行精确量化,选取紧致度、不规则度、纵横比、衰减系数和钙化度作为特征向量组,采用径向基函数作为支持向量机的核函数进行分类。该识别方法对甲状腺结节超声图像具有较高的分类准确性,准确率达到91.25%,有望提高甲状腺癌超声早期诊断的准确性。

[1]POLYZES S A,KITA M,AVRAMIDIS A.Thyroid nodules-stepwise diagnosis and management[J].HORMONES,2007,6(2):101-119.

[2]罗斌钰,赵咏桔.超声检查在甲状腺结节术前鉴别诊断中的作用——一项2890患者、4 165结节的超声-病理分析[J].中华内分泌代谢杂志,2010,26(4):282-284.

[3]吕珂,姜玉新,张缙熙,等.甲状腺结节的超声诊断研究[J].中华超声影像学杂志,2003,12(5):285-288.

[4]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-41.

猜你喜欢

灰度边界恶性
采用改进导重法的拓扑结构灰度单元过滤技术
拓展阅读的边界
恶性胸膜间皮瘤、肺鳞癌重复癌一例
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
意大利边界穿越之家
卵巢恶性Brenner瘤CT表现3例
论中立的帮助行为之可罚边界
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于灰度线性建模的亚像素图像抖动量计算
24例恶性间皮瘤临床分析