APP下载

甲状腺结节超声图像特征提取及识别

2017-10-19尹小童李梦烁曾朝伟王守义

长春工业大学学报 2017年4期
关键词:纹理分类器恶性

王 昕, 李 亮, 尹小童, 李梦烁, 曾朝伟, 王守义

(长春工业大学 计算机科学与工程学院, 吉林 长春 130012)

甲状腺结节超声图像特征提取及识别

王 昕, 李 亮, 尹小童, 李梦烁, 曾朝伟, 王守义

(长春工业大学 计算机科学与工程学院, 吉林 长春 130012)

采用多特征融合方法鉴别甲状腺结节超声图像的良恶性。首先用多尺度LBPV模型提取结节的局部纹理特征,然后与Tamura模型提取的全局纹理特征相结合,从全局和局部两方面对甲状腺结节的纹理特征进行了细致的描述。又提取了纵横比、圆形度、紧致度等形状特征,将上述特征进行融合并利用主成分分析法PCA对融合后的特征进行降维。实验结果表明,模型提取的特征用于分类识别时,较上述任一单一模型所提取特征用于分类时能获得更高的识别率。

甲状腺结节; LBPV模型; Tamura模型; 形状特征; 纹理特征; PCA模型

0 引 言

甲状腺结节是指甲状腺中的细胞在诱因的影响下以非正常的方式快速生长而产生的肿块,可分为良性和恶性[1]。研究表明,恶性结节约占所有结节的5%~10%,并且其发生率正在逐年提高[2]。

临床上对于恶性结节必须及时切除,而对于良性结节只需要定期随访观察即可,因此对于结节的良恶性的判断就显得十分重要,医学上对于甲状腺结节良恶性的判断采用的是穿刺活检(Fine Needle Aspiration Biospsy, FNAB)[3],但由于这是一种有创性检查,会给患者带来一定的痛苦,而且该项检查花费大、耗时长,所以非常不便于大规模的筛查。当前B超图像检查因其方便快捷的特点已成为甲状腺结节良恶性判别的最常用手段,但由于成像和医生经验的原因并没有形成一套统一的标准来判断甲状腺结节的良恶性。众所周知,纹理是一种用于描述图像的重要特性,不同的图像往往具有不同的纹理特征,因此,可以利用图像的纹理特征对图像进行分类识别研究。

国内外针对图像纹理特征的研究已取得了不俗的成绩。目前常用的纹理特征提取算法包括:灰度共生矩阵(Gray Level Co-occurrence Matrix, GLCM)[4];Tamura[5]提出的纹理特征算法;局部二值模式(Local Binary Pattern, LBP)[6],以及由其衍生出来的((Local Binary Pattern Variance, LBPV)[7]等算法。其中,GLCM及Tamuras这两类算法往往侧重提取图像的全局纹理特征而忽视局部纹理特征。而LBP及其变式等算法因为定义在一个很小的邻域内,因此提取图像的局部纹理特征虽然有效,却忽略了其对全局纹理特征的描述。由于甲状腺结节超声图像往往具有灰度不均匀、边缘模糊、噪声污染严重等特点。如果仅仅单一的使用上述算法来对甲状腺结节进行特征提取分类,可能得不到令人满意的结果。

基于以上论述,文中提出了一种多尺度LBPV模型和Tamura相结合的纹理特征提取算法,同时为了更加全面地描述甲状腺结节的特征信息,又提取了结节的形状特征[8],为了去除冗余提升算法的效率,利用主成分分析法(Principal Component Analysis, PCA)[9]对融合后的特征进行降维,最后再将经上述处理过的特征作为分类器的输入向量。实验结果表明,文中提出的模型提取的甲状腺结节纹理特征用于分类时能得到更高的分类精度。

1 多尺度LBPV模型

LBPV模型自出现以来得到了广泛运用,将其每个点的方差值作为编码时的自适应权值,假设一图像M×N,其中任一像素点(i,j)的LBPV定义为:

式中:k----LBP模式数。

由于VAR是对区域对比度的反映,因此,VAR值越大,对应的编码权重越大,对该区域内判别信息的贡献越大。且LBPV算子无需量化、无需训练,因此在做分类实验时表现非常优秀。但因为甲状腺结节超声因其图像本身具有边缘模糊、噪声干扰大、灰度不均匀等特点,如果仅仅使用单一尺度下的纹理特征并不能反映其全面信息,而如果通过改变图像自身的大小从而在多个尺度下提取纹理,则可较好地弥补这一缺点。因此,文中首先将结节区域进行尺度归一化处理,然后将结节区域分成4×4共16个子区域,对每个子区域的LBPV值进行计算,记为H1~H16,最后统计每个区域的谱直方图,形成整个图片的特征直方图为:

H={H1,H2,…,H16}

2 Tamura模型

1978年,Tamura等提出了Tamura模型用于提取纹理特征,Tamura纹理特征因其更直观,在视觉效果上更有优势,所以得到了广泛的应用,该模型纹理特征由6个分量构成,但在图像识别和图像检索方面常用的是粗糙度(coarsences)、对比度(contrast)、方向度(directionality)这3个分量。具体介绍如下:

1)粗糙度。它反映的是图像中纹理的间隔尺寸或者粒度表达式:

其中,Sbest(x,y)=2k;M,N分别表示图像的长和宽。

2)对比度。它反映的是图像像素强度的统计分布,是一种全局度量,其计算公式为:

3)方向度。它反映的是图像纹理集中或者散布的方向属性,其计算步骤如下:

①计算每个像素的梯度g=(Δh,Δv),其中Δh表示水平方向梯度,Δv表示垂直方向的梯度,计算如下:

②计算梯度向量的极坐标:

③利用如下公式构造θ的直方图:

其中,np为图像灰度直方图中峰值的数目,p是直方图HD的峰值,ωp为任一峰值p包含的量化值范围,φp是ωp量化值中的最大值。

3 形状特征的提取

因为良性结节的形状与恶性结节的形状往往有很大的区别,所以除了纹理特征,我们还提取了纵横比、圆形度、紧致度3个形状特征(Form Feature)。

1)纵横比。超声判查的一个重要特征。一般纵横比大于1时,恶性的风险较大,小于1时,恶性的风险较小。

2)圆形度。用来反映结节形状的规则度,其值越小,越可能为恶性。定义为:

3)紧致度。反映物体边缘规则度,其定义如下:

式中:S----结节实质区域的面积;

L----结节实质区域的周长。

在提取完纹理特征和形状特征之后,将这些特征进行串行融合,用H表示:

文中算法的具体实现步骤如下:

1)输入甲状腺结节超声图像;

2)提取结节ROI区域;

3)对结节ROI区域图像进行尺度归一化处理并分块;

4)提取各个子区域的局部LBPV纹理特征;

5)将各个子区域的LBPV特征进行融合;

6)提取Tamura全局纹理特征;

7)提取结节区域形状特征;

8)将上述特征进行融合,并进行PCA降维处理;

9)将降维处理后的特征归一化,并输入到分类器进行分类。

4 实验与分析

4.1结节ROI区域提取

实验中所选用的140幅128×128甲状腺结节超声图像均来自吉林省某医院,其中110幅图像为良性结节,另外30幅结节图像为恶性,所有图像均由临床医生标注了结节区域与边界,所用的超声诊断仪为Philips iu22,彩色超声诊断仪探头频率为7~12 MHz,实验平台是windows10专业版,PC机处理器为intel(R)core(TM)i5-3470cpu@3.20GHz,内存是4GB软件版本MATLAB2013a(64位)。实验中在提取纹理特征前,先对甲状腺结节进行实质ROI区域提取[10],如图1所示。

(a) 原始的结节图像 (b) 分割后的图像

(c) 结节实质区域图1 结节分割及实质区域提取

4.2分类器选择及评价实验

随机取50%良性结节和50%的恶性结节作为训练集,剩余的部分作为测试集。最后将由文中模型得到的特征向量进行归一化处理,并输入到不同的分类器中,SVM、BP神经网络、决策树、极限学习机,每个分类器重复试验10次,然后统计其各自的平均精度和运行时间,统计结果见表1。

由表1可以看出,在选择SVM作为分类器时的分类精度最高,且运行的时间相对较短。为了选择更为合适的分类器,从特异度、灵敏度、阳性预测值、阴性预测值等4个方面对各个分类器的性能进行评价,相关表达式及实验结果分别见表2和表3。

表1 各分类器的分类精度与运行时间表

表2 各分类器性能评价指标的相关公式

表中:TP----被正确分类的恶性结节个数;

TN----被正确分类的良性性结节个数;

FP----被错误分类的良性结节个数;

FN----被错误分类的恶性结节个数。

在上面4个表征指标中,一般灵敏度和特异度的参考价值最大。灵敏度反映的是恶性结节被正确分类的程度,灵敏度值越大,表明被错误分类的恶性结节越少,当其值等于1时,说明恶性结节都被正确分类。同样的特异度反映的是良性结节被正确分类的程度,当特异度的值等于1时,说明良性结节都被正确分类。

表3 各分类器性能评价结果

由表3可以看出,采用SVM模型作分类器时,实验结果的特异度比其他模型都高,再综合表1的分类精度信息,因此,可以说在对甲状腺结节超声图像进行识别时,SVM算法相比其他几种算法具有更优秀的性能。

4.3文中算法与传统算法对比实验

为了验证文中提出的算法与传统LBPV算法相比是否具有优越性,分别将上述各算法得到的特征向量输入到SVM分类器中验证各自的分类精度,实验结果见表4。

表4 各特征提取算法分类效果对比

由表4的对比实验结果可以看出,本算法由于融合了精细的纹理特征信息和形状特征信息,对图像的特征描述更加全面细致,所以得到了最高的分类精度。

4.4PCA降维性能实验

为了验证PCA降维后的特征对分类的影响,进行了对比实验,实验中统一使用SVM做分类器,并对各自的分类精度及运行时间进行统计,实验结果见表5。

表5 PCA处理后分类效果验证

由表5的对比实验结果可以看出,原融合特征是166维,经过PCA降维处理后,特征维度降低为89维,降维后的运行时间明显减少,而分类精度略低于未降维时的精度,这是由于训练样本较少以及PCA算法自身的缺点而造成的。

5 结 语

针对甲状腺结节超声图像灰度不均匀、噪声大等特点,提出了纹理特征与形状特征相结合的结节特征表征方法,从全局和局部等不同角度细致地提取了结节区域的特征。实验结果表明,文中算法提取的融合特征用于SVM分类时较任一单一模型所提取的特征用于分类时有更优越的性能,在自建的图像数据库中,其针对甲状腺结节的良恶性的识别率达94.28%,且经过PCA降维处理后效率有较大提高,识别精度基本不变。

[1] 夏炳兰,何春兰,宋斌,等.超声引导下甲状腺结节细针吸取细胞学检查的诊断价值[J].中国现代普通外科进展,2014,17(7):540-542.

[2] 钱军,刁畅,马云海,等.甲状腺结节诊断评估模式的演变[J].国际外科学杂志,2013,40(2):75-77.

[3] Feldkamp J, Führer D, Luster M, et al. Fine needle aspiration in the investigation of thyroid nodules[J]. DeutschesRzteblatt International,2016,113(20):353-359.

[4] Wu H, Sun T, Wang J, et al. Combination of radiological and gray level co-occurrence matrix textural features used to distinguish solitary pulmonary nodules by computed tomography[J]. Journal of Digital Lmaging,2013,26(4):797-802.

[5] 景军锋,张缓缓,李鹏飞,等.LBP和TAMURA纹理特征方法融合的织物疵点分类算法[J].计算机工程与应用,2012,48(23):155-160.

[6] Ali A, Hussain S, Haroon F, et al. Face recognition withlocal binary pattens[J]. Bahria University Journal of Information & Communication Technolocies,2012,5(12):469-481.

[7] Guo Z, Zhang L, Zhang D. Rotation invariant texture class ification using LBP Variance(LBPV) with global matching[J]. Pattern Recognition,2010,43(3):706-719.

[8] 葛杰,曹晨晨,李光.基于机器视觉的图像形状特征提取方法研究进展[J].包装学报,2015(1):54-60.

[9] Jiang H. Image compression and reconstruction of PCA[J]. Electronic Design Engineering,2012,285(5430):1055-1057.

[10] 王昕,徐文杰.甲状腺结节超声图像分割算法研究[J].电视技术,2016(8):26-30.

Ultrasoundimagefeatureextractionandclassificationalgorithmforthyroidnodules

WANG Xin, LI Liang, YIN Xiaotong, LI Mengshuo,ZENG Chaowei, WANG Shouyi

(School of Computer Science & Engineering, Changchun University of Technology, Changchun 130012, China)

Multi-feature fusion method is applied to distinguish benign and malignant thyroid nodules. First, multi-scale Local Binary Pattern Variance (LBPV) model is used to extract the local texture features of the nodules and then combined with the global texture features extracted with Tamura model to describethe texture characteristics of thyroid nodules globally and locally. Also the aspect ratio, circularity and compactness are extractedand fused, and then reduced the dimensionality with Primary Component Analysis (PCA). Experimental results indicate that the proposed fusion model is more effective than any other single one.

thyroid nodules; Local Binary Pattern Variance (LBPV) model; Tamura model; form feature; texture features; Primary Component Analysis (PCA) model.

TP 391.41

A

1674-1374(2017)04-0322-06

2017-05-19

国家级大学生创新训练计划基金资助项目(201710190041)

王 昕(1972-),女,汉族,吉林长春人,长春工业大学副教授,博士,主要从事图像处理与模式识别方向研究,E-mail:wangxin315@ccut.edu.cn.

10.15923/j.cnki.cn22-1382/t.2017.4.02

猜你喜欢

纹理分类器恶性
恶性胸膜间皮瘤、肺鳞癌重复癌一例
基于BM3D的复杂纹理区域图像去噪
卵巢恶性Brenner瘤CT表现3例
使用纹理叠加添加艺术画特效
BP-GA光照分类器在车道线识别中的应用
TEXTURE ON TEXTURE质地上的纹理
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
消除凹凸纹理有妙招!
甲状腺结节内钙化回声与病变良恶性的相关性