APP下载

基于支持向量机与随机游走结合的GGO型肺结节分割方法

2018-05-30庞学明张泽伟侯爱林孙浩然

天津医科大学学报 2018年3期
关键词:O型像素点灰度

庞学明,张泽伟,侯爱林,孙浩然

(1.天津医科大学总医院放射科,天津 300052;2.天津医科大学医学影像学院,天津 300203)

肺癌是对当今人类健康危害最大的恶性肿瘤之一,美国癌症协会(American Cancer Society,ACS)已指出[1],肺癌现已成为全世界范围发病率最高的恶性肿瘤,也是目前已知的确诊后死亡率最高的癌症。早期发现和治疗肺癌可以提高患者的生存率。肺癌在早期时一般表现为肺结节,其中包括磨玻璃型肺结节(ground glass opacity,GGO)。一些研究表明,GGO型肺结节发展为肺癌的概率要高于实性肺结节[2]。随着低剂量多层螺旋CT的出现,它已经成为肺癌早期诊断的重要工具,但是医生所需分析观察的图像数量也在急剧增加。为了减轻医生的工作量,且帮助他们直观有效地识别病灶,降低漏诊和误诊的可能,计算机辅助诊断(computer aided diagnosis,CAD)技术应运而生。研究表明CAD对于提高诊断准确率、降低漏诊率以及提高诊断效率能够起到重要的作用。相比近些年国内外针对实性结节的检测研究已日趋成熟,针对GGO型肺结节的研究却很少;然而近些年来,GGO型肺结节的发病率在逐年上升。其中通过CAD诊断GGO型肺结节的最关键步骤是对GGO型肺结节进行高精确度的分割。因此我们提出了一个支持向量机和随机游走算法相结合的分割方法。该方法与传统方法相比较,可以实现自动化分割肺结节,避免人工选择种子点的工作量,可以在进一步提高准确性的同时能够提高效率。

1 资料和方法

1.1 资料 回顾性分析2016年5月-2017年3月行CT检查发现GGO型肺结节的患者,共收集符合条件的GGO型结节200个,平均直径为(2.2±0.5)cm,采集方法均使用64排螺旋CT(GE Light Speed)进行,扫描范围自胸廓入口至肺底。患者一次吸气后屏气完成全肺扫描,螺旋扫描方式,电压120 kV,电流 300 mA,螺距 1.375:1,层厚 5 mm,机架旋转一周时间 0.4 s,显示野(field of view,FOV)360 mm,图像矩阵512×512,默认重建算法为标准算法,重建1.25 mm层厚轴位图像。基本实现图像体素各相同性以确保容积分割的准确性。

1.2 方法

1.2.1 支持向量机原理 支持向量机(support vector machine,SVM)是 Vapnik 等[3]在 1995 年提出的一种新的模式识别技术。具有结构简单、全局最优、泛化能力好、计算复杂度低等优点,且具有较强的高维样本处理能力,在图像分类等模式识别领域得到了广泛的应用。支持向量机是基于统计学习的VC维理论和结构风险最小原理,基本思想是构造一个最优分类超平面作为决策面[4],使得两类标签之间的分类间隔最大,然后通过求解二次规划寻优的对偶问题来寻找最优分类超平面。

假设一个二分类的训练样本集合(χ(i),y(i),i=1,2,…,n),x∈Rm是m维的特征向量,相应的分类标记为y∈{1,-1}的分类标签。SVM在高维特征空间中求最优间隔分类超平面为:

式中:ξi为松弛项,是在训练线性不可分样本时引入的。C是一个常数,称为惩罚因子,值越大说明错误分类的惩罚越大,但泛化能力下降即w增加。这是一个典型的二次凸规划问题,因此存在唯一全局最小解。应用Lagrange乘子并满足KKT(Karush-Kuhn-Tucher)条件可得最优分类超平面的分类函数为:

式中:为Lagrange乘子,取值不为零时所对应的样本即为支持向量,b*为分类阈值,sgn(x)为符号函数。K(xi,x)为支持向量xi和未知向量x的核函数,可通过非线性映射将在低维特征空间中的样本映射到高维特征空间中去,可以避免在高维特征空间的复杂运算以及维数灾难问题,常用的核函数有多项式核函数、高斯核函数(RBF)、拉普拉斯核函数、双曲正割核函数等。

1.2.2 提取图像特征 采用支持向量机进行目标点的分类的关键点在于图像特征的选取[5]。选取CT图像的图像特征大致可分为两组:灰度特征,采用一阶统计量化区域内灰度的特性,从灰度直方图计算而得;纹理特征,通过量化区域内灰度共生矩阵的异质差异。见表1。

1.2.3 随机游走图像分割方法原理 随机游走算法是Grady等[6]在2006年提出的一种基于图论的半自动图像分割方法。算法首先将CT图像看做由一定数量的节点和边构成的加权图,G=(V,E,W)。其中,每一个节点vi∈V对应图像中的每个像素;每条边ei,j∈E表示相邻节点之间的关系;每条边上被赋予一个权值wi,j∈W,表示种子点通过随机游走经过这条边的概率,依据最大概率准则完成图像分割。

在基于图论结构的图像分割算法中,需要给定一个加权函数,根据图像的结构信息、灰度、颜色或纹理信息来表示像素点与像素点之间的权重大小。加权函数有很多定义形式,通常采用高斯权重函数来定义加权函数:

式中:Ii-Ij表示相邻结点vi和vj间灰度差。β>0为尺度因子,是该算法中唯一的自由参数。wi,j表示像素点与像素点之间的权重大小,直接影响分割效果。

在映射图中定义联合拉普拉斯矩阵,如下式:

其中,di称为节点vi的度,定义为与节点vi所有相邻边ei,j上权值的和。在已经固定标记点的值的前提下,通过Dirichlet积分公式求解非种子点到种子点的概率值,如下式:

表1 支持向量机的图像特征Tab 1 Image features of support vector machines

将映射图G的所有节点分为两类,种子点集合VM和非种子点集合VU,根据节点属于不同集合,将拉普拉斯矩阵分解,将上式改写成如下形式:

其中,x_U即为所要求解的随机游走概率,通过求解Dirichlet边界条件计算所有未标记点到各类标记点的概率值x_U:

LUxU=-BTxM

假设目标种子点标记为s=1,非目标种子点标记为s=2,各个非种子点vi到达种子点的概率值记为xsi,从而得到数组M,其对应的元素值为:

因此,可以通过下式计算得到所有非种子点到各类种子点概率值:

解得,且根据值将非种子点vi归并到概率最大值所属的类别中,从而实现图像分割。

1.2.4 SVM与随机游走相结合的方法 本文所提出的支持向量机与随机游走相结合方法框图如图1所示。

图1 本文方法框图Fig 1 Block diagram of the method

首先对部分GGO型肺结节利用工作站进行手动分割,从已分割的肺结节图像中选取一定数量的肺结节与肺组织的像素点。通过提取像素点及邻域像素点的图像特征训练支持向量机。经过训练后的支持向量机分类器对肺结节和肺组织区域具有良好的区分能力。选取待分割的GGO型肺结节图像,在图像中选取每隔N行N列的像素点以及邻域像素点,由训练后的支持向量机模型来判断所选取的像素点是否属于种子点。随机游走从支持向量机判断的种子点开始,通过计算非种子点与种子点之间的概率进行图像分割。

2 结果

本实验使用了50个待分割的GGO型肺结节训练支持向量机,使用了150个待分割的GGO型肺结节测试算法的分割性能。见图2。

实验环境为E5620 2.40 GHz CPU,8 GB内存的PC机上应用Matlab 2010a软件编程实现。本文方法选用RBF函数作为SVM核函数,参数选择为γ=1,C=1。

对每幅图像由具有5年临床经验的影像诊断医师进行手动分割作为金标准,然后利用本文算法以及3种经典分割算法进行分割,最后采用基于像素的3种评价指标,包括准确率(P)、召回率(R)以及F1值,来评价算法的分割性能,如下式:

其中,Area_real是具有5年临床经验的影像诊断医师手动分割出的肺结节区域,作为金标准,Area是利用分割算法得到的肺结节区域。当参数α2=1时,就是最常见的评价指标,称为F1值,综合了准确率和召回率的结果。当F1较高时,说明分割方法比较理想,如下式:

图2 GGO型肺结节图像分割结果Fig 2 Segmentation results of GGO pulmonary nodules

根据上式计算出分割结果的平均准确率、平均召回率以及平均F1值见表2。表2中可以看出:4种分割方法的平均F1值均在85%以上,由于GGO型肺结节与肺组织的灰度差别较低,区域增长会存在很多错分的区域,因此其平均F1值最低。本分割方法平均F1值高达96.49%,且平均准确率及平均召回率均在95%以上,说明该算法针对GGO型肺结节具有很好的分割性能。

表2 各分割方法分割性能比较Tab 2 Comparison of segmentation performance among different segmentation methods

3 讨论

目前国内外一些研究已经基于区域生长、聚类以及活动轮廓模型等分割算法实现了对实性肺结节分割的研究[7-9]。然而与较实性的肺结节相比,GGO型肺结节灰度的范围较大,且形状边界也不规整;同时GGO型肺结节与肺组织的对比较小而显得模糊,以上造成了计算机对GGO型肺结节识别和分割的困难。Son等[10]提出了一种基于三维空间的区域生长法对GGO型肺结节进行分割。Zhou等[11]建立了K近邻法分类模型得到GGO型肺结节的分割结果。Zhang等[12]采用马尔科夫随机场模型的分割算法来分割GGO型肺结节。本文采用了基于SVM与随机游走相结合的分割算法对GGO型肺结节进行自动分割,通过已分割的GGO型肺结节区域训练支持向量机用于选取种子点,利用随机游走根据所选取的种子点进行待分割的GGO型肺结节的分割,有效地结合了SVM和随机游走分割方法的优点。与传统方法相比,该方法具有自动分割能力,且能够精确地分割出肺结节区域,很好地实现了肺结节区域与周围肺组织的分离,为GGO型肺结节CAD的准确定位提供了必要的条件。该方法简单高效,准确率高,在医学影像图像分割领域具有良好的应用前景。

[1]Siegel R L,Miller K D,Jemal A.Cancer statistics,2016[J].CA Cancer J Clin,2016,66(1):7

[2]韦春晖.肺癌早期诊断进展[J].临床肺科杂志,2010,15(8):1136

[3]Cortes C,VapnikV.Support-Vector networks[J].Mach Learn,1995,20(3):273

[4]Fasshauer G E,Hickernell F J,Ye Q.Solving support vector machines in reproducing kernel Banach spaces with positive definite functions[J].Appl Comput Harmon Anal,2015,38(1):115

[5]Gillies R J,Kinahan P E,Hricak H.Radiomics.Images are more than pictures,they are data[J].Radiology,2016,278(2):563

[6]Grady L.Random walks for image segmentation[J].IEEE Trans Pattern Anal Mach Intell,2006,28(11):1768

[7]DehmeshkiJ,AminH,Valdivieso M,et al.Segmentation of pulmonary nodules in thoracic CT scans:a region growing approach[J].IEEE Trans Med Imaging,2008,27(4):467

[8]刘慧,张彩明,邓凯,等.改进局部自适应的快速FCM肺结节分割方法[J].计算机辅助设计与图形学学报,2014,26(10):1727

[9]Way T W,Hadjiiski L M,Sahiner B,et al.Computer-aided diagnosis of pulmonary nodules on CT scans:Segmentation and classification using 3D active contours[J].Med Phys,2006,33(7):2323

[10]Son W,Park S J,P ark C M,et al.Automated volumetric segmentation method for computerized-diagnosis of pure nodular groundglass opacity in high-resolution CT[C].Proc.SPIE 7624,Medical Imaging 2010:Computer-Aided Diagnosis,76241P

[11]Zhou J,Chang S,Metaxas D N,et al.An automatic method for ground glass opacity nodule detection and segmentation from CT studies[J].ConfProc IEEE Eng Med BiolSoc,2006,1:3062

[12]Zhang L,Fang M,Novak C L,et al.Consistent interactive segmentation of pulmonary ground glass nodules identified in CT studies[C].Proceedings of SPIE,2004,5370:1709

猜你喜欢

O型像素点灰度
采用改进导重法的拓扑结构灰度单元过滤技术
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
基于局部相似性的特征匹配筛选算法
蚊子爱叮O型血的人?
XLNO型低温脱除氧化亚氮催化剂性能研究
基于像素点筛选的舰船湍流尾迹检测算法
基于canvas的前端数据加密
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
O/O型未定式极限的求法总结