APP下载

基于梯度方向直方图特征和支持向量机的医学影像分类方法

2014-05-03周显国

中国医疗设备 2014年2期
关键词:医学影像直方图语义

周显国

吉林省人民医院 信息中心,吉林 长春 130021

基于梯度方向直方图特征和支持向量机的医学影像分类方法

周显国

吉林省人民医院信息中心,吉林长春130021

随着计算机技术和数据库技术的发展,图片存档及通信系统(Picture Archiving and Communication Systems,PACS)在医院得到了普遍的应用,医院每天会产生大量的医学影像数据[1]。如何检索医学影像,使海量的医学影像为科研和临床诊断服务,成为当前医学影像领域研究的热点。现有PACS只能提供基于文本的、按照病人名字和流水号进行检索的手段,不能满足临床医生按照图像内容检索出一些相似的历史病历或检索出图像内容满足某一图像语义的影像用于诊断的需要[2]。

1 基于内容的图像检索技术

基于内容的图像检索技术主要是根据图像的一些低级视觉特征[3],如颜色、纹理、图像对象的形状以及他们之间的空间关系等作为图像的索引,计算示例查询图像和图像数据库中图像的相似距离,按照相似度匹配进行检索。其主要目的是要克服基于文本图像检索技术的局限性。基于内容的图像检索技术具有如下特点:

(1)直接从图像的内容中提取线索。这一特点使得基于内容的图像检索技术突波了传统的基于关键词检索的局限,可直接对图像本身进行分析并提取特征,使得检索能够更加接近目标。

(2)提取特征的方法多种多样。从图像中可以提取的特征包括颜色、纹理、形状、边缘和目标轮廓等。

(3)基于内容的图像检索是一种近似匹配。在检索中,可以采取逐步求精的算法,每一层中间结果都是一个集合,不断减小集合的范围,直到定位到近似目标[3]。

2 梯度方向直方图

法国国家计算机科学及自动控制研究所DALAL等于2005年提出了一种解决人体目标检测的图像描述子,即梯度方向直方图(Histogramof Oriented Gradient,HOG),该方法使用HOG特征来提取人体的外形信息和运动信息,形成丰富的特征集[4]。

梯度方向直方图特征是在尺度不变特征变换(ScaleInvariant Feature Transform)的基础上发展而来的,能很好地刻画图像的边缘方向特征。因此本文采用它作为医学图像检索系统的描述子。支持向量机具有训练方便、容易使用、泛化能力较好的优点,因此本文采用它作为医学影像分类系统的分类器[5]。

近年来,由于HOG特征能很好地描述图像的边缘方向特征,因此广泛应用在计算机视觉的其他领域中,如目标识别与跟踪、图像检索、人体行为分析和遥感图像分类等。该特征的计算方法,见图l。

图1 HOG特征计算示意图

具体的计算步骤如下:

(1)计算图像中每个像素点梯度方向,一般可以采用[-1,0,1]和[-1,0,1]T获取水平方向和垂直方向上的梯度分量d x和d y。

(2)对于每个像素,根据d x和d y可计算出梯度的方向角θ=a r ct a n(d y/d x),将该角度的范围转化到[0,π],然后每20°角量化为一个方向区间,共9个区间0,1,2,...,8。

(3)选取一个16×16大小的图像块,根据量化后的区间,以每个像素的梯度幅值作为权重,计算16×16图像块中每个8×8图像子块的梯度方向直方图特征,并将2×2=4个直方图特征串联起来。

(4)对每个16×16的直方图特征(4x9=36维)进行归一化,设直方图特征为v∈R36,vi表示直方图的第i维特征,v'i表示归一化后的值,一般可以有如下的三种归一化方式[5]:

(5)将每个16×16块的直方图特征串联起来,作为最终的直方图特征。

另外,在计算直方图特征的时候,也可以采用三线性插值和高斯加权,从而使得构建出来的特征更加鲁棒[6]。

3 支持向量机

支持向量机(Support Vector Machine,SVM)是一种根据结构风险最小化原则,在使训练样本分类误差极小化的前提下,尽量提高分类器的推广能力的机器学习方法,目前已广泛应用在分类、回归等应用中。其分类函数如下:

张衡诞生于南阳郡汉水流域白河之畔的西鄂县(今河南南阳市石桥镇),是中国东汉时期伟大的天文学家、地震学家和发明家。他提出浑天说,发明浑天仪,开启了中国航天遥测技术;他探索地震起因,发明了世界上最早的地动仪。

其中αi表示支持向量的权重,yi表示样本的类别标签,其值为+1或者-1,K(X,Xi)为核函数,常见的核函数有:线性核函数K(X,Xi)=(X,Xi);多项式核函数K(X,Xi)=(a+XtXi)d;径向基函数K(X,Xi)=e x p(-C||X-Xi||);Sigmoid函数K(X,Xi)=1/(1+e x p(-XtXi))。

关于支持向量机的训练,目前常用的方法是序列最小优化算法(Sequential Minimum optimal,SM)。

4 测试结果及分析

4.1数据集与实验参数设置

本文采用的数据集为mageCLEF,该数据集包括训练集和测试集,共有2000张图片,分为31类,其中测试图片999张,训练图片1001张。

实验中,将所有的图片都归一化到64×128,然后进行HOG特征提取,HOG特征向量的维度是3780维,具体的参数如下:块的大小是16×16,梯度计算采用[-1,0,1]和[-1,0,1]T,方向角量化为9个区间,归一化方式采用L1-norm,直方图建立的过程中采用了三线性插值的方法[6]。

实验中采用的分类器是libsvm,是一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其他操作系统上应用。该软件对S V M所涉及的参数调节相对比较少,提供了很多的默认参数,利用这些默认参数可以解决很多问题;还提供了交互检验功能。核函数分别采用线性核、多项式核、径向基函数和Sigmoid函数,各个核函数的参数均使用工具箱的默认值。

4.2性能评估

ImageCLEF共包含31个类,采用线性核函数获得了较好的结果,其相应的混淆矩阵,见表1。

表1 基于线性核函数的医学图像分类混淆矩阵

各个核函数的总体分类性能比较,见图2。其中,线性核函数的分类性能最好,平均的分类正确率为36.74%,多项式核、径向基函数和S i g mo i d函数的分类性能相当,约10%左右。

图2 各个核函数的性能比较

5 结语

本文利用HOG特征和支持向量机对医学图像进行分类,并比较了不同核函数的性能,实现了从低层视觉特征到对象语义的映射,为临床不同语义层次的检索提供了条件。由于分类之间的类内差异性大,类间差异性小,因此难以获得较好的分类性能。未来拟考虑采用贝叶斯网络融合对象语义提取高层语义的多层语义建模方法,对多类别的图像进行分类。

[参考文献]

[1] 张骊峰,章鲁.医学影像数据库的索引及检索技术的研究[J].国际生物医学工程杂志,2007,30(3):159-163.

[2] 张九妹,杜建军,姚宗,等.利用基于内容的图像检索技术的眼底图像计算机辅助诊断系统[J].中国生物医学工程学报, 2012,31(5):785-789.

[3] 王惠锋,孙正兴.基于内容的图像检索中的语义处理方法[J].中国图象图形学报,2001,6(10):945-952.

[4] 余胜,谢莉.基于边缘梯度方向直方图的图像检索[J].科技视界,2012,(20):26-27.

[5] 申海洋,李月娥,张甜.基于边缘方向直方图相关性匹配的图像检索[J].计算机应用,2013,(7):194-197.

[6] 李博,杨丹,张小洪.一种新的基于梯度方向直方图的图像配准方法[J].计算机应用研究,2007,24(3):312-314.

作者邮箱:zxg2004zxg@126.com

[中图分类号]TP399

[文献标志码]B

doi:10.3969/j.issn.1674-1633.2014.02.044

[文章编号]1674-1633(2014)02-0132-02

收稿日期:2013-05-03修回日期:2013-09-18

Classif i cation Method for Medical Images Based on HOG Features and SVM

ZHOU Xian-guo
Information Center, Jilin Province People's Hospital, Changchun Jilin 130021, China

[摘要]本文阐述了基于内容的图像检索技术的特点,采用梯度方向直方图(HOG)特征来描述图片的边缘特征,利用支持向量机(SVM)对多类别的图片进行分类,并比较了几种核函数对分类效果的影响,指出基于HOG特征和支持向量机的分类方法可以辅助医护人员进行医学影像检索。

[关键词]PACS;医学影像分类;梯度方向直方图特征;支持向量机

Abstract:This paper introduces the characteristics of content-based image retrieval technology, and describes the edge features of medical images with histogramof oriented gradient features. Then these images are classif i ed with support vector machine. The effect of several kernel functions on classif i cation results is also discussed in this paper. This paper points out that the classif i cation method based on HOG and SVMcan help medical staff retrieve medical imags.

Key words:PACS; medical image classif i cation; histogramof oriented gradient; support vector machine

猜你喜欢

医学影像直方图语义
真实场景水下语义分割方法及数据集
结合多层特征及空间信息蒸馏的医学影像分割
符合差分隐私的流数据统计直方图发布
医学影像技术在医学影像诊断中的合理运用
影像组学在核医学影像中的应用进展
基于FPGA的直方图均衡图像增强算法设计及实现
语言与语义
用直方图控制画面影调
中考频数分布直方图题型展示
批评话语分析中态度意向的邻近化语义构建