肝脏CT图像特征提取方法的研究及其在检索中的应用
2014-07-30李尹岑孔祥云杨德智
李尹岑,孔祥云,杨德智
(国家知识产权局专利局专利审查协作北京中心光电部,北京 100096)
图像数据库是现代医学系统的一个重要组成部分,对于协助诊断和预防医学相关病情具有十分重要的应用意义,特别是数字化图像存档与传输系统在医疗系统中的应用可以非常方便的帮助医生在进行病情判断与分析时提取生物体内组织或器官形态、结构甚至是功能信息,完成病理组织结构及临床诊断研究。与此同时,基于计算机与扫描成像技术发展而来的CT扫描技术可以将人体病变组织的具体问题影射成像,并利用计算机图像处理与检索技术从图像中提取相关特征参数来表征或反应病人病情。这种技术大大提升了医生诊断病情的准确性和精确度。
1 CT图像检索中常用的视觉特征评价指标
对于CT图像的特征提取主要集中在颜色、灰度、形状以及纹理等方面。不同的图像特征可以表征和度量一类具体的特征问题。目前评价图像特征提取的主要指标有查准率、查全率以及命中准确率等。
CT图像特征提取评价指标中的查准率是指经过图像特征提取后所能够识别和反馈的CT图像的特征图像的数目和所有返回图像的比值,而查全率则是指图像特征提取后返回结果中相关图像数据与数据库中所存在的所有的相关图像数目的比例。这两个评价参数是图像特征提取中应用最为广泛和可信度最高的两个评价指标。
假设存在一幅肝脏CT图像Q,通过数据库检索后所返回的同一大类图像数目为N,相关图像数目为n,数据库中所有的图像数目为T,则查准率的数学表达式为recall=n/N,查全率的数学表达式为precision=n/T。显然,检索结果值越大,检索效果越好,检索越精确。
命中准确率则是用于表征所命中的检索图像与查询图像的比值。假设被检索图像所在的图像集为G,检索后输出的图像数目为A,A中属于G的图像数目为k,则命中准确率可被定义为pre=k/A×100%。
2 CT图像肝部肿瘤检索系统
为获得检索结果和评价结果,首先需要根据肝部肿瘤图像构建检索数据库,数据库的建立可以通过相关数据库软件完成,如SQL,MySQL等。该数据库中包含了以下两部分信息:图像信息极其对应的特征信息。其中,图像信息由患者相关信息构成,特征信息由图像特征参数及相关信息构成。
在使用该数据库进行图像检索时需要执行如下步骤。首先对图像进行基本的信息提取,然后根据提取结果将图像信息分割为多个子图像块,该子块应该包含相关的特征信息,然后分别应用相应的图像特征提取算法对图像中的特征进行深度提取,提取后将该信息与图像数据库和特征数据库进行对比分析,从中提取符合返回结果的图像,完成检索。
3 基于小波变换的肝部CT图像3 提取及图像检索
3.1 基于小波变换的图像特征提取
小波变换是一种非常常见的多尺度可视化信息处理算法,其通过小波变换函数可以将图像中的特征信息放大提取出来。每进行一次小波变换可以将图像分解为四个原始图像四分之一大小的子图,每张子图可用于表征原始图像中的水平方向、垂直方向以及对角线方向的高频和低频信息。经过多次小波变换后可以获得权重最大,特征含量最高的特征信息。
小波变换中关注的核心在于所选择的尺度低通滤波器和小波高通滤波器。原始图像多次经过这些滤波器后可以获得多个方向和维度的纹理特征。
3.2 相似度选取与度量
进行特征检索的关键在于特征匹配,即相似度定义和度量。小波变换环境下的相似度度量主要通过特征参数与目标图像特征参数的距离来表征。为提高算法的通用性和准确性,在度量前可以对所形成的特征参数向量进行归一化处理。假设图像信息函数f(x,y)具有的特征序列为F,F中包含的特征参数有[Hf1j,Hf2j,…,Hfkj]个具体值。 其中,Hfij标示第i副子图像中的第j个特征向量矩阵。K表示所有CT图像数据库中的图像数目,则可以由F获得该特征序列的均值mj和方差σj,其归一化特征序列可以转换为
对其进行相似性度量时所采用的欧式距离定义为
为提升相似度表征的准确性,需要使用统计的方式对腹部和病灶两幅图像之间的相似度进行表征,此时主要需要分别对图像的全局和局部两部分内容的欧氏距离进行计算和分析。需要说明的是,表征图像特征的参数有多个,不同的参数获取和度量方式不尽相同。为获得更为精准和统一的检索结果可以对需要各表征参数的欧氏距离进行线性组合。线性组合后的数据同样需要进行外部归一化,归一化方法同特征参数的归一化方式,均采用高斯归一化。
3.3 特征提取与目标检索步骤分析
为实现完整的肝部CT图像特征提取与目标检索可以执行如下步骤:
首先使用Gabor算法和小波变换算法对可表征肝部全局特征的特征参数进行提取,并将所提取出的特征参数组成特征向量矩阵,矩阵的每一维度表示该图像的某一特征,然后对肝部病灶处的灰度特征和灰度共生特征进行提取,最后将所提取的特征数据与数据库中存储的图像信息和特征信息进行对比检索和查询,在相似度范围内的图像被认为属于目标图像,返回到检索结果中,完成检索。
4 总结
医学诊断中会产生大量的图像信息,这些图像信息之间具有相似性,可用于协助医生对病症、病灶等进行判断和分析。使用图像特征提取方法对医学图像中的关键特征信息进行放大提取可显著提升病情诊断精确度,降低医生的工作难度。
[1]He ZY,You XG,Tang YY.Texture image retrieval based on non - tensorproductWaveletfilterbanks[J].Signal Processing,2009,89(8):1501-1510.
[2]张晨光.基于内容的肝脏CT图像检索的研究[D],上海交通大学,2005.
[3]安志勇.基于内容的图像检索关键技术研究[D].西安电子科技大学,2008.