APP下载

基于模糊聚类的医学图像检索系统*

2018-02-20郭华峰

浙江工贸职业技术学院学报 2018年4期
关键词:检索系统检索聚类

范 渊,郭华峰

(浙江工贸职业技术学院,浙江温州325003)

0 引言

近年来,随着医学成像技术的不断发展,医学图像数据越来越多,CT计算机断层成像、MRI核磁共振成像、PET正电子发射断层成像和DSA数字减影血管造影等设备每天可产生几十G的医学图像数据,且数据量在急剧扩大。面对这海量的医学图像集合,如何快速、准确地找到需要的图像,提取有用的病理信息,以帮助医生和教师更好地医疗和教学工作,已经成为近些年医学图像处理的研究热点。

传统的医学图像检索方法是基于文本的,其检索所需的关键信息都存在DICOM头文件中,但由于其信息错误率高且人工标注主观性大,所以现阶段研究更多的是基于内容的图像检索方法(Content-based Medical Image Retrieval,CBMIR)。基于内容的图像检索方法是以图像本身的灰度、形状、纹理、拓扑等底层视觉特征和高层语义特征,构成描述图像内容的特征向量,并以特征向量作为建立索引和匹配准则的客观依据检索所需图像。很明显,基于内容的图像检索方法更客观,且检索准确率在不断提高。基于以上情况,本文采用基于内容的图像检索方法,结合模糊聚类理论,提出了基于模糊聚类的医学图像检索系统,这必将会为医院和医学工作者医疗决策带来帮助。

1 系统的技术理论

1.1 模糊聚类理论

模糊聚类是涉及事物之间的模糊界限时按一定要求对事物进行分类的数学方法。聚类分析是数理统计中的一种多元分析方法,它是用数学方法定量地确定样本的亲疏关系,从而客观地划分类型。事物之间的界限,有些是确切的,有些则是模糊的。例如人群中的面貌相像程度之间的界限是模糊的,天气阴、晴之间的界限也是模糊的。当聚类涉及事物之间的模糊界限时,需运用模糊聚类分析方法。模糊聚类分析广泛应用在气象预报、地质、农业、林业等方面。通常把被聚类的事物称为样本,将被聚类的一组事物称为样本集。模糊聚类分析有两种基本方法:系统聚类法和逐步聚类法。

在过去几十年里提出了很多种模糊聚类算法,目前应用最广泛的是模糊C-均值聚类(FCM)算法,其算法改进也常用于医学图像处理中。最新的模糊C-均值聚类算法改进主要集中在目标函数修改、收敛速度提升、聚类有效性、算法实现途径和混合型数据聚类等几个方面[1-3]。

1.2 图像检索技术

图像检索技术的出现较早,从20世纪70年代开始就有人陆续研究。图像最早是结合文本进行检索的,称为基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR)。该技术使用文本记录和描述图像的特征,如摄影作品的作者、年代、背景和尺寸等。到90年代以后,出现了对图像的内容语义,如图像的灰度、颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索技术。其中,医学图像检索是图像检索一个重要的应用方向,随着基于内容的图像检索技术的不断成熟,该技术不断被应用于医学图像检索中[4-6]。

然而,基于内容的图像检索技术存在着低层视觉特征与用户对图像理解的高层语义不一致等问题,引入FCM等模糊聚类算法是解决该问题的方法之一。为此,文献[7]根据内容(形状、颜色、纹理等)的视觉特性的不同,结合局部和全局特征,提出一种基于聚类形状的图像检索方法,改善了图像检索的精度。文献[8]则提出了一种基于改进的模糊C均值聚类和卷积神经网络的遥感图像检索方法。该方法运用改进的模糊C均值进行特征聚类分析,提高了遥感图像的检索性能。

2 系统分析与设计

2.1 系统功能分析

经过前期充分的调研,我们设计了基于模糊聚类的医学图像检索系统的功能模块,如图1所示:

图1 系统功能模块图

系统主要分为9大模块,分别是医学图像管理、图像类别管理、用户管理、角色管理、权限管理、医生管理、科室管理、图像检索和图像处理。详细描述如下:

(1)医学图像管理:医学图像主要包括放射、核医学、超声、内镜、病理等所有影像,医学图像管理主要是对上述影像图片的增删改查,包括医学图像的上传、修改和删除管理等功能。

(2)图像类别管理:医学图像从来源分可以分为放射、核医学、超声、内镜、病理等影像,从疾病和部位等也有诸多区分,所以其图像类别也需要进行添加、删除和修改等管理操作。

(3)用户管理:管理员可以把新进的医生添加到用户数据表中,则该医生就可以凭借此账号登陆本系统,同时管理员也可以对用户数据进行修改和停用等操作。

(4)角色管理:系统的使用面向医生、科室领导和管理员等角色,其中管理员负责医学图像、医生、科室和用户等基础数据的添加、修改和删除,科室领导可以统计查询该科室的医生、医学图像等数据,医生可以检索需要的医学图像,从而辅助病情的处理。

(5)权限管理:各个角色可以访问的功能各有不同,如医学图像管理的相关页面只有管理员才能访问,医学图像检索页面则可以供各类用户访问,所以对各类角色对各页面功能的访问进行限制也是必要的。

(6)医生管理:每位新进医生都需要把数据录入到本系统,医生的数据有变化则需要在本系统对原数据进行修改,医生离职则需要对该数据进行停用或删除处理。

(7)科室管理:系统也应提供对科室数据的增删改查功能,科室数据包括超声科和放射科等。

(8)图像检索:提供对图像的文字检索和图像检索两种方式,为医生检索到需要的医学图像提供帮助,其中图像检索技术为基于内容的图像检索方法,其中使用了模糊聚类方法。

(9)图像处理:提供各种处理算法,尽量提供可逆的图像处理堆栈,任意的放大,移动标注,实用的图像合并等。

2.2 数据库设计

根据对系统的前述需求分析,我们设计了基于模糊聚类的医学图像检索系统的数据库。其中,图像类别表用于存储医学图像的类别数据,医学图像表用于存储医学图像的图像名称和路径等数据,科室表用于存储医院的科室数据,医生基本信息表和医生工作信息表用于存储医生的基本信息和工作信息,用户表和角色表用于存储用户和角色的相关数据。部分重要数据库表和数据字段的设计如图2所示:

3 系统实现

3.1 关键技术

基于模糊聚类的医学图像检索系统主要由ASP.NET网站技术、SQL Server数据库技术和基于模糊聚类的图像检索技术三种技术开发实现。系统的医学图像管理和其他基础数据管理等业务功能主要使用ASP.NET的数据库访问技术实现[9],其中修改医学图像的主要实现代码如下:

//定义一个变量用于存储上传的医学图像

string medicalImage="";

//判断用户是否想修改上传的医学图像,或是只想修改图片的其他信息

if(FileUpload1.HasFile)

{

//调用UploadFile方法执行新医学图像的上传,并记录新上传的图像文件名

MedicalImage=BLL.Tools.UploadFile(FileUpload1,1,5);

}

else

{

//否则,不修改原医学图像,则读取原图像名赋予medicalImage

MIR.BLL.MedicalImage bll1=new MIR.BLL.MedicalImage();

MIR.Model.MedicalImage model1=bll1.Get-Model(MedicalImageID);

图2 系统的数据库设计

medicalImage=model1.MedicalImageUrl;

}

//根据medicalImage是否为空判断用户上传医学图像是否成功

if(medicalImage!="")

{

//medicalImage不为空,则说明用户提交修改信息成功,执行数据修改操作

MIR.Model.MedicalImage model=new MIR.Model.MedicalImage();

model.MedicalImageUrl=medicalImage;

model.Description=Description;

……

MIR.BLL.MedicalImage bll=new MIR.BLL.MedicalImage();

bll.Update(model);

MessageBox.ShowAndRedirect(this,"医学图像信息成功!","list.aspx");

}

在图像检索方法的实现过程中,为了克服传统直方图等图像特征分析的不足,引入FCM聚类算法对医学图像特征库中的特征向量进行聚类分析,得到每个图像的分类和聚类中心,并找出带检索图像所在的类,在该类中计算待检索图像与其他图像的相似度。这里对图像之间相似度的计算进行了分析,采用了一个新的相似度计算公式,相似度的计算公式来源于L.A.Zadeh在文献[10]中给出的相似度参考公式: μs(x,y)=e-β||x-y,其中 β>0。医学图像的具体检索步骤如下:

步骤1使用FCM聚类算法对医学图像特征库中的特征向量进行聚类分析,提取每个图像的分类和聚类中心;

步骤2提取待查询医学图像的特征向量;

步骤3计算待查询图像与各个聚类中心的距离,找出距离最小的类,这也就是待查询医学图像所在的类;

步骤4确定待查询医学图像所在的类之后,计算待查询图像与类中其他图像的相似度,相似度计算公式采用 μs(x,y)=e-β||x-y,其中 β>0。

步骤5根据相似度大小对检索后的图像进行排序。

在医学图像检索系统中,采用上述步骤来进行医学图像的检索,达到了较好的效果。

3.2 实现效果

基于模糊聚类的医学图像检索系统是一个针对医学图像的管理和检索系统,实现了包括医学图像管理、图像类别管理、用户管理、角色管理、权限管理、医生管理、科室管理、图像检索和图像处理在内的9大功能。其中医学图像检索的实现界面如图3所示。

图3 医学图像检索界面

4 总结

随着CT、MRI等技术和设备在医院的大规模使用,医学图像数据量越来越大。此时,如何更好地组织和检索医学图像,及时获取需要的医学信息,帮助医生和教师更好地开展医疗和教学工作,就成为当前医学图像处理的研究热点。为此,基于模糊聚类理论、基于内容的图像检索技术和ASP.NET开发技术实现了一个基于模糊聚类的医学图像检索系统,为辅助医疗进行了一次有益的尝试。

猜你喜欢

检索系统检索聚类
浅析图书馆检索系统的应用
瑞典专利数据库的检索技巧
基于K-means聚类的车-地无线通信场强研究
一种基于Python的音乐检索方法的研究
基于行车调度指挥的高危作业智能检索系统研究
世界地质公园地图检索系统开发与应用
基于高斯混合聚类的阵列干涉SAR三维成像
浅析图书馆检索系统的应用
专利检索中“语义”的表现
基于Spark平台的K-means聚类算法改进及并行化实现