基于人工神经网络的尿沉渣细胞识别方法
2010-03-10周明月
周明月
(吉林师范大学 信息技术学院,四平 136000)
尿沉渣分析是对尿液有形成分的检查和识别,包括尿液中的红细胞、白细胞、草酸钙结晶等各种有形成分,通过分析它们在尿液中的含量能辅助对泌尿系统疾病做出诊断,它对肾脏疾病、泌尿道疾病、循环系统疾病以及感染性疾病的诊断治疗具有十分重要的作用[1]。
本文以模式识别技术和人工神经网为基础,实现对细胞的自动识别与分类。通过对尿沉渣图像的预处理、图像分割、细胞特征提取,根据提取的细胞特征利用BP人工神经网络进行红细胞、白细胞、草酸钙结晶的识别分类。
1 尿沉渣细胞识别算法
1.1 图像的预处理及分割
在尿沉渣图像中,由于病变或者其他原因,一些有形成分的边缘非常模糊,还有些图像的光照不均匀,所以对尿沉渣细胞的识别首先需要进行预处理。本文采用Sobel算子对尿沉渣细胞图像进行边缘提取。为了得到比较好的效果需要对提取边缘后的图像进行二值化,然后应用中值滤波器,可以滤除噪声的同时很好的保护图像的边缘细节[2-4]。
最后确定目标体在图像中的坐标位置。按目标像素在图片中的坐标,做出矩形,对应原图的位置即完成目标体的分割。图像分割完成从图像中分割出各个有形成分的区域。图1(a)、(b)、(c)分别是一些经分割得到的红细胞、白细胞、草酸钙结晶。
1.2 图像的特征选择和提取
特征选择和提取的基本任务是如何从许多特征中找出那些最有效的特征,即从各个分割区域中计算出一组描述区域大小、形状以及内部纹理等一系列参数。这一任务是在分类器设计之前进行,为分类器提供数据基础。该任务完成的好坏直接关系后续分类器的设计,即分类问题直接与特征提取有关。
图1 分割后的细胞Fig.1 The segmentation of cells
对红细胞、白细胞、草酸钙结晶进行快速傅里叶变换(FFT)变换,研究频域图像,容易发现二值化之后的图像反映的信息更为明确,利于分析和计算一些特征的特征值。快速傅里叶变换(FFT)的图像二值化之后的图像如图 2-4所示。如图所示,可以看出红细胞和白细胞的频谱都呈现出近似圆形的特征,而草酸钙结晶的频谱呈现出十字线的特征。红细胞的圆形度比白细胞圆形度要好,所以可以对频域进行提取圆形度特征。有部分白细胞与红细胞很相似,我们可以通过面积特征将其区分开来进行粗分类。草酸钙结晶具有十字线特征。本文先后选取FFT的圆形度、FFT的十字线方差、FFT的内接半径、外接矩形比值方差、圆形度、目标体面积、边缘夹角方差、拉长度、内接矩形、核的圆形度等十个特征。
图2 红细胞FFT及二值化后图像Fig.2 FFT and binary of RBC
图3 白细胞FFT及二值化后图像Fig.3 FFT and binary of WBC
图4 草酸钙结晶FFT及二值化后图像Fig.4 FFT and binary of CCO
进行特征值归一化。设特征值为x,xmin和xmax分别为该特征中最小值和最大值,利用公式(1)来计算归一化。经过计算得到若干个归一化后的特征值。
1.3 基于BP神经网络的细胞识别方法
识别出细胞种类是整个系统的核心。人工神经网络具有类似人的学习、归纳与分类的能力以及良好的容错性和泛化能力。本文采用BP人工神经网络制作分类器,采用有监督的学习方法,大量的训练对对分类器进行训练,使误差不断减小。
本文的分类器是基于BP神经网络理论所设计的分类器,采用BP神经网络的结构及BP算法。该分类器网络的结构层次为输入层、隐层一、隐层二、输出层,其中输入层和输出层与外界相连接,为可见层。输入层的输入向量为细胞的若干个特征值(经归一化后的特征值),输出层的输出的向量为若干类别,即识别的细胞类别。输入层单元数、输入向量维数、输入细胞的特征值个数三者相同,输出层单元数、输出向量维数、输出类别个数三者相同[4,5],隐层单元数不固定,必须经过多次实验才能得出最佳设定值[5-7]。分类器的人工神经网络结构如图5所示。
图5 人工神经网络结构Fig.5 The structure of ANN
2 仿真实验
本文应用VC++6.0的设计平台,在此操作平台上,运用人工神经网络训练时可以调整神经元数及隐层层数,并且观察误差变化情况。
选取神经网络分类器的网络结构为输入特征向量为10维,即选取的是细胞的十个特征。隐层一为30单元,隐层二为50单元,输出层为3类。
采用未知类别特征向量送该分类器进行分类,红细胞1500个,白细胞1100个,草酸钙结晶1000个,分类结果见表1。由表1可以看出,识别出红细胞准确率大于95.5%,白细胞大于94.2%,草酸钙结晶大约96.9%。
表1 识别结果Tab.1 Identification results
3 结论
应用人工神经网络和模式识别技术,通过实验和仿真很好的完成了尿沉渣细胞的识别与分类。结果表明,本文算法的识别效率较高,具有较高的实用性。随着现代科学技术的发展,计算机技术己成为医学研究领域中必不可少的得力工具,利用数字图像处理技术、模式识别技术、人工神经网络技术以及人类的实践经验结合起来,医学技术必将会有飞跃的发展。这也是医学系统的一个发展方向。
[1]张家红,张国锋.UF-100尿沉渣分析仪测定尿液有形成分影响因素探讨[J].中国医科大学学报,2004,33(4):371-371.
[2]王传永.基于人工神经网络的血液细胞图像分割方法研究[D].天津理工大学研究生学位论文,2005.
[3]温建明.神经网络算法在弹性限位浮筏系统中的应用[J].长春理工大学学报:自然科学版,2010,33(1):141-143.
[4]Philippe Schmid.Segmentation of Digitized Dermatoscopic Images by Two-Dimensional Color Clustering[J].IEEE Trans.On Medical Imaging,1999,18(2):164-171.
[5]沈凤龙,毕娟.基于BP神经网络分类器的多目标识别方法研究[J].辽东学院学报,2008,15(4):205-209.
[6]江虹,曾立波,胡继明.优化的BP神经网络分类器的设计与实现[J].计算机工程与应用,2001:122-125.
[7]Chuang G,Ming C.Semantic Video Object Segmentation and Tracking using Mathematical Morphology and Perspective Motion Model.IEEE.Proceeding,pages 1997,514-517.