血细胞自动识别中特征提取方法综述
2012-06-01中南林业科技大学计算机与信息工程学院陈爱斌
中南林业科技大学计算机与信息工程学院 黄 溆 陈爱斌
血细胞自动识别中特征提取方法综述
中南林业科技大学计算机与信息工程学院 黄 溆 陈爱斌
运用计算机模式识别技术识别血细胞图像,是医学图像领域应用的一个重要研究课题,在血细胞识别过程中,细胞的特征提取是至关重要的一环。本文从形态学特征、颜色特征、纹理特征等几个方面综述了血细胞自动识别中几种细胞特征的提取方法。
血细胞;特征提取;纹理特征
1.引言
白血病是一种目前致病机理尚不明确的血液类疾病,俗称“血癌”,严重危害患者生命健康。白血病细胞具有恶性、无限增生性,类似于癌细胞,可迅速的浸润到机体的各个组织器官,引发不良症状,甚至在外周血中发生质变。目前白血病的临床诊断主要采用人工显微镜的观察与识别,但该方法不仅费时费力,且无标准化界定,受观察者主观影响较大,因而存在很多检测上的不足。近些年来,随着计算机软硬件技术的不断发展和创新,图像处理以及模式识别等先进技术已经被广泛应用于医疗机构,并为临床诊断提供了更具有科学性和标准化的依据[1]。计算机自动识别技术可提供具有客观性和准确率的检查结果,有利于临床尽快诊断、尽早治疗。然而要得到好的识别效果不仅依赖于原始图像,还需要对细胞图像中的特征进行准确和可靠的提取,它是细胞图像识别很关键的一步。
白血细胞图像有很多的特征。Landeweerd[2]等对外周血细胞进行了识别分类,采用15个特征参数,包括:形态参数4个,光密度参数4个,色度参数5个,纹理参数2个。Seigneuri[3]认为胞核面积,胞核凸度,平均胞浆色调,核轮廓的规则度,及平均胞浆亮度是对骨髓涂片的7类正常粒系细胞进行分类的5个最有效参数。Beksac[4]则提出两个新特征:胞浆中的颗粒数及胞核中的核仁数。Pavlova[5]进一步证明了运用HSV彩色空间系统对白细胞自动识别的重要性,还提取出了两种新的特征:外周血中各类细胞在色调,饱和度直方图的分布特征。Danielal[6]基于灰度共生矩阵计算了细胞的5个纹理特征,例如:嫡、能量、惯性和局部同一性等。宁旭[7]提取了细胞的形貌指标以及细胞的形态色度特征,主要对周长、面积、等效直径、平均灰度、平均光密度、积分光密度、平均色差、特征灰度等特征进行了分析,对正常和异常皮肤淋巴细胞进行了分类。根据这些已有的研究,本文对血细胞图像的特征提取的方法进行了分类综述。
2.细胞特征的提取方法
由于细胞的种类很多,并且某些类别差别细微,要识别它们需要选取较多的特征,提取特征的方法各异。
现在对于细胞特征的提取根据图像的特征可用作标志的属性,通常可分为形态学特征、颜色特征和纹理特征,其中颜色特征和纹理特征属于内部特征,需借助分割图(掩模图像)从原始彩色图像上测量。形态特征属于外部特征,可从分割图像上直接测量。图像的特征也常分为图像的统计特征和图像的视觉特征两类。图像的统计特征是指一些人为定义的特征,通过变换才能得到,如图像的直方图、矩、频谱等。图像的视觉特征是指人的视觉可直接感受到的自然特征,如区域亮度、纹理或轮廓等细胞图像的特征。下面我们按第一种特征提取的分类方法进行具体的综述。
2.1 形态学特征
某些白血病骨髓细胞间存差异不明显等特性,给识别带来了困难和阻碍,因此需要综合选取多种形态或特征来全面分析,以免造成误诊。目前常见的主要选取的形态学特征包含一下几种。
2.1.1 周长
在细胞分割的数字图像中,多利用欧式距离定义来计算细胞边界曲线的长度[8]。一般将水平或垂直方向上的相邻两个像素点的距离定义为1,则最小正方形的对角线距离为。在计算机分割图像运算中,细胞的曲线周长实际上就是将细胞边界所在像素点相连,并将每两个相邻点的距离叠加,最终的总合即为周长值。
2.1.2 面积
最简便和准确的方式,是将细胞区域内的所有像素点进行计数累加来获得细胞区域的面积特征,根据一些研究已经证实[9],访方法可获得与原始模拟区域面积基本一致的结果。
2.1.3 紧凑性
区域致密性又被称为紧凑性,也是一种重要的表现细胞图像形态学特征的指标。当图像越接近圆形时,细胞图像的致密性越高,当然也要同时参考细胞边缘的光滑程度,为此,可以用下式度量:
式中,A表示该细胞区域的面积;P表示该细胞区域的边界周长[10]。F为1,区域为圆形,而边界的弯曲频率或程度越高,边缘曲线越复杂,则F值在小于1的基础上趋向于0。一般情况下,淋巴细胞多呈现为椭圆形,F值相对较大;中性杆状细胞的细胞核图像边缘弯曲形态呈带状,致密性相对较小;单核细胞的细胞核图像表现为明显的不规则边界,其致密性也相对较小。
2.1.4 矩形度
细胞矩形度反映物体对其外接矩形的填充程度,用物体的面积与其最小外接矩形的面积之比来描述,即
式中,A0是物体的面积,AMER是MER(物体最小外接矩形的面积)的面积。R的值在0和1之间,当物体为矩形时,R取得最大值1,圆形物体的R取值为4∏;细长的、弯曲的物体R的取值变小。
2.1.5 细胞核的分叶数
细胞核的分叶数是细胞分类的一个重要指标,中性杆状粒细胞、淋巴细胞、幼单核细胞、单核细胞的细胞核的分叶数为1,中性分叶核粒细胞的分叶数为2~5,嗜酸性粒细胞一般为两叶,嗜碱性细胞可分3~4叶或分叶不明显,常融合成堆集状。
2.2 颜色特征的提取
颜色特征主要通过颜色直方图表示,即对图像中各颜色分布情况的一种数学统计值的表达。直方图横向轴为颜色值,纵向轴为同色值的像素点在整个细胞图像范围内所占的数量比例。颜色直方图在计算机操作及计算方面相对简单,其平移、尺度、旋转等具有不变性,因而适用于大部分图像数据处理类计算机系统。
除此以外,颜色矩也是一种较常见的颜色特征表达方法,利用矩来表示细胞图像中各颜色分布情况。但目前细胞涂片的图像处理中,多采用一阶矩——均值、二阶矩——方差、三阶中心矩——偏斜度表示。这些低阶矩的分辨能力相对较弱,因而常将其与其它细胞图像特征结合应用来应用于临床。
2.3 纹理特征的提取
纹理指的是细胞图像中具有不规则性、但整体宏观方面又存在一定关联性和关系的一种分割图像特征,它的优点在于不依赖于颜色和亮度的影响,可直接反映出细胞分割图像的同质属性。也就是说,纹理特征其实是细胞本身的内在共通特性。纹理特征含有细胞本身的表面结构组织信息,同时关注细胞周围的环境影响,因而常被应用于图像的检索处理当中。纹理特征的提取多通过将细胞图像像素点间的方向性以及距离性共生矩阵处理后,再由矩阵中将具有含义的统计量提取出来。灰度共现矩阵法是目前涂片图像纹理特征提取的重要方法之一[11],对于更加清晰的显示出纹理的粗糙程度具有较好的表现力,同时可更精细的反映出纹理的重复方向。相对于粗纹理的区域,近点像素间存在相近的灰度值,而细纹理区域内,各阵元值相对均匀。
3.总结
血液细胞识别中,细胞的特征提取对血液病诊断有至关重要的作用。因为细胞的特征很多,所以采用的方法也很多。本文从图像处理识别领域出发,综述了提取细胞涂片图像的几类特征,着重描述了细胞图片的形态学特征的提取,如:周长、面积、紧凑性、矩形度、细胞核的分叶数;同时还对细胞的颜色特征和纹理特征的提取进行了一些描述。
[1]黄晓伟.白血病细胞图像的分割与特征提取[D].福建师范大学硕士学位论文,2007,4:3-12.
[2]Landeweerd GH,Gelsema BS Brener JF,etal.Patern recognition of Nucleated cells from the peripheral blood[J].Patern Recognltion.1983,16(2):131-140.
[3]Seigneurin D,Gauvain C,Brugal G.A semiquantitative analysis of human bone marrow granulocytic linage using the SAMBA 200 cell image processor[J].The normal maturation sequence.Analyt Quant Cytol,1984,6(3):168-178.
[4]Beksac M,Beksac MS,TiPi VB,etal.An artifi cial intelligent diagnostic system on differential recognition ofHematoPoietic cells from micro-scopic images[J].Communications in Clinical Cytometry,1998,30(3):145-150.
[5]Pavlova PE,Cyrrilov KP,Moumdjiev IN.Application of HSV colour system in identi fi cation by colour of biological objects Computerized medical imaging on the basis of microscopic images[J].257-264.and Graphics 1996,20(5).
[6]Daniela Mayumi Ushizima Sabino,Luciano da Fontoura Costa,Rizzatti,Marco Antonio Zago.Imaging.A texture approach to Edgar Gil leukocyte recognition[J].Real-Time 2004,10(4):205-216.
[7]宁旭,唐建民.细胞形貌特征提取与分类识别技术研究[J].激光杂志2005,26(4):95-97.
[8]蒋英,李晖,黄晓伟.白血病图像分割方法的适应性分析与改进算法[J].激光生物学报,2007,6(6):28-29.
[9]T.Markiewicz S,Osowski B,Marianska,etal.Automatic recognition of the blood cells of myelogenous leukemia using SVM[C].Proceedings of International Joint Conference on Neural Networks,Canada,2005:2496-2501.
[10]张丽霞,陈金宝.实验诊断学彩色图谱[J].上海:科学技术出版社,2002:133-137.
[11]Nilsson B,Heyden A.Segmentation of complex cell clusters in microscopic images application to bone marrow samples [J].Cytometry part A,2008,66(1):24-31.
[12]Park J,Keller J M.Snakes on the watershed.IEEE Transactions on pattern analysis and machine intelligence,2010,23(10):1201-1204.
[13]周颖颖,周振宇,孙宁,鲍旭东.基于改进LBP特征的白细胞识别[J].生物学工程研究,2009,24(4):242-246.
湖南省科技计划项目(编号:2010FJ3139)。
黄溆(1986—),男,硕士研究生,主要研究方向:图像处理。
陈爱斌(1971—),男,博士,教授,主要研究方向:图像处理、模式识别。