一种改进型RGB向量空间聚合法的尿沉渣图像分割
2017-04-19刘玉成张颖超
刘玉成,张颖超
(1.南京财经大学 国家级重点实验中心,江苏 南京 210003;2.南京信息工程大学 信息与控制学院,江苏 南京 210044)
一种改进型RGB向量空间聚合法的尿沉渣图像分割
刘玉成1,张颖超2
(1.南京财经大学 国家级重点实验中心,江苏 南京 210003;2.南京信息工程大学 信息与控制学院,江苏 南京 210044)
经典的以形态学参数为特征向量的分类算法在处理复杂环境下采集的图像时显得力不从心.为此,本研究从色度学分割的角度出发,创新性地提出一种改进型向量空间聚合法来改进有形成分图像的处理.它可分析不同区域在R、G、B三色向量空间的颜色值,以获得各种细胞和复杂成分在R、G、B三色向量空间中的分布概况,查找分析它们其中的R、G、B分布差异;并应用专业仿真软件Matlab7.0对在DJ8300超级分析仪中采集的各种尿沉渣有形成分的图像检测颜色的像素值.在RGB向量空间中,分类和识别的核心参数C的Mahalanobis距离或欧几里得距离在运算过程中用三行三列的协方差矩阵来表示,且采用的类似实心球体轨迹法和实心三维椭圆体法的模型.实验数据表明,本研究所提的方法能够根据尿沉渣图像中有形成分的聚堆现象、粘连等类似融合特点,优化色度学分割处理,降低采集过程中受光源等环境的影响,最终有效地解决尿沉渣有形成分图像失真的问题,改进图像色差校正的效果.同时,在色度学方法分割和分类尿沉渣有形成分的领域取得新突破,这在后期识别实验的准确率数据方面也得到充分的证明.
协方差矩阵;向量空间;马氏距离;球体轨迹法;三维椭圆体法
0 引言
计算机图像处理技术不断进步,提高工作效率,改变社会的许多工作方式和习惯,其在各个领域都得到大力推广和运用.在医学的领域也是如此,它在尿沉渣有形成分的检测和分类中作用非常重要.但是,受限于尿沉渣空间环境中提取有形成分的复杂性和特殊性,有形成分图像的处理分割[1]较为困难,所以尿沉渣中有形成分的检测分类不甚理想.通过简单分析不难判断,其主要原因是此类成分的形态在采集的时候由于光照、重叠和干扰等因素,加之本身成分形态的相似以及成分种类繁多的影响,使得传统图像分割和识别都不尽如人意.
因而,本研究提出一种改进型色度学图像处理分割和分类的方法.同时,在提高有效成分识别的准确率方面,针对尿沉渣的成分特点和空间环境特征,改变传统纹理特性、形态学特性等成熟特征参数的情况下,采集G、B、R颜色特征参数,从而稳步显示出识别图像处理的优越性.究其原因,是由于改进后色度学空间特征向量法充分考虑这些复杂的干扰因素,且采取正确的图像预处理方法,其识别的准确率得到明显的提高.然后,通过对色度学特征向量计算平台关键性能参数的定义、抽取和传递,实现本算法在DJ8300系统平台的性能移植,尿沉渣中其他细胞成分的识别基本保持原有的准确率,或者略有提高,总体上使得尿沉渣识别的综合准确率得到有效提高.
1 尿沉渣图像的采集与处理
1.1 DJ系统工作平台
本研究中有形成分图像的采集运用国内外先进的DJ8300自动细胞有形成分的采集分析系统仪器.根据系统平台采集模块的特征提取和目标机器训练等具体特点,构建符合尿沉渣有形成分特点的全监督训练模式的架构模型.有前期工作经验了解采集尿沉渣有形成分图像中会存在聚堆、粘连等问题,加上采集过程中受光源等环境的影响,图像采集时经常会发生R、G、B三色向量空间的色彩偏移现象.另外,图像空间信息背景的提取的复杂性,也会使得尿沉渣中有形成分的图像处理和分割比较困难,从而影响有形成分的识别效果.
因此,文中尿沉渣图像信息采集系统在对采集图像的处理之前,增加有形成分图像的预处理环节,运用Matlab仿真系统作为DJ8300系统的辅助平台,对有形成分的图像进行预处理操作.它从R、G、B三色空间整体分布入手,设定统一标准的灰度值,精确定位和采集整体图片中各个不同区域的R、G、B空间的颜色值,在此基础上采用一种改进型的色度学的图像处理方法,使得分割和处理的结果更理想,性能更稳定.下章节中所提出的改进型白平衡算法是其核心分割和处理的重要过程之一.具体的处理流程如图1所示.
图1 图像采集与处理模型的流程图
1.2 图像采集与处理
根据前期相关实验的经验以及具体尿沉渣有形成分图像的具体特征,DJ8300系统平台在复杂的尿沉渣环境中对图像进行数据的采集,所采集的有形成分图像运用白平衡的方法进行向量特性提取前的预处理,目的是降低色彩偏差对图像数据值的干扰,同时,也尽可能排除尿沉渣图像中有形成分本身聚堆现象、粘连等类似融合特征对数据采集的影响,进而优化色度学的分割处理.白平衡算法的预处理环节能够调节图片色彩特性,广泛应用于现代摄像、图像处理,照相系统等领域;它是与色彩科学知识解释相通,白色是指在入射光中由于同一的蓝色、绿色和红色色调,眼睛和具有形成视觉响应的亮度成一定比例;赤、橙、黄、绿、青、蓝、紫七种色光混合组成白色光,而这红、绿、蓝三原色按不同比例混合也能形成七色光,当三原色相同比例在一种光线中时候,它被习惯地称为消色,其所反射的光都是消色,情况包括:黑、白、灰、金和银等;一般情况下,白色亮度被默认为未含有色彩度.
有鉴于此,本研究的处理过程中就运用所提的改进型神经网络的白平衡算法对尿沉渣有形成分图像进行前期的预处理,从而有效地消除光照以及本身聚类等特点对后期实验工作的影响.
神经网络法[2-3]是白平衡算法的重要方法之一,也是时下比较主流的去光照方法之一.该方法处理的主要过程首先是离散化染色空间(r,g),实质就是给特征参数降低维度,便于数值运算,然后对接相应的神经网络结构的方法.笔者针对该识别系统的特点,提出的神经网络白平衡算法使用3层结构网络,输入层有12个节点,第一个隐藏层有M个节点,第二个隐藏层有N个节点,输出层有6个节点;输入层代表离散化的染色空间(r,g),每一个节点的输入可取0或1,表示某个色彩值(ri,gi)是否在图像中出现,输出层表征光源特性;上层为下层数值的加权之和.通过输入不同的图片,训练神经网络的不同权值,从而得到比较满意的数值.
通常情况下,尿酸结晶图像在采集过程中经常会遇到R、G、B空间颜色值失真的情况.笔者采用白平衡算法,目的是去除色度方面的差值对图像数据采集的干扰,将产生颜色偏差的图片恢复到经典光源照射下的标准色彩.所谓的经典光源就是图2中的自然光下的细胞图像.以下是尿酸结晶图像在采集过程中遇到R、G、B空间颜色值失真情况下的偏色图像(图2b)与经典光源之下(图2a)的尿酸结晶图像,分别如图2(a、b)所示.
图2 尿酸结晶图像
2 特征参数的提取
依据本研究中的改进型神经网络的白平衡算法对尿沉渣有形成分图像进行前期的预处理,明显降低光照以及聚堆现象、粘连等类似融合特点对特征参数提取的干扰,优化特征向量数值提取环境,满足尿沉渣有形成分识别所需要的R、G、B色度学特征参数.颜色特征是反映细胞种类的重要指标之一,根据该系统中的颜色特点,采用RGB向量空间[4]颜色模型的方法来对细胞的颜色进行分析和研究;系统对每种成分均提取它们的R(Red)、G(Green)、B(Blue)3个颜色特征值,这3个特征值是各种成分所有像素点的R、G、B的平均值;这在后面章节的细胞成分的分割中起到十分重要的作用,尤其是在后期的训练和识别的过程中,它也作为神经网络识别算法的关键特征参数类型之一,共同导致尿沉渣有形成分的识别和分类准确率的提高,后期的实验数据也说明这一结论.
3 尿沉渣有形成分的分割与分类
3.1 图像的特征空间分割
尿沉渣成分的分割过程遵循色度学方法的一般要求、规则和功能.详细的分割步骤是:1)将一幅彩色图像依据彩色图像特有的色彩规则[5]分割成为多个不同的区域,这些多个区域元素的整体数量,成型规则等都必须符合色度学的分割特定要求,比如说区域的特殊性意义,所谓特殊性,它主要是指符合识别系统模型中前期的色度学分割所必须的局部图片特性;再如,特定区域的一致性要求,它所说的一致性是指局部独立的区域之间相互不重叠,从而符合前期的色度学分割;2)依据色度学分割完成之后的训练和学习要求特点,须前瞻性的选取符合具体细化分割的颜色组合.
系统采集的尿沉渣彩色图像;根据不同的颜色空间特征参数进行分类和分割[6-7];在分析各成分及数据时可以发现,各种细胞和有形成分在R、G、B的3个颜色空间都有交叉区,并且对于不同的图像,由于尿沉渣的各种有形成分在不同环境的光照下采集的颜色空间所对应的参数标准不一致,导致其不易简单分割.另外,在医学尿沉渣有形成分的应用时,源于众多复杂的有形成分,并且也有尿沉渣有形成分自身的原因,有时会出现多个重叠小区,它们相互作用和影响以聚合成某些较大的融合区,被称为图形处理聚堆现象.
考虑上述情况和特点,提出从改进型色度学分割的角度来考虑细胞有形成分的处理,分析不同区域在R、G、B三色向量空间的颜色值,以获得各种细胞和复杂成分在R、G、B三色向量空间中的分布概况,查找分析它们其中的R、G、B分布差异;并应用专业仿真软件Matlab7.0,对在DJ8300超级分析仪中采集的各种尿沉渣有形成分的图像检测颜色的像素值;并提出以下的色度学分割准则[8-9],以分类处理各种尿沉渣有形成分的图像,相关的Matlab模拟仿真过程如下:
第1步,采用正向扫描整幅图像,将每个像素的R分量减去B分量,根据其差值将像素分为两大类:(R-B)>=M类和(R-B)<-M类.
第2步,当(R-B)>=M类时,凡是(R-B)>=M的像素令其保留原先的颜色值,而(R-B)<M的像素则令其为黑色,这样得出的图像可以突显指定细胞区.
第3步,当(R-B)<-M类时,凡是(R-B)<-M的像素令其保留原先的颜色值,而(R-B)>=-M(M为不同的自然数)的像素则令其为黑色,这样得出的图像除去一般细胞,突显指定细胞区.
根据MATLAB7.0仿真处理的结果分析,采用色度分割准则处理的尿沉渣有形成分的图像取得一定的分割效果,它能在没有医学专家的参与下,自动粗略地分割论文中DJ8300超级分析仪采集的尿沉渣中的有形成分,且可以在系统平台上采集的原始的尿沉渣彩色图像中提取出新的图像.但是,要使图像更清晰,视觉效果更好,必须对提取出来的细胞图像进行平滑滤波处理.
3.2 RGB向量空间的图像分割与分类
本研究中具体的分割和分类方法是把一张完整的尿沉渣图像分割成若干个局部区域.作为整个系统中的核心组成部分之一,它是一个十分重要的改进型应用方法,其标准的分割方法和原始模型源自于冈萨雷斯先生的数字图像处理技术,它已发展的非常成熟和稳定,并在相关领域被大力推广.这里改进沿用的目的是在R、G、B图像中分割一个特定的彩色细胞或尿沉渣有形成分;给定一组指定的彩色(或彩色范围)描述的彩色样本点[10-11],系统可根据这一彩色样本点所对应的一组R、G、B颜色空间向量值,来获得一个“平均”的颜色估计,它是文中期望被分割的某种颜色有形成分,通常可以让这种平均色用R、G、B颜色空间向量的列向量m来定义.
系统所构建的改进型色度学分割和分类方法模型中的理念要求,其具体分割的目的是对尿沉渣图像中的每一个R、G、B像素进行分类,使其在指定的范围内有一种颜色或没有颜色,为顺利执行这一比较,系统设定一个相似性度量,最简单的度量之一是欧几里得距离;令z表示RGB空间的任意点,若z和m之间的距离小于指定的阈值T,则说z相似于m.m和z之间的欧几里得距离[12-13]由下式给出:
其中‖∙‖是参数的范数,下标R、G和B表示向量m和z的RGB分量.D(z,m)≤T的点的轨迹是一个半径为T的实心球体,如图3a所示.由定义可知,包含在球体内部或表面的点满足特定的彩色准则;而球体外边的点则不满足.在图像中对这两组点编码,如黑的和白的,产生一幅二值分割图像.前述方程的一个有用归纳是距离:
其中,C是要分割的彩色的样值表示的协方差矩阵.该距离成为Mahalanobis距离.D(z,m)≤T的点的轨迹描述一个实心三维椭圆体[14],如图3b所示,它的重要属性是其主轴取在最大的数据扩展方向上.当C等于单位矩阵I时,Mahalanobis距离约简为欧几里得距离.除现在数据包含在椭球体内而不是包含在圆球体内之外,分割原理类似于上述章节的描述.
图3 RGB向量空间聚合数据的两种方法
分类处理在上述采用的类似实心球体轨迹法和实心三维椭圆体法的模型[15]下,系统函数COLORSEG可在MATLAB7.0仿真软件环境下实现对尿沉渣有形成分的有效分割,具体函数实现的程序代码如下:
S=Colorseg;
%调用MATLAB语言中的分割实现函数,模拟实心球体轨迹法和实心三维椭圆体法来实现尿沉渣有形成分的分割;
%method(表示方法).f(表示RGB图像).T(表示阀值).parameters(表示参数);
分割函数在MATLAB7.0仿真软件环境中有2种method选择,一是‘euclidean’,二是‘mahalanobis’,f是分割的RGB尿沉渣有形成分图像,T是前边描述过的阈值.若选择‘euclidean’,则输入参数是m,若选择‘mahalanobis’,则输入参数是m和C.parameters(参数)m是RGB向量空间中Mahalanobis距离或者欧几里得距离运算过程中所需的向量之一,其选择形式一般也可以有2种,第一种为:‘行’,第二种为:‘列’;两者的选择项可根据不同的距离计算对应的自由选定.而parameters(参数)C在RGB向量空间中Mahalanobis距离或者欧几里得距离运算过程中一般为三行三列的协方差矩阵.
对应的进程中,分割函数COLORSEG的输出值用S来表示,它为与尿沉渣中采集的源图像所对应的灰度图像.按照MATLAB软件中图像处理算法对于灰度图像的处理规则,当T=0时,对应部分的区域作为背景图像被系统保存,而当T=1时,对应部分的区域作为目标图像就被系统从源图像中分割出来;被分割的二值化图像区域在MATLAB软件图像处理的数值计算界面能非常直观的得到显示,整个图像中显示出来的不同区域分别表示为0和1.
据此,系统有效的将各类有形成分从背景图像中分割出来,这在后面的系统实验结果与数据中得到充分的说明,也达到理想的分类和识别预期.
4 实验结果分析
鉴于在尿沉渣空间环境中提取有形成分的复杂性,现有的形态学方法对分类识别细胞等有形成分的准确率不高,本研究探索改进型色度学图像处理分割和分类的方法.同时,在提高有效成分识别的准确率方面,针对尿沉渣的成分特点和空间环境特征,改变传统纹理特性、形态学特性等成熟特征参数的情况下,采集G、B、R颜色特征参数,从而稳步显示出识别图像处理的优越性.通过对色度学特征向量计算平台关键性能参数的定义、抽取和传递,实现本算法在DJ8300系统平台的性能移植,并取得较好的实验效果.具体的实验数据值,如表1所示.
表1 识别准确率数值 %
在改进型的色度学图像处理和识别中,模型借鉴熵、能量、对比度等纹理特征参数;H、S、V三个颜色特征值参数和细胞的圆形度、细长度、区域的周长、矩形度、散射度、伸长度等形态学特征参数等若干种特征参数,随后优化提取R、G、B色度学特征参数.经过后期的分类和识别实验检测,尿沉渣有形成分的实时性和识别率均得到有效的提高.
5 结语与展望
针对经典的形态学特征参数对细胞成分识别方法的不足等问题,本研究提出基于色度学综合特征参数提取的图像处理方法,对医学尿沉渣图像的有形成分进行分析和处理,在改变尿沉渣有形成分图像分割和识别所需的必要纹理特征参数和形态学特征参数的条件上,创造性地采用增加色度学中R、G、B向量空间特征值等3个特征参数的方法,最终有效地提高尿沉渣中细胞有形成分分类的识别率.尤其是对上皮细胞、白细胞和各种复杂晶体等原先标准BP神经网络所难以识别的有形成分,其识别的准确率得到明显的提高.
下一步的工作:基于创新型色度学的图像处理方法改进,识别准确率的问题成为尿沉渣有形成分检测的关键.标准神经网络算法的成熟性以及实现的简单性,使得研究中在一系列的神经网络中选择BP神经网络成为必然.通过对本研究的医学细胞识别的实际应用效果来看,其优点主要体现在处理速度、监督学习、智能记忆和准确率高等方面,具体可以总结为:1)处理速度快,能满足医学细胞检测的实时性要求;2)系统模型科学,智能学习先进,能适应在复杂环境下运行;3)记忆功能强,有助于细胞检测的高准确率.
然而,缺点也是显而易见的.如果系统的记忆数据库中没有类数据源,或者检测与分类奇异的各种细胞元,网络通常无法得出正确的识别效果,且在学习和识别这类奇异的细胞元素时,BP神经网络的识别准确率、系统收敛时间、模型等相关性能指标均有所下降.因此,推进工作可以一并实验基于色度学与形态学结合的识别方法,验证其对传统医学细胞的图像进行分析和识别时的效果.它可沿用BP神经网络识别所需的纹理特征参数和形态学特征参数的基础上,适当增加色度学上的HSV等3个特征参数,最终达到有效提高尿沉渣有形成分的识别准确率的目的.从而进一步改进针对尿沉渣图像有形成分的识别方法,为今后的相关学习和研究奠定一定的基础和良好的平台.
[1]刘玉成.基于色度学和形态学相结合的图像处理与识别技术研究[D].南京:南京信息工程大学,2009.
[2]焦李成,杨淑媛,刘芳,等.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716.
[3]严世珺.数字图像白平衡处理算法研究与改进[D].上海:上海交通大学,2015.
[4]RAFAEL C G,RICHARD E W,STEVEN L E.数字图像处理(Matlab)[M].2015.
[5]MIEHAEL B.Computational approaehes to image understanding[C]//Com Puting Surveys,2012,1(14):3-71.
[6]胡小锋,赵辉.图像处理与识别实用案例精选[M].北京:人民邮电出版社,2014:56-63,188-205.
[7]PIERRE L.The FPGA-based multi-classifier[J].Pattern Analysis and Applications,2015,18(1):207-223.
[8]SATOSHI M,JUN M,HITOSHI M.Ada ptive classifieation of urinary sediment images using feedbaek training[J].Systemsand Com Putersin Ja Pan,2015,32(2):237-244.
[9]傅蓉.细胞重叠与融合性图像的分离与分割技术研究[D].广州:第一军医大学,2007.
[10]冯乃勤,刘春红,张聪品,等.形态学联想记忆框架研究[J].计算机学报,2010(1):157-166.
[11]张波.基于数字图像技术的岩石边坡失稳灾害监测预报的开发研究[D].郑州:郑州大学,2007.
[12]陈志国,须文波.机器视觉智能机器人无损检测系统[J].计算机工程与应用,2009(14):12-14.
[13]田锐,郭艳玲.基于机器视觉的葡萄自动识别技术[J].东北林业大学学报,2008(11):95-97.
[14]韩媞.森林防火系统中图像识别算法的研究[D].哈尔滨:哈尔滨工业大学,2008.
[15]FUNT B,BERNARD K,MARTIN L.Is machine colour constancy good enough[C]∥Proceedings of the 5th European Conference on Computer Vision Freiburg,Germany,2014:445-459.
An Improved RGB Vector Space Polymerization of Urinary Sediment Image Segmentation
LIU Yucheng1,ZHANG Yingchao2
(1.State Key Laboratory,Nanjing University of Finance and Economics,210003,Jiangsu,Nanjing China;(2.Information and Control Institute,Nanjing University of Information Science and Technology,210044,Jiangsu,Nanjing,China)
The classic classification method based on morphological feature vector is unable to handle the image acquisition under complex environment.Therefore,the present study creatively proposes to consider the processing of cell tangible components from the perspective of improved chroma-segmentation and analyze the color values of R,G and B vector spaces in different regions to obtain G and B in the vector space of R,G and B,and find out the difference of the R,G and B distribution among them.And using the professional simulation software Matlab7.0,the pixel values of the detectable colors of the visible components of urine sediment collected in the DJ8300 super analyzer were measured.Categorization and recognition parameters C parameters in the RGB vector space Mahalanobis distance or Euclidean distance calculation process with three rows of three covariance matrix to represent.And the model is similar to a solid sphere locus method and three-dimensional solid ellipsoid method used.The experimental results show that the proposed method can optimize the segmentation of chromaticity and reduce the influence of light source and other environment during the collection process according to the similarity of fusion phenomena such as polygonal phenomena and adhesion of visible components in urine sediment images,to solve this problem of the visible image distortion of the urine sediment,and to improve the effect of the chromatic aberration correction of the image.The new breakthrough in the segmentation and classification of urinary sediment physical components by colorimetric methods has been fully demonstrated in the later data of the recognition experiment.
covariance matrix;vector space;mahalanobis distance;sphere locus method;three-dimensional ellipsoid method
TP 391
A
2095-0691(2017)01-0057-07
2016-09-30
江苏省六大人才高峰项目(2106-A-027);江苏省高校自然科学基金资助项目(12016KJD520122)
刘玉成(1980- ),男,江苏镇江人,实验师,硕士生,研究领域为计算机应用.通信作者:张颖超(1960- ),男,江苏徐州人,教授,研究领域为系统控制和仿真、网络控制技术等.