基于神经网络的尿样颜色识别方法比对分析
2013-09-05王春红张弘强王雪飞张全禹崔金玉
王春红 张弘强 王雪飞 张全禹 崔金玉
(绥化学院 黑龙江绥化 152061)
一、引言
颜色识别在图像处理、遥感技术、工业过程控制、产品质检、机器人视觉系统等领域已得到广泛应用。利用已有的彩色图像处理设备,如摄像头、彩色数码相机等可以进行尿样的颜色识别[1]。但是,由于系统信号传输的非线性等各种外在因素的影响,不同设备间颜色信息的传递是非常复杂的。同一彩色图像经不同彩色图像处理设备拍摄或扫描后再输入到计算机中所得到的RGB数据文件在数量大小和比例关系上也会呈现明显的失调[2]。
神经网络通过寻找输入—输出数据间的关系来实现模式识别任务。经过几十年的发展,神经网络已经在模式识别中奠定了不可或缺的位置[3]。
本文针对颜色色空间转换非线性的复杂关系,在获取标准阈值颜色色度值后,建立学习矢量量化(LVQ)神经网络和概率神经网络(PNN),用于尿样的颜色识别,并与颜色色差评价方法进行了比对。
一、样本体系结构
(一)标准阈值
尿液生化分析每一个具体项目中,分为非正常情况(+,++,+++)、临界正常(-+)和正常(-)。将不同测试项目的尿试纸与标准阈值实验液作用,并在规定时间内测试尿试纸的颜色值,每个检测项目均有5个标准阈值,进行5组实验,即每个检测项目共提取25个颜色RGB值。
(二)标准阈值间色差计算
直接用色度仪器测试与标准阈值实验液反应后的尿试纸的颜色三刺激值XYZ。为能够反映两个颜色之间色差的大小,通常将物体的颜色三刺激值XYZ转化成CIELab匀色空间的色度值[4],依据(1)式进行计算。
其中:Xn,Yn,Zn为标准照明体的三刺激值;L*为米制明度;a*、b*为米制色度。
A、D65标准光源下的尿胆素原标准阈值色度数据如表1所示。
表1 标准光源下的色度数据T ab 1 Experimental data sheet under D65 standard light sources
在D65、A标准光源下的相邻标准阈值间的色差如表2所示。
表2 标准光源下相邻标准阈值间色差T ab2 Color difference under D65 standard light sources
由表2的色度数据可以看出,D65、A标准光源下标准阈值间的色差已超过了人眼颜色分辨差别的阈值。
(三)指标数据的量化处理
对输入数据进行量化处理可减轻网络训练难度[5]。利用计算量化公式将数据转化为区间[0.05,0.95]上无量纲指标属性值。当目标数据越小分析结果越高时,效应系数的计算公式为:
当目标数据越大分析结果越高时,效应系数的计算公式为:
其中Xjmax,是第j个指标的最大值;Xjmax是第j个指标的最小值;Fj是目标数据为Xj的效应系数;j是评价指标数目。将D65标准光源下的尿样颜色RGB数据经过上述处理后,便得到归一化样本数据。
二、LVQ神经网络和概率神经网络的建立和训练
(一)LVQ神经网络
利用Matlab神经网络工具箱中的newlvq()函数设计LVQ网络,代码为:net=newlvq(minmax(P),n,[a,b,c,d,e]),其中 P是输入样本向量,n是竞争层神经元数,a,b,c,d,e分别表示输入样本中各类所占的百分比。输入层神经元数与评价指标数对应[6]。用颜色RGB值对尿样生化分析结果进行模拟评价,因此,网络输入层神经元数为3。根据已有数据,5个阈值,即共有5个训练样本,5个模式中共 25个训练样本中。因此,a,b,c,d,e取值均为0.2。学习率leranlvl采用默认值为0.01,训练步数epochs设为1000。网络的输出结果分5个等级,为-、-+、+、++、+++,因此取输出神经元个数为5。
网络训练函数为trainr,6次训练后网络误差为0.08,经过138次训练后,网络误差达到0,训练结果如图1所示。网络训练好后,权值就固定下来了。以后对于每一输入值,网络就会输出相应的分类值,可以利用这一点来进行网络测试。尿试纸与标准阈值实验液作用后的颜色RGB值为训练样本,每个检测项目中均有5个阈值,共进行5组实验,即每个检测项目共有25个训练样本,与待测尿液反应后的尿试纸颜色RGB值为测试样本。
(二)PNN神经网络
每个检测项目有5个阈值,即每个项目5个训练样本,与待测尿液反应后的尿试纸颜色RGB值为测试样本。输入层神经元数与评价指标数对应,用颜色RGB值对尿样生化分析结果进行模拟评价,因此PNN神经网络输入层神经元个数取为3。隐含层神经元数与学习样本数相同,分成5类,因此隐含层神经元数为5。加权函数为欧氏距离加权函数dist,传递函数为高斯函数radbas。编程中设计输人函数为netprod,输出函数为compet,加权函数为dotprod。网络的输出结果分5个等级,即 -、-+、+、++、+++,因此取输出神经元个数为5。
PNN网络设计函数newprm(),代码为:net=newpnn(P,t,spread),其中 net为产生的概率神经网络,t为目标向量,即评价等级,分别用1,2,3,4,5代表-,-+,+,++,+++五个等级,P为输入样本向量。spread为径向基函数的分布密度,这里设为0.1。
三、预测结果比对
把验证样本数据输人训练完成的LVQ神经网络和概率神经网络进行预测:Y=sim(net,X),X为验证样本矢量,Y为预测结果。ind2vec函数为将类别向量转换为可以使用的目标向量的神经网络函数,也可用函数vec2ind将仿真分类结果转化为易识别的类别向量。
D65标准光源下,测试尿胆素原与待测尿液反应后的尿试纸颜色RGB值,归一化RGB空间色度值及预测结果如表3所示。预测结果1为训练样本和验证样本均未作归一化处理的测试结果。由表3有,对数据进行归一化处理后的LVQ和PNN仿真预测结果2与期望输出值是完全吻合的,这说明网络有比较好的预测精度。而LVQ和PNN利用原始数据进行仿真的预测结果1的预测正确率分别为57.1%和71.4%,说明利用网络进行分类识别时归一化处理是完全必要的。
表3 基于LVQ神经网络的尿样颜色分类结果Tab 3 T he classification results of urine color based on LVQ
四、结论
1.利用神经网络进行分类识别时实验数据的归一化处理是完全必要的。
2.与尿液生化分析颜色色差方法[1]进行了比对,预测值Y与颜色色差计算方法结果完全吻合,表明网络有较好的预测精度,LVQ神经网络和PNN神经网络用于进行尿样生化分析是完全可行而有效的。本文在样本数据较少的情况下,取得了较满意的结果。
[1]王春红,周越,赵红霞.基于色差评定方法的尿液生化分析系统研究[J].四川大学生物医学工程学杂志, 2008(1).
[2]张国,卢凌,阚大顺.颜色在识别中的应用及关键技术研究[J].武汉理工大学学报,2008(4).
[3]BA0 Xiao an,LUO Zhuo lin,ZHANG Rui lin.Apple Grade Judgment Based on the Neural Network[J].AgriculturalSciencesinChina.2004(1).
[4]汤顺青.色度学[M].北京:北京理工大学出版社,1990.
[5]王春红,张弘强,于长兴.基于概率神经网络的尿样颜色识别[J].光学仪器,2012(5).
[6]飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].北京:电子工业出版社,2005.