神经网络在实验室检测工作质量管理及控制中的应用
2014-05-28孙锡丽郭德淮
孙锡丽 黄 昕 黄 何 郭德淮 何 政 王 军
(宁波出入境检验检疫局 浙江宁波 315012)
1 前言
近年来,随着产品质量安全问题频现和消费者安全意识加强,作为衡量产品质量和安全的实验室检测结果,其科学性和准确性引起全社会广泛关注,重要性凸显。客观评价实验室检测工作质量,提前预测、防范并及时消除隐患,是实验室管理工作值得研究和探讨的课题。
神经网络起步于20世纪40年代,是由大量简单的处理单元(神经元)广泛互相连接而形成的复杂网络系统,具有大规模并行、分布式存储和处理、自组织、自适应以及自学习能力,特别适合需要同时考虑许多因素和条件、模糊的信息处理。神经网络为解决大复杂度问题提供了一种相对来说比较有效的简单方法,其中目前应用最广泛的模型之一是BP(Back Propagation)神经网络。本研究根据专家经验,建立影响实验室检测工作质量的评价指标体系,运用BP神经网络对指标的风险等级进行综合评判,找出高风险实验室,为实验室有效管理提供科学决策依据。
2 BP神经网络基本原理
BP神经网络是一种按误差逆传播算法训练的多层前馈网络[1],由输入层、隐含层和输出层组成,隐含层可以是一层或多层,其拓扑结构见图1。
图1 BP网络拓扑结构
BP网络的学习过程由两部分组成:正向传播和反向传播。当正向传播时,输入信息从输入层经隐单元层处理后传向输出层,每一层神经元的状态只影响下一层的神经元状态;如果在输出层得不到希望的输出,则转入反向传播,将误差信号沿原来的神经元连接通路返回,返回过程中,逐一修改各层神经元连接的权值。这种过程不断迭代,最后使得信号误差达到允许范围内。
BP网络中隐含层的层数和每层节点的个数决定了神经网络的复杂度。理论上已经证明,在不限制隐含层节点数的情况下,只有一个隐含层的BP网络可以实现任意非线性映射。因此,本研究使用具有单隐含层的BP网络。
3 检测工作质量风险评价模型构建
3.1 评价指标体系
实验室检测工作是指从实验室接样开始到检测结果输出的整个过程,其质量控制主要包括7个关键点[2]:人员、仪器设备、样品、关键性消耗器材、检测方法、设施和环境条件、检测实验室质量控制的实施。将上述7个关键点设为一级指标,在此基础上,结合日常实验室管理经验,分别对应设计出具体可实施评价的二级指标,形成实验室检测工作质量风险评价指标体系框架(见表1)。
表1 实验室检测工作质量风险评价指标体系
(续表)
人员、仪器设备一级指标选取某一实验室若干组实际人员、设备进行逐个评价,并将个体评价结果取均值汇总为实验室整体人员、仪器设备评价结果;样品、关键性消耗器材、检测方法、设施和环境条件、检测实验室质量控制等一级指标作为实验室管理整体评价指标,按单个实验室进行整体评价,并采取专家评价打分法取得数据。最终将各一级指标评价结果取均值汇总,成为实验室整体检测工作质量评价结果。
3.2 模型构建
3.2.1 网络设计
采用3层BP网络,输入层为实验室检测工作质量风险评价指标数据并按一级指标分别建立7个神经网络,输出层为各一级指标评价结果,中间为隐含层。
(1)输入、输出层节点数确定。实验室检测工作质量风险评价指标分为7个一级指标,各有4-10个二级指标作为BP神经网络的输入,因此输入神经元节点数n为各一级指标下含的二级指标个数。各一级指标输出神经元为评价的结果,评价结果只有1个,因此输出神经元节点数m=1。
(2)隐含层节点数确定。隐含层节点数与问题的要求、输入输出神经元的多少有着直接关系。如果隐含层节点数选择太少,会降低BP神经网络的容错性和自适应性,网络难以处理较复杂问题,导致训练不出理想结果;如果隐含层节点数选择太多,将使网络训练时间急剧增加,而且过多的处理单元容易使网络具有过多的信息处理能力,甚至将训练样本数据中没有意义的信息也记住,这时网络难以分辨数据中真正的模式。本研究依据文献资料[3]中经验公式计算得到各一级指标隐含层节点数为5-9,并经过实际测试,得出最佳隐含层节点数为10-25,例如人员一级指标神经网络形成9-25-13层网络结构(见图2)。
图2 人员一级指标神经网络模型结构
(3)模型建立。选用Matlab2011b神经网络工具箱中的Newff函数来初始化网络,传递函数为tansig,训练函数为trainlm,学习函数值为trainlim,性能默认值mse。所训练的模型参数设定为:训练步数为1000,网络性能目标误差为0.0001,学习率为0.01,动量常数为0.9。最后按照此参数调用优化trainlim算法来训练所建立的网络,训练过程达到设定的参数时,自动停止训练。
3.2.2 数据处理
对于实验室检测工作质量风险管理来说,采集到的样本数据多是定性数据。为了加快网络训练速度和准确度,BP神经网络所处理的一般是数值在[0,1]区间的数据,并在[0.2,0.8]因区间内有较好的重现性,因此需要在研究中将采集到的定性数据事先进行处理。
在本研究中,假设同一级指标权重相同,将二级指标的定性数据每个按0.2-0.8评分,评价指标与对应的数值见表2。
表2 评价指标对应的分数转换表
3.2.3 结果汇总
本模型根据7个一级评价指标分别建立神经网络。人员、仪器设备神经网络输出数据为个体数据,需要将该数据按输出结果取平均值;将人员、仪器设备输出结果的平均值与样品、关键性消耗器材、检测方法、设施和环境条件、检测实验室质量控制的输出结果求均值汇总并进行归一化后得出实验室最终的整体检测工作质量评价结果([0,1]区间内)。
归一化公式为:y=(x-MinValue)/(MaxValue-MinValue)
式中:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值,即0.8和0.2。
该评价结果数值越高表明实验室检测工作质量越良好,≥0.8为优秀,0.8-0.4之间为中等,≤0.4需要高度重视并进行整改。
4 应用举例
4.1 模型训练
训练样本的科学选择关系到网络训练的有效性。本研究根据实验室管理专家经验,选择11个实验室数据为训练集,并分别建立7个一级指标神经网络模型,按模型建立中给定的参数进行训练。
(1)人员、仪器设备一级指标神经网络模型训练
由于篇幅关系,下面仅展示11个实验室数据中的一组,共11个数据,按数据处理规则转换为[0.2,0.8]区间的数据作为输入样本,专家打分结果作为训练的期望值,进行神经网络模型训练,见表3。
表3 人员、仪器设备一组训练样本
(续表)
(2)样品等一级指标神经网络模型训练
对样品、关键性消耗器材、检测方法、设施和环境条件、检测实验室质量控制等一级指标神经,选11个实验室数据,按数据处理规则转换为[0.2,0.8]区间的数据作为输入样本,专家打分结果作为训练的期望值,进行神经网络模型训练,见表4。
表4 样品等一级指标训练样本
(续表)
(3)线性回归情况
经过训练,7个一级指标神经网络模型线性回归R值均达0.8以上,说明神经网络模型的回归性较好。由于篇幅关系,图3仅展示人员一级指标线性回归情况。
图3 人员一级指标线性回归图
4.2 测试样本
本研究抽取2个实验室的实际评价数据作为测试样本,按模型建立中给定的参数进行仿真测试。
(1)对人员、仪器设备一级指标神经网络模型进行仿真,并将模型输出结果取平均值,见表5-1、表5-2。
表5 -1 人员、仪器设备一级指标测试样本1
表5 -2 人员、仪器设备一级指标测试样本2
(2)对样品等一级指标神经网络模型进行仿真,模型输出结果见表6。
表6 样品等一级指标测试样本
(3)测试样本结果汇总。将各测试样本的一级指标输出结果进行归一化([0,1]区间)并进行取平均值,得到实验室整体检测工作质量分值(见表7)。测试样本1经归一化后的分值为0.8070,说明该实验室整体检测工作质量处于良好状态,整体检测风险较小。测试样本2经归一化后的分值为0.5853,说明该实验室整体检测工作质量处于中等状态,有一定的整体检测风险,需加强工作质量管理。专家对该2个实验室的打分分别为0.8和0.6分,测试结果与专家评定基本一致。
表7 测试样本实验室整体检测工作质量评价结果汇总表
5 结论
本研究建立的影响实验室检测工作质量的评价指标体系,运用BP神经网络建立风险分析评价模型,对7个关键风险指标进行逐个评价,对实验室检测工作质量进行综合量化,得出实验室整体检测工作质量风险量化数据。研究结果有利于在实验室管理工作中找出不同风险程度的实验室,为实验室有效管理提供科学决策依据。
[1]应海松.小波神经网络在铁矿石检验中的应用[M].北京:冶金工业出版社,2010.
[2]唐纳德C辛格.实验室最佳操作规范及相关准则质量手册[M].谢滋,陈世山,译.北京:中国标准出版社,2008.
[3]叶斌,雷燕.关于BP网中隐含层层数及其节点数选取方法浅析[J].商丘职业技术学院学报,2004,6:52-53.