GA-BP神经网络及其在液体乳安全评价中的应用
2017-06-01姜同强
姜同强,任 叶
(北京工商大学,计算机与信息工程学院,北京 100048)
GA-BP神经网络及其在液体乳安全评价中的应用
姜同强,任 叶*
(北京工商大学,计算机与信息工程学院,北京 100048)
利用遗传算法(Genetic Algorithm,GA)优化BP(Back Propagation,BP)神经网络的初始权值、阈值,以期加快网络收敛,提高预测精度。以乳制品中的液体乳为实验材料,建立安全评价指标体系;将优化后的GA-BP神经网络作为评价模型,对液体乳的日常检测数据进行拟合;以测试数据作为验证,检测模型的收敛速度和拟合度。结果表明GA-BP较BP神经网络来讲更稳定,能较快收敛,且仿真误差较小;在隐层节点数为9时,GA-BP神经网络对液体乳的拟合效果最好,预测精度较高,是一种可行的液体乳安全状况评价方法。
遗传算法,BP神经网络,液体乳,食品安全评价
食品安全问题的发生,不仅损害了消费者的健康,还给社会经济造成了极大的损失,为保障人们吃上无害食品,对食品风险进行安全评价就显得尤为重要。食品安全评价主要包括指标体系和评价模型两个部分。
对不同的研究对象,指标体系的构建差异甚大。已有研究成果大多基于危害分析与关键控制点[1](Hazard Analysis Critical Control Point,HACCP),对食品生产、加工、销售过程中可能产生危害的关键点进行分析,以构建安全评价指标体系,如以食品供应链为研究主线[2-3]。
评价模型的选取也直接影响评价结果的高效性和准确性。常用评价模型主要有2类:定性分析和定量分析。定性分析主要借助相关理论分析得出结论,如德尔菲法[4]、风险矩阵[5]、案例推理[6]等。定量分析主要采用方法、模型对食品的检测或监测数据进行分析,实现对食品安全的评价,如主成分分析[7]、因子分析[8]、时间序列法[9]、贝叶斯网络[10-11]、神经网络[12-13]等。
针对以上内容,国内外研究学者已经做了大量优化指标体系[14-15]、改进评价方法[16-17]的工作来完善。神经网络是食品安全评价研究中的常用工具[18-19]。其中,BP神经网络是非线性不确定性数学模型[20],它将误差作为导师信号,反向调整网络权值、阈值,来实现数据的拟合,在乳制品溯源[21],品质分类识别[22]等领域已经有着广泛的应用。
表1 液体乳安全检测原始数据
然而,在实际使用中BP神经网络也存在着局限[20]:收敛速度慢;局部极小点。遗传算法具有较快的收敛能力和较强的学习能力[23]。因此,可以利用遗传算法(Genetic Algorithm,GA)擅长搜索全局最优的特点,来弥补BP神经网络的缺陷[24]。
为弥补BP神经网络局部最优、收敛速度慢的缺陷,本文利用遗传算法优化BP神经网络的初始权值、阈值,并以液体乳为材料进行实验验证。一方面,要利用GA-BP神经网络模型对液体乳进行安全评价,验证模型有效性;另一方面,要根据实验结果比较GA-BP神经网络与BP神经网络的网络性能,验证GA-BP神经网络的优良性。
1 材料与方法
1.1 实验材料
本文使用的实验数据来自食药监局的日常检测,偏重成品检测。先对原始数据进行筛选,获得液体乳检测数据。同时,简化属性,去除次要因素,如报送单位、生产企业等信息。简化后的数据如表1所示。
对简化数据进行预处理。
对数据进行分析,去除次要影响因素,挑选出11个检测项作为评价指标。评价指标分为5类:品质指标、金属污染物、食品添加剂、微生物与致病菌、非法添加物危害。
检测结果包含定量值和定性值。对定量值,以标准界限值为参考依据进行处理。对定性值,先将其定量化,如“未检出”量化为检测值0,再按定量值进行处理。其中,正指标和逆指标的处理方法相反。
本文将挑选200组数据作为实验的训练集和测试集。每组样本所对应的安全状况将参考行业专家的意见,采用专家问卷方式获得。此外,还需要对这200组数据进行归一化。
1.2 实验方法
1.2.1 安全评价指标体系的建立 根据预处理结果,参考国家标准[25]、企业标准,结合文献资料[21],构建液体乳的安全评价指标体系,如表2所示。
对于液体乳安全状况,本文将借鉴李克特量表[2]的思想构建液体乳安全状况等级,将安全状况进行量化。具体划分见表3。
1.2.2 BP神经网络工作原理 BP神经网络是一种基于误差反传的多层感知器,以图1所示的单隐层网络的应用最为普遍。单隐层感知器包括了输入层、隐层和输出层。
表2 液体乳安全评价指标体系
表3 液体乳安全状况等级划分
图1 三层BP神经网络结构[20]Fig.1 Three-layer BP neural network[20]
表4 GA-BP神经网络和BP神经网络性能比较
三层传感器中,输入向量为X=(x1,x2,…,xi,…,xn)T,隐层输出向量为Y=(y1,y2,…,yj,…,ym)T,输出层输出向量为O=(o1,o2,…,ok,…,ol)T,期望输出向量为d=(d1,d2,…,dk,…,dl)T,输入层到隐层之间的权值矩阵为V=(V1,V2,…,Vj,…,Vm),隐层到输出层之间的权值矩阵为W=(W1,W2,…,Wk,…,Wl)。隐含层和输出层的激活函数分别为f1、f2,设b1、b2为隐层、输出层神经元的阈值,其中V,W,b1,b2的取值范围为(-1,1)。
当网络输出与期望输出不等时,存在输出误差E,定义如下:
k=1,2,…,lj=1,2,…,m
式(1)
由式(1)可知,网络误差E是包含权值、阈值(V,W,b1,b2)的函数,当输入向量X一定时,调整两者可以改变误差E的大小,而网络局限也与网络初始状态(初始权值、阈值)有关,为此采用遗传算法产生其初始状态,实现对BP神经网络的优化。
1.2.3 遗传算法优化BP神经网络 利用遗传算法优化BP神经网络的初始权值、阈值的核心内容主要为:
确定编码长度。因为是利用遗传算法优化BP神经网络的初始状态,所以种群中的每个个体都应该包含网络权值、阈值,那么编码串就应该由四部分组成[24]:输入层到隐层权值(W)、隐层到输出层权值(V)、隐层阈值(b1)、输出层阈值(b2)。根据BP神经网络的网络结构,编码的长度为:i×m+m×l+m+l,对应权值个数和阈值个数。
确定适应度函数。BP神经网络主要以其均方误差作为评判依据,误差越小,网络越优良。因此,本文将均方误差的倒数作为适应度,若误差越小,则适应度越大。
确定网络初始状态。将遗传算法获得的最优权值、阈值作为BP神经网络的初始状态。
以MATLAB软件为实验工具,将样本集中180组样本作为训练集,剩下的20组样本作为测试集进行实验。本实验将在经验公式范围内,对BP神经网络和GA-BP神经网络随机运行50次,选取均方误差MSE、迭代步数(收敛速度)作为网络性能评价指标。
2 结果与分析
2.1 GA-BP神经网络和BP神经网络性能比较
对表4中的实验结果进行分析,随着隐含层神经元个数的增加,两种网络的迭代次数、训练集的均方误差均逐渐降低,而测试集的均方误差变化较复杂,波动较多,在隐层神经元个数为8(BP)和9(GA-BP)时取得最低值。因而,就本次实验的数据来讲,GA-BP和BP神经网络的最佳隐层节点数分别为9和8,此时两种网络能够更好地拟合实验数据。
由表4中的实验结果可见,在训练过程中,GA-BP神经网络较BP神经网络而言迭代次数更少,收敛速度更快,说明利用遗传算法优化BP神经网络的初始权值、阈值,确实能起到加快网络收敛的效果。但随着隐层神经元个数的增加,两种网络的收敛速度都有较大提高,利用遗传算法优化网络在加快网络收敛上的优势就不够明显。就实验误差来看,不管是训练还是测试过程,GA-BP比BP神经网络对数据的拟合更好,其均方误差更小。因而,利用遗传算法能够一定程度优化BP神经网络的局部最优问题。值得一提的是,BP神经网络进行数据拟合时,迭代次数和实验误差都波动较大,表现时好时坏,而GA-BP神经网络的实验结果在小范围内进行波动,相对来讲更稳定,那么就有更大的概率能够对数据实现较好的拟合。
2.2 GA-BP神经网络的液体乳安全评价
就实验结果来看,利用GA-BP神经网络进行液体乳安全评价时,网络的最佳隐节点数为9。因而,针对隐节点数为9的GA-BP神经网络实验,列举某一次实验结果进行分析。
将遗传算法优化得到的初始权值、阈值赋给BP神经网络,用实验样本集进行训练,对数据进行拟合,预测非线性函数输出,其训练集与测试集的仿真误差见图2。
图2 基于GA-BP神经网络的 液体乳安全状况评价仿真结果Fig.2 Simulation results of dairy products safety evaluation based on GA-BP neural network注:a为训练集,b为测试集。
从图2可见,训练集使用180组数据,测试集为剩余的20组。利用训练好的网络对训练集和测试集进行仿真,得到的结果与实际值间的均方误差为0.0000897、0.0012。就网络误差来看,仿真结果均方误差较小,说明GA-BP神经网络能够对液体乳的检测数据进行较好拟合,对液体乳安全评价的非线性仿真效果良好。训练好的GA-BP神经网络模型亦可以用于后续的液体乳安全状况评价。
3 结论
本文以液体乳为实验材料,采用GA-BP神经网络评价模型对检测数据进行拟合,实现对液体乳安全状况的可靠性评价和GA-BP模型的有效性验证。研究结果表明,利用遗传算法优化BP神经网络的初始权值、阈值能加快网络收敛,有效拟合数据,优化了BP神经网络的局部最优问题。同时,GA-BP较BP神经网络来讲更稳定,有更大的概率达到全局最优。经实验验证,GA-BP神经网络能够在系统内部规律未知的情况下,对液体乳安全状况进行可靠评价,且在隐层节点数为9时,仿真结果误差最小,是一种可行的食品安全分析途径。
[1]Liao J Y. Research of food quality safety control system based on HACCP[J]. Journal of Anhui Agricultural Sciences,2012,23:11843-11845.
[2]蔡强,王君君,李海生,等.基于神经网络的食品安全评价 模型构建研究[J].食品科学技术学报,2014,01:69-77.
[3]雷勋平,Robin Qiu,吴杨.基于供应链和可拓决策的食品安全预警模型及其应用[J].中国安全科学学报,2011,11:136-143.
[4]周萍萍,张磊,焦阳,等.应用德尔菲法建立进口食品中化学性危害物质风险分级指标体系[J].食品安全质量检测学报,2016,05:2114-2119.
[5]Liu Q J,Chen T,Zhang J H,et al. Risk matrix-based risk monitoring model of food safety[J]. Food Science,2010. 05:86-90.
[6]Gong Y X,Wang D H. View on the food safety emergencies risk pre-warning system based on case-based reasoning[J]. Food Science & Technology,2012,07:311-315.
[7]周乃元,潘家荣,汪明.食品安全综合评估数学模型的研究[J].中国食品卫生杂志,2009,03:198-203.
[8]王媛媛,洪思慧,房晓倩,等.基于因子分析的食品监管风险评价模型研究[J].食品工业科技,2016,13:266-270.
[9]董笑,白宝光.基于时间序列分解法对原料乳质量安全预测的探究[J].食品工业,2016,05:188-191.
[10]张丽,滕飞,王鹏.基于贝叶斯网络的食品供应链风险评价研究[J].食品研究与开发,2014,18:179-182.
[11]Zhang F Y,Dong Q L,Huang S L,et al. Modeling the qualifying criteria of pork based on Bayesian network[J]. Science & Technology of Food Industry,2012,10:52-54,93.
[12]Wang J,Tang Z,Jin X. Food Safety Evaluation System Construction Based on Artificial Neural Network[J]. Advance Journal of Food Science and Technology,2015,02:98-100.
[13]章德宾,徐家鹏,许建军,等. 基于监测数据和BP神经网络的食品安全预警模型[J]. 农业工程学报,2010,01:221-226.
[14]唐晓纯,苟变丽.食品安全预警体系框架构建研究[J].食品科学,2005,12:246-250.
[15]武力. “从农田到餐桌”的食品安全风险评价研究[J].食品工业科技,2010,09:304-306.
[16]徐超,杜树新,罗祎,等. 基于集对分析理论的进出口食品安全风险评价方法[J]. 科技通报,2013,03:208-211,230.
[17]刘於勋.食品安全综合评价指标体系的层次与灰色分析[J].河南工业大学学报(自然科学版),2007,05:53-57.
[18]金剑,齐思源,彭亚拉.神经网络法在食品安全预警中的应用[J]. 食品科技,2011,11:306-309.
[19]王辉,王斌,徐静,等.基于BP神经网络的乳制品质量预测研究[J].农机化研究,2013,03:218-220.
[20]韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2007:47-62.
[21]吴聪.乳制品供应链的溯源体系与预警模型研究[D].广州:华南理工大学,2014.
[22]仲伟峰,马丽霞,何小溪.PCA和改进BP神经网络的大米外观品质识别[J].哈尔滨理工大学学报,2015,04:76-81.
[23]雷英杰,等.MATLAB遗传算法工具箱及应用[M].西安:西安电子科技大学出版社,2005:146-207.
[24]刘春艳,凌建春,寇林元,等.GA-BP神经网络与BP神经网络性能比较[J].中国卫生统计,2013,02:173-176.
[25]国家国家食品安全风险评估中心. 食品安全国家标准汇编[M].北京:中国人口出版社,2014:1-563.
GA-BP neural network and its application in safety evaluation of liquid milk
JIANG Tong-qiang,REN Ye*
(School of computer and information engineering,Beijing Technology and Business University,Beijing,100048)
The initial weights and thresholds of back propagation(BP)neural network were optimized by genetic algorithm(GA)to accelerate the network convergence and improve the prediction precision. The liquid milk in dairy products was used as the experimental material to establish the safety evaluation index system. The GA-BP neural network was used as the evaluation model to fit the daily data of liquid milk. The convergence rate and the fitting degree of the model were verified by the test data. The results showed that GA-BP was more stable than BP neural network and could converge quickly,and the simulation error of GA-BP neural network was smaller. When the number of nodes was 9,GA-BP neural network had the best fitting effect to liquid milk,and the prediction precision was high. So GA-BP neural network was a feasible method to evaluate the safety of liquid milk.
genetic algorithm;BP neural network;liquid milk products;evaluation of food safety
2016-10-24
姜同强(1966-),男,硕士,教授,研究方向:综合评价技术,E-mail:jiangtq@th.btbu.edu.cn。
*通讯作者:任叶(1993-),女,硕士研究生,研究方向:食品安全综合评价,E-mail:r1104040125@163.com。
国家科技支撑计划“电子溯源的食品安全风险评估关键技术研究与应用”(2015BAK36B04);北京市科技计划项目(Z161100001616004);2016年研究生科研能力提升计划项目资助。
TS201.6
A
1002-0306(2017)05-0289-04
10.13386/j.issn1002-0306.2017.05.046