基于BP神经网络的婴幼儿奶粉质量安全评价模型研究
2017-03-28朱雨文刘波峰谭阳红
朱雨文 刘波峰 谭阳红
摘要:针对婴幼儿奶粉质量安全评价问题,提出了基于BP神经网络的评价模型;以湖南卓跃生物科技有限公司日常监测数据为样本,筛选并选择了与婴幼儿奶粉质量安全评价最为相关的27种指标因素,以27种指标因素组成输入层,评价结果组成输出层;针对隐含层节点个数,首先利用试凑法预估范围,然后利用MATLAB仿真确定最佳的隐含层节点个数,最后利用10组数据对神经网络评价模型进行了仿真验证。结果表明,提出的评价模型是可行和有效的。
关键词:婴幼儿奶粉质量;安全性评价;BP神经网络;供应链
中图分类号:TP183;TS252.7 文献标识码:A 文章编号:0439-8114(2017)04-0740-05
2008年发生的三鹿奶粉的三聚氰胺问题让国内消费者对国产婴幼儿奶粉安全信心崩塌,国产奶粉市场占有率不断下降;2013年恒天然的肉毒杆菌事件表明国外婴幼儿奶粉安全性也存在诸多问题[1,2]。保障婴幼儿奶粉质量安全,已经成为政府和众多专家学者研究的热点。白世贞等[2]基于供应链视角对乳制品质量安全进行了研究,孙肖明等[3]针对影响乳制品质量因素和解决办法进行了研究,柳亦博等[4]利用危害分析临界控制点(Hazard Analysis Critical Control Point,HACCP)体系针对乳制品质量安全监理进行了研究。
研究表明,影响乳制品质量安全的因素很多。在乳制品中,婴幼儿奶粉食用对象为婴幼儿,其质量安全问题更需保证。婴幼儿奶粉最终到消费者手中时,经历从生产到销售的众多环节,每一个环节出现问题都有可能对婴幼儿奶粉质量产生影响,如何科学和有效评价婴幼儿奶粉质量是非常必要的。葛哲学等[5]基于监测数据和BP神经网络构建了食品安全预警模型;章德宾等[6]基于BP神经网络构建了乳制品质量安全评价研究。但已有研究存在以下不足:①都是针对多种商品的食品安全建模,由此建立BP神经网络模型相对宽泛,而针对婴幼儿配方奶粉质量安全评价时,商品以及其供应链更加具体、国家标准更加严格,HACCP关键点控制的不同,其评价指标必须更加具体和详细;②建立的BP神经网络模型是针对多种商品,针对婴幼儿奶粉质量安全评价模型研究较少。
BP神经网结构简单,训练与调控参数丰富,在神经网络中应用最广泛,其不需要输入、输出值间存在严格的假设关系,同时能够以区间数、模糊数等方式处理定性信息[7],在模式识别[7,8]、危害分析和HACCP中关键点股市分析预测[9-12]、管理问题优化与决策等方面得到大量的实际应用[13]。本研究在分析湖南卓跃生物科技有限公司日常监测数据基础上,基于婴幼儿奶粉供应链,从奶牛养殖、挤奶、加工包装、仓储运输、销售整个过程出发,参照HACCP和GB10765-2010《食品安全国家标准:婴儿配方食品》要求[14],在每个环节中选取关键点作为评价指标,分析建立基于BP神经网络的婴幼儿奶粉质量安全评价模型,在MATLAB中编程实现,并进行模型有效性验证。
1 婴幼儿奶粉质量安全评价指标的筛选
婴幼儿奶粉供应链可分为奶牛养殖、挤奶、加工包装、仓储运输、销售5个环节。每个环节基于HACCP关键点控制方法和国家标准GB10765-2010《食品安全国家标准:婴儿配方食品》筛选评价指标,筛选的主要原则是:
1)记录整个婴幼儿奶粉供应链所涉及企业的信息。
2)筛选出对婴幼儿奶粉安全有影响的信息。
3)所筛选的指标要符合国家相应的法律法规的要求。
4)所筛指标准确可靠,指标釆集简单可行。
基于上述筛选原则和饲养规律把养殖环节分成养殖饲料科学性与安全性、养殖卫生环境、疾病防疫水平等3个主要评价指标。
基于上述筛选原则,结合工厂实际检测相关指标,把挤奶环节评价指标分为必需含有评价指标、污染物评价指标、真菌霉素评价指标、微生物评价指标。其中,蛋白质含量和脂肪含量必需含有评价指标;污染物评价指标包括铅、汞、铬、砷、三聚氰胺、硒硝酸盐、亚硝酸盐含量;真菌霉素评价指标包含黄霉素M1含量;微生物评价指标原奶中细菌总数、大肠菌落含量。
加工包装环节、仓储运输环节、销售环节的评价指标都是依据上述筛选原则,结合各自环节所存在问题确定,其具体原则如下:
婴幼儿奶粉供应链的5个环节具体27个评价指标如表1所示,表1中限于空间只列举了6组用于婴幼儿奶粉质量安全评价的原始数据。由表1可知,数据存在如下特点:
1)抽象性变量,如养殖信息中养殖饲料科学性和安全性难以用精确的指标反映出来,这些评价指标就需要依靠专家打分来反映相对客观、合理的结果。
2)具体测量种类较多,要将这些数据全部纳入到一个模型中,就需要一个相对简单的方法来处理这些不同类型数据。采用了归一化处理的方法。
2 神经网络建模
神经网络的学习方式与用途有很多种类,其中具有误差反向传播算法的BP神经网络是目前应用最为广泛的一种人工神经网络。BP神经网络除输入层和输出层外,还包括一个或多个隐含层,各个层神经元之间实现全连接,而同层内各神经元无连接。含有单个隐含层的BP神经网络可以任意逼近含有多个隐含层的BP神经网络,因此采用由输入层、隐含层、输出层构成的3层BP神经网络。
BP神经网络建模,首先确定输入层和输出层节点个数。隐含层节点个数的确定首先利用试凑法预估范围,然后利用MATLAB仿真確定最佳的隐含层节点个数。
2.1 输入层和输出层节点个数的确定
输入层个数的确定是以湖南卓跃生物科技有限公司日常监测数据为样本,筛选并选择了与婴幼儿奶粉质量安全评价最为相关的27种指标因素,以27种指标因素作为输入层个数,具体指标见表1中评价指标项。
输出层个数确定为1,质量安全评价模型输出结果应遵循原则为简单、直观、有效。所以采用评价等级数字作为输出层,来反映整个供应链下婴幼儿奶粉质量安全评价分。评分为1~9分,1分表明婴幼儿奶粉质量安全最差,9分表明质量安全最好,低于6分就表明婴幼儿奶粉质量安全存在问题。
2.2 隐含层节点个数的确定
隐含层节点个数确定是一个非常复杂的问题,目前还没有一个理想的解析式可以准确确定隐含层节点个数,这也是BP神经网络的缺点之一[15]。但是,在实际应用过程中可以根据经验公式M=■估计隐含层神经元的个数[16]。其中,n表示输入层个数,这里是27;m表示输出层的个数,这里是1;a为1~10的常数,由试凑法可知,隐含层神经元的个数7~16,然后分别比较所构建的10个BP神经网络的性能,选取均方误差精度最小时隐含层个数作为本研究BP神经网络模型隐含层神经元个数。
BP神经网络要求传递函数全部可微,现有可微传递函数主要有Purelin、logsing、tansig 3种[7],因为输入变量p的维度27还是有点大,为了能够较快得到收敛,选择tansig()函数为隐层神经元的传递函数;输出层神经元的传递函数也选择tansig()函数;训练BP神经网络选择基于数值优化的Trainlm()函数,因为Trainlm()函数与传统的梯度下降法相比,具有收敛速度快和精度高等特点。权值和阈值的初始化采用Newff()函数自动完成[14]。
使用MATLAB 7.10的神经网络工具箱,用300个样本来测试构建的10个BP神经网络的性能。由表2可知,隐含层神经元个数为12时,构建BP神经网络性能最佳。构建了婴幼儿奶粉质量安全评价的BP神经网络模型,如图1所示。
3 MATLAB实现与验证
根据BP神经网络模型,开始训练BP神经网络。神经网络的训练首先要设定最大训练次数、目标精度、学习率等参数。图1模型在不设置训练次数的情况下,最优训练精度在训练8 000次左右即稳定于1e-16,但此时的测验样本平均绝对误差达到了0.952 3,出现了训练样本过度学习的过拟合现象。为防止过拟合现象的出现,目标精度应低于最优值的水平,经过测试将训练目标精度设为1e-8,训练次数设为2 000,BP神经网络性能较好。学习率设为0.01,因为学习率过大,会造成学习过程的不稳定,通过测试发现学习率设为0.01较为合理。
在以上训练参数下,选取300个样本来训练,10个测试样本作为验证,训练结果如图2所示。由图2可知,在训练周期为51次时,该网络收敛于稳定,目标精度达到预设的1e-8。
婴幼儿奶粉质量安全实际评分与预测评分散点图如图3所示。由图3可知,预测评分与实际评分结果非常接近。
10个测试样本的预测评分与误差率见表3。由表3可知,10个测试样本误差率都在0~4%之内,平均误差率是1.10%,说明已构建的BP神经网络较为准确的,可以对婴幼儿奶粉质量安全进行评价。
4 结论
通过建立BP神经网络模型对历史数据进行训练,能够在系统内部规律未知的情况下,对新的待测样本做出较为精确的预估。本研究基于BP神经网络的这种优点,结合婴幼儿奶粉供应链特点,以湖南卓跃生物科技有限公司日常监测数据为样本,筛选并选择了与婴幼儿奶粉质量安全评价最为相关的27种指标因素,以27种指标因素组成输入层,评价结果组成输出层。针对隐含层节点个数,首先利用试凑法预估范围,然后利用MATLAB仿真确定最佳的隐含层节点个数。最后利用10组数据对神经网络评价模型进行了仿真验证。结果表明,基于BP神经网络的婴幼儿奶粉质量安全评价模型能够在实际训练数据样本进行有效预测,是一种可行的婴幼儿奶粉质量安全评价方法。
参考文献:
[1] 郭利亚,王加启.当前我国奶业发展的五个特征[J].中國畜牧杂志,2013,49(8):3-5.
[2] 白世贞,刘忠刚.基于供应链视角的乳制品质量安全问题研究[J].商品储运与养护,2013,35(12):105-108.
[3] 孙肖明,孟宪梅.影响乳制品质量安全的因素与解决措施[J].畜牧兽医科技信息,2013(8):9-10.
[4] 柳亦博,朴贞子.HACCP体系控制与乳制品质量安全监管研究[J].山东农业科学,2010(3):98-101.
[5] 葛哲学,孙志强.神经网络理论与MATLABR2007实现[M].北京:电子工业出版社,2007.
[6] 章德宾,徐家鹏,许建军,等.基于监测数据和BP神经网络的食品安全预警模型[J].农业工程学报,2010,26(1),221-226.
[7] 赵 杰,林 辉.基于BP神经网络模型的目标属性识别仿真[J].系统仿真学报,2007,19(11):2571-2573.
[8] 陈 红,熊利荣,胡筱波,等.基于神经网络与图像处理的花生仁霉变识别方法[J].农业工程学报,2007,23(4):158-161.
[9] CHEN C R,RAMASWAMY H S. Analysis of critical control points in deviant thermal processes using artifical neural networks[J].Journal of Food Engineerings,2003,57(3):225-235.
[10] 张绍秋,胡跃明.基于BP神经网络的税收预测模型[J].华南理工大学学报(自然科学版),2006,34(6):55-58.
[11] DUBUS I G,BEULKE S,BROWN C D.Calibration of pesticide leaching models:Critical review and guidance for reporting[J].PestManagementScience,2002,58(8):745-758.
[12] CAMPO I S,BEGHIN J C. Dairy food consumption,supply, and policy in Japan[J].Food Policy,2006,31(3):228-227.
[13] 禹建丽,孙增圻,VALERI KROUMOV,等.基于BP神经网络的股市建模与决策[J].系统工程理论与实践,2003,23(5):15-19.
[14] 孙红英.BP神经网络方法在用电量预测中的应用[D].广州:中山大学,2005.
[15] 刘忠刚.基于BP神经网络的乳制品质量安全评价系统[D].哈尔滨:哈尔滨商业大学,2014.
[16] 韩志国,王基铭,陈智高.基于人工神经网络的石油化工工程建设项目管理绩效评价[J].石油学报(石油加工),2010,26(3):317-319.