基于BP神经网络的柑橘农药残留预测
2022-11-16周佳俊龚道新蒋紫烟梁佳豪赵佳苏龙廖婵娟
周佳俊,龚道新,2,蒋紫烟,梁佳豪,赵佳,2,苏龙,2,廖婵娟,2
基于BP神经网络的柑橘农药残留预测
周佳俊1,龚道新1,2,蒋紫烟1,梁佳豪1,赵佳1,2,苏龙1,2,廖婵娟1,2*
(1.湖南农业大学资源环境学院,湖南 长沙 410128;2.湖南农业大学农业环境保护研究所,湖南 长沙 410128)
基于BP神经网络算法,采用主成分分析法得到农药相对分子质量、气温、降水量、pH、CEC、有机质、施药浓度、采收间隔期是影响农药残留量的主要因素,并将其作为输入变量,初步构建柑橘农药残留预测模型。结果表明:经160组样本数据模型训练和测试,预测相对误差为0.92%~18.93%,平均为7.42%,绝对误差为0.001~0.153 mg/kg;BP神经网络预测模型的决定系数为0.962 05。可见,面对复杂的自然环境及柑橘种质性状,基于BP神经网络的柑橘农药残留预测系统对柑橘上多种农药的残留显示出较高的预测精度,说明将机器学习算法用于柑橘的农药残留检测是可行的。
柑橘;农药残留;BP神经网络;主成分分析;预测模型
柑橘在中国的种植面积已经超过苹果跃居全国首位,但柑橘产业仍存在优质、高产的品种缺乏,种植技术水平较低等问题[1–3]。相比于柑橘产业的日益扩大和高速发展,中国在柑橘上施用农药的相关风险评估手段及柑橘评价体系相较于世界先进水平还存在一定差距。食品安全和经济市场对于柑橘上农药残留的相关研究均有着迫切的需求。建立关于柑橘上农药残留的预测分析系统,不仅可为公众了解柑橘上农药残留信息提供有效平台,还可为国家制定农药残留相关法则和完善柑橘上农药残留风险评估体系提供依据。
已有许多围绕农药残留构建的数学模型,如经典的指数负增长函数模型、多项式回归分析、二元农药残留函数模型、Rayleigh动态模型、灰色预测GM(1,1)模型等[4]。ROJAS等[5]建立了用来预测果蔬中农药的保留时间的电子模型,并用该模型预测了57种农药的保留时间。ZDRAVKOVIĆ等[6]基于蒙特卡罗方法建立了QSPR模型来预测农药残留的保留时间,该模型具有良好的统计质量,得到了比较满意的结果。YU等[7]构建了4个ARIMA时间序列模型对农产品的农药残留进行预测。FENG等[8]利用4种不同的算法建立模型,并利用这4种模型预测的平均结果证明了提高化学特征的复杂性和扩大训练集的规模可提高训练效果,最后提出了混合预测方法来预测农药的含量。ZUO等[9]建立了数学模糊系统,预测不同时间段乐斯本农药残留量的降解程度。吴长刚等[10]建立了指数负增长函数模型等3个模型,模拟乐斯本在生态环境中的残留消解动态,并分别预测了农药残留情况。翟晨等[11]采用偏最小二乘法分别建立了苹果中溴氰菊酯和啶虫脒含量的定量模型。肖涛等[12]将Verhulst预测模型应用在预测瓜果蔬菜中农药残留量上。这些研究很好地将数学模型与农药残留结合到一起,并能较准确地预测农药在作物上的残留量。但由于选择模型的限制,大部分研究都是围绕单一农药进行残留预测,不能充分考虑到多种因素对农药降解的影响。
农药在自然环境中的降解受到的影响因素很多,诸如温度、湿度、降水量、施药浓度、施药次数、施药时间等[13–19],且施药的生态环境也是一个复杂的系统。人工神经网络被广泛应用于信息、医学、经济等领域。BP神经网络模型不同于传统神经网络模型之处在于其非线性能力[20],这使得模型在应用中具有非常强的模拟方程与函数的能力,其优点是可对大量的信息进行并行处理,有着很强的自我学习能力及适应力[21]。使用神经网络模型来预测柑橘上农药残留的研究鲜有报道。笔者利用BP神经网络模型对柑橘上农药的残留情况进行预测:先开展农残试验,获得柑橘的种植环境数据、实际农药最终残留量及消解残留动态等数据;再利用SPSS进行影响因子分析,通过主成分分析法筛选出主要影响因子;最后运用Matlab2018a建立基于BP神经网络的柑橘上农药残留预测的模型。现将结果报告如下。
1 材料与方法
1.1 仪器与材料
主要仪器:G6740–1290超高效液相色谱串联质谱检测仪为美国安捷伦科技公司的产品;7890A气相色谱仪为美国安捷伦科技公司的产品,带有ECD检测器;XH–C漩涡混合器为常州迈科诺仪器有限公司的产品;LD–3台式离心机为常州市金坛区西城新瑞仪器厂的产品。
供试农药:体积分数5%虱螨脲悬浮剂为湖南泽丰农化有限公司的产品;体积分数10%虱螨脲悬浮剂为宁波三江益农化学有限公司的产品;体积分数50%甲基硫菌灵·吡唑醚菌酯悬浮剂为浙江威尔达化工有限公司的产品;500 g/L氟啶胺悬浮剂为山东邹平农药有限公司的产品;体积分数20%丙硫唑悬浮剂为贵州道元生物技术有限公司的产品。
供试柑橘:云南玉溪的品种为温州蜜桔;四川成都的品种为春见;江西高安的品种为温州蜜桔;湖南长沙的品种为温州蜜桔;湖南张家界的品种为椪柑;福建福州的品种为脐橙52号;广西南宁的品种为年柑;福建厦门的品种为芦桔;浙江兰溪的品种为椪柑;广东湛江的品种为红江橙;湖北武汉的品种为金水柑;广西玉林的品种为南瓜桔。
1.2 样品的制备与检测
1.2.1柑橘农药残留田间试验
选择在云南玉溪、四川成都、江西高安(消解)、湖南长沙(消解)、湖南张家界、福建福州、广西南宁(消解)、福建厦门(消解)、浙江兰溪、广东湛江、湖北武汉、广西玉林等12个柑橘生产区,根据NY/T 789—2004《农药残留分析样本的采样方法》、NY/T 788—2018《农作物农药残留试验准则》及相关规定,采用市售的5种供试农药进行柑橘上的农药残留试验。
1.2.2农药残留室内检测
设定不同的液相色谱串联质谱及气相色谱试验条件,根据筛选建立的条件,配制系列标准溶液,以峰面积()对农药质量浓度()作回归分析,绘制出浓度与峰面积的标准曲线,通过添加回收试验检测方法的准确性。称取已制备好的样品,进行提取、净化、检测,最终得到柑橘上实际农药最终残留量数据及消解残留动态数据。标准曲线及添加回收率试验相关数据如表1、表2所示。线性回归分析结果表明,在0.01~5.00 mg/L范围内,虱螨脲和甲基硫菌灵、吡唑醚菌酯、氟啶胺和丙硫唑的色谱峰面积和质量浓度间均呈良好的线性关系,该方法条件下仪器对于虱螨脲和甲基硫菌灵、吡唑醚菌酯、氟啶胺和丙硫唑的最低检出质量浓度均为0.01 mg/L(表1),平均添加回收率为75%~103%(表2),均满足NY/T 788—2018《农药登记残留试验准则》的要求。可见,该方法用于检测柑橘样品中5种农药的最终残留量是可靠和有效的。
表1 5种农药的标准曲线方程及其决定系数
表2 5种农药的添加回收率及相对标准偏差
2 BP神经网络模型预测柑橘农药残留
先对影响柑橘上农药残留的因素进行分析,确定模型的输入因子;再通过Matlab2018a建立BP神经网络模型,设置参数;最后再对模型进行训练。
2.1 影响柑橘农药残留的因素分析
诸多因素影响农药在柑橘上的残留量,且因素不是固定的。影响因素可分为农药本身性质、环境特征、柑橘的种质性状和试验影响因素等4大类。
从中国农药信息网的农药百科中查得柑橘上的常用农药,并从化工字典中查询到相关农药的理化数据(相对分子质量、熔点、沸点、蒸气压、闪点),从而获得农药本身性质参数;通过土壤信息服务平台网站在线检索到全国第二次土壤普查土种数据(温度、降水量、pH、CEC、有机质),以此获得环境特征参数;查询国家柑橘信息资源共享服务平台及文献获得关于柑橘种质性状的数据(可溶性固形物(TSS)、固酸比、糖酸比、可溶性糖、还原糖、V–C)。
运用SPSS 17.0进行因子分析,先导入农药本身性质(只选取农药的相对分子质量)、环境特征因子及柑橘的种质性状参数;采用主成分分析方法,从解释变量的变异出发,使变异的方差能够被主成分所解释,输出结果得到的数据如表3所示。表3中给出了各变量中信息分别被提取的比例。可见,在输入的12个因子中,提取比例最高的是可溶性糖(0.918),而提取比例最低的是有机质(0.754)。
表3 农药本身性质和环境特征及柑橘的种质性状的公因子方差
通过提取出共同影响因素来实现对数据的降维处理,对于个别数据变异点的解释需要保留,在输出的结果中第一主成分代表着它包含了数量最多的变异数据;第二主成分比它稍少,在之后的主成分中包含的变异程度按照级别的递减而依次减少。系统给出主成分分析表如表4。第一个成分的初始特征值为2.492,能解释的方差比例为20.769%,前6个成分的初始特征值均大于1,能解释的总方差比例为85.101%;剩下6个成分初始特征值都小于1:因此,从这12个变量中提取前6个相关性最大的成分。
表4 农药本身性质和环境特征及柑橘的种质性状的主成分分析结果
试验影响因素中,农药施用于柑橘地后,其有效成分在柑橘中的残留量与施药剂量、施药后取样时间的长短因素有关。在其他因子相同时,施药剂量越大,其残留量也越大;施药后取样时间越短,其残留量也越高。
经上述分析可知,在影响农药在柑橘上的残留量的众多因素中,农药的相对分子质量、气温、降水量、pH、CEC、有机质、施药浓度、采收间隔期等8种因子对农药残留量影响最大:因此,选取这8种因子作为模型的输入因子。
2.2 BP神经网络模型的建立
农药预测模型选取3层(输入层、隐含层和输出层[22–24])BP神经网络。根据2.1确定的输入因子可知,输入层节点数为8,输出层节点数为1,通过隐含层节点数的计算公式[25]计算得出隐含层的节点数为4~13,再通过网络训练和检验在这个数据范围内确定最终的隐含层节点数。采用Matlab2018a中的feedforwardnet函数[26–28]建立BP神经网络,其中net=feedforwardnet,设定默认隐含层的节点数为9,建立柑橘上农药残留预测模型(图1)。
图1 柑橘上的农药残留预测模型
通过net=train(net,Pn,Tn)实现网络训练,得到预测模型,其中,Pn为训练输入,Tn为训练目标值;以=net(Pn)指令得到训练样本的预测输出。根据柑橘上农药残留的实际情况,所训练的模型主要参数设定为学习率0.01,动量因子0.9,最大迭代次数2000,误差允许率0.01。核心代码如下:
myNet.trainParam.epochs = 2000;
myNet.divideParam.trainRatio = 0.7;
myNet.divideParam.valRatio = 0.15;
myNet.divideParam.testRatio = 0.15;
myNet.trainParam.lr = 0.01;
myNet.trainParam.goal = 0.01;
myNet.trainParam.mc = 0.9;
至此,柑橘农药残留BP神经网络模型建立完毕。利用虱螨脲、甲基硫菌灵、吡唑醚菌酯、丙硫唑等4种农药残留的数据(共160组)来训练BP神经网络模型;利用氟啶胺的农药残留数据来检测预测模型。
3 农药残留模型预测与验证
结合上述模型参数,对氟啶胺在柑橘上的农药残留进行预测,通过比较实测值与预测值的40组数据对预测模型进行检验。从表5可看出,测试样本的模型预测值与现场实测值相近,相对误差为0.92%~18.93%,平均为7.33%;绝对误差为0.001~0.153 mg/kg。同时使用cftool工具箱中的RMSE函数计算拟合优度判定系数值,得到结果如图3所示。由图3可知,预测柑橘上农药残留模型的总拟合优度决定系数为0.962 05。可见,基于BP神经网络的柑橘上农药残留预测模型具有良好的准确性和稳定性。
表5 氟啶胺在柑橘上的农药残留预测值与实际值
图2 神经网络拟合回归结果
4 结论
为实现对柑橘上农药残留的精准预测,本研究选择了5种农药在12地开展田间试验,通过试验分析及资料查询获得了柑橘上农药残留量和相关参数,构建了柑橘上农药残留预测模型;利用此模型,对氟啶胺在柑橘上的残留量进行预测,通过田间试验实际测量值与预测值对比发现,相对误差为0.92%~18.93%,绝对误差为0.001~0.153 mg/kg,BP神经网络模型总拟合优度判定系数为0.962 05。可见,在面对复杂的自然环境及柑橘种质性状时,该预测模型仍显示出较高的预测精度,说明将机器学习算法用于柑橘农药残留检测是可行的。
[1] 沈兆敏.我国柑橘生产现状及未来发展预测[J].果农之友,2019(2):1–4.
[2] 赵丹,杨肖华,胡晶晶,等.大数据看我国柑橘市场[J].营销界,2019(31):30–33.
[3] 谢姣,邓丽莉,明建,等.导致柑橘果实油胞病的橘油挥发组分分析[J].农业工程学报,2019,35(1):310–316.
[4] 程福安,章家岩,冯旭刚,等.基于灰色模型的蔬菜农药残留量不确定度评定[J].食品与机械,2019,35(7):98–102.
[5] ROJAS C,ARANDA J F,PACHECO JARAMILLO E,et al. Foodinformatic prediction of the retention time of pesticide residues detected in fruits and vegetables using UHPLC/ESI Q-Orbitrap[J].Food Chemistry,2021,342:128354.
[6] ZDRAVKOVĆ M,ANTOVIĆ A,VESELINOVIĆ J B,et al.QSPR in forensic analysis:the prediction of retention time of pesticide residues based on the Monte Carlo method[J].Talanta,2018,178:656–662.
[7] YU W P,HAN X Y,WANG Y Y,et al.Prediction of pesticide residues in agricultural products based on time series model in Chengdu,China[J].IOP Conference Series:Earth and Environmental Science,2020,594(1):012022.
[8] FENG C,XU Q,QIU X L,et al.Evaluation and application of machine learning-based retention time prediction for suspect screening of pesticides and pesticide transformation products in LC-HRMS[J]. Chemosphere,2021,271:129447.
[9] ZUO S,SUN J J,YU X R,et al.Study on prediction of pesticide residue based on fuzzy system[J].Agricultural Science & Technology,2016,17(7):1729–1732.
[10] 吴长刚,管琳,周静,等.农药残留量预测数学模型[J].河北农业大学学报,2015,38(2):135–139.
[11] 翟晨,彭彦昆,李永玉,等.基于拉曼光谱的苹果中农药残留种类识别及浓度预测的研究[J].光谱学与光谱分析,2015,35(8):2180–2185.
[12] 肖涛,黄冬梅,周旭,等.灰色Verhulst模型在农药残留预测中的应用[J].河北农业大学学报,2014,37(5):135–138.
[13] 施海萍,叶建人,蔡娟娟,等.农药不同使用方法影响作物上农药残留量的试验研究[J].中国植保导刊,2004,24(5):32–33.
[14] 张夕林,张谷丰,孙雪梅,等.中粳稻区白背飞虱灾变规律及配套控制技术研究[J].农药科学与管理,2002,23(4):26–28.
[15] 阮楚琪,白云明,何岸飞,等.设施土壤中百菌清和毒死蜱的时空变化特征[J].农药,2012,51(3):200–203.
[16] 陈锐,孙晓宇,邓媛,等.多菌灵降解菌的生物学特性及降解能力研究[J].生物技术通报,2018,34(5):187–194.
[17] 徐重新,刘敏,张霄,等.农药危害风险及其残留检测用广谱特异性抗体研究进展[J].江苏农业学报,2019,35(2):489–496.
[18] 肖乾芬,王晓栋,魏忠波,等.三唑磷农药水解动力学研究[J].农药,2005,44(8):356–358.
[19] 李凌云,许晓敏,林桓,等.超高效液相色谱–串联质谱法快速检测蔬菜中248种农药残留[J].色谱,2016,34(9):835–849.
[20] 柳海涛,孙双科,郑铁刚,等.水电站下游鱼类产卵场水温的人工神经网络预报模型[J].农业工程学报,2018,34(4):185–191.
[21] 刘毅娟,雷鸣,何旸,等.人工神经网络概述[J].电子测试,2015(11):74–75.
[22] 占敏,薛惠锋,王海宁,等.贝叶斯神经网络在城市短期用水预测中的应用[J].南水北调与水利科技,2017,15(3):73–79.
[23] WANG Y,LU C J,ZUO C P.Coal mine safety production forewarning based on improved BP neural network[J]. International Journal of Mining Science and Technology,2015,25(2):319–324.
[24] 薛倩,牟凤云,涂植凤.组合预测方法在重庆市GDP预测中的应用[J].重庆工商大学学报(自然科学版),2017,34(1):56–63.
[25] 皮进修,赵清俊,彭建文.基于SARIMA–GMDH的CPI组合预测模型[J].统计与决策,2016(17):22–25.
[26] 闫君,赵波,丁辉,等.食品安全指数法评估兰州市柑橘类水果农药残留的风险[J].农业科技与信息,2019(10):66–68.
[27] DE MATAS S S,KEEGAN B P.An exploration of research information security data affecting organizational compliance[J].Data in Brief,2018,21:1864–1871.
[28] 王嵘冰,徐红艳,李波,等.BP神经网络隐含层节点数确定方法研究[J].计算机技术与发展,2018,28(4):31–35.
Prediction of pesticide residues in citrus using BP neural network
ZHOU Jiajun1,GONG Daoxin1,2,JIANG Ziyan1,LIANG Jiahao1,ZHAO Jia1,2,SU Long1,2,LIAO Chanjuan1,2*
(1.College of Resources & Environment, Hunan Agricultural University, Changsha, Hunan 410128, China; 2.Institute of Agricultural Environmental Protection, Hunan Agricultural University, Changsha, Hunan 410128, China)
By use of the BP neural network algorithm, the principal component analysis method was used to obtain the main factors affecting the pesticide residues including the relative molecular weight of pesticides, temperature, precipitation, pH, CEC, organic matter, application concentration and harvest interval. These factors were then used as input variables to preliminarily build the pesticide residue prediction model. The relative error of prediction was 0.92%-18.93%, the average relative error was 7.42%, and the absolute error was 0.001-0.153 mg/kg, and the coefficient of determination of BP neural network prediction model was 0.962 05. It can be seen that in the face of complex natural environment and citrus germplasm characteristics, the pesticide residue prediction system on citrus based on BP neural network showed a high prediction accuracy for the residues of various pesticides on citrus, indicating that it was feasible to apply machine learning algorithm to pesticide residues detection on citrus.
citrus; pesticide residues; BP neural network; principal component analysis; prediction model
周佳俊,龚道新,蒋紫烟,梁佳豪,赵佳,苏龙,廖婵娟.基于BP神经网络的柑橘农药残留预测[J].湖南农业大学学报(自然科学版),2022,48(5):572–577.
ZHOU J J,GONG D X,JIANG Z Y,LIANG J H,ZHAO J,SU L,LIAO C J.Prediction of pesticide residues in citrus using BP neural network[J].Journal of Hunan Agricultural University(Natural Sciences),2022,48(5):572–577.
http://xb.hunau.edu.cn
TP183;TS255.7
A
1007-1032(2022)05-0572-06
10.13331/j.cnki.jhau.2022.05.010
2021–06–01
2022–10–08
湖南省教育厅重点项目(21A0129)
周佳俊(1999—),男,河南周口人,硕士研究生,主要从事农药环境安全与管理研究,1262245825@qq.com;*通信作者,廖婵娟,博士,副教授,主要从事农药环境安全与管理研究,cjliao@hunau.edu.cn
责任编辑:邹慧玲
英文编辑:柳正