基于BP神经网络的稻瘟病预测预报研究
2017-08-11刘庭洋浦仕磊李志宇李文静王云月
刘庭洋,李 烨,浦仕磊,李志宇,李文静,吴 奇,王云月
(云南农业大学植物保护学院/教育部生物多样性与病害防控重点实验室,云南 昆明 650201)
基于BP神经网络的稻瘟病预测预报研究
刘庭洋,李 烨,浦仕磊,李志宇,李文静,吴 奇,王云月*
(云南农业大学植物保护学院/教育部生物多样性与病害防控重点实验室,云南 昆明 650201)
【目的】稻瘟病是水稻主要病害之一,严重制约水稻高产稳产。近年来随着品种布局、耕作制度改变及气候变化的影响,其流行程度年度间波动很大。目前,稻瘟病在云南省各水稻产区呈现中等偏重发生的趋势,预测预报作为指导防治的先行者,具有重要作用。【方法】为了及时有效的做好稻瘟病防范工作,本研究采用稻瘟病发生相关气象因子及田间穗瘟病情指数,利用BP神经网络技术,选取德宏州芒市为试验点开展稻瘟病预测预报研究。【结果】从气象因子与预测对象的相关性来看,筛选出来的各气象因子与病情指数之间都存在较强的相关性,其理想输出和实际输出值都比较接近,误差曲线也比较吻合,预测准确度能满足实际需求。【结论】由此可见,BP神经网络建立的稻瘟病中期预测模型更具有优势。不需要事先进行数学公式表达,具有更高的预测准确度,选择试验点5-9月的气象数据以及田间稻瘟病病情指数建立的预测预报模型,预测结果更为客观和可靠,能及时做好稻瘟病的防控工作。
稻瘟病;BP神经网络;预测预报
【研究意义】稻瘟病(Rice blast)是云南省水稻重要病害之一,居于三大水稻病害之首,近年来该病在云南省常年发生面积23.33万hm2左右,约占水稻种植面积的24%,严重制约水稻高产稳产[1-2]。随着品种布局、耕作制度改变及气候变化的影响,其流行程度年度间波动很大。预测作为指导防治的先行者,其作用受到普遍关注。【前人研究进展】稻瘟病的发生受到寄主、环境、病源三因素相互作用并与各影响因子间是一种复杂的交互关系,具有非线性的特点,而BP神经网络具有较好的解决非线性的能力,良好的运算效率,容错性和适应性强等优点,摆脱了传统测报方法的运算速度慢,准确率低等缺陷[3~10]。 【本研究切入点】本研究采用稻瘟病发生相关气象因子(温度、湿度、降雨量、日照时数)及田间穗瘟病情指数,利用BP神经网络技术有效的预测稻瘟病发生趋势和流行程度,【拟解决的关键问题】用以指导重灾年份重点防控,抓住关键期及时用药、统防统治,这样不但可以节省人力、物力和财力,更可以减少滥用农药所带来的环境污染,无疑具有重要的经济、生态效益[11-15]。
1 材料与方法
1.1 试验点的选择
本研究结合各地稻瘟病发生程度、发生面积、品种布局及气候环境因素,选取单双季籼稻区的德宏州芒市作为本研究的试验点,该试验点为云南省水稻种植的主产区,稻瘟病为当地水稻生产中的主要病害,且当地的气候、水稻品种、病原菌以及栽培方式均有利于稻瘟病的发生,该地的稻瘟病发病较早。
1.2 数据收集
收集到本研究所需试验点近10年(2002-2012)年的气象资料,包括(均温、湿度、降雨量、雨日、日照时数)以及往年稻瘟病发生情况(病情指数),该数据由芒市植保站提供。
为验证模型有效性,参照稻瘟病测报调查规范(GB/T 15970-2009)对2012年的水稻稻瘟病病害发生情况进行田间调查。计算田间穗瘟病情指数。
1.3 预测因子筛选
利用SPSS软件分析试验点的气象因子与水稻稻瘟病之间的相关性,筛选出建模所需数据。本研究采用逐步回归分析方法,进行因子筛选。在SPSS中根据建立测报模型的需要,以筛选出对稻瘟病发病影响加大的因子和避免逐步回归过程中过度拟合为目标,将F值设置为:F值<0.15的自变量进入回归方程,而F值>0.18的自变量剔除,筛选出的显著相关的气象因子。
1.4 逐步回归模型建立
在SPSS软件中对气象因子进行逐步回归分析,然后筛选出影响主要发病的气象因子,并建立逐步回归预测模型。
所采用逐步回归模型为y=b0p+b1px1+b2px2+…+bnpxp+εp。
1.5 BP神经网络模型建立
在MATLAB软件中选用traingd、raingdx、trainlm 3种训练函数,将归一化后的数据作为BP网络的学习样本,气象因子作为学习样本的输入数据,病情指数是学习样本的输出数据。用threshold函数规定输入向量的最大值和最小值在[0,1]范围内,newff函数创建一个前向BP网络。中间层神经元传递函数采用S型正切函数,相应的输出层神经元传递函数采用S型对数函数。选取合适隐层神经元数目和训练函数,训练次数设置为100 000次,训练目标误差设置为0.0001,其他参数取默认值。对网络进行训练。以此来建立BP神经网络模型。
1.6 数据检验
将芒市试验点的历史数据输入到逐步回归模型和BP神经网络模型中,检验模型对历史数据的预测准确度。
将2012年数据作为测试数据输入模型,进行运算,得到稻瘟病当年病情指数的预测值,与实际病情指数进行比较,计算绝对误差及预测准确度,评价模型的有效性。
2 结果与分析
2.1 SPSS统计筛选结果
表1 逐步回归筛选出芒市气象数据
经过SPSS软件逐步回归筛选后与芒市水稻稻瘟病发生程度相关的气象因素有:5月上旬累计日照时数、6月中旬平均湿度、6月下旬平均湿度、7月中旬累计降雨量、7月下旬累计日照时数,其中(上、中、下旬均以10 d为准)等5个气象因子(表1)。从气象因子与预测对象的相关性来看,筛选出来的各气象因子与病情指数之间都存在较强的相关性。
2.2 芒市逐步回归模型建立
芒市水稻稻瘟病的逐步回归预测模型为y=-236.717+0.466X1-1.441X2+3.788X3+0.075X4+0.508X5回归方程相关系数R=1,显著性检验F>100。回归方程总体回归R值和F值达到极显著水平。
利用传统回归模型计算出预测值后与芒市的实际病情指数比较(表2),其中2005和2007年的回检预测值与实际值存在一定的差距,且绝对误差较大,由此可见传统的回归模型得出的预测结果还不是完全的精确。
2.3 芒市BP神经网络的模型建立
将芒市(2002-2011)年气象数据作为输入训练样本,将(2002-2011)年的病情指数作为输出训练样本,以此来建立BP神经网络模型(表3)。
2.3.1 MATLAB归一化结果 对芒市2002-2011年的数据进行不同函数、不同隐含层神经元数目进行训练,所得结果都显示traingd、traingdx、trainlm 3种训练函数的神经网络测报模型的隐层神经元数目分别在17、13、15个时,每种训练函数的模型误差最小,因此,芒市稻瘟病病害的3种训练函数神经网络测报模型的隐层神经元数目分别选择17、13、15。学习率分别为0.162、0.208、0.243。
2.3.2 3种训练函数建立的芒市稻瘟病BP神经网络性能图 网络初始化后,traingd训练函数建立的模型经过100 000次训练后虽然网络的性能没有为0,但是输出的均方误差已经很小了,网络的误差平方和为0.000289,达到目标误差的要求,网络训练的误差平方和变化曲线如图1。
traingdx训练函数建立的模型经过190次训练后网络的误差平方和为9.73e-05,达到目标误差的要求,网络训练的误差平方和变化曲线如图2。
trainlm训练函数建立的模型经过8次训练后网络的误差平方和为4.64e-05,达到目标误差的要求,网络训练的误差平方和变化曲线如图3。
表3 MATLAB归一化后的芒市气象因子
图1 traingd函数网络性能图Fig.1 Network performance chart for traingd function
图2 traingdx函数网络性能图Fig.2 Network performance chart for traingdx function
图3 trainlm函数网络性能图Fig.3 Network performance chart for trainlm function
在各自最适隐层神经元数目的条件下,3种训练函数都可以使网络收敛达到目标误差,traingd训练函数的速度最慢,所需训练步数多,trainlm训练函数速度最快,所需训练步数最少,traingdx训练函数的速度级所需步数居中。对比图1~3可以看出traingd、traingdx训练函数的误差平方和变化曲线比较平缓,而trainlm训练函数的误差平方和变化曲线较尖锐。
鉴于trainlm训练函数是BP神经网络模型中3种函数性能最好,运算速度最快的,因此选择trainlm训练函数建立芒市试验点BP神经网络模型。利用MATLAB软件得出以下结果(表4~6)得出芒市BP神经网络的输出接点的阀值为-1.5290。
表4 芒市BP神经网络输入层到隐含层的权重矩阵
表5 芒市BP神经网络隐含层和输出层间的权重矩阵
Table 5 Weights matrix of Mangshi BP neural network hidden layer and the output layer
节点数Serialnumber权重矩阵Weightsmatrix12.556722.43063-4.399444.12795-1.486860.551071.88488-0.96809-1.000510-2.714211-1.2539121.657513-1.712214-1.8059150.1900
由以上过程得到芒市试验点BP神经网络预测预报模型为:
其中,xi为预测当年气象因子输入数据,yj为隐层节点输出值,z为预测病情指数输出值(该值为归一化后的),ωji和bj分别表示第i输入节点到第j个
表6 芒市BP神经网络隐含层的阀值向量
2.3.3 芒市BP神经网络回归模型误差与预测精确度对比 表7~9结果显示,芒市的traingd、traingdx、trainlm 3种训练函数模型对历史数据回检预测准确度都在80%以上。其回检预测值为合格。trainlm训练函数的模型预测准确度最高,相比其他2个函数,trainlm训练函数对芒市的水稻稻瘟病的拟合程度更好。
表7 芒市traingd函数BP神经网络模型历史数据回检结果
表8 芒市traingdx函数BP神经网络模型历史数据回检结果
表9 芒市trainlm函数BP神经网络模型历史数据回检结果
2.3.4 VB环境下的简化BP神经网络可视化程序设计 运用BP神经网络预测模型对病情指数进行预测,关键是生成符合历史数据的神经网络模型,其中权、阈值等参数的确定显得尤为重要。为方便相关农业部门对病害病情指数的预测,给出简单易用的病情指数预测程序是具有重大现实意义的。
图4 VB环境下芒市测报模型初始参数选择Fig.4 Initial parameter selection of Mangshi forecasting model under VB environment
以下是在VB环境下对芒市试验点数据归一化后的简易BP神经网络可视化测报。在不影响测报准确性的要求下,对输入层到隐层和隐层到输出层的传递函数,均选择logsig函数,且权值调节系数和阈值调节系数不再通过训练函数的调整迭代,而设定为0.1,网络学习次数(训练次数)为10000。
表11 2002-2012年芒市病情指数(归一化后)
可视化测报程序的运行操作过程分为3步:第1步,如图4所示,为芒市试验点选取神经网络各层节点数,以芒市10年气象数据为训练年分数,以试验点筛选出的气象因子数为输入层节点个数,选择15个隐含层数目,1个输出层节点数。第2步,生成BP神经网络模型并对历年数据进行检测。将2012年芒市筛选出的气象因子归一化处理后,输入到VB测报程序,预报模型的权、阈系数及数据检测结果见图5,其理想输出(实际病情指数归一化)和实际输出值都比较接近,误差曲线也比较吻合,预测精确度都能达到80%以上(表10)。第3步,利用已生成BP神经网络测报模型,输入2012年芒市相关影响因子的气象数据,预测2012年的发病程度(归一化),预测输出为:0.9897,而理想输出为1.0000(表11),预测精确度为98.97%,可以看出预测准确度能满足实际需求。
3 讨 论
3.1 测报因子的选择
影响稻瘟病发病的因子很多,在建立稻瘟病BP网络预测模型时,这些因子不可能都作为预测因子,需选取那些对稻瘟病的发生影响明显的因子,以提高预测的精度,在筛选预测因子时,选取了对水稻生长有影响的气象因子作为预测因子,从结果来看,5-6月的温雨气候条件显著影响稻瘟病的发生,这主要是由于此时水稻正处于分蘖末至拔节的营养生长阶段,是叶瘟发生发展的关键时期,这一时期气象条件既影响水稻的长势长相,又影响叶瘟的发病程度,从而影响后期穗瘟的流行强度,同时,7月中旬是水稻扬花灌浆的生殖生长阶段,此时如遇连续多日低温及降雨形成水膜的情况下,有利于病菌的繁殖和侵入,直接影响后期穗瘟的发生流行,是后期穗瘟发生至关重要的气象因素;水稻生长中后期,也就是水稻收割之前的8-9月在田间具有大量菌源的情况下,如遇连续阴雨闷热天气,也会造成病害的流行。
3.2 BP神经网络的构建
训练神经网络之间需要构造一个网络构架,函数newff()就是用来构建神经网络的。它需要4个输入条件,依次是:由R维的输入样本最大最小值构成的R>2维矩阵,各层的神经元个数,各层神经元的传递函数以及训练用函数的名称。
假设需要构建1个2层神经网络,其输入向量是二维的,输入向量的范围为[-1 2; 0 5],第1层(隐层)有3个神经元,传递函数是tansing();第2层(输出层)是单个神经元,传递函数是线性的,训练函数选择traingd(),至此就生成了初始化待训练的神经网络。
3.3 BP神经网络隐层神经元数目的选取
改变非线性函数的频率和BP神经网络隐层神经元的数目,对于函数逼近的效果有一定的影响,网络非线性程度越高,对于BP神经网络的要求越高,则相同的网络逼近效果要差一些;隐层神经元的数目对于网络逼近效果也有一定的影响,一般来说,隐层神经元数目越多,则BP网络逼近非线性函数的能力越强,同时网络训练所用的时间相对来说要更长一些。因而,在设计一个神经网络时可以结合该公式以及经验,选准一定的隐层神经元数目进行网络训练,验证所设定的这些值是否能赋予神经网络良好的性能,从中找出适合的隐层神经元数目。
4 结 论
(1)影响稻瘟病发生的因素很多,但主要因素是气象条件,结果表明,从5月水稻分蘖期到9月水稻收割前起的温度、湿度、降雨量以及日照时数与试验点水稻稻瘟病发生息息相关,因此选择试验点5-9月的气象数据以及田间稻瘟病病情指数来建立预测预报模型,以及时做好稻瘟病防控工作。
(2)利用3层BP网络建立的稻瘟病中期预测模型更具有优势。不需要事先进行数学公式表达,具有更高的预测准确度,预测结果更为客观和可靠。可以更好地反映出病害与相关因子间的函数关系,其拟合与预测精度均较高。
[1]张思竹.云南省水稻产业发展报告[R]. 2011.
[2]王园媛, 李晓菲, 陈 涛, 等. 云南省水稻白叶枯病BP神经网络测报技术研究[J].云南农业大学学报,2013,28(2):257-263.
[3]张 蕾, 燕亚菲, 刘志红, 等. 灰色人工神经网络在稻瘟病发生预报中的应用[J].中国农学通报, 2010,26(12):238-241.
[4]唐启义, 程家安, 蒋学辉, 等. 晚稻稻瘟病BP神经网络分区预报[J].植物保护学,2002,2(3):205-209.
[5]张孝羲, 张跃进.农作物有害生物预测学[M].北京: 中国农业出版社,2006.
[6]张德丰.MATLAB神经网络应用设计[M].北京:机械工业出版社,2009.
[7]张映梅, 李修炼, 赵慧燕, 等. 人工神经网络及其在小麦等作物病虫害等预测中的应用[J].麦类作物学报,2002,22(4):84-87.
[8]陈观浩, 张耀忠, 董 鹏, 等. 早稻叶瘟灰色灾变长期预测模型[J].山地农业生物学报,2003,22(6):209-511.
[9]何忠全, 张志涛, 陈志谊, 等. 我国水稻病虫害防治技术研究现状及发展策略[J]. 西南农业学报,2004(1): 110-114.
[10]胡小平, 杨之为, 李振岐, 等.汉中地区小麦条锈病的BP神经网络预测[J].西北农业学报, 2000(3): 28-31.
[11]黄伟杰, 刘晓平, 李 军, 等. 基于BP网络的水利工程投资风险评价[J]. 长沙理工大学学报, 2004, 1(2): 34-38.
[12]李祚泳, 彭荔红, 等. 基于人工神经网络的农业病虫害预测模型及其效果检验[J].生态学报, 1999,19(5):759-762.
[13]殷世才, 周晓吉, 杨和生, 等.穗瘟测报模型及应用[J].云南农业大学学报,1998,13(1): 97-101.
[14]周开利, 康耀红. 神经网络模型及其MATLAB仿真程序设计[M].北京: 清华大学出版社,2005.
[15]吴先丽, 彭洪江, 彭仕钟. 水稻稻瘟病叶瘟与穗颈瘟相关性分析[J].西南农业学报,1995, 8(4): 79-83.
(责任编辑 王家银)
Investigation of Rice Blast Prediction and Forecast Based on BP Neural Network
LIU Ting-yang, LI Ye, PU Shi-lei, LI Zhi-yu, LI Wen-jing, WU Qi, WANG Yun-yue*
(Key Laboratory of Biological Diversity to Control Pests and Diseases, Ministry of Education/College of Plant Protection, Yunnan Agricultural University, Yunnan Kunming 650201, China)
【Objective】Rice blast was one of the major diseases of rice, and seriously restricted stable high yield of rice. With the influence of varieties layout, cropping system and climate change in recent years, the prevalence of inter-annual fluctuation was very large. Currently, the rice blast showed a trend towards the middle to high of the rice-producing areas in Yunnan Province. Prediction and forecast played an important role as a pioneer of the guide of prevention and control. 【Method】In order to timely and effective do a good job of rice blast prevention work, we adopted its related meteorological factors and field rice panicle blast disease index, used BP neural network technology, selected Dehong prefecture Mang city as a test point to carry out the prediction and forecast research. 【Result】From the relevance of meteorological factor and forecasting object, there was a strong correlation between various meteorological factors by screening and the disease index, the ideal and actual output values were closer, error curve was consistent, prediction accuracy could satisfy the actual demand.【Conclusion】The medium-term prediction model of the rice blast disease established by BP neural network was more advantageous, that was no need for a mathematical formula to express in advance, had a higher prediction accuracy. The prediction model was established by 5-9 meteorological data of experimental sites and disease index of rice blast in the field were more objective and reliable, and could do a good job of disease prevention and control.
Rice blast; BP neural network; Prediction and forecast
1001-4829(2017)7-1546-08
10.16213/j.cnki.scjas.2017.7.014
2015-09-10
云南省现代农业水稻产业技术体系
刘庭洋(1988-),男,河南信阳人,硕士研究生, 主要从事水稻稻瘟病预测预报研究,E-mail:136216341@qq.com。*为通讯作者,王云月(1962-),女,云南昆明人,教授,博士生导师,主要从事利用生物多样性控制病虫害促进种质资源保护研究,E-mail:1371209436@qq.com。
S435.111.4+1
A