基于BP神经网络的稻麦轮作区小麦赤霉病预测模型
2023-10-31邢瑜琪黄卫利王军娟刘美艳胡小平
邢瑜琪,周 佳,黄卫利,王军娟,刘美艳,胡小平
(1. 西北农林科技大学 植物保护学院/农业农村部黄土高原作物有害生物综合治理重点实验室,陕西杨凌 712100;2. 渭南职业技术学院,陕西渭南 714000;3. 西安黄氏生物工程有限公司,西安 710065;4. 江苏师范大学 生命科学学院/江苏省药食植物生物技术国家重点实验室培育点,江苏徐州 221116;5. 江苏师范大学 生命科学学院,江苏徐州 221116)
小麦赤霉病是由多种镰刀菌引起的一种流行性病害,常造成小麦减产40%~60%,甚至绝收[1-3],更为严重的是小麦发病籽粒中产生的多种真菌毒素严重威胁人畜健康,影响食品安全。近年来,由于气候变化、栽培制度及耕作模式的变革,小麦赤霉病在中国呈北扩西移态势,发生面积逐年扩大,为害日益严重[4-5],年均发生面积高达436.83万hm2[6]。
中国稻麦轮作区小麦种植面积约为9×106~13×106hm2[7-8],主要分布于长江中下游地区[9]。其中,江苏省分布面积约为120万 hm2,在稻麦轮作模式中有着极其重要的地位[10]。江苏省小麦种植区以苏北灌溉总渠为界分为淮北、淮南和沿淮麦区[11]。据统计,2010年以来,江苏省小麦赤霉病呈高发趋势,2010、2012和2016年均为重度发生,2013至2015年中的其余年份均为中度发生[12]。
小麦赤霉病扩展迅速,防治周期短,确定其最佳防治时间,对保障小麦的增产稳产至关重要,对小麦赤霉病进行科学准确的预测预报是有效防控的前提和基础。目前,有关小麦赤霉病预测模型的主要研究方法有普通回归分析、神经网络和灰色系统等。BP 神经网络是基于误差反向传播算法的多层前馈型神经网络,因其使用方案简洁、易被理解、训练能力强等优势,近年来被广泛普及应用[13]。胡小平等[14]创建了植物病虫害 BP 神经网络预测系统,该系统提供的预测结果与实际结果高度一致;Feng等[15]利用人工神经网络中的多光谱成像技术诊断黄瓜病虫害,结果表明该技术具有较高的准确度。
当前国内外已构建多个小麦赤霉病预测模型,De Wolf等[16]根据扬花期前后的气象因子构建了小麦赤霉病的预测模型并成功建立了赤霉病风险预测系统,该系统预测准确度达到75%;Madgwick等[17]通过对英国14个站点1960-1990年的气象因子数据和小麦赤霉病发病率数据进行分析,建立了 Logistic 回归模型,并对未来50a内美国小麦赤霉病发病情况进行了预测;刘志红等[18]建立了四川资中小麦赤霉病 BP 神经网络模型,结果表明,模型拟合与预报精度都优于多元线性回归模型;赵超越等[19]基于遗传算法优化的 BP 神经网络建立了小麦赤霉病的气象预报模型,模型平均预报精度可达99%。张文军[20]根据气象、菌源等因子建立了关中地区小麦赤霉病预测模型,张平平[21]在此基础上对模型进行优化并研制了小麦赤霉病自动监测预警系统。目前该系统已在陕西、河南、湖北、安徽、甘肃等多个小麦种植省推广应用。该预测模型中的初始菌源量为单位面积的玉米秸秆带菌率,而稻麦轮作区小麦赤霉病的初侵染源主要是田间水稻稻桩和根茬上越冬的病原菌,因此系统对稻麦轮作区小麦赤霉病预测准确度有一定的影响。此外,赤霉病的流行受气候条件影响大,不同地区的生态及气候有着显著的差异,采用小生态区历年相关数据对模型进行不断地改进及优化能大幅提高预测准确度。因此,本研究采用 BP 神经网络算法以江苏洪泽(苏北)、姜堰(苏中)、张家港(苏南)田间初始菌源和历年气象因子为自变量,对赤霉病病穗率进行预测,以期为稻麦轮作区小麦赤霉病的准确预测与及时防控提供技术支撑。
1 材料与方法
1.1 数据来源
小麦赤霉病历年发生情况及稻桩带菌率均参考国标GB/T15796-2011进行调查,在小麦抽穗期调查稻桩带菌率,小麦蜡熟期调查赤霉病病穗率,数据资料由江苏省洪泽区(苏北)、姜堰区(苏中)、张家港市(苏南)植保站提供。各地区历年气象数据从中国气象数据网(http://data.cma.cn/)获取,具体到小时气温、日照时数、降雨量、相对湿度等。
1.2 模型变量选取
选用小麦蜡熟期赤霉病病穗率作为因变量(Y),小麦播种期-抽穗扬花期的平均相对湿度、日照时长、降雨量等气象资料和田间稻桩带菌率作为自变量(X),以旬为单位分组,采用逐步回归分析法统计分析各变量因子与赤霉病病穗率的相关性,筛选出相关性系数较高的气象因子。
1.3 BP 神经网络模型
编写 Matlab(2020b)神经网络算法程序,输入层由各地历年初始菌源量和筛选的当地关键气象因子构成,输入层与隐含层网络连接的权值为 W1,节点阈值为 b1;隐含层包含 5 个神经元节点,使用双曲正切S型传递函数 tansig 作为传递函数[f(x) = 2/(1+exp(-2*n)-1)];Matlab调用格式:A = tansig (N,FP));隐含层到输出层的网络连接权值为 W2,节点阈值为 b2,使用线性传递函数 purelin 作为传递函数[f(x) = x;Matlab调用格式:A = purelin(N,FP)];设置最大训练次数为 50 000,训练目标精度为 0.000 1,输出层为小麦蜡熟期赤霉病的病穗率。
1.4 模型准确度评价
将田间调查小麦赤霉病实际病穗率与系统预测病穗率按照国家标准GB/T15796-2011进行流行等级划分:即病穗率(DF)≤0.1%,0级,不发生;0.1%
式中,R:预测准确度;Fi:预测流行等级;Ai:实际流行等级;Mi:第i次预测的最大参照 误差。
2 结果与分析
2.1 模型变量的筛选
2.1.1 洪泽地区变量筛选 以小麦蜡熟期赤霉病病穗率作为因变量 (Y),以洪泽地区 2003-2017 年上年 12 月至当年 3 月平均相对湿度、日照时长、降雨量等气象资料和田间稻桩带菌率作为自变量 (X),以旬为单位分组,计算各变量因子与赤霉病病穗率的相关性。最终选用稻桩带菌率(X1,P=0.590)、1月中旬平均温度(X2,P=0.048)、上年12月上旬平均温度(X3,P= 0.049)、上年12月平均温度(X4,P=0.018)、3月中旬平均相对湿度(X5,P=0.023)、3月平均相对湿度(X6,P= 0.016)、2月下旬平均日照时长(X7,P=0.014)、3月上旬平均日照时长(X8,P=0.006)、3月中旬平均日照时长(X9,P= 0.049)和3月平均日照时长(X10,P=0.015)作为预测模型的自变量(表1)。
表1 洪泽地区模型参数及其含义Table 1 Parameters in model and their meanings for Hongze region
2.1.2 姜堰地区变量筛选 以小麦蜡熟期赤霉病病穗率作为因变量(Y),以姜堰地区 2001-2018 年上年 11 月至当年4 月平均相对湿度、日照时长、降雨量等气象资料和田间稻桩带菌率作为自变量 (X),以旬为单位分组,统计分析各变量因子与赤霉病病穗率的相关性。最终选用稻桩带菌率(X1,P=0.038)、3月中旬平均相对湿度(X2,P=0.049)、1月中旬平均降雨量(X3,P=0.032)、2月下旬平均降雨量 (X4,P=0.045)、 3月平均降雨量(X5,P=0.025)、4月上旬平均降雨量(X6,P=0.032)、3月上旬平均日照时长(X7,P=0.036)、3月中旬平均日照时长(X8,P=0.029)、上年11月平均日照时长(X9,P=0.045)、上年12月上旬平均日照时长(X10,P=0.014)和上年12月平均日照时长(X11,P= 0.014)作为预测模型的自变量(表2)。
2.1.3 张家港地区变量筛选 以小麦蜡熟期赤霉病病穗率作为因变量(Y),以张家港地区 2005-2020 年上年 11 月至当年 3 月平均相对湿度、日照时长、降雨量等气象资料和田间稻桩带菌率作为自变量(X),以旬为单位分组,统计分析各变量因子与赤霉病病穗率的相关性。最终选用稻桩带菌率(X1,P=0.459)、3月上旬降水量(X2,P=0.003)、3月上旬平均日照时长(X3,P= 0.032)、上年11月上旬平均降水量(X4,P= 0.040)、上年11月中旬平均降水量(X5,P= 0.009)、上年11月平均日照时长(X6,P= 0.003)和上年12月上旬平均降水量(X7,P=0)作为预测模型的自变量(表3)。
表3 张家港地区模型参数及其含义Table 3 Parameters in model and their meanings for Zhangjiagang region
2.2 模型的建立与验证
2.2.1 洪泽地区 将“2.1.1”中的变量因子作为神经网络算法的输入层,当年赤霉病病穗率作为输出层。以2003-2017 年的调查数据作为训练集,预测 2019-2021 年洪泽地区小麦赤霉病的病穗率依次为 7.29%、4.51% 和 10.90%,田间调查实际发生的赤霉病病穗率分别为 6.55%、 1.02% 和 2.70%,模型的预测准确度为 91.67%(表4)。
表4 洪泽BP神经网络模型测试集预测值与实际值Table 4 Predicted and actual values of Hongze BP neural network model test set
2.2.2 姜堰地区 将“2.1.2”中的变量因子作为神经网络算法的输入层,当年赤霉病病穗率作为输出层。以2001-2018 年的调查数据作为训练集,预测 2019-2022 年姜堰地区小麦赤霉病的病穗率依次为 4.02%、11.17%、3.80% 和 7.18%,田间实际发生的赤霉病病穗率分别为 2.67%、14.97%、9.50% 和 5.31%,模型的预测准确度为100%(表5)。
表5 姜堰BP神经网络模型测试集预测值与实际值Table 5 Predicted and actual values of Jiangyan BP neural network model test set
2.2.3 张家港地区 将“2.1.3”中的变量因子作为神经网络算法的输入层,当年赤霉病病穗率作为输出层。以2006 -2018年的调查数据作为训练集,预测 2019-2022 年洪泽地区小麦赤霉病的病穗率依次为 3.85%、1.02%、21.00% 和 3.93%,田间实际发生的赤霉病病穗率分别为 3.74%、0.32%、25.90% 和 9.40%,模型的预测准确度为100%(表6)。
表6 张家港BP神经网络模型测试集预测值与实际值Table 6 Predicted and actual values of Zhangjiagang BP neural network model test set
3 讨 论
小麦赤霉病的发生受到初始菌源量、气候条件、品种特性与栽培耕作方式等多种因素的影响[23-24]。Moschini等[25]基于气象数据建立了阿根廷佩尔加米诺的小麦赤霉病发病率模型,结果表明模型可以准确预测赤霉病发病率;Brennan等[26]通过对小麦8个品种进行温度敏感性试验得出温度的变化对小麦赤霉病发生的影响比较大;Rossi等[27]结合孢子量和相关气象系统分析建立了小麦赤霉病风险分析模型;陈将赞等[28]对天台县小麦赤霉病历史发病情况与气象资料进行分析,建立的赤霉病预测模型预测准确率为 79.1%。李富占等[29]运用逐步回归方法建立了河南新野县病穗率预测模型,回验准确率达 96.3%;本课题组前期建立了玉米-小麦轮作区赤霉病预测模型,并在长江流域及黄淮沿淮麦区6个县(市)开展了小麦赤霉病物联网实时监测预警技术试验,结果表明,该技术对赤霉病发生程度的预测准确度在黄淮沿淮麦区平均为84.3%,高于长江流域的50%;对病穗率的预测准确度在黄淮麦区平均为86.8%,高于长江流域的73.0%。模型对黄淮及沿淮麦区小麦赤霉病的短期预测效果较好。其原因主要是模型中的秸秆带菌量参数以玉米秸秆为基准,更适用于黄淮麦区玉米茬口的小麦赤霉病发生流行特点[30]。
稻麦轮作模式在江苏省有着极其重要的地位,本研究以江苏省不同生态区的小麦赤霉病为研究对象,以小麦赤霉病病穗率、田间稻桩带菌率和关键气象因子数据为基础,使用BP神经网络建立了稻麦轮作区小麦赤霉病预测模型,经准确度评价,苏中与苏南地区模型的预测准确度均可达100%,苏北地区模型的平均预测准确度为 91.67%。值得关注的是,相同流行等级下的病穗率可能存在一定差异,例如2022年张家港地区预测病穗率与实际病穗率分别为9.40%和3.93%(均属于1级轻发生),然而二者对于小麦产量和品质的影响可能不同,未来会对模型进一步优化,提高模型精准度。此外,小麦赤霉病的发生还与寄主抗性、耕作措施等因素密切相关,本研究仅分析了稻桩带菌率和气象条件对小麦赤霉病病穗率的影响,在未来的研究中,可全面分析不同因素对赤霉病病穗率的影响,进一步提高预测模型的准确度和稳定性。