基于环境信息和深度自编码网络的农作物病害预测模型
2018-05-08张善文黄文准张传雷
张善文, 黄文准, 张传雷
(1.西京学院信息工程学院,陕西 西安 710123; 2.弗吉尼亚理工大学计算机科学系,美国 弗吉尼亚 VA24061)
农作物病害一直是世界各国农业生产中的主要灾害之一。目前,中国农作物病害的发生范围、发展趋势和危害程度都有所增大。农作物病害严重制约了中国农产品的产量、质量和农业可持续发展。农作物病害的及早预测和科学防治是提高农作物产量和质量,减少经济损失以及控制农药污染最有效的措施之一[1-2]。农作物病害与土壤、气候、气象等环境信息紧密相关,任何病害的发生和发展都需要一定的环境条件,一些病害在多雨季节发生,一些病害在高温干旱的环境中发生。一般情况下,温暖、多雨、低洼潮湿以及连作地易造成病害发生和流行[3-4]。很多病害具有季节性,例如,黄瓜细菌性角斑病发病期为4月下旬至5月上旬,发病高峰期为5月下旬至6月上旬,发病的适宜温度为22~24 ℃,相对湿度在70%以上。黄瓜灰霉病在高湿(相对湿度94%以上)、低温(18~23 ℃)、光照不足、植株长势弱时容易发病,当气温超过30 ℃且相对湿度不足90%时,病害停止蔓延,因此该病在冬季、低温、光照少的温室内容易发生。黄瓜炭疽病在生长中后期发病较重,当湿度高达87%~95%时发病迅速,而在湿度小于54%时该病害不发生[5]。农作物的生长环境条件不仅影响农作物病害在一个发病季节中的发生和危害程度,还决定着病害的地理分布[6-7]。例如,小麦赤霉病就是一种比较典型的气候型病害,该病害是否发生和蔓延及其危害程度主要取决于气候条件(抽穗至灌浆期雨日数)、菌源数量(稻桩带菌率)和寄主易感病生育期等因素。若小麦灌浆乳熟期温度偏高,雨水偏多,小麦赤霉病发病侵染则较严重[8]。而当温度超过20 ℃时,即使湿度条件适宜,小麦条锈病菌也不会发生侵染。有些环境因素对农作物病害可即时发生作用,产生明显的当时效应,有些则当时效应不显著,而后效深远[1]。作物病害预测的难点主要是:(1)影响病害发生的因素多,不容易选出与特种病害关系紧密的因素;(2)实际采集到的样本数量较少且分布不均,不容易得到泛化能力强的预测模型[9]。王淑梅[10-11]提出了一套农作物病害发生和发展所需的气候气象预报方法。邓刚[12]给出了气象因子变化规律与黑龙江省林业有害生物种类变化、发生危害程度及其分布之间的关系,验证了降水量与林业有害生物发生量之间的线性关系。同一种病害发生和发展所需的气候及气象等一些自然条件较为稳定[13],如黄瓜霜霉病适宜高温高湿且耐干燥,当温度为20~25 ℃,相对湿度为 70%~85%时最可能发病。在雨季来得早、雨量大、雨天多时,黄瓜疫病易流行。了解这些信息将有助于预测农作物病害的发生和发展。但是,由于农作物病害发生的原因很多,大部分病害发生与气象条件(气温、日照、湿度等)、土壤条件(田地连种和施肥情况、含水量、土壤重金属等)、生物学特性(根系吸水能力、叶面等)以及农业基础措施等很多因素紧密相关,而且在病害发生和发展的不同阶段一般是很多环境因素综合发生作用,各个因素之间经常相互制约和相互影响[14],使得很多传统农作物病害预测方法的准确率不高,鲁棒性不强[15]。
深度学习是一种通过模拟人脑多层感知结构来认识数据模式的学习算法,能够从大量无标签非线性的复杂数据中自动学习有效的分类特征,具有较强地数据分类、识别和预测能力,已经成功应用到人脸识别[16]、交通拥堵预测[17]、蛋白质相互作用预测[18-19]、植物识别[20]和作物病害识别[21]等问题中。由于农作物病害预测的复杂性,目前鲜有利用深度学习和作物生长环境信息预测作物病害的应用实例报道。日常生活中气候气象等信息通过网络、报纸、电视以及农业物联网等途径获得,特别是高性能大容量数据存储器、计算机、网络技术以及海量复杂数据处理技术的不断发展,为实现农作物病害自动预测提供了可能[22-23]。本研究拟利用农作物生长的环境信息,提出一种基于深度自编码网络的农作物病害预测模型,以期作为一种长效的农作物病害预测模型应用于农作物病害管理系统中[24-25]。
1 材料与方法
1.1 数据获取
与西北农林科技大学、陕西杨凌农业示范区和朱雀国家森林公园等单位合作,利用农业物联网传感器采集与农作物病害发生相关的环境信息等,在植保专家的指导下构建一个农作物病害管理数据库。
采集到的与病害发生相关的环境信息主要包括:土壤信息(地域、土壤温度、土壤湿度、土壤水分、土壤盐分、土壤是否连种、土壤pH值以及微生物含量等)、气象信息(空气温度、空气湿度、光照度、光合有效辐射、降水量、雨日数、气压、风速、风向、二氧化碳浓度等)和病害信息(农药使用量、病害类型、发病季节和病害等级)。
针对黄瓜病害预测问题,从以上3个方面遴选出近6年来影响黄瓜常见3种病害(霜霉病、褐斑病和炭疽病)发生和发展的13个主要因素:土壤温度、土壤湿度、土壤盐分、土壤是否连种、微生物含量、空气温度、空气湿度、光照度、降水量、雨日数、二氧化碳浓度、农药使用量和发病季节。由于这些因素数据的量纲、范围、表示方式、物理意义和数量级不同,所以需要对这些数据进行量化或离散化、标准化和归一化预处理,以满足不同类型数据之间的可比性。对于非数字化的原始数据需要进行转换和等级划分,再将所有数据进行归一化处理。
由于黄瓜病害的发生具有季节性,7月和8月为病害的越夏期,6月和9月是农作物病害的高发期,9月的环境条件更适于病害的发生。将9月病害发生的季节信息值设置为0.9,6月病害发生的季节信息值设置为0.8,7月和8月病害发生的季节信息值均设置为0.7,其他季节病害发生的季节信息值设置为0.1。将黄瓜生长过程中的光照度由强到弱分别设置为5个等级(0.9、0.7、0.5、0.3和0.1),将黄瓜生长过程中的农药使用量由多到无分别设置为4个等级(0.7、0.4、0.2和0),将黄瓜生长过程中的土壤设置为没有连种、连种1次和连种2次以上3个等级(0、0.2和0.4),所有土壤和空气的温湿度都采用日平均温湿度,其他因素对应的信息值按公式(1)进行归一化处理:
(1)
式中,aj和bj(j=1,2,...,n)分别为第j个数据归一化前后的值,max(ai)和min(ai)分别为n个数的最大值和最小值。
将预测病害的发生程度设置为4个等级(0、1、2、3),分别表示病害不发生、病害发生初期、病害发生中期和病害发生后期。综上所述,用x表示由病害发生的13个因素组成的特征向量x=[x1,x2,...,x13]。
1.2 自编码网络
自编码网络(AE)是一个2层神经网络,第一层称为编码层C(.),第二层称为解码层G(.)。AE由输入层、单隐层和输出层组成,其基本结构如图1显示。AE利用编码器C(.)将输入数据x编码成C(x),再由解码器G(.)从C(x)中解码重构,表示为R(x)=G[C(x)],然后通过最小化重构误差L[R(x),x]进行模型训练。
C(.):编码层;G(.):解码层;x:输入数据;R(x)、C(x):x的编码。图1 自编码网络的基本结构Fig.1 Basic structure of auto-encoder network
1.3 基于深度自编码网络的黄瓜病害预测
由于导致黄瓜病害发生的因素复杂多样,而且很多因素之间相互作用,这使现有的很多农作物病害预测系统不能有效地应用于黄瓜的病害预测。为此,构建一种基于深度AE(DAE)的黄瓜病害预测模型,该模型由3个AE网络和1个分类器组成。每一个AE网络的输入和输出节点数均为13,其形式与由黄瓜病害信息组成的特征向量一致。输入的每一个节点对应特征向量X的一个分量,输出节点也与特征向量X的分量形式一一对应[19]。
DAE是深度学习中的一种快速学习网络,利用DAE学习到的特征向量代替原始的特征向量,输入到分类器中进行模式分类(即病害等级预测),能够极大提高数据分类的精确度。DAE的求解过程是通过迭代逼近求得隐层权重W的过程。因输入特征向量的每个分量都已进行归一化处理,故采用Sigmoid函数作为隐层的变换核函数:
(2)
式中,x和b分别为输入数据和偏置,W为隐层权重,z为x的线性组合,T表示矩阵转置。
求得隐层权重W后,再通过核函数fW(z)进行非线性特征变换。由于DAE的学习功能是挖掘病害发生环境信息数据样本的深层特征,而不提供对新样本的预测分类,所以需要设计一种分类器预测作物病害。
对于分类或预测问题,需要为基于DAE的预测模型提供有标签的学习样本集。当分类器通过学习获得分类能力后,利用该分类器对新输入的特征样本进行分类或预测。本研究用Softmax模型[25-26]构建分类器,具体如下:
第一,构建训练集。假设病害环境信息的特征向量x经公式(2)中的函数变换后得到的新向量仍记为x。根据数据库中的先验知识对第i个特征向量设定的类别标签(即对应的病害等级)为y(i)∈{0,1,2,3},其值分别代表病害预测模型要输出的4种预测结果,由此得到有标签学习向量集:L={(x1,y1),(x2,y2),...,(xm,ym)},m为待预测的特征向量数。
第二,求解预测分类器。对于给定的训练样本集L,针对第j类估算概率值p=(y=j|x),由此定义一个概率函数Hm(x)为:
(3)
式中,θ1,θ2,...,θk为需要求解的预测模型参数向量,i=1,2,...,m,j=0,1,2,3,T表示矩阵转置,p表示条件概率,即输入的特征向量对应每一种病害发生的概率。
同样地,定义一个代价函数E(θ)为:
(4)
式中,m为待预测的特征向量数,i=1,2,...,m,j=0,1,2,3。T表示矩阵转置,1{·}表示函数,即1{值为真的表达式}=1。
通过迭代确定参数θ1,θ2,...,θk,即可得到预测模型的分类器。
在以上分析结果的基础上,给出基于DAE病害预测模型的流程图(图2)。在病害预测中,首先只对与病害发生相关的环境信息数据进行归纳,通过设计基于DAE的学习模型,自动从无标签的环境信息特征向量中发现共性特征,用于表征病害发生状态,然后通过仅对少量病害特征向量进行类别标记,作为分类器训练有标签数据集的输入样本,最终形成预测实际病害发生的预测模型。因此,本研究提出的病害预测模型是一种半监督学习模型。单个AE网络的预训练是对输入数据编码和解码的重建过程,可以采用贪心算法对每个AE网络进行预训练和逐层反向迭代。首先计算每层输入数据与权值生成的新数据并传递到下一层,然后与相同的权值结合生成重构数据,映射回输入层,通过不断缩小输入数据与重构数据之间的误差,训练每层网络。预测模型中各层AE网络都先经过预训练,再通过反向迭代误差对整个模型的权值进行微调。
图2 基于深度自编码网络的病害预测模型流程图Fig.2 Flowchart of disease forecasting model based on deep auto-encoder network
2 结果与分析
在实际训练过程中,试验环境为Matlab 2012a,从数据库中选择2011-2016年黄瓜3种病害(霜霉病、褐斑病和炭疽病)的环境信息,组成环境信息特征向量,作为试验数据。在试验过程中,需要整理2类学习集:(1)用于确定公式(2)中f(z)的特征学习集,从全部特征向量集中随机选择50 000个特征向量作为特征学习集样本;(2)用于确定Softmax分类模型参数的分类学习集,设定分类学习集样本规模为10 000,分类学习集要为每个特征向量设置类别标签。其中5 000个样本用于训练Softmax模型分类器,剩余的5 000个样本用于验证预测模型的性能。特征学习的迭代上限设置为400,并基于学习后得到的特征对Softmax模型分类器进行训练,然后在测试集上验证预测模型的分类性能。预测结果如表1显示,为了表明此方法的有效性,表1中还给出了基于强模糊支持向量机(SFSVM)[24]和基于BP神经网络(BPNN)[25]的黄瓜病害预测结果。
表1显示,基于DAE黄瓜病害预测模型的预测正确率远高于其他2种预测模型,其主要原因是,基于DAE的预测模型能够模仿人思考、学习和总结经验的过程,能够从病害发生的环境信息中深度挖掘分类和预测特征,并根据所获取的特征信息进行判断和推理,从而得到较好的预测结果。预测结果表明,DAE模型在基于环境信息的农作物病害预测中具有良好的特征学习性能。
表1基于3种方法对3种黄瓜病害预测的正确率和方差
Table1Forecastingcorrectrateandvarianceofthreediseasesofcucumberbythreemethods
病害正确率(%)SFSVMBPNNDAE霜霉病62.34±1.4771.22±1.6185.26±1.27褐斑病66.58±1.8273.17±1.3486.05±1.43炭疽病71.25±1.6473.83±1.5387.17±1.52
SFSVM:强模糊支持向量机;BPNN:BP神经网络;DAE:深度自编码网络。
3 讨 论
基于深度学习的认知机理,探讨了深度学习在农作物病害预测中的应用,提出了一种基于DAE的农作物病害预测模型。该模型能够挖掘农作物生长的环境信息与病害发生、发展之间的深层联系,实现了基于环境信息的病害预测,并与经典的基于SFSVM和BPNN预测方法的结果进行了比较。试验结果表明,基于DAE的预测模型能够较好地预测农作物病害,尤其在基于农业物联网大数据的背景下,能够更好地挖掘农作物生长的海量环境信息,提高环境信息大数据的应用效果。本研究仅是农作物病害预测预报系统中的数据挖掘及模式分类核心模块的研究工作之一,其更重要的研究价值在于基于DAE的学习机理可在并行计算网络上构建深度学习网络,下一步的研究工作旨在构建一个利用农业物联网采集的海量环境信息预测病害发生的预测预报系统。
参考文献:
[1] PAVAN W, FRAISSE C W, PERES N A. Development of a web-based disease forecasting system for strawberries [J]. Computers & Electronics in Agriculture, 2011, 75(1):169-175.
[2] 王翔宇,温皓杰,李鑫星,等. 农业主要病害检测与预警技术研究进展分析[J]. 农业机械学报, 2016, 47(9):266-277.
[3] 李 丽,李道亮,周志坚,等. 径向基函数网络与WebGIS融合的苹果病虫害预测[J]. 农业机械学报, 2008, 39(3):116-119.
[4] 宋启堃,郑 松,宋彦棠. 黔南州主要农作物病虫害监测预警专家系统的构建与实现[J]. 云南地理环境研究, 2011, 23(1):34-37.
[5] 温皓杰,张领先,傅泽田,等. 基于Web的黄瓜病害诊断系统设计[J]. 农业机械学报, 2010, 41(12):178-182.
[6] 曹志勇,邱 靖,曹志娟,等.基于改进型神经网络的植物病虫害预警模型的构建[J].安徽农业科学, 2010,38(1):538-540.
[7] 陈光绒,李小琴. 基于物联网技术的农作物病虫害自动测报系统[J]. 江苏农业科学, 2015, 43(4):406-410.
[8] 姚卫平.贵池区小麦赤霉病发病程度中期预测模型[J].基层农技推广,2016,4(3):20-24.
[9] 莫丽红. 基于APSO优化的小麦条锈病神经网络预测模型[J]. 湖北农业科学,2012,51(11):2337-2340.
[10] 王淑梅.气象条件与农作物病虫害预报和防治[J].世界农业,2010(2):55-57.
[11] 王淑梅.基于气象视角的农作物病虫害预测预报研究概况[J].中国植保导刊, 2009(12):13-16.
[12] 邓 刚.气象因子的变化对黑龙江省森林病虫害影响的研究[D].哈尔滨:东北林业大学,2012.
[13] 陈怀亮,张 弘,李 有.农作物病虫害发生发展气象条件及预报方法研究综述[J].中国农业气象, 2007,28(2):212-216
[14] 马丽丽,纪建伟,贺超兴,等.番茄专家系统环境数据库在病害预测中的应用[J].农机化研究,2008(6):161-163.
[15] SHI M. Based on time series and RBF network plant disease forecasting[J]. Procedia Engineering, 2011, 15: 2384-2387.
[16] LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.
[17] 谭 娟,王胜春.基于深度学习的交通拥堵预测模型研究[J].计算机应用研究,2015, 32(10): 2951-2954.
[18] WANG Y, YOU Z, LI X, et al. Predicting protein-protein interactions from protein sequences by stacked sparse auto-encoder deep neural network [J]. Molecular BioSystems, 2017, 13(7):1336-1344.
[19] YOU Z H, ZHOU M C, LUO X, et al. Highly efficient framework for predicting interactions between proteins[J]. IEEE Transactions on Cybernetics, 2017, 47(3): 721-733.
[20] DYRMANN M, KARSTOFT H, MIDTIBY H S. Plant species classification using deep convolutional neural network[J]. Biosystems Engineering, 2016, 151: 72-80.
[21] SLADOJEVIC S, ARSENOVIC M, ANDERLA A, et al. Deep neural networks based recognition of plant diseases by leaf image classification[J]. Computational Intelligence and Neuroscience, 2016, 2016(6):1-11.
[22] 黄 冲,刘万才.试论物联网技术在农作物重大病虫害监测预警中的应用前景[J].中国植保导刊, 2015, 10:55-60.
[23] 徐德良,王敏鑫,邵 元.海物联网技术在茶树病虫害防治中的探讨[J]. 茶叶,2014,40(3):155-163.
[24] 杨志民,梁 静,刘广利.强模糊支持向量机在稻瘟病气象预警中的应用[J].中国农业大学学报, 2010,15(3):122-128.
[25] 陈 涛,高必梵,艾菊梅.基于BP神经网络的农作物虫害预测系统的研究[J].数字技术与应用, 2015(1):91-93.
[26] SHIN H C, ORTON M R, COLLINS D J, et al. Stacked auto-encoders for unsupervised feature learning and multiple organ detection in a pilot study using 4D patient data[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(8): 1930-1943.