深度学习环境下香料种植推荐模型的设计研究
2022-02-15孙吉红张剑波
孙吉红,钱 晔,周 正,张剑波
(1.云南省科学技术院,昆明 650000;2.云南农业大学大数据学院(信息工程学院),昆明 650201;3.云南省高校农业信息技术重点实验室,昆明 650201)
云南省香料植物品种丰富,种类多样性和香气多样性均在全国前列,素有“植物王国”美誉,目前已探明种类有18 000 余个,占全国植物品种总量的51.6%。其中,省内发现或引种的香料植物超过400种,与国内已报道的800 余种香料植物相比,约占50%,品种丰富程度在全国位居前列[1]。云南省地处亚热带、热带,在云贵高原复杂地貌特征的影响下,气温随海拔的升高差异明显,形成了独特的立体式地理气候条件,非常适宜香料植物的生长[2]。因此,不仅世界上大多数的香料植物都能在云南省找到适宜生长、繁衍的地区,而且植物次生代谢物质积累充分,香料植物产量更高、香气更好。云南省天然芳香作物种植面积约27万hm2,位居全国前列。从事天然香料种植和初加工的农民已超过200 万人,其中,八角、草果、小黄姜、花椒、砂仁等特色天然香辛(调味料)种植面积均为全国最大。近年来,随着香料植物品种的不断开发和引进,云南省香料作植种植面积仍在不断增加[2,3]。仅玫瑰花种植面积已接近全国总面积的25%,约0.4万hm2。
无论从气候环境、地理位置,还是香料种类、种植面积方面,云南省都具有优势,但香料价格不稳定,主要表现在连续几年高售价的香料下一年可能价格大跌,严重影响种植户的收入,甚至导致中小型种植企业陷入危机。近年来,大数据技术的迅速发展,各行业大数据中心的建立为解决行业中存在的问题提供了专业化平台,各种智能算法的衍生为解决各行业的具体难题提供了技术支撑。为此,本研究致力于在深度学习的环境下,以云南省最具代表性的草果为研究对象,采用智能算法构建草果种植推荐模型,在此基础上进行推广应用,构建多种香料种植推荐模型,形成云南省香料种植推荐模型群,并搭建信息平台,为种植户、种植企业、科研人员等提供具有参考意义的数据。
1 草果种植推荐模型的构建
本研究以草果为研究对象,在深度学习环境下,采用人工神经网络算法,构建基于智能算法的草果种植推荐系统,对草果的产量、质量、价格分别进行预测,形成一个草果产业化的推荐系统。
1.1 智能预测模型构建的方法
智能推荐模型的前身主要是指基于智能算法的价格(产量)预测模型,一般情况下,以人工神经网络算法或者遗传算法等定量性算法为基础,在收集整理大量数据的基础上,确定影响研究对象价格(产量)的因素,并将收集的数据填充进影响因素中,初步形成构建智能模型的数据集,并采用拉依达准则等相关算法寻找并删除异常数据,根据数据之间的关系以及收集数据所属行业领域补充空缺的数据,形成完整的数据集合[4];根据数据集合的基本情况,将该集合分为训练集合、测试集合;根据数据集合中数据量的大小结合智能算法的特点拟定构建智能模型的算法。所有预备工作做好后,在构建智能模型的平台上,按照智能算法构建模型的步骤进行模型构建,然后进行价格(产量)预测[5],将预测的结果与实际的结果进行对比,得到智能预测模型预测的准确率。如果预测结果与实际结果相差较大,则返回智能算法选择这一步骤,并且检查数据收集的关键环境是否有误。如果预测结果接近于实际的结果将完成智能模型的构建。在此,需要强调的是智能算法构建模型,它是一个不断学习的过程,学习的次数特别重要,如果数据量太小,无论选择哪一种算法都无法得到精准的预测结果。只有当数据量达到一定规模时,才能准确判断该模型是否需要修改完善。因此,数据量的大小成为了构建智能预测模型关键因素之一。
经过多位学者的研究还发现,构建智能预测模型关键的因素是正确确定影响预测对象的价格、产量、需求量、销售量等因素。随着大数据技术时代的来临,各种智能算法深入多个领域的研究工作中。钱晔等[6]提出了采用人工神经网络算法构建基于鲜切花价格影响因素的验证模型。主要是采用管理学中头脑风暴法收集整理归纳专家意见。然后,采用名义小组技术将形成的意见分别发给每一位技术专家,形成影响鲜切花价格的影响因素。最后,采用人工神经网络算法构建的验证模型进行验证。总之,构建智能预测模型[7]的关键点在于影响因素、对应的数据集合、适合的算法以及模型的调试验证等。目前,科研人员在农产品价格预测的应用中,主要采用的智能分析方法包括神经网络预测[8-10]、灰色预测法[11]、支持向量机[12]等。
1.2 草果产量智能预测模型的构建
目前,云南省怒江州境内草果种植面积已经超过3.33 万hm2,主要采用林下种植的方式,在河沟、湿度大的阴山面进行大量种植,已经成为云南省乃至全国草果种植基地的特色。以怒江州境内种植的草果为研究对象,采用人工神经网络算法构建基于智能算法的草果产量预测模型。
1.2.1 确定试验数据集 在云南省怒江州境内草果种植基地,安装传感器实时采集种植草果期间每天的浇水量、施肥量、喷洒农药量、温度、湿度等相关数据,如遇空缺则标记为“0”,因为草果从播种至收货的时间周期为5~6 个月。因此,该模型的数据收集的一个周期为5~6 个月。在收集数据期间内,至少收集3年的数据,形成6 个种植周期的数据信息,大约为1 095 组信息,形成本研究中草果产量智能预测模型的数据集合。然后,分别将各类信息进行归纳整理,剔除异常数据、补充空缺数量,并通过归一化算法将数据集合中的数据控制在(0,1)中。其中,将前2 个周期的数据集合作为测试集数据,后面4 个周期的数据集合作为训练集数据。
归一化算法[13]是使用premnmx 函数进行数据归一化处理,对预测对象的影响因素及预测对象进行归一化处理,使得各影响因素及对应的预测值控制在(-1,1)的区间。语法格式为:
式(1)中,P表示归一化后的数据集合;p表示需要归一化的数据集合;式(2)中,m为随机变量,max<m<min。
1.2.2 拟定并验证影响因素 目前,尚未有科研人员针对草果的产量影响因素进行深入研究。仅有部分研究人员[13]针对某种农产品进行产量预测。本研究将传感器中收集整理的各类数据暂定为影响草果产量的因素进行研究,主要依据为暂定影响因素囊括了草果种植过程中所有可能产生的数据类型,具体包括种植草果过程中记录的温度、湿度、光照度、浇水量、施肥量、喷洒农药量等数据。
1.2.3 修改并确定构建智能模型的算法 大数据技术发展至今,已经产生了多种不同的智能算法,以最典型的人工神经网络算法为例,不同的算法具有不同的特点,例如模糊神经网络算法针对空缺数据较多、异常数据量较大的情况下,能够提高模型预测的精准率;GRNN 神经网络算法适合在训练样本较小的情况下,提高模型预测的准确率;RBF 神经网络算法作为传统BP 神经网络算法的补充算法,规避了BP 神经网络算法训练速度较慢的特点,适合在训练数据、测试数据量较大的情况下使用。每种算法都具有各自不同的特点,但是在试验过程中,根据数据的特点去匹配算法时,同样会遇到问题。部分研究人员直接选择数据集与之最匹配的算法进行智能模型构建,在少量的试验过程中将难以区别这种选择的缺陷。但是,在实际的生产过程中,将会暴露该类做法的缺陷,即在数据量不断增加,试验次数不断加大的情况下,该类模型的预测结果会出现不稳定现象。为了规避预测结果不稳定带来的影响,在确定算法的过程中,将采用以下方式对算法进行相应的完善。以BP 人工神经网络算法为例,构建智能预测模型时,可以采用启发式改进方法对算法进行改进,具体方法包括:构建模型时,将权值的范围设置为1-n,即将权值设置为1、2、3,…,n,用于调整权值,解决BP 神经网络在学习训练过程中的难题。同时,可以将BP 人工神经网络算法与遗传算法或者灰色算法等进行有机结合,形成一种新的算法,提高网络训练的速度和预测的准确率,也可以通过归一化算法、拉依达准则等算法提升测试集、训练集数据的质量,以此提高智能预测模型的准确率。
1.2.4 草果产量预测模型的构建 本研究基于怒江州草果种植基地,采用传感器收集数据,将收集到的3年6 个周期的数据进行整理,形成构建草果产量预测模型的数据集合,采用RBF 人工神经网络算法,以MATLAB 为平台构建智能产量预测模型。
1)确定输入输出模式。输入模式为影响草果产量的因素,包括种植草果过程中每天的浇水量、施肥量、喷洒农药量、温度、湿度等相关数据。综上所述,该模型中输入向量包括影响草果产量的因素;输出向量为1,输出层神经元个数设置为1。
2)智能模型网络训练。将数据集合中前两期共365 组数据作为测试集样本数据输入RBF 网络中,然后分别设置隐含层节点数、网络最大训练次数、平均误差、学习速率等。试验过程中,分别设置隐含层节点数,然后对应输入剩余的4 组共730 组数据作为训练集样本数。分别输出不同的预测结果,并与实际产量进行对比,设置的哪一个节点对应的预测结果准确率最高,哪一个节点为确定的隐含层节点。
3)智能预测结果及分析。本研究中隐含层节点数设置为1~7,RBF 预测结果将产生7 个不同的结果,分别将7 个预测结果除以实际产量,得到预测的准确率,选取准确率最高的结果为预期模型。当准确率低于85%时,将返回至确定影响因素的步骤,重新确定影响草果产量的因素。
2 智能预测模型的推广应用
深度学习环境下草果种植推荐模型的研究主要包括草果产量智能预测模型、草果质量智能预测模型、草果病虫害智能预测模型、草果价格智能预测模型等。在深度学习环境下,构建草果智能预测模型群的方法与以上方法类似,按照已构建的基于智能算法的草果质量预测模型可以构建其余的模型,形成基于智能算法的草果种植智能模型群,从草果的选种、种植管理、销售、反馈一体化智能管理系统,为云南省草果行业的发展提供一种新思路。结合云南省怒江州草果种植的实际情况,构建基于云环境下草果种植管理平台,具体情况如图1、图2、图3 所示。
整个平台包括3 个模块,第一个模块是基于智能算法的草果种植推荐模型群,第二个模块是用户权限管理,第三个模块是云环境下草果种植管理平台。其中,第一个模块作为整个平台的核心部分,主要是针对草果的价格、产量、质量、病虫害进行预测,为农户提供下一个种植周期,包括草果的种植品种、种植规模、种植过程中病虫害的防治方法,为提升草果的品质,增加农户的收入提供智力支持,为草果种植、加工、销售企业提供企业发展指南,为研究香精香料的研究人员提供了数据支持,具体内容详见图1。
图1 基于智能算法的草果种植推荐模型群
第二个模块主要是用户权限管理,在此强调用户权限管理主要是该平台的建设与用户的使用权限关联紧密,对于游客仅能够浏览系统中的公开信息,将注册付费后的普通会员分为种植户、种植企业、销售企业、加工企业、科研人员5 个类型。种植户能够收到草果种植下一季的价格、产量、质量预测的数据以及针对下一季当地气候环境病虫害防治方法;种植企业相对于种植户可以获取更广泛的数据信息,例如:能够收到草果种植下一年的价格、产量、质量预测的数据以及针对当地气候环境病虫害防治方法;销售企业、加工企业收到的信息更为聚焦,能够获取下一年每天的销售预测价格等重要信息;科研人员能够获取基于智能算法的草果种植推荐模型中预测的所有数据值,仅能用于科学研究工作的开展,并且科研成果必须用于该平台的修整完善。超级会员作为该平台受益最多的群体,能够查询到所有智能模型的推荐结果,并且能够享受定制化的服务。管理员除了拥有超级会员的权限外,同时需要承担管理整个平台的责任。具体内容详见图2。
图2 用户权限管理
图3 所示为云环境下草果种植管理平台,在基于智能算法的草果种植推荐群、用户管理2 个模块的共同作用下,构建云环境下草果种植管理平台,该平台的主要功能包括:用户权限管理、经营模式管理、数据共享模式管理、数据采集系统管理等模块。最值得关注的是本研究主要基于云环境下构建智能推荐平台,由于用户数量大、推荐数据准确性高、用户收费底、效果好等优点,不但能够为用户提供满意的服务,农户致富、企业发展壮大、科研人员获得发展的空间,更重要的是能够在不断壮大、激活该智能平台的基础上,促进云南省乃至全国草果行业的发展。
图3 云环境下草果种植管理平台
3 小结
本研究基于深度学习环境下,以人工智能算法为基础,选取草果种植为例构建香料种植推荐模型,解决农户、企业种植全过程中的难题,为科研人员提供构建智能模型时所需的训练集数据和测试集数据,全面助推云南香料产业的发展。主要表现在以下3 个方面。
一是构建草果智能预测模型群。在云南省怒江,即科学技术欠发达的地区,提出了在深度学习环境下,采用人工神经网络算法构建基于智能算法的草果价格预测模型、病虫害预测模型等多个智能模型,搭建草果产业智能推荐模型群,是解决怒江地区经济相对落后问题的一种创新思路。
二是推广应用价值高。本研究构建的智能模型群,不仅适用于草果产业的发展,同样适用于香料产业中的其他作物,为深入研究香精香料作物的产量、质量、病虫害等关键性问题提供参考。
三是适用人群广泛、服务能力强。本研究成果不仅适用于种植户、企业,还适用于相关领域的科研人员。针对智能模型的预测结果,可以为种植户、企业提供下一季种植品种的类型、种植规模等信息,为研究人员提供研究的数据支撑;针对智能模型收集、整理数据的过程,可以形成大量数据集合,为构建草果产业大数据中心提供数据支撑;针对智能模型的拓展应用,可以为构建模型的企业提供良好的经济效益,提供大量的低价格、高质量的服务。