基于主要环境因子的设施黄瓜生长模型研究*
2022-04-24洪苗柳平增张艳马学文郑勇柳建增
洪苗,柳平增,张艳,马学文,郑勇,柳建增
(1. 山东农业大学信息科学与工程学院,山东泰安,271000; 2. 山东农业肥业科技有限公司,山东肥城,271600;3. 山东省现代农业农村发展研究中心,济南市,250100; 4. 山东省万兴食品有限公司,济南市,250000)
0 引言
黄瓜是我国主栽蔬菜之一,规模和产量都位居世界第一[1-2]。环境条件是实现作物高产、高效、优质生产的关键因素[3-4],作物生长与长期所处的环境有着紧密的联系。研究基于主要环境因子的设施黄瓜生长模型对提高黄瓜生产水平和管理能力具有十分重要的意义。
目前国内外学者基于温室环境的作物生长模型主要从两个研究角度展开多项研究工作。针对环境因素的选择,其研究内容以光温为主。Heuelink[5]用有效积温法建立番茄的生长模拟模型。陈永快等[6]以有效积温为变量,采用Logistic曲线方程,建立NFT下小白菜生长模型。刘志刚等[7]以光温因子—辐热积(TEP)为驱动变量,建立温室基质栽培生菜营养生长模拟模型。倪纪恒等[8]根据温室黄瓜果实对温度和辐射的响应,建立以辐热积为尺度的温室黄瓜果实模型,能较准确地预测温室黄瓜各节位的果实生长。还有一些学者增加了变量的内容,在方法的选择上具有多样化。张传帅等[9]采用偏最小二乘回归研究日光温室内空气温度、光照强度、CO2浓度等多个环境因素的番茄生长模型。员玉良等[10]采用主成分回归研究了向日葵基于空气温度、相对湿度及光合辐射等环境变量的茎直径生长模型。Kurtar等[11]采用多元回归分析的方法研究基于温度、光照以及SPAD值的黄瓜生长模型。赵亚威等[12]利用BP神经网络构建了叶类蔬菜如小白菜、油菜的环境数据与长势特征叶面积的生长模型,为温室植物的种植提供参考依据。
综上所述,学者们多以温度、光照等环境因素为尺度研究黄瓜生长模型,不仅环境变量的选择具有局限性,并且研究方法上忽略了变量之间多重共线性问题。本文拟利用主成分分析提取能够代表黄瓜生长状况的指标,利用岭回归解决环境因素与生长指标之间的多重共线性问题,并为试验增加环境变量个数,建立基于温室内主要环境因子的设施黄瓜不同时期生长模型,为设施黄瓜种植应对环境因素的变化提供决策依据。
1 材料与方法
1.1 试验材料
试验于2020年7月20日—11月13日在山东省德州市陵城区麋镇创新园区进行。试验黄瓜为嫁接品种“德瑞特2号”,砧木为南瓜种,种植方式采用无土基质盆栽法,2020年7月20日种植第一批,2020年8月30日种植第五批,每批次种植160颗。定植时黄瓜苗已两叶一心,定植行间距为70 cm,灌溉采用双行滴管带,滴箭插置于幼苗根部附近。各批次黄瓜定植后统一进行水肥管理,用量按照常规园区常规管理方式,本试验不做特殊处理。
1.2 数据采集类型与方法
试验园区温室内环境数据采用了实验室自主研发的“神农物联”系列物联网设备连续自动采集完成,采集时间间隔30 min,采集数据种类为空气温度、空气湿度、二氧化碳浓度以及光照强度等指标,并从数据挖掘的角度提炼出昼夜温差字段,其测量所需设备信息如表1所示。黄瓜地上部生长数据每周采集一次,每次取10株长势相同样本采集株高、茎粗、叶片数、叶面积以及单片叶面积等指标,其中叶面积指标使用国产LA-S植物图像分析仪所得,茎粗作物茎粗测量仪测量得到,株高采用直尺或卷尺所得。
表1 采集设备Tab. 1 Acquisition tools
1.3 数据处理方法
1.3.1 主成分分析原理及方法
主成分分析(principal component analysis,PCA),又名主分量分析,是通过降维技术,把具有一定相关性的变量,按照贡献率的大小,重新组合成一组新的、且相互独立、少数能充分反映原始数据信息的综合指标以替代原来的指标,进而在保留重要信息的前提下,避开原变量之间的线性相关关系,便于进行下一步的数据分析[13]。
设施黄瓜地上部生长指标有5个样本,每个样本有18个数据,则构成5×18维矩阵
(1)
当数据类型不一致时,通常具有不同的量纲和量纲单位,此时需要对数据进行标准化处理以消除量纲的影响,从而解决数据之间的可比性。首先将黄瓜生长指标进行标准化处理,将矩阵X标准化为Z,其中
(2)
式中:μ——所有生长指标数据的均值;
σ——所有生长指标数据的标准差。
将式(1)经过标准化处理后得到设施黄瓜生长指标的相关系数矩阵
(3)
计算生长指标的相关矩阵R的特征根λi及其特征向量αi,并将特征根由大到小排列。λi越大则所对应的主成分反映的信息就越大。第1个主成分F1可表示为
F1=α1,1Z1+α2,1Z2+…+α18,1Z18
(4)
求解贡献率并确定主成分个数,第i个主成分的贡献率
(5)
m个主成分的累计贡献率
(6)
当累积贡献率大于80%时,则可以选取m个因子作为主成分,这m个因子能较大限度的保留原数据的信息。
1.3.2 多重共线性分析
在多元回归中,当两个或更多的自变量相关时,就有可能出现多重共线性(multicollinearity)的情况[14]。当多重共线性严重时,模型或数据的微小变化可能造成系数估计的较大变化,这将使得结果模型不稳定,也不容易解释。一般来说,只要不存在严重共线性,对预测不会有较大影响,但高度的多重共线性会造成计算困难。
方差膨胀因子(VIF)是多重共线性的度量之一,其通过检查指定的解释变量能够被回归方程中其他全部解释变量所解释的程度来检测多重共线性。其定义为
(7)
式中:Rj2——第j个变量在其他所有变量回归时的确定系数。
VIF取值接近于1,多重共线性越轻,反之越重。通常以10作为共线性判断边界。当VIF<10,可认为不存在多重共线性;当10≤VIF<100,则认为存在较强的多重共线性;当VIF≥100,则认为多重共线性非常严重。设施黄瓜不同生长期生长指标和环境因子的VIF检查,其数值多大于10,说明变量之间存在较强共线性,模型建立时应选择适用于多重共线性的方法。
1.3.3 岭回归分析原理及方法
针对多重共线性问题,1962年,霍尔(A.E.Hoerl)首先提出改进最小二乘估计的方法,称为岭估计。1970年,霍尔与肯纳德(Kennard)合作,对岭估计做了进一步的改进[15]。岭估计通过岭参数k的不同取值获得回归参数的估计值,当k=0时就是普通最小二乘估计。
岭估计通过损失部分信息,降低精度,放弃最小二乘法的无偏性的代价得到更加稳定的估计结果,相较于最小二乘法,岭估计对病态数据的拟合度更好,且均方误差更小,因此专用于共线性数据分析[16]。当变量存在多重共线性,即数学描述为|X′X|≈0,那么在原本的相关矩阵X′X基础上加上一个正常数矩阵kI(k>0),使得X′X+kI接近奇异的程度将会大大降低,即X′X+kI=0的可能性比X′X=0的可能性小很多,从而使岭估计具有更小的均方误差,设岭估计
(8)
2 结果与分析
2.1 设施黄瓜地上部生长指标主成分分析
提取出表现设施黄瓜苗期和初花期长势好坏的主要特征,其中X1、X2、X3、X4、X5分别表示株高、茎粗、叶面积、叶片数以及平均单叶面积。首先利用R语言中scale函数对生长数据进行标准化处理,将其转化为无量纲的纯数值,便于不同单位或者量级的指标能够进行和加权,之后选用主成分分析法进行长势特征的提取。苗期结果如表2所示。
表2 苗期生长指标相关性分析Tab. 2 Correlation analysis of seedling growth indexes
显然,苗期各生长指标之间显著相关,故此选择主成分分析作为数据分析的主要手段,对生长数据进行主成分提取。由表3苗期总方差解释和图1碎石图可见,第1个主成分因子的贡献率大于0.8,即可得到m=1,即选定一个主成分F1。
表3 苗期总方差解释Tab. 3 Explanation of total variance at seedling stage
图1 苗期碎石图Fig. 1 Seedling lithotripsy
表4 苗期初始因子成分矩阵Tab. 4 Initial factor component matrix of seedling stage
从表4可以看出,叶面积、叶片数、茎粗、平均单叶面积、株高在第一主成分上均有较高的载荷,说明第一主成分F1完全包含了这5个指标的信息。即选取这一个主成分可以完全反映设施黄瓜苗期长势的指标信息。所以根据初始因子载荷矩阵及其特征值计算出对应的单位特征向量,并结合式(4),可以得到
F1=0.48×X3+0.45×X4+0.44×X2+0.44×X5+0.42×X1
(9)
由以上分析可知,叶面积在该主成分上占据最高载荷,则叶面积可作为评估黄瓜苗期长势的主要指标。
同理,对初花期生长数据进行主成分分析挑选出最能代表初花期长势的指标。
表5 初花期总方差解释Tab. 5 Interpretation of total variance at initial flowering
图2 初花期碎石图Fig. 2 Early flowering lithotripsy
表6 初花期初始因子成分矩阵Tab. 6 Initial factor component matrix of early flowering stage
由表5初花期总方差解释和图2初花期碎石图可见,第一个和第二个主成分因子的贡献率之和大于0.8,即可得到m=2,即选定两个主成分F1、F2。从表6可以看出,叶面积、叶片数、茎粗在第一主成分上具有较高的载荷,株高、单叶面积在第二主成分上具有较高的载荷,说明主成分F1、F2基本上包含了这5个指标的信息。即选取这2个主成分完全可以反映设施黄瓜初花期长势的指标信息。因此得到初花期主成分函数
F1=0.59×X3+0.58×X1+0.50×X4+0.09×X2+0.22×X5
(10)
F2=0.12×X3-0.15×X1-0.37×X4+0.66×X2+0.63×X5
(11)
由以上分析可知,叶面积在第一主成分上具有最高载荷,则叶面积可作为评估黄瓜初花期长势的主要指标。
综上所述,最能表现设施黄瓜苗期和初花期生长的指标皆是叶面积。因此在黄瓜生长时,叶面积越大,黄瓜的长势越好,结瓜越多,瓜农收益越高。与现场调研以及与专家咨询所得结果一致,叶面积越大,光合作用越强,植株产生营养物质的能力越强,结瓜越多。所以,若想要黄瓜长势良好,则应适度增大叶面积。
2.2 基于主要环境因子的设施黄瓜苗期生长模型
将环境数据以及长势数据进行标准化处理后,使用R程序包car包的函数vif()将所采集苗期叶面积数据及环境数据进行共线性检查,结果显示VIF温度=182.926 091,VIF光照=426.808 457,VIFCO2=3.538 106,VIF昼夜温差=63.243 900,VIF湿度=155.156 345。因其数值除CO2外皆大于10,则说明环境数据之间存在多重共线性问题,故考虑岭回归算法建立设施黄瓜苗期生长模型。
在岭回归中,最困难的是确定岭参数k*。使用程序包ridge中linearRidge()函数分析苗期叶面积和环境变量之间的关系,由linearRidge()函数得岭迹k*=0.133 520 1,满足岭迹选择k的条件。所得结果如表7所示。
表7 苗期岭回归结果Tab. 7 Ridge regression results at seedling stage
经过回归后拟合得岭回归方程
Y叶面积=1.419×10-7+0.212 4×Z温度+0.260 6×Z光照-0.222 0×ZCO2+0.184 5×Z昼夜温差+0.284 0×Z湿度
(12)
分析岭回归方程可得:当Z光照、ZCO2、Z昼夜温差、Z湿度不变时,Z温度每增加1个单位,Y叶面积则平均增加0.212 4个单位;当ZCO2、Z昼夜温差、Z温度、Z湿度不变时,Z光照每增加1个单位,Y叶面积则平均增加0.260 6个单位;当Z温度、Z光照、Z昼夜温差、Z湿度不变时,ZCO2每增加1个单位,Y叶面积则平均减少0.222 0个单位;当Z光照、ZCO2、Z温度、Z湿度不变时,Z昼夜温差每增加1个单位,Y叶面积则平均增加0.184 5个单位;当Z光照、ZCO2、Z温度、Z昼夜温差不变时,Z湿度每增加1个单位,Y叶面积则平均增加0.284 0个单位。
2.3 基于主要环境因子的设施黄瓜初花期生长模型
表8 初花期岭回归结果Tab. 8 Early flowering ridge regression results
经过回归后拟合得岭回归方程
Y叶面积=2.584×10-6+0.291 8×Z温度+0.337 1×Z光照+0.271 7×ZCO2
(13)
分析拟合方程可得:当Z光照、ZCO2不变时,Z温度每增加1个单位,Y叶面积则平均增加0.291 8个单位;当ZCO2、Z温度不变时,Z光照每增加1个单位,Y叶面积则平均增加0.337 1个单位;当Z光照、Z温度不变时,ZCO2每增加1个单位,Y叶面积则平均增加0.271 7个单位。
2.4 模型验证分析
对所得的岭回归生长模型进行显著性检验与方差分析。从表9中可以看出苗期该回归模型的决定系数大于90%,方差为1.965,残差为2.839,检验结果为极显著,可用于黄瓜苗期长势与环境因素的相关性分析。
表9 模型检验Tab. 9 Model test
对黄瓜苗期长势影响排名前三的环境因素依次是光照、温度和湿度,且影响情况为正相关,其他变量影响较小。初花期该回归模型的决定系数大于90%,方差为1.43,残差为1.972,检验结果极显著,可用于黄瓜初花期长势与环境因素的相关性分析。以此证明,对黄瓜初花期长势影响最大的是温度和光照,其次是CO2浓度。
3 结论
本研究以山东省德州市陵城区麋镇创新园区秋冬茬设施黄瓜为试验对象,对基于温室主要环境因子设施黄瓜生长模型进行研究,主要结论如下。
1) 采用PCA提取黄瓜地上部分多个长势指标序列特征发现,苗期和初花期的叶面积载荷值在第一主成分中分别为0.994、0.980,说明叶面积能够较明显的表现黄瓜的苗期和初花期长势。在实际生产中可以帮助用户更便捷的判断黄瓜长势好坏,叶面积越大,农户后期收益越高,因此在生长发育期适度增大叶面积对设施黄瓜种植管理至关重要。
2) 由岭回归建立的设施黄瓜生长模型发现,苗期主要环境影响因素为光照、温度和湿度,初花期主要影响因素为温度和光照,且都为正向显著影响,模型的决定系数皆大于90%,检验结果显著性较高。
3) 在实际生产种植中环境参数变化较大,不同参数之间关系复杂,将变量进行关联性分析更有利于指导实际应用,可为后期温室环境调控提供参考。
作物生长是一个复杂的过程,各长势指标之间互有关联,本研究仅探寻了环境因素对黄瓜长势主要指标的影响,未对其他长势指标的作用进行研究,并且种植管理等因素对黄瓜长势的影响也有待进一步的探讨。