福建烟区烤烟产值估测模型与分区
2014-12-24杨光荣张黎明范协裕邢世和
位 佳,杨光荣,张黎明,范协裕,邢世和
(福建农林大学资源与环境学院,福建福州350002)
作物产量、产值预测是当代农业科学研究的核心内容之一,是农业决策的重要依据[1].在当前卷烟工业追求烟叶质量的状况下,提高烟叶产值成为烤烟生产的关键[2],而产值预测对于实现烤烟生产的监测、管理科学化,具有重要的现实意义.烤烟是一种投入少、收入高、周期短、见效快的经济作物,但生态条件变化对烤烟质量有较大影响[3].国内外对于如何提高烤烟产量的研究较多.如Helmy[4]研究指出施用无机氮的烟叶产量和质量优于施无机氮;江豪等[5]认为种植密度及打顶时期对云烟85的产量与质量影响较大.胡卫东等[6]利用“3414”试验方案研究出烟叶产量最高时的氮磷钾施用量.王鹏等[7]研究表明发酵饼肥可提高烟叶产量.曾志三等[8]通过利用历史数据建立灰色预测模型来估测烟叶产量.
总之,国内外有关烟叶的研究主要集中在烟叶产量与肥料的关系,且研究方法大多为田间试验方法;应用数学模型估测烤烟产量、产值的研究相对较少.福建省是我国优质烤烟主产区和重要烟草生产基地,主要种植品种为K326、云烟87(85)[9].本研究利用福建烟区代表性样点烤烟产值及其影响因子数据资料,筛选建立烤烟产值最佳估测模型;借助GIS与烤烟产值最佳估测模型集成技术,利用福建烟区烤烟产值影响因子空间属性数据库,开展福建烟区烤烟产值估测及分区研究.
1 方法
1.1 资料收集
收集的资料主要有:(1)1∶25万福建烟区烤烟品种用地适宜性评价数据库,包括评价因子和烤烟用地适宜性的空间属性数据库;(2)福建烟区399个代表性调查样点地理信息坐标、烤烟品种产值(近3 a均值)及相关土壤属性调查分析数据(其中K326样点数186个,云烟85样点数36个,云烟87样点数177个).
1.2 烤烟产值影响因子的确定及其数据库的建立
烤烟为喜光、喜温作物,烤烟大田生育期日照时数要求达500-700 h,日照百分率为40%以上,适宜生长的温度为20-28℃,成熟期日均温大于20℃的持续日数不少于50 d.合理的降水是形成优质烟叶的有利气候条件,烤烟生育期月均降水量为100-200 mm.肥力中等、质地疏松、有机质含量适中的土壤最适于种植烤烟.烤烟为喜钾作物,对土壤酸碱度较为敏感,适宜pH值为5.5-6.5.烤烟忌氯,氯离子含量低于0.8%才能生产出优质烟叶[11].根据上述烤烟对气候、土壤和地形等立地条件的要求,选取立地环境条件(坡度、坡向、耕层厚度、地下水位)、土壤理化性质(有机质、粘粒、碱解氮、速效磷、水溶性氯、交换性镁、pH值和速效钾)、气候(无霜期、日均温≥20℃的持续天数、日照时数和≥10℃活动积温)共16个因子作为福建烟区烤烟产值估测的主要影响因子.
土壤理化性质因子数据为福建烟区399个代表性调查样点实测数据;立地环境条件和气候因子数据借助ARC/GIS软件,通过399个烤烟产值调查样点的地理信息坐标,从福建烟区烤烟用地适宜性评价因子数据库中提取.由于云烟85和云烟87是同源烤烟品种,其生产和效益相近,且考虑到云烟85的实际调查样点数相对偏少,故将两者合并后进行产值建模、预测和分区.利用获取的数据分别建立福建省烟区烤烟K326、云烟87(85)产值估测模型筛选的样点数据集(K326样点数据集有186个,云烟87(85)样点数据集有213个),并将该样点数据集分成两部分,分别作为估测模型建模(或训练)样本和估测模型精度的验证样本.其中,烤烟K326建模或训练样本数为130个,验证样本数为56个;云烟87(85)建模或训练样本数为149个,验证样本数为64个,符合统计学的大样本原则.
1.3 烤烟品种产值估测模型的建立
1.3.1 神经网络模型的建立 神经网络算法是一种采用误差反向传播算法的自动学习过程的方法[12].利用研究区279个建模或训练样本的烤烟产值和立地环境条件、土壤理化性质和气候因子数据资料,根据神经网络模型的网络参数确定原则[13-14],借助DPS统计软件分别对K326、云烟87(85)产值的神经网络模型进行拟合[15].经过多次神经网络训练的比较[16-18],分别选取烤烟K326、云烟87(85)产值的神经网络模型的网络参数,建立了烤烟品种的神经网络模型.在DPS数据处理系统中,建立含1个隐层的BP网络,将所筛选出的16个影响因子作为输入样本,以烤烟K326、云烟87(85)的产值作为输出样本.以输入层节点数为自变量的个数,即因子个数,故输入层节点数为16.Sigmoid参数取0.9,允许误差为0.0001,迭代次数为1000,将输入样本作标准化转换,K326和云烟87(85)产值模型的最小训练速率分别为0.6和0.9,动态参数均取0.6,隐含层节点数分别选取14和16.
1.3.2 双重筛选逐步回归模型的建立 双重筛选逐步回归模型是一种逐步算法,既能按照自变量与因变量的关系对因变量进行分组,又能使每个自变量对各组因变量的影响程度反映出来,最后分组建立方程[19].设Fx和Fy分别为自变量和因变量的引入和剔除临界值,则一般取:
式中,Fα和Fβ分别表示给定置信度;p和m分别表示因变量和自变量的个数.
采用DPS统计软件分别对K326、云烟87(85)产值的双重筛选回归方程进行拟合(其中置信度α和β均为0.1),建立以下 K326、云烟 87(85)产值的最优回归方程.因变量 Yk和 Y1分别为 K326和云烟87(85)的单位面积产值;自变量为pH(X1)、粘粒(X2)、有机质(X3)、碱解氮(X4)、速效磷(X5)、速效钾(X6)、交换性镁(X7)、水溶性氯(X8)、耕层厚度(X9)、地下水位(X10)、无霜期(X11)、日照时数(X12)、≥20℃持续天数(X13)、≥10℃活动积温(X14)、坡度(X15)和坡向(X16).
在临界值Fx=1.28,Fy=2.10的条件下,建立如下回归方程:
模型的相关系数 R=0.352,显著水平 P=0.037,剩余标准差 S=16.41,n=128,表明模型中的自变量与K326的单位面积产值呈显著相关.
在临界值Fx=0.50,Fy=2.09的条件下,建立如下回归方程:
模型的相关系数R=0.397,显著水平 P=0.007,剩余标准差S=197.46,n=147,表明模型中的自变量与云烟87(85)的单位面积产值呈极显著相关.
1.4 最佳模型的验证与确定
为筛选出福建烟区最佳产值估测模型,将56个K326和64个云烟87(85)烤烟品种验证样本的立地环境条件、土壤理化性质和气候因子数据分别代入上述各烤烟产值估测模型,计算出K326、云烟87(85)的验证样本烤烟产值模型的估测值.通过以下检验方法确定最佳产值估测模型:(1)估测产值与实际产值的线性回归分析,根据相关系数和斜率判断模型估测产值的准确性;(2)利用配对样本t检验法验证样本估测产值与实际产值的差异显著性;(3)测定模型估测产值与实际产值的模拟精度.
1.5 烤烟产值的空间推算与分区
利用烤烟产值最佳预测模型、主导影响因子空间和属性栅格数据库,借助ARC/GIS软件,分别估测福建烟区K326、云烟87(85)的产值,得到烟区K326、云烟87(85)的烤烟产值栅格空间数据图层;利用福建烟区烤烟生态适宜用地图层分别掩膜K326、云烟87(85)的烤烟产值栅格空间数据图层,建立福建烟区烤烟适种区的K326、云烟87(85)产值栅格空间数据库.利用福建烟区烤烟适种区K326、云烟87(85)产值栅格空间数据库,借助动态聚类分析模型[19],进行福建省烤烟适种区K326、云烟87(85)产值分区,具体分区标准见表1.
表1 福建烟区烤烟产值分区标准Table 1 The division index of flue-cured tobacco output value in Fujian tobacco production area
1.6 面积统计
利用福建烟区烤烟生态适宜用地图层数据库的图斑面积数据,以县(市、区)为单位,按产值分区分别统计烤烟K326和云烟87(85)高、中、低产值区面积.
2 结果与分析
2.1 烤烟产值估测模型的优选
福建省烟区K326与云烟87(85)实际产值与模型的模拟值见表2、3.从图1、2可以看出,神经网络模型模拟的K326、云烟87(85)产值与其实测值的相关系数分别为0.97和0.98,均达到极显著水平(P<0.01);双重筛选回归模型模拟的K326、云烟87(85)产值与其实测值的相关系数分别为0.12和0.42,显著性水平较差.样本t检验结果显示,神经网络模型估测的K326、云烟87(85)产值与其实测值的t值分别为0.43和0.54;双重筛选回归模型估测的K326、云烟87(85)的相应t值分别为1.19和0.63.根据2种烤烟品种样本数(K326为55,云烟87(85)为63)可知,品种K326样本数的t0.05为2.05,品种云烟87(85)样本数的t0.05为2.00.由此可见,2种模型的产值估测值与实际值之间均无显著差异,其中神经网络模型下的烤烟产值估测值与实际值的t值最小.从表4可以看出神经网络模型对K326与云烟87(85)估测产值均值的模拟精度分别达99.74%和99.72%,高于双重筛选回归模型对K326与云烟87(85)估测产值均值的模拟精度.
表2 K326产值的模型预测值和实际调查值Table 2 Model estimated output values and actual investigative output values of tabacco K326
图1 福建烟区K326实际值与不同模型估测值的线性回归Fig.1 Correlative analysis of model estimated output values and actual output values of K326 in Fujian tobacco production area
图2 福建烟区云烟87(85)实际值与不同模型估测值的线性回归Fig.2 Correlative analysis of model estimated output values and actual output values of Yunyan 87(85)in Fujian tobacco production area
表3 云烟87(85)产值的模型预测值和实际调查值Table 3 Model estimated output values and actual investigative output values of tobacco Yunyan 87(85)
另外从模型估测产值平均值和标准差来看,神经网络模型的K326与云烟87(85)估测产值的均值分别为(19609.03 ±118.42)元·hm-2和(21924.93 ±112.76)元·hm-2,分别比 K326 与云烟 87(85)实际调查产值的均值高0.26%和0.28%.而双重筛选回归模型的K326与云烟87(85)估测产值的均值分别为(18993.03 ±476.12)元·hm-2和(22140.74 ±436.99)元·hm-2,分别为 K326 与云烟 87(85)实际调查产值均值的97.11%和101.26%.
由此可见,神经网络模型下的烤烟产值估测值与实际值差距最小.综上所述,神经网络模型对K326与云烟87(85)的产值模拟较为准确,可作为福建K326与云烟87(85)烤烟品种产值的估测模型.
表4 烤烟K326、云烟87(85)产值模型预测均值与实际调查均值的对比结果1)Table 4 Comparison results of estimated average output values of model and actual average output values of K326,Yunyan 87(85)
2.2 烤烟产值分区
从表5可看出,烟区间烤烟产值差异十分明显,烤烟K326、云烟87(85)估测产值分别为12000.00-27180.00 元·hm-2和 13532.10-29536.95 元·hm-2,产值均值分别为17149.65 和20683.20 元·hm-2.
3 讨论
(1)验证结果表明,神经网络模型可以作为福建烟区K326与云烟87(85)烤烟品种产值估测的理想模型.利用神经网络模型估测了福建烟区各县市K326、云烟87(85)品种的产值,借助动态聚类分析模型,将福建省烤烟适种区的K326、云烟87(85)的产值划分为高产值区、中产值区和低产值区3个等级(图3),其中烤烟K326高产值区集中分布在浦城、连城、上杭、长汀和永定县市的低丘陵地带,云烟87(85)高产值区主要分布于建阳、长汀、上杭、新罗和尤溪等县(市区);烤烟K326低产值区主要分布于顺昌、尤溪、武平、大田、政和、邵武和建瓯等县(市),云烟87(85)低产值区主要分布于建宁、建阳、武夷山、政和、建瓯和武平等县(市).分区结果表明:福建烟区云烟87(85)高产值区面积明显大于K326,烟区耕地应优先选择种植云烟系列品种.
(2)农作物产值预测方法大都具有区域差异性,不同预测过程中考虑的影响因子不同.从这个角度出发,本研究根据烤烟农业环境的特殊性,同时比较2种相对适合的模型,优选最佳的预测模型,提高了预测精度,进而可以使产值预测与分区结果更加切合实际.在实际应用中可将人工神经网络与传统的分析方法结合起来,如计算机图像分析、回归分析、模糊数学、灰色系统、遗传算法、专家系统等,使预测结果更加精确.另外,影响烤烟产值的因素随着时间的变化也在不断地发生变化,因此烤烟产值的预测也会出现误差,只有根据诸多因素的变化对模型进行调整才能减少误差,进而使烤烟产值预测和分区结果更加合理、实用.今后仍需不断完善模型,并且与其它模型结合,从而提高模型预测的精度和适用性.
表5 福建烟区不同烤烟品种估测产值及分区面积Table 5 The model estimated output values and division areas of flue-cured tobacco in Fujian tobacco production area
[1]林绍森,唐永金.几种作物产量预测模型及其特点分析[J].西南科技大学学报,2005,20(3):55-60.
[2]殷英,张玉,余祥文,等.烤烟主要农艺性状与产量产值的关系研究[J].中国烟草科学,2012,33(6):18-22.
[3]周金仙,卢江平,白永富,等.不同生态区烟草品种产量、品质变化研究初报[J].云南农业大学学报,2003,18(1):97-102.
[4]HELMY A M.Agronomic performance and chemical response of tobacco to some organic nitrogen sources and conventional nitrogen fertilizers under sandy soil condition[J].Grasas Yaceites,2009,60(1):55-67.
[5]江豪,陈朝阳,王建明,等.种植密度、打顶时期对云烟85烟叶产量及质量的影响[J].福建农林大学学报:自然科学版,2002,31(4):437-441.
[6]胡卫东,张杨珠,李洪斌,等.施肥比例对烟草产量和品质的影响[J].湖南农业科学,2010,23:63-66.
[7]王鹏,汤晖,李江力,等.发酵饼肥对烤烟产量质量和效益的影响[J].黑龙江八一农垦大学学报,2004,16(1):32-35.
[8]曾志三,顾明.GM(1,1)模型对烟草产量的灰色预测[J].山地农业生物学报,2006,25(4):293-296.
[9]陈建.福建经济与社会统计年鉴(农村篇)[M].福州:福建人民出版社,2004:137-138.
[10]赵晶,王连喜,朱勇,等.云南与福建烤烟K326主要化学成分比较分析与分类评价[J].西南农业学报,2012,25(2):449-454.
[11]邢世和,张黎明,周碧青.福建农用地利用区划[M].北京:中国农业科学技术出版社,2012:3,54.
[12]郭庆春.基于BP神经网络模型的粮食产量预测[J].湖南农业科学,2011(17):136-138.
[13]蔡昆争,何振芳,李力.人工神经网络在农业中的应用.农业系统科学与综合研究[J].2001,17(1):54-56.
[14]MULLER B,REINHARDT J.Neural networks,an introduction[M].Berlin:Spinger-Verlag,1990:52-62.
[15]唐启义,冯明光.DPS数据处理系统——实验设计、统计分析及数据挖掘[M].北京:科学出版社,2005.
[16]徐进,李玉民.基于神经网络的粮食产量系统预测方法研究[J].现代化农业,2001(9):29-31.
[17]王启平.BP神经网络在我国粮食产量预测中的应用[J].2002(3):79-80.
[18]浦瑞良,宫鹏,R.Yang.应用神经网络和多元回归技术预测森林产量[J].应用生态学报,1999,10(2):129-134.
[19]项云飞,陈绘画,张建薇.马尾松毛虫危害程度分级预报的研究[J].安徽农业科学,2009,37(17):8037-8041.
[20]邢世和,黄吉,黄河,等.GIS支持下的区域耕地质量评价[J].福建农林大学学报:自然科学版,2002,31(3):378-382.