马尾松毛虫发生面积预测方法分析研究
2020-04-29邱利军杨怀义侯占东
邱利军 张 波 杨怀义 侯占东
(1.河北建筑工程学院,河北 张家口 075000;2.中国建筑材料工业地质勘查中心山西总队,山西 太原 030031;3.江苏中煤地质工程研究院有限公司,江苏 常州 213018)
0 绪 论
森林病虫害预测在森林管理中非常重要,有利于在未发生前制定策略加以控制以降低损失且增加工作效率.影响我国南方马尾松林的最大害虫就是马尾松毛虫.因此,本文对马尾松毛虫发生面积进行预测研究,其具有实际意义.国内外学者在马尾松毛虫预测方面,已经取得很多研究成果,其中文献[1,2]采用人工神经网络方法建立模型进行预测;文献[3,4]采用马尔科夫链建模预测马尾松毛虫面积;文献[5]采用机器学习的方法建模进行马尾松毛虫发生面积预测;文献[6]采用灰色系统模型进行虫发面积预测;文献[7]采用ARIMA模型进行马尾松毛虫发面积预测.基于此,本文提出采用多元线性回归分析模型对马尾松毛虫发生面积进行预测.相对其他方法而言,其建模简单.具体过程是利用该模型对松毛虫发生面积与影响因子间进行建模分析并预测,并对建模数据序列分别采用累积序列、新陈代谢形式序列以及前期数据优化后的序列建模,并对建模预测结果进行了比较分析,认为采用数据优化后的序列建立多元线性回归模型进行预测能够达到较好效果.
1 多元线性回归模型与数据序列选取
多元线性回归模型主要用于研究因变量与多个因子之间非确定关系,其数学模型是:
yt=α0+α1xt1+α2xt2+…+αpxtp+εt
其中,t=1,2,…,n,εt~N(0,σ2).t为因子变量,p为因子个数.
多元线性回归模型矩阵表示形式为:
y=α+ε
其中,y为因变量向量,则是x一个n×(p+1)的自变量元素矩阵,α是待估计参数向量,ε是服从同一正态分布的n维随机向量.
2 计算实例
采用文献[1]数据,采用1983年到2001年马尾松毛虫发生面积及其相关影响因子数据,分别对1994年-2001年面积进行预测.已知数据采用8个气象因子,即:当年2月下旬平均气温;当年3月上旬平均气温;当年2月中旬相对湿度;上年10月中旬降水量;上年9月中旬日照时数;上年6月上旬最低气温;上年8月中旬最低气温,上年12月中旬最低气温.分别采用累积数据序列整体预测和新陈代谢序列建模预测.结果如下表1及图1所示:
表1 累计序列与新陈代谢序列预测面积值比较
图1 累计序列建模与固定n值新陈代谢序列建模比较图
由表1结合图1可知,累计预测方法相对于采用n(n=10,11,12,13)期数据新陈代谢形式建模,预测效果稳定,但不同年份的最佳预测值分别位于n取不同值的预测曲线上,即n=10时,2000年与2001年取得的预测效果较优,n=11时,1994年、1995年、1999年取得的预测效果较优,n=12时,1996年的预测效果较好,而n=13时,1997年与1998年的预测效果较好.因此,应用依据行列向量相关系数对建模样本量及因子数进行筛选,然后进行建模以达到较好预测效果,并与累计数据序列建模预测数据、新陈代谢预测择优数据进行比较.结果见下表1,曲线图如下图2所示:
表2 筛选优化后数据预测与其它预测比较
图2 数据筛选后建模预测与其它建模预测比较面图
由上表2及图2可知,累计数据序列建立多元线性回归虽然较固定n值的新陈代谢序列建立多元线性回归预测稳定,但是误差较大,不能够实际应用.而采用改变n值的新陈代谢序列建立多元线性回归模型进行预测,其预测效果有所提高,但是1994年、1998年以及1995年预测结果误差较大,相对误差均大于20%,存在于实际的较大差异,且建模数据序列元素数为变量,较难确定.而建模数据筛选优化后建立多元线性回归模型进行预测,预测效果最好,虽然1994年和1998年误差均超过10%,但相比较于新陈代谢改变n值的择优数据已经明显精确.达到了与实测值相符的要求.且从图2可以明显看出,经过数据筛选优化的多元线性回归曲线更接近面积实测曲线值.
3 结 语
依据马尾松毛虫历史资料数据采用多元线性回归建模方法对其发生面积进行了预测分析,并分别采用数据累计序列建模、固定序列数新陈代谢数据建模、新陈代谢数据预测择优以及采用优化数据后建模,比较分析预测结果认为在优化建模数据的前提下,采用多元线性回归模型预测马尾松毛虫发生面积,能够取得较好效果.对实际林业保护具有一定的价值和意义.