晋城市粮食产量预测方法比较研究
2011-12-28和文超,师学义,景明,孙静静,刘伟玮
和 文 超,师 学 义,景 明,孙 静 静,刘 伟 玮
晋城市粮食产量预测方法比较研究
和 文 超,师 学 义*,景 明,孙 静 静,刘 伟 玮
(中国地质大学(北京),北京 100083)
提高粮食产量预测精度是科学编制土地利用总体规划的重要课题。该文首先运用灰色关联分析方法对影响粮食产量的因素做出关联因子排序,分析表明粮食单产对粮食总产量的影响最大,粮食作物播种面积次之。其次在灰色关联分析的基础上选取主要影响因子,通过比较线性回归模型、灰色GM(1,1)模型和灰色多元线性回归组合模型的预测结果,得到灰色多元线性回归组合模型预测结果最佳。
灰色关联分析;多元线性回归;粮食产量预测;GM(1,1)
科学、准确地预测粮食产量是政府制定人口和资源利用政策的重要依据,也是科学编制土地利用总体规划并确定耕地保有量的重要课题。许多学者利用不同的方法对粮食需求量进行了预测,其中回归分析模型和灰色GM(1,1)模型是常用的两种方法。回归分析模型对样本中的异常数据非常敏感,会直接影响预测精度;灰色预测模型对于波动性和随机性较大的曲线进行拟合时误差较小[1,2]。使用单一的预测方法会漏掉一些关键信息,从而降低粮食产量的预测精度,组合模型能有效集合更多的重要信息。李林等利用多元线性回归与GM(1,1)模型耦合预测城市用水量[3],丁倩等讨论了灰色多元线性回归方法在房地产中的应用[4]。为了克服单独使用回归分析模型和灰色GM(1,1)模型的缺点,并提高粮食产量的预测精度,本文尝试将灰色模型与多元线性回归模型耦合,建立灰色多元线性回归组合模型并应用于晋城市粮食产量的预测。
1 基于线性回归模型[5]的粮食产量预测
根据X、Y的现有数据,将X、Y作为已知数,依据回归方程Y=aX+b寻求合理的a、b,确定回归曲线,再将a、b作为已知数,确定X、Y的未来演变。1)确定回归直线。一元线性回归方程:Y=aX+b,通常用最小二乘法确定参数,a=¯Y-b¯x,b=Lxy/Lxx。2)相关性检验。近1,说明线性相关性越高。
本研究所用数据来源于《1988-2005年晋城市统计年鉴》。为了便于预测和比较,采用分段预测的方法,分别以1988-2002年和1993-2002年的粮食总产量预测2003-2005年的粮食总产量。预测结果如表1、表2所示。
表1 基于1988-2002年数据预测2003-2005年的粮食产量及其误差Table 1 Grain yield prediction value and residue error of 2003-2005 based on the data of 1988-2002 万hm2
表2 基于1993-2002年数据预测2003-2005年的粮食产量及其误差Table 2 Grain yield prediction value and residue error of 2003-2005 based on the data of 1993-2002 万hm2
利用SPSS软件建立晋城市粮食总产量时间序列模型。以显著性水平α=0.05检验证明Y(粮食总产量)与X(年份)间有线性关系,说明该模型可用来预测晋城市粮食总产量。
2 基于灰色GM(1,1)模型的粮食产量预测
GM(1,1)模型的实质是对原始序列作一次累加,使生成的序列呈一定规律,然后建立一阶线性微分方程模型,求得拟合曲线对系统进行预测[6,7]。灰色GM(1,1)模型通过累加生成灰色模型,滤去原始数据中的随机量或其他噪声,从上下波动的时间数列中寻找某种隐含规律。
根据晋城市粮食产量数据,按照时间顺序,每6年为一个单元,每单元的前5年用作建模计算。由SPSS及MATLAB软件计算得出晋城市粮食产量的灰色预测模型。表1、表2中,后验差比值C、小误差概率P均满足一级要求,即C≤0.35,P≥0.95,说明模型拟合精度较好。
3 基于灰色多元线性回归组合模型的粮食产量预测
3.1 灰色多元线性回归组合模型
该模型的主要步骤是:1)在灰色关联分析的基础上利用灰色GM(1,1)模型得到影响粮食产量的主要因素的预测值;2)利用原始样本数据建立多元线性回归模型;3)将灰色GM(1,1)模型的预测结果作为多元线性回归预测方程的输入值,在较全面考虑各影响因素的基础上,实现灰色预测模型与多元线性回归方程的有机结合,得到灰色多元线性回归组合模型。
3.2 晋城市粮食产量影响因素的灰色关联分析
根据研究区具体的自然条件和社会经济条件,选取对粮食生产有直接影响的5类因素[8]:自然因素、劳动力因素、农用水利设施因素、化肥施用因素和农机电因素。根据对晋城市粮食产量影响因素的定性分析及现有粮食生产资料情况,采用1988-2005年序列资料作为研究基础,从中选取10个影响粮食总产量的主要因子,用其年数据作为样本,根据灰色关联度的分析方法[9-12],得出影响晋城市粮食总产量的10个主要因素的动态关联度结果(表3)。按关联度的大小进行排序:粮食单产>粮食作物播种面积>化肥施用量>农业总投入>农业劳动力>有效灌溉面积>降雨量>耕地面积>农村用电量>农业机械总动力。由此可知,对晋城市粮食总产量影响最大的因素是粮食单产,其关联度高达0. 9241;其次是粮食作物播种面积和化肥施用量。
表3 粮食总产量影响因素灰色关联系数Table 3 Grey incidence coefficient of grain yield factors
3.3 灰色多元线性回归组合模型的预测结果
在晋城市粮食产量影响因素灰色关联分析的基础上,考虑到关联度的大小,本文引入粮食单产、粮食作物播种面积两个主要因素预测晋城市粮食总产量。首先根据1988-2002年和1993-2002年的粮食单产和粮食作物播种面积数据,利用灰色GM(1,1)模型预测2003-2005年的粮食单产和粮食作物播种面积。其次以粮食单产、粮食作物播种面积这两个主要因素作为自变量,粮食总产量作为因变量,用SPSS软件分别对晋城市1988-2002年和1993-2002年粮食总产量、粮食单产和粮食作物播种面积建立多元线性回归模型。表1中R2为0.898,调整后R2为0.943,模型拟合较好;表2中R2为0.852,调整后R2为0.912,模型拟合较好。用sig=0.05进行显著性检验,模型可以用来预测晋城市粮食总产量。再将2003-2005年粮食单产和粮食作物播种面积的预测结果分别代入多元回归模型中,得到2003-2005年粮食总产量的预测值。
4 预测模型的比较分析
(1)线性回归模型。由表1、表2可知,线性回归模型预测粮食总产量的误差在3种方法中相对最大。虽然模型的拟合度较高,但预测结果精度较低(表4)。结合R2和数据的长度分析可知,R2值越大,已知数据的线性关系越好,预测误差越低;历史数据越充分(表4),预测结果越准确。由于线性回归方法适用于线性关系较好且历史数据较充分的数据,而本文数据在1998年和2001年发生突变,使得整段数据的直线型关系降低,从而影响了模型预测精度。由此得出,在使用线性回归法时,原始数据具有良好的直线线性关系,才能保证预测结果具有较高的准确性。
表4 3种预测方法的比较Table 4 Comparative analysis of prediction methods
(2)灰色 GM(1,1)模型。由表1、表2、表4可知,灰色GM(1,1)模型预测值的精度较高,拟合一致性较好。这是由于GM(1,1)模型是根据随机误差原理建立的,并从数据的上下波动中寻找隐含的规律,本文数据波动性及随机性较大,模型的优势得以发挥,使得灰色GM(1,1)模型的预测结果比线性回归模型的预测结果更准确。由此可知,当已有数据波动性及随机性较大且数据量不多时,使用GM(1,1)模型的预测结果较为准确。
(3)灰色多元线性回归组合模型。由表1、表2可知,灰色多元线性回归组合模型的预测误差在3种方法中最小,预测精度也最高(表4)。这是因为,利用灰色多元线性回归组合模型有效地利用了各种信息,充分结合了数据波动性和直线性的特点,比单纯利用灰色GM(1,1)模型或线性回归模型预测结果的精度更高。
5 结论与讨论
实践中应结合数据本身的特点选择不同的预测模型。线性回归模型适用于直线关系较好的数据,灰色GM(1,1)模型适用于数据波动性和随机性较大的数据。灰色多元线性回归组合模型既充分体现了灰色系统能及时跟踪响应变量的动态变化的特点,又综合了多元线性回归模型充分考虑影响因素作用的优点,从而可以更好地指导晋城市粮食产量的预测,进而更好地促进土地利用总体规划的科学编制。这种粮食产量预测方法也可以推广到全国各地的粮食产量预测,具有广泛的应用前景。
当然,由于粮食生产是一个复杂的系统过程,粮食产量还受各种自然因素和政策因素等方面的影响,同时,粮食生产的影响因素随着时间的变化也在不断发生变化,这就决定了由过去的粮食产量预测未来的产量难免存在偏差。只有根据诸多因素的变化对粮食产量的预测模型不断进行调整,才能减小预测误差,以实现更准确的预测。
[1]巫锡柱,晏路明.粮食生产灰色关联动态分析和预测[J].农业系统科学与综合研究,2005,11(4):244-251.
[2]刘亚,崔春红.粮食产量灰色模型预测[J].安徽农业科学,2008,36(9):3485-3490.
[3]李林,刘坤.多元线性回归与GM(1,1)模型耦合预测城市用水量[J].水资源与水工程学报,2008,2(3):63-64.
[4]丁倩,干晓蓉.灰色多元线性回归分析及其在房地产中的应用[J].云南师范大学学报(自然科学版),2009,5(3):21-29.
[5]汤江龙,赵小敏.土地利用规划中人口预测模型的比较研究[J].中国土地科学,2005,19(2):14-20.
[6]韩中庚.数学建模方法及其应用[M].北京:高等教育出版社,2005.143-153.
[7]李军成,陈国华,石小芳.基于灰色多元线性回归的粮食产量预测[J].安徽农业科学,2010,38(16):8281-8282.
[8]王渝陵.影响粮食综合生产能力的相关要素[J].渝州大学学报(社会科学版),1999(4):22-25.
[9]徐建华.现代地理学中的数学方法(第二版)[M].北京:高等教育出版社,2004.47-68.
[10]何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,2001.102-129.
[11]周介铭,彭文甫.影响四川省粮食生产因素的灰色分析与粮食产量预测[J].四川师范大学学报,2005,28(3):350-351.
[12]王学萌,张继忠,王荣.灰色系统分析及实用计算程序[M].武汉:华中科技大学出版社,2001.
A Comparison on the Grain Yield Prediction Methods for Jincheng City
HE Wen-chao,SHI Xue-yi,JING Ming,SUN Jing-jing,LIU Wei-wei
(ChinaUniversityofGeosciences,Beijing100083,China)
Improving the forecast accuracy of grain yield is the important subject of compiling general land use planning.In this paper,grey correlativity analysis is used to analyze key factors of grain production.The result shows that the production of per land area has the greatest influence on grain,followed by cultivated area.Then based on the grey correlativity analysis,the author selects the main factors.The result shows that grey-multiple linear regression model has the highest prediction accuracy by comparing the linear regression model,grey GM(1,1)model and grey-multiple linear regression model.
grey incidence analysis;multiple linear regression;forecast of grain yield;GM(1,1)
F301
A
1672-0504(2011)05-0079-03
2011-05- 11;
2011-07-17
国家自然科学基金项目(70673055)
和文超(1986-),女,硕士研究生,研究方向为土地利用规划。*通讯作者E-mail:shixueyi60@163.com