APP下载

基于SVM的蒸发量预测因子组合与模型研究

2019-10-21程才华

山西水利 2019年7期
关键词:长治蒸发量灰色

程才华

(山西水利职业技术学院,山西 太原 030027)

据统计我国现有2 474个国家级地面站,国土面积963万km2,气象站覆盖率低,且现有的气象站存在严重的蒸发数据缺测情况,现有的蒸发资料难以满足农田灌溉及水文预报的需求[1-3]。已有学者针对蒸发数据不足的问题展开了蒸发量预测研究,但研究的时间尺度较短,预测过程中缺乏对各气象因子与蒸发量关系的考虑,对于长期蒸发量预测成果的合理性与可行性有待评估[4-5]。文章以山西长治气象站为例,首先以该气象站2015-2016年的日气象数据为基础,利用灰色关联法得到蒸发量与其他气象因子之间的关联程度,对影响蒸发量的主要气象因子进行筛选,并输入主要气象因子,输出相应时段的蒸发量数据,为作为构建蒸发量SVM预测模型的基础,研究在不同气象因子组合下模型预测精度的变化,研究气象因子的选取及组合对模型预测效果的影响。

1 数据来源

长治站基础气象数据源于中国气象科学数据共享服务网,气象数据包括长治站2015—2017年的日系列蒸发量(EVP)、平均风速(WIN)、逐日日照时数(SSD)、逐日平均气温(TEM)、逐日平均相对湿度(RHU)、逐日20~20时累计降水量(PRE)。

2 理论依据

2.1 灰色关联度排序及输入因子选择

各气象因子与蒸发量关联程度信息量及数据量均较少,而灰色关联方法可利用灰色关联度来描述因素间关系的强弱,可有效解决信息量贫瘠数据量少的问题。因此本研究以灰色关联理论确定了各气象因子对蒸发量作用的大小[7],为蒸发量预测模型输入因子的合理确定提供依据。

2.2 预测模型

本文选取支持向量机(SVM)神经网络模型对蒸发量进行预测[8-9]。预测应用非线性回归算法。最优分类回归方程为:

式中,ω为权系数向量,φ(x)为映射关系,b为阈值。

对于给定的训练样本集合{(x1,y1),(x2,y2),…,(xn,yn)},其函数形式为:

对应的约束条件为:

式中,C用于衡模型精度和复杂度,为惩罚因子;ε为不敏感损失函数;ξi为松弛变量的上限为松弛变量的下限。

判定函数通过Lagrange因子法来描述优化问题:

式中,αi(i=1,2,…,l)为Lagrange因子;K(x,xi)为向量机核函数;

本次研究所用预报模型为高斯核函数:

本研究支持向量机模型利用Libsvm工具箱,在Matlab环境下建立。

2.3 评定标准

本研究选择常用的预测精度评价指标均方根误差RMSE及决定系数R2对预测效果进行评价。其中:

式中,N代表样本数量,θi和分别代表代实测值和预测值代表实测值的平均值。RMSE越小R2越大,预测精度越高。

3 蒸发量影响因子分析

利用灰色关联理论计算得到影响蒸发量的5个参数对蒸发量的关联度,如表1所示。一般认为关联度大于等于0.8时,序列间的关联显著[6]。本研究所用5个气象因子与蒸发量都表现出显著的关联性(>0.8),表明本研究所选取的5个气象因子都是影响蒸发量的重要因素,可作为预测模型的输入。

表1 关联系数计算结果表

4 模型的预测精度对比

分析可知,本研究所选择的5个气象因子都是影响蒸发量的重要因素,预测模型输入需要充分考虑这5种因子对蒸发量的影响。为研究模型在不同因子组合下的预测效果,分别构建不同数量因子组合下的预测模型,共计26组,对模型输出结果进行检验,从而寻求最佳的模型输入因子组合。预测模型由建模样本组构成,通过调节模型参数使得输出的预测值与实测值误差最小,输入建模组选择2015—2016年逐日系列气象因子的组合,对2015—2016年蒸发量进行预测与实测蒸发量进行对比,调节模型参数使SVM模型预测精度达到最高。将调节好的模型参数应用于2017年的蒸发量预测,以2017年相应的气象因子组合作为所建预测模型的测试样本,从而计算得到模型的拟合结果。

通过对26种因子组合样本进行训练,建立了26个蒸发量预测模型,各因子组合下的模拟效果如表2所示。由表2可知,各因子组合下的模型所得RMSE介于0.403~0.575之间,模型R2介于0.191~0.824之间,模拟效果差距较大,表明因子组合是影响蒸发量预测精度的关键因素,文章所建立的SVM蒸发量预测模型精度最高即R2最大取为0.824时对应的因子组合为第21组,即TEM+WIN+SSD+RHU,此时模型的RMSE值也最小为0.403;预测模型精度最低即R2最小为0.191时对应的因子组合为第10组,即RHU+PRE,此时模型的RMSE值也最大即0.575,最佳与最差模拟结果对比见图1。这表明,对长治地区的蒸发量预测取TEM+WIN+SSD+RHU组合其结果最为可靠,接近实际情况,取RHU+PRE组合其结果较差,不能为实际提供参考。

表2 各因子组合下的模拟效果

图1 预测结果对比图

5 结语

文章基于灰色关联与SVM建立了20个不同因子组合下的长治地区蒸发量预测模型,对模型精度进行对比分析,得到气象因子组合对模型模拟效果具有重大影响,在长治地区模型模拟精度最高时对应的因子组合为TEM+WIN+SSD+RHU,此时模型预测R2值0.824,RMSE值为0.403。在不同区域进行蒸发量预测时,会存在当地气象资料不满足最佳蒸发量预测因子组合的情况,此时借助本研究在不同区域选取所能得到的预测精度最高因子组合,对蒸发量进行预测。文章研究内容可为蒸发量预测提供新的思路,一方面有助于提高资料充足地区的蒸发量预测精度,另一方面可以为缺资料地区的蒸发量预测提供参考,未来需要对不同地区的季节性蒸发量预测模型进行研究,寻找区域性最佳预测因子组合,为蒸发量预测提供更多依据。

猜你喜欢

长治蒸发量灰色
贵州清镇蒸发量变化特征及其影响因素分析*
长治:考察调研 绿色防控
长治药茶产业带动农民增收
山西长治:“三级联动”保“三秋”生产
当当鼓
浅灰色的小猪
1958—2013年沽源县蒸发量变化特征分析
1981—2010年菏泽市定陶区蒸发量变化特征分析
灰色时代
她、它的灰色时髦观