APP下载

西江梧州站基于支持向量机的水位预测模型研究

2022-12-07朱颖洁

广东水利水电 2022年11期
关键词:实测值西江梧州

朱颖洁

(梧州水文中心,广西 梧州 543002)

1 概述

西江是中国七大江河之一珠江的第一大水系,干流自西向东流经滇、黔、桂、粤4省(自治区),依次称为红水河、黔江、浔江,在梧州与西北来的桂江汇合后称西江。西江水量占珠江的50%以上,西江上连滇黔,横贯八桂,下接珠江水网直达港澳,与国际海运网对接,是构筑泛珠三角区域经济体系与建设中国—东盟自由贸易区的重要出海动脉,是名副其实的黄金水道。2014年8月1日,国家发改委正式印发《珠江-西江经济带发展规划》,珠江-西江经济带发展正式上升为国家战略。为了提升西江航运能力,提高航道通行效率,保障船舶运行安全,航道水位预测也变得日益迫切。水位预测是一个较复杂的非线性系统,其动态受多种因素的影响,包括气象、水文、地质等。对西江水位的准确短期预测及航道管理及电子航道图系统功能完善等方面具有重要的理论和实践意义。

河道水位预测研究是新历史时期下水文拓展服务的重要研究课题之一。赵思远等[1]选用基于混合线性回归模型的黑箱模型方法对黑龙江干流中上游段包括漠河、鸥浦、三道卡、长发屯、乌云、勤得利6个站点进行水位过程模拟;温泉等[2]采用多元回归模型,开展了长江中游水位短期预测预报研究;李小韵[3]利用多元门限回归模型,建立了松花江干流肇源、三家子、涝洲、木兰、富锦5个水位站的水位预报模型;余青容[4]研究“互联网+”背景下长江航道水位预测;卞宁[5]利用改进型灰色系统,预测长江航道水位;杨玮[6]提出了优化GM(1,1)模型与ARIMA 模型的混合预测算法,算法可有效应用于水位变化剧烈的站点(如长江上游朱沱站);余珍[7]建立了基于时间序列分析ARIMA模型的短时水位预测模型,预测长江中游河段航道水位变化;包红军等[8]基于人工神经网络,建立淮河中游河道水位预报多断面实时校正模型;李永凯等[9]采用水文模型与水力学模型相结合的方法进行沮漳河河溶水文站洪峰水位预报;周勇强等[10]提出一种基于SFLA-CNN和LSTM的组合预测模型,应用于江苏省太湖区域的水位预测,有效地提高了预测准确率;姬战生等[11]基于二维卷积神经网络,构建了东苕溪瓶窑水文站水位预报方法;赵辉等[12]分别采用单—函数法、曲线插值法和多元线性拟合法计算三斗坪水位,并分析了其影响因素;刘涛等[13]采用分段套索最小角回归交叉验证算法预测长寿站水位;郁爽等[14]依据NARX神经网络模型对永定河北京段水位进行模拟预测。但是还没有对西江黄金水道水位预测进行系统研究的成果。本文根据水位历史观测数据,采用支持向量机数学建模的方法,建立了西江水位短期预测模型,提高了水位预测精度,全面提升西江航道管理服务的水平和能力,可为西江黄金水道的建设提供技术支撑,为西江流域国民经济的发展提供决策依据。

2 资料与研究方法

本文选取西江中游河段为研究区域,利用梧州站2018—2019年逐日平均水位观测历史数据。以2018年数据为训练样本,2019年数据作为验证样本,建立支持向量机日平均水位短期预测模型。

2.1 支持向量机

支持向量机(SVM,Support Vector Machine)建立在线性可分和结构风险最小原理基础上,线性不可分时可把低维线性不可分转为高维线性可分;同时能依据有限的样本信息,在模型的复杂性和模型的学习能力之间寻求最优方案,并确保最终模型具有良好的泛化能力[15]。SVM是一种良好的预测算法,本文采用支持向量机对西江梧州站水位进行预测研究。

对于线性情况,支持向量机函数拟合首先考虑利用线性回归函数f(x)=ω·x+b拟合(xi,yi),i=1,2,…,n,xi∈Rn为输入量,yi∈R为输出量,即需要确定ω和b。

线性拟合函数为:

(1)

非线性SVR的基本思想是通过事先确定的非线性映射将输入向量映射到一个高维特征空间(Hilbert空间)中,在此高维空间中再进行线性回归,从而取得在原空间非线性回归的效果。

非线性拟合函数的表示式为:

f(x)=ω·Φ(x)+b

(2)

2.2 纳什效率系数

研究利用纳什效率系数(Nash-Sutcliffe efficiency coefficient,简称NSE)验证SVM水文模型模拟结果的可靠性。根据《水文情报预报规范》(GB/T 22482—2008),NSE大于0.9时为甲等方案,介于0.7~0.9之间为乙等方案,介于0.5~0.7之间为丙等方案。

(3)

其中:

Qmi——某一时间段日平均水位的实测值;

Qsi——某一时间段日平均水位的模拟值;

3 SVM 模型构建及参数调试

根据西江水位变化的主要规律,综合考虑资料获取的可行性,将西江梧州站前4 d日平均水位作为系统输入,以西江梧州站日平均水位作为系统输出。因此,西江梧州站的水位模拟问题转化为由4个输入和1个输出的支持向量机的数值模拟问题。研究基于R软件的e1071软件包,日尺度上对西江梧州站水位进行模拟。选取2018—2019年西江梧州站日平均水位数据,建立支持向量机模型,预测梧州站日水位数据。

通过优选分析,Sigmoid核函数比较适合西江梧州站日水位模拟,以总体方差最小为原则,对SVM gamma、cost和epsilon参数进行调试,结果如下:

Gamma=0.01;cost=10000;epsilon=0.1。

4 SVM 模型效果分析

4.1 日水位SVM模型模拟结果评价

在西江梧州站日水位模拟训练阶段,利用2018年的资料进行模型参数调试并建立SVM模型,利用2019年资料进行模型预测检验,得到西江梧州站日水位数值模拟结果和绝对误差分布示意(见图1~图4)。SVM模型模拟结果表明:在模型训练阶段和预测阶段,汛期西江中游逐日平均水位波动频繁、剧烈,导致汛期个别月份误差较大,其他月份误差较小;西江梧州站日水位序列数值模拟纳什效率系数NSE均为0.999,均超过0.9的甲等方案标准,满足日水位预报要求,具有较高的精度和可靠性,本文所建立的西江中游逐日平均水位SVM模型具有较好的短时预测能力。

图1 日水位SVM模型训练结果示意

图2 日水位SVM模型绝对误差分布示意

图3 日水位SVM模型预测结果示意

图4 日水位SVM模型预测结果绝对误差分布示意

4.2 SVM模型实测值与模拟值的比较

为了解日平均水位SVM模型实测值与模拟值之间的差别,研究利用模拟值与实测值建立了过原点的直线拟合方程(直线方程的截距为零,其形式为Y模拟值=KX实测值,方程均通过了置信度为99%的显著性检验)。拟合直线方程的斜率K可近似代表模拟值与实测值的比值,若比值大于1说明模拟值整体大于实测值,比值小于1说明模拟值整体小于实测值,比值越接近1说明二者越接近。红色的线为95%置信区间的上下界;在SVM模型训练阶段和预测阶段(见图5),日平均水位模拟值与实测值的比值分别为0.988 6和1.002 9,二者都非常接近于1。本文所建立的西江日平均水位SVM模型具有较好的短时预测能力。

图5 西江梧州站日平均水位SVM模型实测值与模拟值的比较示意

4.3 SVM模型与自回归模型模拟效果分析

将西江梧州站前4 d日平均水位作为自变量,以西江梧州站日平均水位作为因变量,分别利用SVM模型和自回归模型进行了模拟预测,从模拟效果(见表1)可知,训练阶段和预测阶段SVR模型的纳什效率系数NSE均高于自回归模型, SVM模型预测效果比自回归模型好。

表1 SVM模型与自回归模型纳什效率系数对比

5 结语

水位预测在提供航道维护管理效能、提升航道公共服务品质等方面具有重要作用。针对水位时空变化影响因素多、规律复杂等,本文建立了西江中游梧州站基于支持向量机水位预测模型,以总体方差最小为原则优选分析各模型变量,基于逐日平均历史数据的变化趋势,对2019年的日平均水位变化进行了预测,并与自回归模型进行模拟效果对比分析,结果表明:西江梧州站日平均水位SVM模型预测效果比自回归模型好;日平均水位SVM模型具有良好的短时预测能力,精度较高,可为船舶航线优化、船舶合理配置、航道维护管理等提供技术支撑。

猜你喜欢

实测值西江梧州
密闭取心技术在西江24-3油田的应用
中共梧州城工委
考虑相关长度误差的含水层渗透系数反演研究
西江千户苗寨
变电站集合式电容器故障分析和处理
西江特大桥上部结构施工关键技术
基于Ansys屋盖不同单元类型下的模态分析
梧州工人运动的急先锋
浅析比重瓶法实测土粒比重
八十多载后寻访梧州