APP下载

基于历史数据的港区泥沙疏浚标高预测技术研究

2022-09-01姚晨明姚磊

中国水运 2022年8期
关键词:清淤标高时刻

姚晨明,姚磊

(长江重庆航道工程局,重庆 400010)

航道的船舶适航水深的维护需要对口门浮泥进行清淤,但是这些浮泥受潮波流影响堆积位置是不断变化的,需要从清淤和适航水深两个方面入手,历史的疏浚数据包含了疏浚数据的变化特征,预测口门段清淤时机及清淤部位对于保证航道的通航能力,以合理调配清淤船舶和时段,节约工程成本有着重要的工程意义。

港口的疏浚数据特征具有一定的规律性,根据施工日报表的数据项,及现场施工的经验判断,对于主航道和回淤严重的口门区域会进行周期性疏浚,疏浚工作涉及接移管线的操作,船舶在相隔工作日期内不会有较大的位置变化,开挖标高也在一定的范围内变动,本研究的目标即根据历史清淤记录进行未来的疏浚地点预测及提醒。

1 建模方法及数据准备

因疏浚工作的周期性及规律性,潮汐等水文环境、泥沙淤积也具有季节性和周期性,具有时序特征,因此采用时间序列模型进行数据预测,预测目标为经纬度和开挖标高。本研究选择擅长提取时序特征的长短期记忆网络LSTM(Long Short Term Memory)模型进行预测任务。本技术的研究依托于盐城港滨海港区中电投煤炭码头疏浚工程,以施工日报表提取的数据作为数据集,利用前一天或几天的零点坐标、开挖标高数据预测下一个(当前)时刻的对应数据。采用时间序列模型,经纬度和开挖标高作为输入项,

根据调研结果,本研究可获得的数据主要是施工日报表和相关CAD 文件,因此本研究分析主要依托施工日报表、施工进度图来获取原始数据。考虑到需要根据历史的数据来预测当下时刻的值,因此可以将这个任务视作监督学习问题并对输入变量进行归一化处理。考虑历史数据表示上一个时间段的经纬度位置和开挖标高,所以在数据的使用方式上本研究用t-5,t-4,t-3,t-2,t-1,t次的施工数据通过模型进行特征分析和提取,然后对输出的t+1 结果与其真实数据进行对比来分析误差。数据的分布形式如图1所示。

图1 数据集样本示例

2 数据清洗

由于初始数据中存在一些异常数据和缺失数据,因此需要进一步对数据进行清洗以确保数据的合理性。在选取全部施工日报字段后,获得2018年10月13日-2022年1月31日区间有效的数据共639 条,因部分数据存在多个零点坐标和开挖标高的情况,经过分析处理后形成1438 条数据。对于异常值处理,异常值集中在施工时间、零点坐标、浚前标高、开挖标高字段,当出现多个值的情况,标点括号半角全角混用的问题,全部分割后再做处理。由于数据库端浚前标高、开挖标高录入多值情况,所以数据拆分为多独立值处理。对于缺失值处理,删除缺失值较多的数据,并清理冗余数据,这里采用KNN 方法和中值插值方法对数据进行填充,对比后发现中值插值方法进行浚前标高和开挖标高的数据填充。剔除异常值以及填充缺失值之后,处理后的数据分布如图2所示,港池区域数据集中度符合预期,便可进行下一步的模型训练。

图2 数据清洗后的分布

3 模型的构建与验证

在网络结构方面,本文设计了一个三层的LSTM 网络,如图3所示,其结构基于python 的keras 框架,分别由LSTM 层,dropout 层,dense 层以及activation 层依次构成。数据维度从初始的时序的240 维度降维为最终的时刻的3 维输出,也就是利用前15 天经纬度坐标和开挖标高数据预测下一个(当前)时刻的对应数据。

图3 网络模型结构

模型搭建完后,对于网络的训练过程所涉及参数的调整,确定网络模型的激活函数为relu 函数。每一层网络节点的舍弃率默认值设定为0.3。对于训练的误差计算方式使用均方误差(mean squared error)。网络参数的迭代更新方式采用RMSprop(Root Mean Square propagation)算法。权衡实验环境的内存效率和内存容量后,本文设置模型训练的轮次数为1000,数据批次数为64。

接着进一步开始在数据集基础上对模型进行训练,由于训练时输入LSTM 网络的数据维度关系到LSTM 层的参数,本文以15 个时间节点所对应的特征数据作为输入预测后续1 个时间点。训练过程的中的损失函数值变化曲线如图4(a)所示,模型验证集的在1000 轮次内达到收敛,训练集的函数值稳定在0.0008 附近,这表明模型训练达到预期效果。

当模型训练采用经度、纬度、开挖标高3 个维度数据作为输入时,对应的模型测试准确率为96.13%,这表明本研究提出的方法能够实现在历史疏浚数据上进行较高精度的疏浚标高参数的预测。在项目实际应用过程中,为达到更长时间的预测效果,当采用预测6 个后续时刻坐标和标高方式来训练模型时,其预测值和真实值的误差值在0.0011 附近,如图4(b)所示,实现了更长时刻的预测应用效果。此外,本文将预测数值在GIS系统中可视化显示,其效果如图5所示,实现了较好的应用效果。

图4 模型训练过程指标曲线

图5 预测位置GIS 平台展示

4 结语

本研究通过对疏浚数据收集和清洗做成数据集,构建了LSTM 网络模型后,模型的训练误差降到了0.0008,这模型能够充分提取分析历史疏浚数据的时序特征,并在此基础上通过历史时刻的数据预测当前时刻的疏浚位置和标高,实现了96%的预测准确率,这对于港区疏浚施工参数预测有着较好的应用价值。

猜你喜欢

清淤标高时刻
捷龙轮清淤工艺研究
冬“傲”时刻
捕猎时刻
GNSS技术在高层建筑施工测量中的应用
连续刚构桥梁施工控制
方格网法在南昌象湖清淤方量计算中的应用
论打桩引起的基坑开挖问题及桩基标高影响分析
一天的时刻
高层建筑的标高控制技术
国内外清淤机现状分析及其对策