APP下载

三峡升船机船舶通航时间分析与预测

2021-07-07

关键词:升船机船型船长

耿 飞 金 雁

(武汉理工大学交通学院 武汉 430063)

0 引 言

升船机是三峡枢纽通航设施的组成部分之一.长航局在2016年开展了升船机通行船舶航行控制标准及升船机适应船型尺度等相关研究,制定了《三峡升船机试通航工作方案》,进行了两次试通航试验.由此制定了升船机通行船舶技术要求,确定了通过三峡升船机船舶的主尺度要求为:船舶总长≤105 m,船舶总宽≤16.8 m,船舶最大吃水≤2.65 m,船舶自水线以上高度≤18 m,船舶排水量≤3 000 t,船舶进出升船机航速≤0.5 m/s.然而该技术要求主要是基于试验结果得出的结论,并没有进行更多理论方面的探讨.为了进一步提升三峡升船机的社会经济综合效益,挖掘目前及未来三峡枢纽的通航能力,本文做了两项理论方面的研究:①通过相关性分析图挖掘船型要素与通航时间的关联关系,找出各个船型要素对通航时间影响程度,并对其原因进行分析研究,得出适应升船机的船型;②根据船舶的船长、船宽及吃水等船舶主尺度数据来预测其通过三峡升船机的通航时间,根据预测结果可以实时判断是否让该船舶通行.

近年来,一些学者将梯度提升机和决策树结合起来,得到梯度提升决策树(GBDT)算法,并应用到预测领域[1-3].基于此,文中提出基于梯度提升决策树的三峡升船机船舶通航时间预测模型,与传统的神经网络和线性回归等预测模型相比较,该模型具有较好的预测性能[4-5].

1 三峡升船机运行情况

1.1 三峡升船机工作流程及历时现状

三峡升船机的运行流程分为船舶进出厢和设备运行两大流程,因此,升船机总历时也主要由船舶进出厢历时和设备运行历时两部分所组成.

1) 船舶进出厢流程 船舶进厢:船舶接到进厢指令(从靠船墩解缆(驶离靠船墩(进入闸首、船厢(在船厢停泊妥当、系缆完毕(报告集控室泊妥.正常情况下,该过程平均时间为22.8 min.船舶出厢:船舶接到出厢指令(从船厢解缆(驶出船厢及另一侧闸首(驶出闸首(船尾驶过最远端靠船墩.该过程平均时间为11.25 min.

2) 设备运行流程 收到船舶在船厢内泊妥报告(核验并确认具备解除对接条件(解除船厢对接(核验并确认具备上下行条件(船厢上行或下行(船厢对接(发出厢指令.该过程约30 min.

试通航指挥部组织进行的三峡升船机完善工程复航后满负荷运行及实船补充测试显示,厢次平均历时为66.11 min,设计每日工作时间为22 h,每天大约可以运行19.97厢次.结果可见,升船机日运行次数较少,主要是由于集装箱船、商品车滚装船等大型船舶过机时间较长.

1.2 通航船舶数据

根据三峡通航管理局提供的2016年9月—2017年12月所有通行升船机船舶基础数据,从中选取510个样本数据进行模型构建.通航船舶数据片段见表1.

表1 通航船舶数据片段

1.3 三峡升船机运行历时现状初步分析

统计表1中不同类型船舶过升船机总历时中船舶平均进出厢用时和设备平均运行用时,见表2.

表2 不同类型船舶通行升船机用时 单位:min

结合表1,2对通航数据初步分析可知:

1) 过机的设备运行平均用时与船型无关,是一个固定值,约为30 min,故而可以主要考虑船舶进出厢用时.

2) 从统计平均值可以看出,滚装船、集装箱船和货船等大型船舶的船舶进出厢用时明显高于客船及其他小型船舶,猜测大的船舶尺度对船舶进出厢用时存在较大影响.

由初步分析可知:用传统数理统计方法绘制图表对各种船型逐一分析较为困难,且难以得出船舶尺度与通航时间之间的关联.故而本文采用数据挖掘和数理统计方法,使用GBDT和相关性分析图对数据进行整体分析[6-7].从一个全新的角度对通航数据进行整体统计和分析,力求找出船舶影响升船机运行时间的主要因素及其影响程度,根据船舶主尺度对船舶通航时间进行预测,为管理部门制定提高升船机通行效率的管理办法提供决策依据.

2 通航时间与船型要素相关性分析

该案例中相关性分析使用Rapidminer数据挖掘平台来完成,利用其中相关性分析矩阵并应用到船舶尺度样本数据集.根据现有船舶主尺度如船长、船宽、吃水等计算出其他可能有关联的船型要素如船长船宽比、型深吃水比等,利用相关性分析得出各船型要素间的关联程度并用具体数值体现出来[8].分析结果是一张相关性分析图,可得到所有属性间的相互关联度,将其中最重要的船型要素与通航总历时的关联关系制成关联度分析表见表3.

表3 船型要素与通航时间关联度分析表

船型要素是影响通航时间的重要因素,由表3可知,与船舶通航总历时关联度较大的船型要素有船长、船宽、排水量、厢体平面充满率、厢体体积充满率等.已知三峡升船机船厢有效平面尺度为120 m(长)×18 m(宽),其中,船厢上下游防撞钢丝绳之间的长度为120 m,防撞钢丝绳的保护装置为破断保护型,正常情况下不允许船舶碰撞.以下主要从碰撞角度对关联系数较大的船型要素原因进行分析.

1) 排水量、厢体平面、体积充满率对船舶进出厢用时影响 此三者均是衡量船舶大小的指标归为一类,由表3中关联系数可知其对通航时间影响最大.根据从2016年9月至今升船机试运行和两个阶段的实船试验的实际运行情况发现:船舶越大,则惯性越大;低速情况下舵效、速度控制等操纵性能相对较差.

2) 船长对船舶进出厢用时影响 为避免船舶碰撞,当船舶在船厢内停泊时,船艏艉与防撞钢丝绳均应保持5 m以上的安全距离.超过105 m船长船舶进出升船机时,由于船舶进厢时速度低于0.5 m/s,靠泊时速度更低,船舶低速状态下很难精准定位,当船舶长度超过105 m接近110 m时,很难确保船舶靠泊后船艏或船艉距离防撞钢丝绳都保持5 m安全距离.

3) 船宽对船舶进出厢用时影响 观察升船机的实船运行状态发现,17.0 m以上船宽较大的船舶进出升船机时,由于上、下闸首工作大门止水座相对突出,易被进出厢船舶撞损.如果闸首工作门止水座被撞变形将会导致漏水,升船机将无法正常运行.船舶宽度越大,撞击止水座的机率越大,历时越长.

4) 其他船型要素对船舶进出厢用时影响 船舶主尺度比方面,与船舶通航总历时关联度由大到小排序为:型深吃水比(-0.357)>船长型深比(0.354)>船长船宽比(0.153)>船长吃水比(0.112)>船宽吃水比(0.039).通航时间影响最大的因素是型深吃水比,且关系系数为负,说明该值越大,通航时间越短.其次是船长型深比,该值越大,通航时间越长.对通航时间影响最小的因素是船型,从相关性分析图来看,船型与其他船舶主尺度特征关联度均不大,说明在不考虑船舶主尺度情况下,船型这个单一因素对通航时间影响较小,并且作为数据集中唯一的标称属性,单独进行分类研究效果较好.

为提高通航效率,在制定适应升船机的船型标准时,应减小船长型深比,增加型深吃水比.应对大吨位船舶,如货船、集装箱船、商品车滚装船等大型船舶加以限制,优先通过公务船、一般干货船、小型客船、普通客船等小型船舶,将有效提高三峡升船机运行效率.

3 基于GBDT的通航时间预测模型

3.1 GBDT算法原理

GBDT是一种基于梯度提升框架的决策树类算法,其基本原理就是在损失函数负梯度的方向上生成多棵弱回归树,然后再将这些树组合在一起生成一棵强回归树,即最终的时间预测模型[9-11].

对于训练样本集T={(X1,y1),(X2,y2),…,(XN,yN)},Xi∈χ⊆Rn,yi∈γ⊆R,训练样本的总数为N,对于每个变量矩阵Xi,都含有z个变量(x1i,x2i,…,xzi),迭代次数设定为M,损失函数为L(y,f(x)).基于此,GBDT的核心步骤如下:

1) 模型初始化 寻找常数值c使损失函数L最小化.

(1)

g(x)为模型预测值,y为时间真实值,采用平方损失函数,即

(2)

2) 进入迭代过程 迭代总次数为M.对于i=1,2,…,N,利用最速下降法,搜索方向为模型的负梯度方向,逐步接近目标值.求得损失函数L的负梯度为

(3)

3) 利用(Xi,rmi),i=1,2,…,N作为训练数据,生成一颗弱回归树,获得第m颗弱回归树的叶节点区域Rmj,j=1,2,…,J.其中:J为第m颗弱回归树的叶节点数.采用线性搜索的方法找到在每个区域中使损失函数L最小的最佳常数值c为

(4)

4) 得到强回归模型:

(5)

式中:I()为指示函数;v为学习速率,当Xi落入Rmj区域时,它的值就为1,区域外便为0.

5) 迭代过程结束后,根据式(6)得到最终的预测模型F(X)=fM(X).F(X)为最终的预测结果,其预测值为

F(X)=f0+f1(X)+f2(X)+…+fm(X)

(6)

式中:m为弱回归树数量;X为属性向量;f0为模型初始值,每棵树的预测值为fi(X),i=1,2,…,m.

3.2 模型预测结果

本试验数据处理流程主要包括特征属性选择,数据预处理,训练数据集,模型应用结果展示等几个部分.试验所用升船机通航数据样本为510个,无缺失数据.除去10个异常值后训练样本所占比例为80%,即400个样本用来训练,剩余100个样本用来测试训练好的预测模型.

GBDT算法模型参数设置如下:损失函数采用平方损失函数,叶子节点深度为5,迭代次数100,学习速率为0.1,弱回归树的数量取20棵,采用平方误差损失函数.该模型输入为各船舶主尺度及船型,具体包括船长、船宽、型深、吃水、排水量以及船型,输出为船舶通航时间.

为探究GBDT模型在通航时间回归预测时较其他模型的优劣,采用人工神经网络中的BP(back propagation)算法及线性回归(linear regression)算法来做对比试验,将BP-NN与LR模型与其进行对比分析,3种模型预测结果见表4,预测误差比较见表5,预测曲线对比见图1.此处通航时间为船舶进出厢时间之和,不包括设备时间,以提升精度,方便比较.

表4 三种模型预测结果片段 单位:min

表5 三种模型误差比较

图1 三种模型预测结果对比图

由图1可知,GBDT模型的预测曲线与实际时间曲线吻合度极高.很大程度上是因为GBDT算法中,参与预测的属性包括了船型这一特征.船型是一个标称属性,在用BP-NN与LR算法进行回归预测时,数据特征一般都是数值属性,而非标称属性,因而除去了船型这一特征.而GBDT算法却可以克服这一缺陷,灵活处理各种类型的数据,包括连续值和离散值.该模型通过将GBM和决策树相结合,在损失函数负梯度的方向上生成若干棵弱回归树,不断更新预测结果,从而进一步提高预测精度.其外,它还能有效地减小各特征之间关系互嵌、信息冗余对预测结果的负面影响,具有正确性和有效性.并且对异常值的鲁棒性很强,从而使预测精度显著提高.

数理统计中均方根误差,绝对误差,相对误差,平方误差均是衡量误差的指标,用来评价数据的变化程度,其值越小,说明预测模型精确度越高.而平方相关值,表示的是通过回归关系,因变量的变化可以被自变量解释的程度并用比例表示出来,比例越接近1则模型效果越佳.例如表5中,R2为0.849,意味着因变量84.9%的变化能够使用该回归模型解释,换言之,在自变量不变的情况下,因变量的变化程度能够降低84.9%.由表5可知,相比于BP-NN和LR两种时间预测模型,GBDT模型各项统计指标误差值更小且平方相关度更高,对通航时间的预测精度显著提高.因此,相比于传统的BP-NN和LR预测模型,基于GBDT的通航时间预测模型具有更好的预测性能.

4 结 论

1) 对船舶通航时间与船型要素的关联关系进行的挖掘分析结果表明,船长过长、船宽过宽,船舶进出升船机存在明显的碰撞升船机设备现象,导致通航时间增加.在制定适应升船机的船型标准时,应减小船长型深比,增加型深吃水比.限制排水量、厢体平面、体积充满率较大的船舶如集装箱船、商品车滚装船通行,多使公务船、普通客船等较小船型通行,可有效提高三峡升船机运行效率.

2) 基于GBDT的三峡升船机通航时间预测模型的算例结果分析表明,相比于传统BP-NN和LR预测模型,该模型具备更优良的预测性能.不仅可以灵活处理各种类型的数据,包括数值属性和标称属性,还能有效地减小各特征之间关系互嵌、信息冗余对预测结果的负面影响,体现了该模型的正确性和有效性.对升船机船舶通航时间的预测使得通航管理部门能根据船舶尺度实时判断是否使其通过,对通航历时较久的船舶加以限制,提高了升船机运行效率.

猜你喜欢

升船机船型船长
出发吧,船长
升船机简史
世界最大升船机铭刻
图解三峡升船机的运行原理
当船长
中国古代著名的海船船型
——福船
中国古代著名的海船船型—广船
Anti-ageing effects of a new Dimethylaminoethanol-based formulation on DGalactose induced skin ageing model of rat
丢失
内倾船型的非线性横摇仿真分析