APP下载

“双碳”背景下的船舶主机能效数据分析

2024-01-16赵泽楷郑齐清

中国修船 2023年6期
关键词:油耗双碳能效

赵泽楷,郑齐清

(泉州师范学院交通与航海学院,福建 泉州 362000)

为实现2030 年碳达峰及2060 年碳中和,我国大力发展新能源、不断提升不可再生资源利用率与限制排放,推动绿色航运与智能航运发展。国际上,MEPC 76 通过了MARPOL 公约以及附则VI的修正案,提出可以降低企业国际发展航运碳强度的强制性信息技术和营运管理措施,确定了2026 年船舶碳强度比2019 年降低11%的目标。航运业要实现“双碳”目标,需要采取强有力的措施,包括清洁能源替代、节能提效、能源回收再利用、碳捕集等,其中提高能效是现阶段船舶实现减排行之有效的途径之一。

现代船舶的自动化水平正变得越来越高,船上装配的数据采集系统收集着海量的船舶设备运行数据,其中包含与船舶能效相关的数据,通过对这些数据挖掘分析有利于船舶能效管理,且智能能效管理是实现智能船舶的重要支撑。能效数据分析可为能效管理体系的实施提供依据,其最终目的就是将现有航行能效数据通过采集、清洗、分析得出运行状况,然后,利用数据分析结果,可以节约和改善现有的能源消耗。船舶数据分析和优化技术是实现船舶智能能效管理的重要方法。由于船舶在海上的航行时间较长,航行环境的变化会致使实船能效的部分数据偏离正常值,从而影响能效评估和管理;因此在“双碳”背景下,有必要对实船能效数据的处理及挖掘技术进行研究。

1 数据预处理

船舶能效数据包含外部船舶航行数据,包括速度、航向、姿势、风速、水深、流速;内部主机工作数据,包括主机转速、主机功率,油耗及油耗率等。由于船上各种设备所处运行环境的复杂性及监测的不准确性,所监测的数据出现不完整或异常是不可避免的,例如在某一时刻收集器异常导致传输信号丢失或失真,则船舶姿态测量值超出合理范围;因此,需要对收集到的数据进行筛选,对缺失值和异常值进行处理。

由于航行环境的复杂性,在实际航行过程中所采集到的部分数据丢失或偏离正常值对船舶能效分析产生了很大的影响[1],而处理能效数据是智能能效管理评估和优化的关键。本文样本数据较少,所以考虑采用点的线性发展趋势插值的方式对缺失值和异常值进行分析处理;即对所有能效数据设置时间序列[2],对于有缺失和异常的数据均将其填补替换,以此对含有缺失和异常的初始数据进行预处理,其中对船舶航行参数的处理如下。

1.1 缺失值处理

对已有数据进行序列图创建,之后利用点的线性趋势插值法对数据进行缺失值替换,缺失的数据被填充,缺失值处理前数据如图1所示,缺失值处理后数据如图2所示。在此基础上可以进行下一步异常值处理。图1、图2中均为2019年的数据。

图1 缺失值处理前数据

图2 缺失值处理后数据

1.2 异常值处理

由图1 可知数据存在较多的突变值,因此,有必要对上文缺失值被替换的数据进行标准化处理;将缺失值补充好的数据进行描述性分析并通过原始数据的均值和标准差对数据进行标准化得到Z分数,归一化后的数值(正值或负值)形成标准正态分布曲线[3],做出初始Z分数折线图如图3所示,直观地反映出各变量的离散化程度。利用其标准的正态分布曲线将Z分数出现的极端值(Z分数的绝对值大于等于2)筛选出来并将对应的数据剔除,之后对异常值剔除后的数据再运用点的线性趋势插值进行数据填补,再对其进行标准化分析得到Z分数,最终Z分数折线图如图4 所示。由图4 可直观观察到数据分布情况,此时处理好的数据的Z分数只有一个绝对值大于2,但是由于基数的问题,不能再对其采用点的线性插值进行值的替换,否则会使数据一直趋向于标准值导致数据失真,故对于此数据进行保留,进行下一步的分析。

图3 初始Z分数折线图

图4 最终Z分数折线图

船舶航行指标数据经过清洗后,其中各项数据的均值处于90%的置信区间,其清洗结果符合数据分析要求,可以进行下一步数据分析。

2 数据分析

对复杂的多因素统计分析,SPSS 软件提供了简单的统计描述,例如数据的主成分分析、因子分析、方差分析、统计描述和聚类分析等;而在使用SPSS 软件分析数据时,不需要记忆各种算法公式,只要了解统计与分析的原理,即可得到需要统计分析的结果,操作简单方便快捷。本文采用SPSS 软件对现有数据进行主成分分析、系统分析和K均值(K-means)聚类分析。

2.1 主成分分析

主成分分析是一种利用降维的思想将多个指标在不丢失信息的前提下转化为几个不相关的综合指标的多元统计分析方法[4]。由于样本变量的数量较多,在使用统计分析方法时,变量过多会增加数据分析的复杂性。因此,在解释信息较多的情况下,希望尽可能减少重叠程度高的变量,以便后续分析。

2.1.1 主成分分析基本原理

变量之间存在着一定的相关性,太多的变量会增加分析数据的难度和复杂性;当2个或几个变量之间存在一定的相关性时,在许多情况下,可以反映出这些变量的重叠度较高;而重叠度较高的变量所反映的信息也具有相似性,为此在尽可能保持原有性能指标的前提下,删去多余的重叠度较高的变量,重新建立的更少的新变量(即可反映原变量的综合指标,又是两两不相关的),使得原先需要分析的多个变量减少到只需分析具有综合性能的新变量上,将需要解决的问题更集中化且更简便。方法如下。

利用矩阵的思想将数据集划为含有p个样本的n个变量的n×p阶矩阵[5]:

设原变量指标为x1,x2,…,xn,降维处理后的新变量z1,z2,z3,…,zm(m≤n)。其中,z的意义为体现综合性能的指标,则:

式中,xij为原变量指标的第i个样本第j维的值(i=1,2,…,m;j=1,2,…,n);zm为降维处理后的新变量;lij表示最大载荷分布系数。

其中,zi与zj(i≠j;i=1,2 ,…,m;j=1,2,…,m)相互无关;使z1为x1,x2,…,xm所有线性组合的最大差分变量。同理可得zm是与z1,z2,…,zm-1都不相关的x1,x2,…,xn所有线性组合的最大差分变量;此时可保证新变量z1,z2,…,zm的相对独立性。由上述过程可知新变量指标z1,z2,…,zm可称为原变量指标x1,x2,…,xn的第1,第2,…,第m主成分。

综上,此原理可认作变量xj(j=1,2,…,n)上的最大荷载分布系数lij;体现在各主成分zi上用来反映各主成分的主要特征。

2.1.2 主成分数据分析

1)系数矩阵。航行参数相关系数矩阵表如表1所示,表1中系数越大代表该成分含有对应参数的信息越多,可以看出个别参数整体之间的相关性显著。由表1可知,油耗率与主机油耗、转速、轴功率、对水航速、对地航速、吃水的相关系数分别为-0.958、0.965、-0.961、-0.884、-0.802、-0.946,可见存在着较为显著的关系,与轴功率、转速存在着更显著的关系。可以看出这些变量之间有较强的直接相关性,可以证明这些变量重叠反映在信息上。

2)主成分分析。依据前文结果,主成分分析解释总变量见表2。表2 体现12 个变量的29 天的航行数据。主成分数目选定既要满足数据降维,又希望综合尽可能多的信息,计算累积方差贡献率并通过判断其不低于某一阈值(如85%)来确定主成分数目。在一些文献中,认为第一个成分是最优的线性函数[6],能最有效地反映样本之间的差异并提供偏差信息。本试验第一主成分方差累积贡献率(58.513%)不高,不适用该方法。

表2 主成分分析解释总变量

特征值碎石图如图5 所示,图5 中横坐标表示主成分数目,纵坐标是反映主成分的解释力度的指标,若特征值大于1,则表示该指标大于平均水平,反之则达不到平均水平;同时可结合图5中的陡度和累积方差贡献率以达到确定最优主成分数目的目标。

图5 特征值碎石图

观察图5 可知,综合考虑碎石图中特征值λ大于1 的情况,连线陡峭程度和85.549%的累积方差贡献率可得最适合提取的3个主成分,综合了船舶航行指标中的大部分信息。

通过主成分提取和方差分解分析3 个主成分(n=3)所得的成分得分系数如表3 所示,由表3 可知:第1 主成分体现有较高载荷的主机油耗、转速、轴功率、吃水、油耗率,对水航速和对地航速,这7 项指标可综合反映出该成分的信息;第2主成分体现有较高载荷的风速、海浪等级、水流速度,这3项指标可综合反映出该成分的信息;第3 主成分体现有较高载荷的航向角和水深,这2 项指标可综合反映出该成分的信息。

表3 主成分得分系数

综上,提取3 个主成分可以基本反映全部指标性能,故决定采用3 个新变量来代替原来的12 个变量。

上文所得的第1主成分PC1包含了原来数据集信息量的58.513%,第2 主成分PC2 包含了原来数据集信息量的16.685%。主成分分析PC1 和PC2 得分图如图6 所示。以0 为2 条基准线形成的坐标系观察图6的区间关系,能够直观显示各航行指标与PC1和PC2的关系;风速、海浪等级、对水航速分布在PC1 和PC2 的正向区间呈正相关关系,表明这3种变量可以结合主成分得分图直观显示航行动态和航行环境间关系;主机油耗、轴功率、转速、吃水、对地航速分布在PC1 和PC2 第四区间航行动态和航行环境间呈负相关关系;油耗率分布在PC1 和PC2 的第二区间航行动态和航行环境间呈负相关系;水深、水流速度,航向角分布在在PC1和PC2 的第三区间航行动态和航行环境间呈正相关关系。

通过图6 也可知,在第1 主成分中的对水航速、对地航速、吃水3个指标相对于油耗率也存在着相对较高的负相关关系,此时可以考虑是在船舶航行的过程中兴波阻力、船型、滑失比等因素的影响。同时第2主成分中的风速和海浪等级对第1 主成分中主要指标之一的油耗率也呈现负线性相关,对此也可以考虑到的是在船舶航行过程中如遇到恶劣天气可能会使油耗率相对增加(考虑在良好天气及风浪等级较低的情况下);成分得分如表4 所示,根据表4 在第3 主成分中的航向角也与第1主成分中的油耗率存在着较强的相关关系,还可以考虑船舶航行过程中航线规划的因素对油耗率的影响。

表4 主成分得分

综上所述,通过这种方法对船舶航行综合指标的相关关系进行初步的分析,对影响主机油耗率的具有相对较强相关性的指标都进行了考虑,从而为后续的航行性能评估分析打下了基础。

2.2 聚类分析

2.2.1 离差平方和(Ward)法系统聚类

因为数据样本较为松散需要进行聚类分析,寻找对于船舶航行能效数据成效较高(即集中度较高)的数据来作为优化船舶航行的基础数据样本,使用Ward 法系统聚类分析来确定样本数据的聚类数量。

聚类分析是对个体或指标进行分类,因此同一类别数据之间的相似性强于其他类别;在本文中,将这些案例按照差异程度逐渐分组在一起。首先聚合优先级差异最小的案例,最后聚合多个个案于各类别,以反映每个类别的综合性质,完成聚类分析。

本文对所采集的29 天船舶航行数据采取Ward法对个案(Q 型)进行系统聚类分析。

Ward 法的基本思想是将n个个案分别作为一类,此时残差平方和W=0,以后的每一次将其中的几个入类,每缩小一个类,残差平方和同时增加,每次选择W增加2种类型合并的最小值,以确保性能指标的接近性,直到类的误差平方和较大时停止将所有样本聚类成新的类别[6]。Ward法的类间距离是2种情况合并后增加的偏差平方和。

式中,D2pq为聚类分析的类间距离;WR、Wp、Wq分别为第R、p、q类个案的离差平方和。

聚类分析谱系图如图7 所示,由图7 可知,在类间距离为25时,图7中横坐标所表示的2019年4月至5月的29天航行数据可归为2类。

图7 聚类分析谱系图

2.2.2K-means聚类法

对于上文通过Ward 法聚类得到的聚类数目K(K=2), 首先随机设置初始聚类中心, 然后采用迭代方法(最大迭代次数10 次),通过不断移动聚类中心来尝试着改进划分[7],将船舶航行29天的数据进行K-means 进行聚类,得到初始聚类中心如表5所示、最终聚类中心如表6 所示,最终将经过聚类分析后的2 类实验数据进行下一步分析,即主机能效分析。

表5 初始聚类中心

表6 最终聚类中心

3 能耗评估

3.1 负荷-油耗分析

K-means 聚类选取主机油耗率、主机功率、主机转速,再进行处理得到2类聚类中心值和29天船舶航行数据,据此分别做出轴功率-油耗率如图8所示、转速-油耗率如图9所示、转速-轴功率如图10 所示的3 类散点图,再对散点图利用Epanechnikov 内核对99%的散点进行拟合得到负荷和油耗之间的相关关系。

图8 轴功率-油耗率

图9 转速-油耗率

图10 转速-轴功率

由于聚类中心可反映主机在运行中的集中度较高的工况,故可以根据图8~图10 进行分析,并从中看出主机转速与轴功率、油耗率之间的关系。随着主机轴功率以及主机转速增加,燃油消耗率降低。从功率与燃油消耗率的关系来看,燃油消耗率随着主机功率的增加而降低。在船舶航行中为了快速起见,船舶可选择燃油消耗率最低的航速作为最佳航速(约85%最大持续输出功率)。为了节省燃料,船舶会选择每海里耗油量最低(30%最大持续输出功率)的航速(最低稳定航速40 r/min),但持续使用最低可持续转速也是不现实的,此时可依据相应的航行环境来选择合适的转速、功率和油耗率区间,以达到主机节能减排的目的。

3.2 集中工作区的主机性能评估

船舶航行过程中的燃油经济性是体现主机工作性能的重要指标之一,而忽略实船航行环境对主机负荷所产生波动性的影响可通过主机的燃油消耗率直接体现主机运行的经济性指标;为使船舶航行中实际转速保持在设定转速附近,主机会通过调速器调整供油量进而改变主机输出功率。因此,可以通过燃油消耗率与负荷之间的关系来评估主机的经济性能。

本文采用Ward 法系统聚类将工况点划分为2类,K-means 聚类被用来获得聚类中心,和Epanechnikov 内核基于拟合用于符合99%分散点,所形成主机负载和燃料消耗率的散点图(图8);从图8中聚类后的数据散点的拟合曲线可以看出,总油耗率随着负荷的增加而降低。

由于目标船下水时间是2003 年,本次实船测取数据时,船舶主机各部件结构参数已与试验台上的数据有偏差,如轴承间隙改变、活塞顶部积碳、圆度及圆柱度发生变化、排进气阀磨损、喷油孔积碳、轴瓦磨损、滑油质量等,加上外界环境条件的变化,这些因素都可能引起燃烧不良,导致主机热效率下降,油耗率升高。对于实船数据的测取与分析有利于营运船舶主机效能评估[8]。

4 结束语

文章采用数据分析法对目标船的主机能效数据进行评估,利用SPSS 软件便捷和快速的特点对所采集的数据进行清洗及预处理、描述性统计分析、主成分分析及K-means聚类分析,得到在船舶定速航行中主机的频繁工作区,进而对不同工况下的主机性能表现进行综合评估。

利用SPSS 软件对船舶在定速航行状态下的数据进行筛选清洗和预处理,得到处理后的航行时主机能效数据;通过主成分分析法重新建立两相关关系较弱的变量以突出新变量的独立性,建立的新的主成分占总体数据特征的85.549%,可高度反映船舶航行影响主机工作能效的主要因素;通过Ward 法系统聚类简单快捷地确定了聚类数K的取值;接着对数据散点进行K-means 聚类得到船舶在定速航行状态下的聚类点,最后通过对各聚类中的数据散点进行拟合,得到主机功率与油耗率关系的拟合曲线,并以此评价主机在不同工况点的性能。

猜你喜欢

油耗双碳能效
“双碳”目标背景下碳排放治理路径研究
不谈油耗 只讲运动 试驾第十一代思域e:HEV
“双碳”目标下企业如何应对碳市场带来的挑战与机遇
专访奚国华:中信力争成为国企助力“双碳”目标的旗帜
“双碳”下县城发展新思维
上海:稳中有进 能效趋优
降低内燃装卸机械油耗措施的探讨
双管齐下 YarisL致享综合油耗测试
关注能效
轮胎式装载机油耗测量方法探讨