基于机器学习的船舶柴油机异常点检测技术研究
2022-05-19吴德阳都劲松
0 前言
作为船舶航行的动力来源,柴油机的工作状态对船舶安全航行具有重要意义。随着计算机技术的发展船舶机舱逐渐朝着自动化、智能化方向发展
。机舱监测系统中热工压力参数和气缸排气温度报警检测多采用基于经验的固定阈值法,对操作人员经验和专家知识依赖较高
。
异常点检测通过识别正常值与异常值间的特征值区别识别异常行为,无需事先了解异常行为特性,减少对人员经验和专家知识的依赖。传统的异常点检测算法大多是基于统计学原理
,如胡碧辉等提出的基于“3σ ”准则和高斯过程回归相结合的方法进行边坡变形监测
,王新峰等提出的基于箱线形图的裂隙间距异常点检测
等。但是这种基于统计学原理的异常点检测方法检测出的异常点多为极值,具有一定的局限性,且在数据集缺乏报警点时,常常将正常点识别成异常点。
别名地丁、地丁草、紫花地丁、小鸡菜、扁豆秧,为罂粟科植物紫堇的干燥全草,夏季花果期采收,除去杂质,晒干。主要分布于辽宁、河北、内蒙古、山东、山西、陕西、甘肃、宁夏等。
本文提出基于孤立森林算法的无监督异常点检测算法,并用该算法对船舶柴油机气缸排气温度历史航行数据进行异常点检测;在面对缺乏报警数据的数据集时进一步提出基于LSTM算法的异常点检测算法,本文以船舶柴油机热工参数为例,通过计算船舶柴油机转速与柴油机热工参数的Pearson相关系数,判断两者间相关性,运用LSTM算法预测当前转速下柴油机热工参数值,当实际值偏离预测值时识别为异常点,以此实现对缺乏报警数据的船舶柴油机热工参数异常点检测。
1 柴油机气缸排气温度报警
在船舶航历史数据中出现报警的测点数据,本文基于孤立森林和SVM算法对测点历史数据进行异常点检测,将检测结果与实际报警数据对比分析。柴油机气缸排气温度是船舶柴油机状态监测的重要指标之一,排气温度的高低一定程度上反应了柴油机燃烧质量的好坏
,柴油机气缸排气温度是否正常影响柴油机使用安全和寿命。
未来“一带一路”传播研究需重点关注“合作传播思维与国际传播主体意识培养”的问题,围绕差异化的传播环境和受众特征开展区域国别研究,同时考察多层次传播主体的传播实践及其效果,持续跟进“新媒体成为国际传播主渠道”这一动向。
1.1 数据分析
由于燃油喷射定时、喷油量不同等原因,相同工况下柴油机各气缸排气温度存在差异,机舱监测系统中柴油机气缸排气温度报警检测采用上限阈值法,当排气温度超过阈值时报警。在船舶航行历史数据中发现柴油机6号气缸出现排气温度高报警,其余各缸排气温度正常,报警时段柴油机转速在800-920rpm,未达到超负荷运行。 读取最近三月的船舶航行中柴油机各气缸排气温度数据,分别求柴油机各气缸排气温度均值、反差、标准差,如表1所示。均值反应排气温度数据的平均温度,方差和标准差反应排气温度数据离散程度。从表1数据可知,发生报警的柴油机6号气缸的排气温度均值、方差、标准差与其余各缸特征值相比均无明显差异。
6号气缸在平均温度、离散程度上与其余气缸没有明显差异,为识别6号气缸排温数据中异常点,提出运用孤立森林算法对柴油机6号气缸排气温度数据进行异常点检测。
1.2 孤立森林
孤立森林算法是一种基于树的无监督异常点检测算法,核心思想是异常点数据与正常数据存在疏离
。如图1所示孤立森林对输入参数不断进行递归划分,直到每一个输入参数点处于一个独立的子空间,然后计算从根节点到每个孤立参数特征的路径长短,根据平均路径长度判断参数是否为异常值,路径较短为异常值,路径较长为正常值。如图1中字母e经过一步划分即处于独立空间,此处可以将其识别为异常值。直观上看,密度高的数据使每个数据处于独立空间比密度低数据需要划分更多次数,相对离散的数据点更容易识别为异常点。
4.3.1 广泛吸引金融机构参与。扩大合作金融机构范围。不仅与政策性银行、国资银行、市属担保公司等建立长期合作关系,更要鼓励股份制银行、外资银行、民营银行和担保公司加入高标准农田建设合作圈,尤其是在农村分支机构较多的邮政储蓄银行和重庆农村商业银行。
1.3 异常点检测与结果分析
柴油机气缸排气温度受柴油机转速影响,不同转速下柴油机排气温度不同。以柴油机6号气缸排气温度和对应时刻柴油机转速作为孤立森林的两个特征输入。孤立森林异常点检测结果如图2所示,其中红色数据点为检测的异常点,黑色数据点为正常点,观察图2发现异常值多为离散数据。为直观观察孤立森林算法是否检测出报警点,绘制柴油机6号气缸排气温度数据散点图如图3所示。图3中红色数据点为报警点,黑色数据点为正常点,对比报警信息数据发现孤立森林异常值检测可以检测出所有报警信息,报警信息检测率为100%。
为验证孤立森林对柴油机气缸排气温度异常点检测的有效性,本文将其与无监督SVM异常点监测结果对比。SVM常被用于分类问题,即用多维空间内的超平面将数据集划分成两类或多类数据,本文使用SVM中One Class SVM对数据集进行异常点检测。One Class SVM适用于训练集中只有一类样本或者有两类样本但其中一类样本数量较少的情况,中心思想就是寻找一个超平面将所以正样本圈住,以这个超平面作为决策标准,在超平面外的识别为异常点。
One Class SVM对相同数据集的异常值检测结果如图4所示,对比图3发现One Class SVM异常点检测对报警信息的检测存在明显遗漏,报警信息检测率约为75%。对比孤立森林和One Class SVM异常点检测耗时如图5所示,在数据集较小时,One Class SVM训练耗时较短,但随着数据集规模增大,孤立森林算法在时间上更有优势。船舶柴油机数据量通常较大,孤立森林算法在柴油机数据上训练效率更高。
2 热工压力参数压力
在数据中存在报警数据时可以使用孤立森林的方法检测异常点,但是船舶航行过程中大部分测点未发生报警,如果使用孤立森林异常点检测方法检测将无法识别报警数据特点。针对缺乏报警数据的测点提出基于LSTM算法和相关测点相关性的预测方法预测正常值,将偏离预测数据的实际值定位为异常点。
热工压力参数是柴油机故障诊断的重要方法之一
,本文船舶数据中柴油机热工压力参数测点包括柴油机高温水进机压力,低温水进机压力。在船舶历史航行数据中缺乏柴油机热工压力参数报警点,所以传统的异常点检测算法在本船热工压力参数上不适用。
式中:
是当前时刻遗忘门状态;
是sigmoid激活函数;
是遗忘门的权重矩阵;
-1
是上一时刻单元的状态保留量;
是当前时刻输入序列;
是遗忘门的偏置。
2.1 数据分析
根据柴油机热工压力参数和转速的相关性,将柴油机热工压力参数和柴油机转速作为特征,运用孤立森林异常点检测算法检测结果如图8所示。在船舶航行历史数据中柴油机热工压力参数在柴油机转速在800-920rpm没有报警信息,但是基于孤立森林的异常点检测算法根据其判断异常点理论将正常点识别为异常点。因此在缺乏报警数据时使用孤立森林算法进行异常点检测是不合理的。
问卷针对宝鸡市城市内涝区居民进行,根据2011年7月28日发生的实际内涝情况,分别对新老城区居民进行调查。选取姜谭路东段(约1 500 m)、新建路西段与新福路东段(约 2 000 m)、高新四路(约 1 500 m)三个样本地段,分别对附近居民进行了随机访谈调查。此次调查选取的这三个点是宝鸡市2011年的严重内涝区,分别代表了宝鸡市的工业区、农业区和商业区,访谈的对象均属宝鸡市民,能够代表一般意义上的现代中小城市居民对内涝灾害的感知情况。
为验证船舶柴油机转速与柴油机热工压力参数的相关关系,计算船舶柴油机转速和热工压力参数的Pearson相关系数。Pearson相关系数是用来衡量两组数据线性相关性的评估标准,相关系数值越接近1或者-1则相关性越强,越接近0则相关性越弱,通常情况下相关系数绝对值在0.8-1之间表示相关性强,相关系数是正数表示两组数正相关,是负数表示两组数负相关。计算柴油机转速数据与高温水进机压力、低温水进机压力的Pearson相关系数值分别为0.992、0.995,说明船舶柴油机转速与热工压力参数相关性较强。Pearson相关系数计算公式如下:
(1)
2.2 长短时记忆网络
针对热工压力参数值和柴油机转速线性相关的现象,在热工压力参数缺乏报警数据的情况下,提出基于LSTM
的热工压力参数异常点监测方法。柴油机热工参数受柴油机转速影响是时间序列上的连续影响,LSTM特殊的神经网络结构可以解决这个问题。
LSTM是一种特殊的递归神经网络,具有独特的细胞状态和门结构,如图7所示h
、h
h
分别是上一时刻状态、当前时刻状态、下一时刻状态保留量,三个sigm从左到右分别是遗忘门、输入门、输出门,同一时刻,LSTM细胞单元包含当前时刻输入、上一时刻输入,上一时刻的细胞状态三种输入,三种门结构将短期记忆与长期记忆结合,使LSTM实现信息的筛选和长期保留,解决了时间序列长期依赖的问题
。
LSTM中遗忘门决定上一时刻单元状态保留多少信息到当前单元状态,即决定保留多少上一时刻对预测值的影响信息,其计算公式为:
=
(
[
-1
,
]+
)
(2)
为在出现异常数据时能准确识别异常点,本文基于LSTM算法对缺乏报警信息的热工压力参数数据建立异常点识别机制。计算柴油机转速与热工压力参数的Pearson相关系数,判断柴油机转速与热工压力参数相关性,基于柴油机转速与热工压力参数相关性,运用LSTM和SVM算法预测当前转速下热工压力参数值,以图示和残差作为预测准确度评估标准对比分析LSTM和SVM算法预测结果,当热工压力参数实际值偏离预测值则检测为异常点。
LSTM中输入门决定当前时刻输入有多少保存到细胞单元中,即决定保留多少当前时刻对预测值的影响信息,计算公式为:
=
(
[
-1
,
]+
)
(3)
(4)
(5)
中输出门决定当前时刻输出值,即输出当前时刻及之前时刻对预测性的影响信息,输入到下一个细胞单元,计算公式为:
在管理过程中,班主任与家长之间造成误会,大部分是因为沟通不畅,信息不对等造成的。在与家长沟通时,尽可能创造机会让家长来说,认真聆听他们的想法,同时真诚地提出自己的建议,但一定要注意沟通的态度,要把尊重家长放在首位。
为了进一步的充实语料库的内容。为了进一步的充实语料库的内容,帮助同学们了解专业词汇在具体文章中的应用和提高同学们专业性文章的阅读能力,我们从一些德国媒体与网站中节选了几篇与选题相呼应的德语文章。
=
(
[
-1
,
]+
)
(6)
=
tan
(
)
(7)
第一步:首先进行数据预处理,剔除历史数据中柴油机未启动时间段数据,对数据集进行归一化处理,设置时间序列步长为15秒,划分测试集、训练集、验证集,以柴油机转速作为模型输入,热工压力参数值作为模型输出,将数据处理成LSTM输入输出格式。
2.3 模型训练与结果分析
读取船舶航行历史数据中柴油机转速和柴油机热工压力参数如图6所示,通过数据观测发现高温水进机压力、低温水进机压力和柴油机转速值变化规律相似。当柴油机启动、停止或其他原因导致柴油机转速较低时,热工压力参数会随着柴油机转速降低而降低。传统的热工压力参数多采用固定阈值的方法设定报警阈值,当柴油转速偏低时,热工压力参数值也会偏低,容易触发报警。
以历史数据中柴油机转速作为输入,对应时间点热工压力参数作为输出建立LSTM模型。用当前时段柴油机转速作为输入运用建立的LSTM模型预测当前转速下柴油机热工压力参数值,用均方误差(MSE)评价模型精度,选择精度最优的模型通过验证集验证模型准确度。
数据集为某船历史航行数据中热工压力参数和柴油机正常工作数据,建立LSTM模型以柴油机转速预测当前转速下热工压力参数值,作为具体步骤如下。
式中:
输出门的状态;
是输出门权重矩阵;
是输出门的偏置。
简而言之,教师对“支架”教学理解越到位,对学生的最近发展区判断越准确,对教学“支架”的使用越自如,越有可能通过“支架”作用满足学习者的学习需求。但是,如果学习者不积极配合,在课堂中保持沉默,或者认为“支架”教学没有作用,不全身心投入,那么教师的单向努力也不能实现“支架”的作用。
第三步:对模型进行不断迭代寻优,寻找均方误差最优模型。运用数据集对模型迭代600次其损失函数如图9所示。随着迭代次数的增加,模型训练精度不断增加,但精度增加趋势减缓逐步趋于稳定。
(8)
第二步:搭建LSTM时间序列预测模型,预测模型以liner为激活函数,以均方误差作为精度评估标准。均方误差计算公式如下:
模型迭代次数越多训练时间越长,综合模型训练精度和时间长短考虑,将迭代300次生成的模型通过验证集预测,预测值和实际值如图10所示。图中红色为热工压力参数实际值,黑色为预测值。
为了对比提出的LSTM模型预测准确性,本文使用SVM对相同数据集做预测对比分析。SVM是一种非常重要的机器学习算法,核心思想是尽可能寻找最优决策边界,使模型具有很好的泛化性
,因此在数据预测方向也有很多应用。
本文使用SVM基于相同数据集预测当前转速下柴油机热工参数值是实际值对比如图11所示。SVM预测模型虽然能够预测出热工参数的波动规律,但是预测值与实际值偏差较大。
以残差作为模型预测结果评估标准,在统计学中残差表示两组数之间的差值,本文用残差评估实际观测值和预测值之间的差,将残差看做预测值的误差。LSTM和SVM算法分别预测低温水进机压力、高温水进机压力与实际值残差如表2所示。由表2可知LSTM算法预测准确度相对SVM预测准确度更高。
残差计算公式如下:
文言文教学固然存在或多或少的问题。如何认清问题的存在,很好地解决问题是当下急需重视的内容。只有解决好这些问题,才能更好地指导文言文教学实践。
(9)
3 总结
本文基于船舶航行历史数据进行异常点检测分析。船舶航行历史数据具有价值密度低的特点,报警信息在机舱数据中占比很小,本文针对包含报警数据的柴油机气缸排气温度提出基于孤立森林的异常点检测算法;对缺乏报警数据的柴油机热工压力参数数据集提出基于LSTM预测的异常点检测算法。研究结果表明:
(1)孤立森林异常点检测算法能检测出船舶柴油机气缸排气温度报警点,在大数据异常点检测时相比与SVM耗时更短,报警点识别率更高。
(2)针对热工压力参数与柴油机转速波动规律相似的现象提出建立LSTM模型,以柴油机转速预测当前转速下热工压力参数值,以残差作为评估标准,计算LSTM模型预测的高温水进机压力、低温水进机压力结果与真实值残差均为1.62,实验证明将LSTM模型应用于热工压力参数异常点检测具备可行性,当真实值偏离预测值时识别为异常点。
至于“空腹喝凉开水,会克火抑阳,损坏体质”的说法是有道理的,这是因为早上是阳气升发的开始,如果喝凉水,脏腑的阳气会产生一种不良刺激,时间久了对健康不利。
首先,教务管理人员要提前对毕业班学生的学分进行摸底排查,对个别重点学生的学分,更是要把他们的课程总表打印出来,对照他们的专业人才培养方案一一核对,并和班主任、学习委员及其本人联系,帮助他们联系相关的任课教师,及时选修、补修课程,完成专业人才培养方案规定的最低学分要求;同时尽可能地采取一些政策范围内的补救措施,如,争取创新学分和素能拓展学分等.还要及时把学分的最新消息更新在班主任、班级的QQ群中,保证信息的畅通和对称,使学生及时了解此类信息,以便及时采取补救措施.
本文基于孤立森林算法可以检测出柴油机排气温度异常点,但是虚检率很高,将大量正常值识别成异常点,如何降低虚检率有待进一步研究。
[1]CHEN H, ZHANG Z H, GUAN C, et al. Optimization of sizing and frequency control in battery/supercapacitor hybrid energy storage system for fuel cell ship[J]. Energy, 2020, 197: 117285.
[2]KOWALSKI J, KRAWCZYK B, WO?NIAK M. Fault diagnosis of marine 4-stroke diesel engines using a onevs-one extreme learning ensemble[J]. Engineering Applications of Artificial Intelligence, 2017, 57: 134-141.
[3]王瑞涵,陈辉,管聪.基于机器学习的船舶机舱设备状态监测方法[J].中国舰船研究,2021,16(01):158-167.
[4]邹彤彤,杨涛,周勇,王仲平,余来斌,王东凯,肖荣,出晓娟.基于KNN算法的隧道地表变形监测数据异常检测分析[J].科学技术创新,2021(28):95-97.
[5]胡碧辉,邹晨阳,陈芳.岩质边坡地表变形监测数据处理与时效变形分析[J].水利规划与设计,2019(10):113-115+156.
[6]王新峰,梁杏,孙蓉琳,杨静熙,郑汉淮.基于野外测量数据的裂隙间距箱线图法初探——以锦屏一级水电工程厂房为例[J].安全与环境工程,2010,17(02):103-107,122.
[7]雷猛. 某船发电柴油机排温高故障分析与排除[J]. 船舶物资与市场, 2021(5):2.
[8]陈冲,何为,钟田福,王晶.基于孤立森林方法的催化裂化装置排污数据异常识别[J].西安石油大学学报(自然科学版),2021,36(04):119-126.
[9]操江能,杨闽松.船舶柴油机故障诊断技术探析[J].内燃机与配件,2021(12):142-143.
[10]徐武,孙鹏军,郑文胜.某型柴油机滑油压力低故障原因分析[J].柴油机,2021,43(01):55-56+60.
[11]Yokoo Kazuki;Ishida Kei;Ercan Ali;Tu Tongbi;Nagasato Takeyoshi; Kiyama Masato;Amagasaki Motoki Capabilities of deep learning models on learning physical relationships: Case of rainfall-runoff modeling with LSTM.[J]Science of The Total Environment,2021.
[12]易成新,李维刚,吕立华,赵云涛.基于RF-LSTM的热连轧板坯粗轧出口温度预报[J].钢铁研究学报,2021,33(09):952-959.
[13]王逸兮,余铮,查志勇,冯浩,王敬靖.基于改进SVM的电力企业信息系统异常检测方案的优化[J].计算机与数字工程,2020,48(03):567-570+662.