基于ReliefF-ANFIS方法的船舶安全评估∗
2018-08-01王梦璇
王梦璇 李 伟
(1.中国电子科技集团公司第二十研究所 西安 710000)(2.大连海事大学航海学院 大连 116026)
1 引言
1.1 研究意义
在对船舶安全航行评价中,一是要做到研究结论科学准确,这当然需要大量数据;二是要快速高效,如何保证快速做出安全评价而不影响船期,这就需要采集相对较少的关键数据对船舶进行快速评价。文中引入特征选择算法(ReliefF)[1]对船舶各项安全评价指标进行筛选,并计算出各项的分类权重,避免了处理原始数据时的数据冗余以及人为确定各评价指标主观因素过强的弊端;引入自适应神经模糊推理系统(Adaptive Network-based Fuzzy Inference System,ANFIS)[2]可以根据评价指标迅速对船舶航行安全状况进行分级,整个算法可以实现对船舶安全评价的自动化,精简安全评价步骤,客观评价安全状态;通过ReliefF与ANFIS两种方法的结合为船舶安全领域的研究提供一种新思路。
1.2 研究方法
为了对船舶航行安全进行安全评价,本文分三个模块对问题进行研究。首先是船舶安全评价指标体系(Safety Assessment Index,SAI)的建立,其次是基于ReliefF精简SAI,最后利用ANFIS建立风险预测模型,评价船舶航行安全状况,具体流程如图1所示。
图1 研究方法
2 船舶评价指标体系研究
2.1 安全评价指标选取的原则
研究基于水上交通运输的复杂系统安全评价问题,本文借助了陈伟炯的MMEM模型[3],把水上船舶交通运输系统分为四个方面进行研究,各部分相互独立又有耦合之处,评价结果是整个部分作用所得,各个部分又由于评价指标不同,需单独研究。
表1 船舶安全评价因素等级表
2.2 安全评价指标的选取
2.2.1 人员因素评价指标体系
在水上交通安全评价中,甚至只要涉及到人的安全评价中,人员因素一直是研究的难点和重点。本文搜集整理了影响船舶航行安全的人员因素,现对船舶航行安全人员相关因素评价指标整理如表2所示。
2.2.2 船舶因素评价指标体系
由于近年来造船行业发展迅速,表中评价指标肯定有所疏漏,在咨询了大连海事大学多位专家后得出表3中评价指标。
表2 船舶人员因素评价体系表
表3 集装箱船船舶因素评价体系表
2.2.3 管理因素评价指标体系
本文实例数据基于“高河轮”[4],在研究管理因素时查阅了船东——中远集装箱运输有限公司的各项管理规章制度,并根据大连海事大学专家给出了意见予以补充完善,如表4所示。
2.2.4 环境因素评价指标体系
本文建立的环境评价指标包括自然环境和社会环境两部分。本文结合孙志堂安全顾问的意见以及大连海事大学专家的建议建立了环境因素评价指标,如表5所示。
表4 集装箱船管理因素评价体系表
表5 集装箱船环境因素评价体系表
3 船舶评价指标体系研究
3.1 ReliefF精简评价指标
ReliefF算法是目前应用较为广泛的数据挖掘方法之一。遵照特征选择算法的框架,根据本文需要,将ReliefF算法应用在指标体系的精简问题当中,具体计算流程如图2[5]。
1)输入算法参数,包括样本集D,迭代次数m,临近样本个数k;
图2 ReliefF算法流程图
2)函数输出为各特征指标的权重值,需初始化权重向量ω为零向量;
3)从样本集中随机选择样本Ri,抽取k个同类最邻近实例样本Hj,并抽取与Ri不同类的实例中选出k个最邻近实例样本Mj(c);
4)计算权重,直至达到循环次数后停止计算;
5)输出各特征权值。
输出的权重值目的在于找出能够对船舶安全评价有影响力的评价指标,淘汰掉权重值不合适或者计算中容易产生冗余的特征指标。在ANFIS运算中,参数越多代表了运算的时间复杂度和空间复杂度越大,对运算效率产生了重要影响,所以很有必要对参与ANFIS运算的评价指标进行精简。文献[6]中提出了基于均方差的淘汰规则。
3.2 基于层次分析法(AHP)的赋权
ReliefF计算的权重值仅对特征指标删减有意义,在ANFIS计算中还需要输入用于安全评价的特征指标权重值。目前应用广泛且认可度较高的赋权方法是以问卷调查为基础,采用层次分析法(AHP)来赋权[7]。
3.3 ANFIS评价模型
ANFIS算法结合了模糊推理与神经网络算法的优点[8],利用了神经网络自动从输入输出数据中提取规则的能力,使算法具有神经网络自适应学习的能力与模糊控制处理模糊信息的功能,令系统能够自适应、自学习[9]。
整个船舶安全评价系统是一个拓扑结构,由人员、船舶、管理、环境四个子分支组成,整个系统是多个ANFIS组成的分层次网络结构[10]。以人员因素为例,建立的ANFIS评价网络拓扑结构如图4所示。
图3 ANFIS模型构建流程图
图4 人的因素ANFIS评价网络拓扑结构
在构建各等级ANFIS模型时,最低等级评价指标输入为各评价指标的风险值,由调查问卷所得,对于ANFIS所需要的评价指标则由ReliefF筛选后确定。
在确定各输入变量的隶属度函数时,由于非线性隶属度函数具有良好的拟合能力,一般隶属度函数有高斯型和钟形[11],本文选择高斯型隶属度函数。
4 实例验证
4.1 基于ReliefF指标体系精简
对“高河轮”所做调查问卷表进行分析,将3477组数据组成的样本集D利用ReliefF进行处理。其中共涉及到61个底层船舶特征,样本集为安全评价样本集,样本类别3,迭代次数100次,临近样本个数取2。计算出分类权重值为表6。
分类权重数据均分布在2倍标准差范围之内,其中1倍标准差之内数据为49项,12项数据在1倍标准差之外。所以,秉持降低维度的目的,根据评价指标的淘汰规则,可以将1倍标准差之外的数据淘汰掉。
表6 分类权重值
4.2 基于AHP评价指标赋权
由于船舶安全评价指标发生了变化,淘汰掉12项后,各评价指标的权重值势必要发生变化,首先利用层次分析法对现有评价指标的权重W进行计算。
4.3 基于ANFIS风险评价
利用ANFIS对船舶航行进行评价,按照系统搭建步骤,首先需要生成历史数据,根据对船舶风险预先控制方法的研究[12],产生100组历史数据。将“高河轮”数据、四级评价指标权重值作为测试数据用于系统训练,输出结果如表8。
系统训练前后人员因素、船舶因素、管理因素、环境因素隶属度函数如图5所示。
其中在多次训练后,计算训练后神经模糊系统的输出与训练数据的均方根误差如表9。
从训练前后隶属度函数图变化不大以及均方根误差可以看出,ANFIS预测效果非常不错,说明搭建的系统比较成功,能够在保持较高精度的前提下成功预测船舶航行安全状态。
表7 四级评价指标权重值
图5 隶属度函数图
表8 系统输出
表9 均方根误差
最后通过图6可知,在57组测试数据中,60分以上有46组,其中70分与80分之间34组,占总评价指标的60%,多次训练后均方根误差均较小,说明匹配度完好。经过系统评价后可以看出,船舶基本处于“一般安全”的状态,评价指标预测值符合实际情况。
图6 评价结果散点图
5 结语
本文遵循船舶安全评估的一般思想,建立61项底层评价指标,通过ReliefF算法,结合淘汰规则,淘汰掉了12项评价指标,取得了不错的效果。同样用AHP计算权重值,对比筛选后与筛选前的评价指标权重值,数据变化量级为10-2~10-3,变化并不剧烈,也从一个侧面显示,ReliefF算法淘汰的评价指标均是对安全评价结果影响不大的项,可视情况去除掉。ANFIS安全评价系统结合了模糊评价与神经网络的优点,通过实例验证发现,能够建立符合现状的评价指标风险值与船舶综合风险的关系。