基于K-means的水下控制系统集成测试风险分析
2024-02-29陈泽峰李华山张宪阵孙广斌李海寿
陈泽峰, 李华山, 张宪阵, 孙广斌, 李海寿
(海洋石油工程股份有限公司 a. 特种设备分公司;b. 海洋工程技术中心, 天津 300450)
0 引 言
水下生产系统集成测试是水下设备深海安装之前非常关键的一个环节[1],是深水油气田开发中水下生产系统安全、平稳运转的保证。同时,系统集成测试还可起到操作预演、培训相关作业人员的作用,并提高作业效率[2]。然而由于系统集成测试程序复杂、测试设备专业,且关键水下产品依赖进口,目前我国尚未开展大规模的水下生产系统集成测试工作。为满足开发深水油气资源的战略,系统掌握水下生产系统集成测试技术及其风险评估迫在眉睫。
水下生产系统集成测试包括水下采油树、水下管汇、水下控制系统、跨接管等关键水下设施在内的水下生产系统的集成测试技术,涵盖系统的安装、连接、水下机器人(Remotely Operated Vehicle,ROV)通道、密封性、可替换性、电连续性、控制响应功能等测试。在油田投产前验证水下生产系统的完整性、可靠性十分必要。
本文提出一种水下控制系统集成测试的风险评估方法。首先采用危险源辨识分析(HAZID)工具制定筛查标准,识别测试阶段的通信、液压建立、稳定性等风险;其次提取集成测试领域的风险发生可能性、风险后果严重程度、风险预防控制能力等3个风险特征向量,将其作为改进的K-means聚类算法的样本指标[3];最后设置初始聚类数的轮廓宽度,降低风险聚类的数据维度、提高预测精度。所作研究具有一定的理论支撑和应用价值。
1 理论基础
1.1 K-means算法
数据挖掘是利用一种或多种机器学习技术自动分析和提取知识的过程[4]。K-means聚类算法将观测的样本分成K个簇,同一个簇的样本具有同构性和一致性,不同簇之间存在最大的差异和异质性,采用对象间的距离作为相似度指标,对象间距离越近,相似度越高,反之相似度越低。该算法具有良好的局部搜索能力、简单高效。
假设有n个待分析样本组成的集合M={X1,X2,…,Xn},且每个样本都有m个维度的特征。初始化K个聚类中心C={C1,C2,…,CK}:
(1)计算每个样本Xi至各个聚类中心的欧氏距离,欧氏距离D计算式为
(1)
式中:Xit为第i个样本的第t个特征向量;Cjt为第j个聚类中心的第t个特征向量。
(2)将Xi归入欧式距离最小的Cλ簇中,并更新Cλ∪{Xi}。
(3)对簇中的样本重新计算均值向量μj,计算式为
(2)
式中:Cj为第j个簇;Xi为第Cj个簇中的第i个样本。
(4)重复步骤(1)~步骤(3),直至目标函数达最优解,则停止K-means聚类分析。欧氏距离J对应的目标函数为
(3)
最终,将n个待分析样本根据样本间相似性划分至K个簇中,每个样本属于且仅属于到某个簇中心欧氏距离最小的簇。
1.2 轮廓系数
轮廓系数结合聚类的凝聚度和分离度两种方法[5],用于评价聚类结果的效果,凝聚度用于测量一个聚类中数据的相似性,而分离度则评估形成的聚类之间的距离,可有效提高K-means聚类的预测精度并降低数据维数。定义K个簇组成的集合K={L1,L2,…,LK},需要计算样本x(i)的轮廓系数Sx(i)、每个簇的轮廓系数平均值Sj、所有簇的轮廓系数平均值Savg,计算式为
(4)
式中:x(i)为第j个簇Lj的样本;ax(i)为xi与Lj簇其他样本间的平均距离,bx(i)为xi与其他簇样本间的最小平均距离。
(5)
式中:Sj为第j个簇;nK为x(i)对应第j个簇的样本个数。
(6)
1.3 HAZID风险识别工具
风险识别工具由德国GL公司提出[6],用以识别设计、制造、安装、测试阶段的健康、安全和环境(Health,Safety and Environment,HSE)风险[7],评估风险对应预防措施有效性并适当改进,使风险控制在可承受范围内或将其消除,能够在很大程度上排除集成测试对人员、测试设备、环境、周围事物的风险。HAZID是一种风险识别方法,制定用于筛查风险的识别标准,并形成风险识别清单,进一步对风险的重要性和减少危害的措施进行定性评估[8]。HAZID分析流程如图1所示。
图1 HAZID分析流程
2 聚类风险评估模型
风险评估通过算法模型对风险事件的发生概率、严重程度、预防措施等进行定量分析,进一步将其转化为可分类的高风险、低风险等定性描述。K-means聚类分析可发现数据之间关联性。因此,提出改进的K-means聚类算法用于水下控制系统集成测试风险。具体步骤如下:
(1)与5位行业专家进行访谈,确定集成测试的风险事件,并形成样本集M={X1,X2,…,Xn}。
(2)为获得每个风险事件的详细描述、风险状态、现有的预防措施、定量分析等,采用HAZID风险识别工具编制HAZID工作表,通过HAZID会议获得与潜在风险相关的原始数据。其中,定量分析基于风险发生可能性L、风险后果严重程度S、风险预防控制能力M等3个特征向量,具体如表1所示。
表1 风险评估特征向量
(3)风险等级R由K-means聚类算法的K值决定,选取轮廓系数最大值对应的K值作为最终的聚类数量。迭代次数由最小化平方误差和目标函数J决定。
(4)基于HAZID工作表,采用SPSS软件,运用K-means聚类算法对水下控制系统集成测试风险进行聚类。
3 实例分析
3.1 实例背景
以工信部某课题水下控制系统集成测试为例,详细阐述基于K-means聚类算法的风险评估工具。简单起见,只考虑水下水下控制模块(Subsea Control Module,SCM)、水下路由模块(Subsea Route Module,SRM)、水听器(Hydrophone,HPH)、水下环境监测系统(Closed Circuit Television,CCTV)、多相流量计(Multiphase Flow Meter,MPFM)、采油树、电/液飞线、电气动力站(Electric Power Unit,EPU)、主控站(Main Control System,MCS)等关键设备,忽略海上安装过程调试,从现场接收测试(Site Reception Test,SRT)、界面测试、功能测试等3个方面完成集成测试风险评估。
3.2 HAZID工作表
通过专家会议、HAZID会议辨识在联合测试中可能存在的危险源,包括但不限于:
(1)外部和环境危险源(自然灾害、人为制造的危险、周边设施中可能存在的危险源、环境问题)以及健康危险源;
(2)首次使用的国产化研制产品可能出现的故障;
(3)项目执行过程中的问题,包括但不限于项目风险管理策略、项目应急计划等;
(4)设施危险源,包括但不限于物料危险源、活动危险源(超压、开停车、测试、维修等)、控制方式和原则、泄漏等。
结合项目设计文件及厂家FAT程序等,运用HAZID方法重点研究水下脐带缆终端接头与水下液压分配单元连接测试安装、水下连接器的测试安装、水下电力和通信设备的联合测试等过程存在的风险,以及针对风险所能采取的改进措施,共计识别出21条集成测试风险。部分HAZID工作表如表2所示。
表2 部分HAZID工作表
3.3 K值确定
采用轮廓系数确定最优的聚类数量,所有簇轮廓系数均值越大表明聚类效果越好,图2显示当簇数为2~10时,平均轮廓宽度的变化。当K=4时,平均轮廓宽度最大,为0.85。因此,在接下来的K-means聚类中可选取K=4,将风险划分为四大类。
图2 使用轮廓系数法的最优簇数
3.4 K-means风险评估
将HAZID工作表中21项风险作为K-means聚类算法的输入样本,运用SPSS软件进行聚类分析,将风险分为重大风险、高风险、中风险、低风险等4个聚类,最终得出21项风险评级结果,如表3所示。
表3 风险评级结果
重大风险的发生和忽视将对项目造成不可挽回的损害。管理这些风险是集成测试工作的首要任务,能够避免造成人员伤害、设备损失和项目进度的滞后。高风险事件的发生严重扰乱集成测试进度,一般需要花费大量的时间和金钱来补偿这些风险,通过测试前风险评估,可降低进度、财产损失。中风险事件导致集成测试进度缓慢,可在设计、审查期间消除或减少其影响,优化集成测试流程、工艺等。低风险事件包括通常发生在可预测时间的风险。本研究与管理人员、专家评估结果相吻合,并提出建议的行动和纠正措施,可较好地反映风险分级结果。
4 结 论
水下控制系统集成测试测试程序复杂、测试设备专业,目前我国尚未开展大规模水下生产系统集成测试工作,难以通过专家访谈、以往项目经验教训登记册、调研等全面分析识别集成测试风险。在风险识别阶段,定义4个不同的类别,运用系统的HAZID风险分析工具,建立用于筛选风险的标准,并对可能的风险事件进行审查,共分析21种危险源对人员/资产安全、环境和公司声誉的影响,HAZID工作表较以往项目历史经验更全面,具有较强的风险识别和改进措施制定能力。在此基础上,结合轮廓系数,设置初始聚类数的轮廓宽度,可有效提高K-means聚类的预测精度并降低数据维数,有助于识别集成测试期间可能发生的潜在中等或较高风险情景,并确定可能的额外保障措施以减轻这些风险。所作研究为以后水下测试项目提供风险评估思路。