基于知识本体的HAZOP信息标准化框架
2020-06-29高东肖遥张贝克许欣吴重光
高东,肖遥,张贝克,许欣,吴重光
(1 北京化工大学信息科学与技术学院,北京100029;2 北京德普罗尔科技有限公司,北京100029)
危险与可操作性分析(HAZOP)于20 世纪70年代被提出,是一种以系统工程为基础的危险分析方法。该方法采用表格式分析形式,具有专家分析的特性,主要适用于连续性生产系统的安全分析与评价,是一种启发性的、实用性的定性分析方法。由于该方法具备“集体智慧”、“引导词激发创新思维”以及“系统化与结构化审查”等特点,自诞生之日起,就被广泛应用于国内外各个行业的安全评价、安全分析中[1-7]。HAZOP 分析一般按照国际标准IEC 61882展开,该标准详细规定了HAZOP分析的基本定义、基本原理、分析步骤、流程等。
基于人工的分析方法存在工作量大、耗时长;严重依赖专家经验;分析结果完备性难以保证;知识的继承管理困难等问题,众多学者开始对计算机辅助分析方法或计算机自动分析方法展开研究,通过计算机来辅助或替代人工进行HAZOP,以提高安全分析的效率,获得更加准确的结果[8-15]。
无论是基于人工的分析方法还是基于计算机辅助或自动的分析方法,在分析结果的表达存储上均存在各自的缺点。
(1)基于人工的分析方法通过专家会议的方式进行,分析结果以表格的形式保存,不同专家、不同项目做出的分析结果表达形式缺乏统一标准,在不同项目、团队以及生产的设计、施工、生产、维护等不同阶段进行信息的传递、复用、共享时会造成巨大的不便,耗费大量的人力物力成本。
(2)基于计算机辅助或自动的分析方法,虽然采用了计算机软件来进行分析与结果存储,分析结果同样缺乏统一的表达形式,同时方法不具备知识自动识别能力。因此不同软件之间难以实现信息复用、共享;同时同一软件在不同项目、团队以及生产的设计、施工、生产、维护等不同阶段难于识别、复用。因此,针对安全分析相关信息标准化的研究成为一个重要的研究课题。
本体(ontology)是哲学上的一个概念。在哲学的范畴来说,知识本体是客观存在的一个系统的介绍或说明。它描述了系统的基本概念和系统间的相互关系,由于具有共享和再利用知识库的功能,知识本体被应用于很多方面,比如信息组织、信息研究等。知识本体一般分为通用知识本体与领域知识本体[16-18]。作为领域知识本体之一,国际标准ISO15926 是过程工厂包括石油与天然气生产设施生命周期数据集成的标准,基于知识本体构建,用于计算机知识存储与构造知识库的标准[19]。以此标准为基础,一些学者进行了安全分析信息标准化的研 究。 Lee[20]将FMEA (failure mode and effect analysis)与知识本体相结合,并构建了基于FMEA和知识本体的诊断模型,在故障模式与失效分析中进行了尝试。Kuraoka 等[21]提出了一种基于本体论的HAZOP 分析信息表达方式,尝试采用本体对HAZOP信息进行表达。针对HAZOP分析常见的因素尤其是设备进行了基于知识本体的标准化,给出了安全分析元素的标准化表达。之后在此基础上,Batres 等[22]针对HAZOP 分析,提出了一种hazard scenario graph用于安全分析结果的表达,该方法以ISO15926 为基础定义了安全分析中常见的元素,如行为、事件、原因、后果等,并提供了相应的环境工具。但该危险剧情图建模过程较为复杂且需要人工将危险剧情一步一步建立到模型中,工作量很大、效率低,且严重依赖于建模人员的水平。
在前人研究的基础上基于ISO15926 标准中关于标准化的表达,吴重光等[23]分析、抽提了HAZOP 分析方法的自身特点、规律,提出了一种新的过程安全分析信息标准化方法。该方法以HAZOP 分析中最为关键的危险事件传播路径作为标准化对象,针对危险事件传播路径给出了描述、表达方法,即剧情对象模型SOM(scenario object model)。采用剧情对象模型来描述石油化工过程中各个变量、设备、事件、原因、后果之间的影响关系。该模型基于知识本体实现,解决信息共享的问题。以剧情对象模型为基础,吴重光等[24-25]开发了图形化工具,实现了剧情对象模型的图形化表达,便于建模、分析,并将该方法、工具应用到实际HAZOP分析的项目中。
上述关于HAZOP 分析信息标准化工作均基于传统的HAZOP 分析流程进行,通过人工或者计算机辅助的方式进行离线的HAZOP 分析。为了充分利用HAZOP 分析信息以及实时获得的数据,Gao等[26]提出一种在线安全分析方法,并基于知识本体实现了信息的标准化。
虽然HAZOP 知识本体的描述与其他领域知识本体描述的方式、原理类似,但HAZOP 信息的描述呈现以下特点。
(1)HAZOP 的对象是石油化工行业,其自身涵盖了工厂整个生命周期中工程、采购、建设、操作等大量的数据类型与信息,非常复杂。
(2)HAZOP 知识本体需要针对HAZOP 自身的规范、标准流程建立,与传统描述静态关系的其他领域知识本体相比,HAZOP 的知识本体更强调类之间的逻辑影响关系,比如原因、后果之间的对应、事故的传播路径等。
在HAZOP 分析信息标准化方向,虽然已有不少研究成果,但目前的方法还存在以下问题。
(1)对HAZOP 分析中关键信息抽提、归纳还不完全,知识本体对HAZOP 信息的归纳表达仍然有待完备。
(2)HAZOP信息标准化的过程依赖手工建模,建模过程复杂、工作量大、效率低,而且模型的水平严重依赖建模人员的水平。
(3)所形成的计算机模型往往也只有特定的软件才能识别、打开,严重影响HAZOP 分析信息的共享、复用。
为解决上述问题,提出基于知识本体的HAZOP信息标准化框架,实现了HAZOP分析信息表达的标准化以及自动化,达到了信息有效的共享与复用。本文首先介绍了当前HAZOP 分析及其标准化过程中存在的问题,其次介绍基于知识本体的HAZOP标准化信息模型,实现了HAZOP分析中所有关键信息、因素的标准化表达,然后介绍了基于此模型的信息标准化方法,实现针对人工HAZOP分析结果的自动识别与标准化,最后将该方法应用到某油品合成装置的安全分析中,将传统的HAZOP 分析结果自动转化为标准化的分析信息模型,验证了方法的有效性。
1 基于知识本体的HAZOP 标准化信息模型
1.1 基于偏差(事故)传播路径的HAZOP元素
无论是基于人工的HAZOP 还是计算机辅助的HAZOP 方法,其本质都是基于“偏差”进行,也就是对偏离正常工艺设计条件的情况(包括设备失效、人为误操作等)进行分析,寻找该偏差可能导致的事故、导致该偏差的原因、传播路径以及需要采取的措施等等。因此,HAZOP 信息就是由大量的偏差(事故)传播路径构成的。传播路径包括涉及的偏差、中间事件、原因、后果、现有安全措施、风险等级、建议措施等,构成了HAZOP 分析的全部元素。如图1所示。
各个元素的主要定义如下。
偏差传播路径,构成HAZOP结果的基本单元,包含偏差、中间事件、原因、后果、现有防护措施、建议以及风险等级等。HAZOP 分析结果由一个或多个偏差传播路径组成。
图1 基于偏差传播路径的HAZOP元素
偏差,与设定的工艺条件的偏离。偏差由工艺参数和引导词构成。工艺参数,与过程有关的物理或化学特性,包括具体工艺变量如温度、压力、液位、流量等,以及抽象的过程如混合、反应、浓度、pH 等。引导词,用于定性或定量设计工艺指标的简单词语,引导识别工艺过程的危险,常见的引导词包括多、少、高、低、没有等。
原因,产生偏差的原因包括设备故障、人为误操作、设备失效等。
后果,偏差传播最后导致的后果包括爆炸、火灾、设备损坏、人员伤亡等。
中间事件,偏差产生后,传播路径中从原因到后果之间的事件。例如误操作关闭反应器的冷却水阀门为原因,反应器爆炸为后果的话,那么,反应器温度升高、反应器压力升高都是中间事件。
防护措施,当前系统中存在的设备或系统,用于防止或减轻偏差的传播、不利后果的发展发生。
建议,针对偏差传播导致的不利后果以及已有的防护措施,还需要加入的设备或采取的措施,如加装控制系统、加装检测仪表等。
风险等级,由偏差导致不利后果的频率与严重度确认的风险等级,通常为1~5 级。5 级最为严重,用于描述当前偏差传播路径引起后果的频率与严重度。也有采用L、M、H三级,H为最严重。
1.2 基于知识本体的HAZOP标准化信息模型
上述基于偏差(事故)传播路径的HAZOP 元素基本涵盖了传统HAZOP 分析中常见的元素。将上述元素按照知识本体的概念进行归类,归类按照以下原则进行。
(1)类是知识本体的基本概念,将HAZOP 中概念性元素包括传播路径、偏差、建议措施等采用类的方式来描述。
(2)对于简单元素,如风险等级、路径编号等,直接作为类的属性。
(3)对于可以进一步抽象的元素,进一步抽提共性,形成父类、子类的关系。如HAZOP的原因、后果以及中间事件都以事件类作为父类,因为它们都可以采用单体+活动的形式来描述。
最后得到基于知识本体的HAZOP 标准化信息模型。如图2所示。
图2 基于知识本体的HAZOP标准化信息模型
该模型由偏差传播路径类组成,偏差传播路径类又包含偏差类、事件类、措施建议类以及风险等级、路径编号等属性组成。
偏差传播路径类,代表HAZOP 中偏差传播路径的概念。
偏差类,代表HAZOP 中偏差的概念,包含工艺变量类与引导词类。工艺变量类主要包括:温度、压力、液位、物位、流量、pH、电压、电流、黏度、频率、速度、反应等。引导词类代表了HAZOP 中常见的引导词,包括没有(否)、多(大、高)、少(小、低)、多余(以及)、部分(局部)、相反(反向)以及其他(异常)等。
事件类,代表了偏差传播中发生的“事件”。具体又分为3 种事件:原因事件类、后果事件类、中间事件类。原因事件类代表了HAZOP中的原因,后果事件类代表了HAZOP 中的后果,中间事件类代表了传播路径中从原因到后果之间的事件。无论是原因事件、后果事件还是中间事件,都可以采用单体+活动来描述。单体为本体概念中的某个实体、事物,活动为本体概念中的某个行为、动作。单体+活动可以用来描述事件。以“反应器爆炸”此后果事件为例,反应器为单体,爆炸为活动;又以“精馏塔液位升高”此中间事件为例,精馏塔液位为单体,升高为活动。即所有的事件都可以采用单体+活动来表述。
措施建议类,代表了HAZOP 中针对每条传播路径的现有的防护措施以及针对偏差传播的建议。包括安全措施类与建议类。安全措施类包括控制系统、紧急停车系统、报警等。建议类由活动+单体组成。以“增加液位控制系统”建议为例,增加为活动,液位控制系统为单体。即所有的建议类都可以采用活动+单体来表述。
风险等级,为偏差传播路径类的属性,描述风险等级。采用三级制:L、M、H。L 对应5 级风险中的1级、2级;M对应5级风险中的3级;H对应5级风险中的4级、5级。
路径编号,为偏差传播路径类的属性,描述该路径的编号。
2 基于知识本体的安全分析信息标准化方法
需要实现标准化的HAZOP 信息分为两类:一类是新开展的HAZOP 分析的信息,此类信息可以在进行分析时,就采用支持上述标准化模型的软件进行信息的表达与存储;另一类为大量已经完成的HAZOP 分析报告,针对此类报告,需要对分析结果进行自动识别、分类,形成标准化的信息。其中,已经完成的HAZOP 分析报告数量庞大,报告的形式虽有标准格式但具体内容、书写风格各异,大量的信息无法复用、共享,是实现安全分析信息标准化的难点。
2.1 基于知识本体的安全分析信息标准化算法
针对此问题,以基于知识本体的HAZOP 标准化信息模型为基础,提出HAZOP信息标准化方法,算法整体流程如图3所示。
HAZOP 分析中,将待分析工艺按照工艺单元等划分成不同的节点,对每个节点中的变量选择引导词形成偏差,分析原因、后果、中间事件、安全措施、建议,确定风险等级等,形成一条条HAZOP 分析记录即偏差传播路径。因此,对分析结果进行标准化也按照不同的节点中的不同记录依次处理。对每一条记录的标准化主要包括以下几个步骤。
(1)提取识别记录中的工艺参数。读取记录中的工艺参数,将其按照HAZOP 标准化信息模型中工艺参数类型进行分类。
图3 HAZOP信息标准化方法
(2)提取识别记录中的引导词。读取记录中引导词,将其按照HAZOP 标准化信息模型中引导词类型进行分类。
(3)提取识别记录中的原因。读取记录中的原因,并将其识别为一条或者多条HAZOP 标准化信息模型的原因类的结构,即单体+活动的模式。
(4)提取识别记录中的后果。读取记录中的后果,并将其识别为一条或者多条HAZOP 标准化信息模型的后果类的结构,即单体+活动的模式。
(5)提取识别记录中的中间事件。读取记录中的中间事件,并将其识别为一条或者多条HAZOP标准化信息模型的中间事件类的结构,即单体+活动的模式。
(6)提取识别记录中的安全措施。读取记录中的安全措施,并将其识别为一条或者多条HAZOP标准化信息模型的安全措施类的结构。
(7)提取识别记录中的建议。读取记录中的建议,并将其识别为一条或者多条HAZOP 标准化信息模型的建议类的结构,即活动+单体的模式。
(8)提取识别记录中的风险等级。读取识别记录中的风险等级。
(9)将上述信息形成一条完整的标准化偏差传播路径。
在各个步骤知识提取与识别过程,均采用BiLSTM 神经网络进行训练、标注、识别。长短期记忆网络(long short-term memory,LSTM)是一种循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的;BiLSTM 分为前向LSTM 和后向LSTM,将训练数据转化为字向量形式,字向量的大小可以根据需要训练成固定大小。本文将训练数据利用Word2Vec 模型训练成了100维,然后将每个字的向量输入到前向神经网络和后向神经网络,使得前向神经网络包含了句子正方向每个词与词之间的关系,后向神经网络包含了句子反方向上每个词与词之间的关系,然后将训练的结果进行拼接,最后利用Softmax 函数,对数据进行归一化,求出每个词对应标签的概率,从而得到想要的标注结果,达到实体识别的目的[27]。
本文的数据提取以实体+活动为例,具体流程如图4所示。
图4 数据标注识别流程
首先将训练数据分类,分为实体标注数据与句子分类标注数据,然后将其分别在神经网络模型中进行训练,得到实体识别的神经网络模型与分类神经网络模型。最后将实际数据输入进行识别。用于实体识别的数据需要将数据标注成BIOE 形式,B表示实体的头部,I 表示实体的中间部分,E 表示实体的尾部,O表示非实体数据。如:费/B托/I/反/I应/I器/E超/O温/O,/O泄/O漏/O,/O遇/O点/O火/O 源/O 引/O 发/O 火/O 灾/O 爆/O 炸/O,/O 人/O 员/O中/O 毒/O 伤/O 亡/O。对于实体的活动识别,需要整理活动的类型,如超压、超温爆炸等,将每一条数据进行按活动类型标注。如:费托反应器超温,泄漏,遇点火源引发火灾爆炸标注为超温爆炸;然后构建神经网络模型进行训练,从而达到实体+活动识别的目的。
以“费托反应器超温,遇点火源引发火灾爆炸”该结果为例,通过标注两种数据(费托反应器、超温爆炸)训练了神经网络模型后,实体识别网络可以将句子中的实体识别出来,再经过分类网络能将句子的活动类型识别,从而达到实体识别与类型识别的目的,即上述例子识别结果为:费托反应器超温爆炸。
以某HAZOP 分析中一条记录为例,如表1所示。
该记录描述了某汽提塔塔底温度升高时,可能的原因、后果、保护措施、建议措施、风险等级等。对此条记录进行标准化处理,得到如图5所示。
图5 一条标准化记录
2.2 基于知识本体与语义识别的HAZOP 分析系统
基于上述方法,开发了基于知识本体与与语义识别的HAZOP分析系统。系统的界面如图6所示。
该系统的主要特点包括以下两部分。
表1 某汽提塔单元HAZOP分析记录
图6 基于知识本体与语义识别的HAZOP分析系统
(1)对传统HAZOP 分析结果进行语义分析与识别,将分析记录转换为基于知识本体的标准形式进行存储,实现了HAZOP 分析结果的自动化、标准化,便于后续的复用与共享。
(2)以存储的历史标准化信息为基础,抽提、识别历史信息,对HAZOP 分析提供智能辅助。即对进行的HAZOP 进行决策支持,按照相关度、可能性等提供可能的偏差原因、后果、建议等,充分利用专家知识,提高HAZOP分析的效率。
3 案例研究
以某厂油品合成装置的HAZOP 分析为例,该装置进行了基于人工的HAZOP 分析,分析报告涵盖了油品合成装置中的费托合成单元、催化剂还原单元、蜡过滤单元、尾气脱碳单元、精脱硫单元、合成水处理单元、液体中间原料罐区单元、低温油洗单元及除氧水及凝液精制站单元等共9 个单元。采用基于知识本体与语义识别的HAZOP 分析系统对报告对9 个单元102 个节点834 个分析记录进行了语义分析与识别,将其转换为基于知识本体的标准形式进行存储。
以节点83为例,该节点HAZOP分析结果如表2所示。
此节点的标准化结果如图7所示。
如图中所示,系统将该节点的5条记录进行了识别,形成了标准化的表达。
此外,该系统将存储的历史标准化信息为基础,抽提、识别历史信息,对HAZOP 分析提供智能辅助。即对进行的HAZOP 进行决策支持,按照相关度、可能性等提供可能的偏差原因、后果、传播路径等等。进行HAZOP 分析时,根据输入的变量与引导词,系统根据历史数据提示所有可能的原因、后果以及建议等,充分利用专家知识,提高HAZOP分析的效率。
表2 HAZOP分析结果
图7 HAZOP分析标准化结果
4 结论
针对传统基于人工的HAZOP 分析结果以及计算机辅助的HAZOP 分析均存在的分析结果缺乏统一的表达形式,难于共享、复用等问题,提出了基于知识本体的HAZOP信息标准化框架。
该框架包含HAZOP 的标准化信息模型与HAZOP 信息标准化方法。HAZOP 标准化信息模型基于知识本体与IEC 61882构建,给出了各个元素以及各个元素之间关系的定义,实现了HAZOP 信息的标准化表达。在此模型基础上,提出了HAZOP 信息标准化方法,采用识别、分类算法对已有HAZOP 分析结果进行自动识别、分析,实现了HAZOP 分析结果的标准化、自动化。以该框架为基础设计开发了基于知识本体和语义识别的HAZOP 分析系统,并将该系统应用到某油品合成装置的HAZOP 分析中。结果表明该框架可以有效地自动实现分析结果的标准化,便于分析知识的表达、共享与复用。