基于BP网络和证据理论的钻井安全事故预测
2014-08-14蔡汶君王兵谭露
蔡汶君 王兵 谭露
(1.西南石油大学理学院, 成都 610500;2.西南石油大学计算机科学学院, 成都 610500)
引起钻井作业安全事故的原因比较复杂,其中人的不安全行为、管理缺陷、环境与物的不安全状态等因素影响为主要原因。针对导致这些事故发生的原因,构建事故评价指标体系,建立一种新的钻井安全事故预测模型,对钻井安全生产有着非常重要的指导意义[1-2]。
事故预测的方法包括回归预测法、灰色预测法、神经网络预测法、贝叶斯网络预测法等。神经网络预测法主要解决非线性问题,它对含有非线性关系的数据具备很好的捕捉能力。大量的预测试验结果表明,对于大部分非线性预测对象,神经网络法所得预测精度更高。神经网络预测法所用的神经网络主要为BP神经网络和RBF神经网络,BP神经网络用得最多[3]。本次研究采用经典BP神经网络对钻井安全事故的发生进行回归预测。证据理论算法具备较强的不确定信息处理功能,考虑到由于单一BP神经网络输出结果不够稳定,在此将多个BP神经网络的预测结果作为证据体进行证据理论合成进而预测钻井安全事故的发生[4]。
1 BP神经网络和证据理论
1.1 BP神经网络
BP神经网络(Back-Propagation neural Network)主要通过误差反向传播算法进行学习,是一种含有3层或3层以上的前馈神经网络,包括输入层、隐含层和输出层[7]。它是应用最多的一种人工神经网络,通过网络的自学习、自适应能力和强容错性的非线性函数逼近能力,在预测问题中可以较好地克服人的因素带来的主观性影响。1989年,Robert Hecht Nielsen研究证明,对于任何在闭区间内的一个连续函数都可以用一个隐含层(假设隐含层有足够多的节点数)的BP神经网络来逼近,因而一个3层BP神经网络就可以完成任意的n维到m维的映射。图1为3层BP神经网络结构示意图。
图1 三层BP神经网络结构示意图
1.2 证据理论合成
Dempster-Shafer证据理论(简称D-S理论)是一种处理不确定性事件的理论[8],针对事件发生结果(证据)探求事件发生的主要原因(假设)。借助证据理论可将整个问题和证据分为若干子问题、子证据并根据D-S合成准则,对所有子证据进行融合,最后得到问题的解。
1.2.1 证据理论基本概念
定义1 设U表示变量X所有可能取值的集合,且在U内的所有元素互不相容,则U称为X的识别框架,由函数m:2U→[0,1]满足下列条件:
则称m为U上的概率分配函数(BPAF),m(A)为A的基本概率数。当A为U的子集且m(A)≠0时,称A为m的焦元。
定义2 命题的信任函数(Belife Fuction)Bel:2U→[0,1],且
Bel函数也称为下限函数,表示对A的全部信任。由概率分配函数定义可知:
1.2.2 Dempster合成法则
设Bel1、Bel2是辨识框架U上的两个基本信任度函数,m1,m2分别是其对应的基本概率分配函数,Ai和Bj为焦元,若有Ai∩Bj=A,则m1(Ai)m2(Bj)就是分配到A上的信度,则分配到A上的总信度为:
两个信度合成法则为:
令K=1为冲突权值:当K>0时表示这两组证据一致或部分一致,此时可以进行组合;当K=0时表示这两组证据是完全矛盾的,此时不能进行组合。
2 BP神经网络预测模型
2.1 样本数据的选取及预处理
钻井作业中发生安全事故是由人的不安全行为、环境不良、管理缺陷和物的不安全状态等因素综合作用而引起,由此可将将钻井作业过程中人的不安全行为、环境不良、管理缺陷和物的不安全状态这4项指标因素的每月发生概率(分别用x1,x2,x3,x4来表示)作为BP神经网络的输入,将事故发生等级(无、轻伤、重伤、死亡)的量化数值作为BP神经网络的输出(其中:1 000代表无、0 100代表轻伤、0 010代表重伤、0 001代表死亡)。
为了使数据能更好地适应激励函数,加快收敛速度,对输入数据进行归一化处理,把输入参数值变换到区间(0,1)上,变换公式为:
2.2 网络结构的确定
采用3层BP神经网络,输入层节点为4,分别代表人的不安全行为概率x1,物的不安全状态概率x2,环境不良概率x3,管理缺陷概率x4。输出层节点为4,分别为无(1 000)、轻伤(0 100)、重伤(0 010)、死亡(0 001)。根据隐含层节点数的经验计算公式确定隐含层的节点分别为4、6、9,构建3个BP神经网络,隐含层的激活函数取双曲对数S函数,输出层取双曲正切S函数,训练算法都采用Levenberg-Marquardt法。
2.3 网络的训练及预测
利用训练样本数据对确定的3个BP神经网络进行训练(训练工具为Matlab7.11)[9]。待误差达到或小于预设误差时,保存3个BP神经网络的训练权值。利用训练好的网络权值输入预测数据进行预测。
3 BP神经网络和证据理论合成的预测模型
由于单个BP神经网络的输出结果不稳定。同时输入的数据之间的相关性较小,经过BP神经网络的非线性映射之后,网络输出的结果之间基本上是独立的,符合证据体之间是相互独立的要求,因此可以采用3个不同结构的网络来对同一目标进行预测,对得到的预测结果进行融合,其结构如图2所示。
图2 BP网络与证据理论合成的预测模型结构图
融合步骤如下:
第一步:利用训练好的3个BP神经网络权值输入预测数据进行预测。
第二步:将上一步的BP1、BP2和BP3网络的预测值作为证据体,即预测结果可能取值的集合作为识别框架,U={无事故,轻伤,重伤,死亡},m1,m2,m3分别为3个BP网络在识别框架U上的基本概率分配函数。将第i个BP网络输出结果值作为识别框架U中每个对应元素A的基本概率分配值mi(A),来构造基于BP神经网络的基本概率分配(BPA)。
第三步:利用Dempster合成规则,先将前两个BP网络进行融合,再将融合值与第3个BP网络进行融合,得到最终的结果。
4 实例分析
本次研究采用从某钻探公司钻井现场调研得到的2011年至2012年的每月事故影响因素数据,经过归一化处理后得到的数据作为网络的训练样本,用构建好的3个BP神经网络进行训练。表1为处理过后的训练样本数据,图3为训练误差曲线。
表1 处理过后的训练样本数据
图3 BP网络的训练误差曲线
利用已训练好的3个BP神经网络对2012年2月至9月钻井作业时是否发生安全事故进行预测,根据预测结果构建证据理论合成的基本概率分配。表2为3个BP网络确定的基本概率分配值,由于篇幅原因,此处仅列出4个月的预测结果构建的基本概率分配。表2中O1表示无安全事故发生,O2表示轻伤,O3表示重伤,O4表示死亡,E表示每个网络的误差,识别框架U={O1,O2,O3,O4,E}。对表2进行D-S融合得到预测结果,数据如表3所示,表中R代表预测结果,T代表实际结果。
表2 3个BP网络确定的基本概率分配值
表3 D-S融合后的最终预测结果
运用构建的钻井安全事故预测模型对2012年2月至9月钻井作业时是否发生安全事故进行预测,其中,2月份到5月份的安全事故预测结果与实际结果完全吻合,而6月份到9月份的安全事故预测结果,只有7月份的预测结果与实际结果不吻合;由此认为吻合情况良好,整体符合率87.50%。对7月份进行安全事故预测时,其预测的事故等级比实际的事故等级大,如果公司提前根据预测结果采取预防措施,便可防止安全事故发生,防止人员伤亡,挽回经济损失。同时多个BP网络预测结果融合后的基本概率分配较融合前各个BP网络预测得到的基本概率分配具有更好的峰值性和可分性,从而进一步提高了钻井安全事故预测的准确性。
5 结 语
此次研究结合BP神经网络、D-S证据理论与证据信息融合,以实现进行钻井作业时的安全事故预测。以某钻探公司2012年2月份至9月份的安全事故为例进行验证,结果表明提出的钻井安全事故预测方法大大提高了事故预测的正确性和实用性。
[1] 陈宝智.系统安全评价与预测:第2版[M].北京:冶金工业出版社,2011.
[2] 郑小平,高金吉,刘梦婷.事故预测理论与方法[M].北京:清华大学出版社,2009:210-235.
[3] 宋瑞,邓宝.神经元网络在安全评价中的应用[J].中国安全科学学报,2005(3):78-81.
[4] Shafer G.A Mathematical Theory of Evidence[M].Princeton:Princeton University Press,1976.
[5] 曹庆贵,张广宇,张建.基于神经网络和证据理论的煤矿风险预警模型[J].矿业安全与环保,2011(38):81-83.
[6] 叶请,吴晓平,刘玲艳.基于BP神经网络的D-S证据理论及其应用[J].海军工程大学学报,2007(2):63-67.
[7] 戴文战.基于三层BP网络的多指标综合评估方法及应用[J].系统工程理论与实践,1999(5):29-40.
[8] Dempster A P.Upper and Lower Probabilities Induced by a Multivaluedmapping[J].Annl.Marh.Stat.38,1967:325-339.
[9] 兰雪梅,朱健,黄承明,等.BP网络的MATLAB实现[J].微电脑应用,2003,19(1):6-8.