贝叶斯模型在矿井涌水水源判定中的应用
2017-06-15赵金龙周东东
赵金龙,周东东
(1.西山煤电集团公司 地质处,太原 古交 030053; 2.西山煤电集团公司 屯兰矿,山西 古交 030200)
·专题综述·
贝叶斯模型在矿井涌水水源判定中的应用
赵金龙1,周东东2
(1.西山煤电集团公司 地质处,太原 古交 030053; 2.西山煤电集团公司 屯兰矿,山西 古交 030200)
《水质分析在矿井涌水水源判定中的应用》中提供的水源判定方法是利用Spss程序间接判定矿井涌水的充水水源,该方法由于利用了第三方Spss程序,不便于计算机编程直接实现矿井涌水水源的判定,也找不出其相似水样,所以,本文引入贝叶斯模型,还以《水质分析在矿井涌水水源判定中的应用》中的31个水样资料为例,利用贝叶斯模型代替Spss程序对矿井涌水水源进行判定,其中,27个水样建立水体水质数据库,选取了7个水质指标,对另外4个水样分别利用贝叶斯模型判定其充水水源,检验效果良好,证实贝叶斯模型适用于矿井涌水水源的判定。
矿井涌水水源;水样;水体;水质指标;贝叶斯模型;水源判定
矿井开采引起岩层产生大量的裂隙,导致水体的相对平衡状态被打破,进而产生矿井涌水,经取水样化验判定其充水水源,从而采取针对性措施,有效预防矿井水害事故的发生。而《水质分析在矿井涌水水源判定中的应用》中提供的水源判定方法是先利用Spss程序统计出各种水体判别函数的判定系数,再将水样的水质指标测量值带入判别函数判定其充水水源,该方法由于利用了第三方Spss程序,不便于计算机编程直接实现水样的水源判定,也找不出其相似水样,所以,本文引入贝叶斯模型,以矿井涌水作为水样,以已知充水水源的水质数据的水样作为水体,选取参与水源判定的水质指标,利用水样的水质指标测量值,以水体的水质指标标准值为依据,利用贝叶斯模型对水样进行水源判定。通过本文的实验进行检验,证实贝叶斯模型是否适用于矿井涌水水源的判定。
1 水源判定水体标准及水质指标的选取
2 贝叶斯模型判定原理
水源判定是指按照判定目标,选择相应的水质指标、水体和判定方法,对水样进行水源判定。水源判定是采取针对性措施防治水害的基础。
水源判定其实就是一种水体的推断决策,即利用各种已知信息,统计推断出多种可能性,并依可能性最大原则做出最终决策,因此,这种决策具有两个明显特点:1) 决策取决于信息量。2) 决策具有概率可能性。为了充分体现决策的这两个特点,本文将贝叶斯模型引入水源判定中,因为贝叶斯模型正是利用水样与水体的水质信息,建立水体之间的网络结构关系,确定水体的信赖关系,从而将定性信息与定量信息相结合进行处理,实现对水样充水水源的概率推断。
表1 已知水样资料表 mg/L
在此基础上,对贝叶斯模型判定方法定义如下:设水源判定实验E的样本空间为Ω,A⊂Ω,Bi(i=1,2,…,s)为Ω的一个有限划分,且p(Bi)>0,当p(A)>0,则:
(1)
式中:
Bi—水体;
A—水样;
P(Bi)—事件Bi先验概率,通过经验直觉和判断来推估水样属于水体i的可能性;
P(A|Bi)—条件概率,用于度量水样属于不同水体时,出现某一水质指标相应的可能性;
P(Bi|A)—后验概率,表示在得出水样的水质指标测量值A的条件下,水样属于水体i的可能性。
结合式(1)进一步阐明P(Bi),P(A|Bi)和P(Bi|A)在水源判定中的含义。P(Bi)为一种先验概率,是对S种情况可能性大小的一种事前估计。对水样进行水源判定,一般需要依据水样的水质指标测量值,但是在缺乏测量值的情况下,一般都是通过经验直觉和判断来推估水样属于某个水体的可能性,即推估P(Bi). 出于P(Bi)一般先于水样测量值而推估出来,故称之为先验概率。P(A|Bi)则可以看作是一种似然概率,代表水样的水质指标数值大小一般和其所属水体紧密相关。P(Bi|A)为后验概率,表示在得出水样的水质指标测量值A的条件下,水样属于水体i的可能性,因此,该概率是在水样的水质指标测量值得出以后才能获得,故称为后验概率。
水源判定通常依据后验概率P(Bi|A)来进行定量评估。因此,后验概率如何由积累的经验和水样的水质指标测量值加以估计,便成为关键问题。贝叶斯模型正是为解决这样的关键问题而建立起来的。式(1)显示,由P(Bi)(取决于先验知识)和P(A|Bi)(取决于水样的水质指标测量值)便可以估计P(Bi|A). 因此,其本质意义是:在得到水样的水质指标测量值的条件下,贝叶斯模型提供了一种将先验概率转化为后验概率的简单而方便的有效机制。本文正是利用这样的机制,依据获得的信息,计算后验概率并以此推断判定,从而达到对矿井涌水水源进行判定的目的。
针对水源判定情况特点,本文特对式(1)中各参数做如下规定;Bi为水体,其值用yji表示;A为水样,其值以xjk表示;i为水体数,i=1,2,…,s;j为选取水质指标的个数,j=1,2,…,m;k为水样数。因此,式(1)可以改写为式(2),作为水源判定依据的贝叶斯模型判定方法。
(2)
式中:
xjk—第k个水样的第j个水质指标的测量值;
yji—水体为i时,第j个水质指标的标准值。
3 判定方法的实现
根据式(2),对水样进行水源判定的基本步骤如下:
1) 计算P(yji).
在没有任何先验信息的条件下,水样属于哪个水体,这在很多应用中难以确定,但在水源的判定中却是可以确定的。最为人们接受的原则是在无水样的水质指标测量值条件下,水样属于某个水体的概率相同。即取:
P(yji)=P(yj2)=…=P(yj27)=1/27
(3)
2) 计算P(xjk|yji).
在以贝叶斯模型进行水源判定中,P(xjk|yji)的合理确定最为关键,本次采用最常用的距离方法,因为该方法直观简便,原理清晰。根据几何概率的概念,距离方法可以表示为:以代表水样的水质指标测量值与水体的水质指标标准值之间的距离绝对值的倒数进行计算。见图1,式(4).
图1 水样的水质指标测量值与水体的水质指标标准值的距离示意图
(4)
式中:
yji—水体为i时,第j个水质指标的标准值;
xjk—第k个水样的第j个水质指标的测量值;
Lji—第k个水样的第j个水质指标测量值xjk与水体i的水质指标标准值yji的距离,Lji越大,则该水样属于水体i的概率可能性就越小。
这里值得说明的是等式右边的分母部分,之所以采用求和符号∑(1/Lji),是为了确保P(xjk|yji)有意义,0
3) 计算P(yji|xjk).
利用式(2),其意义是:在得出第k个水样第j个水质指标测量值xjk的情况下,计算水样属于水体i的概率。需要注意的是,对于水样的每个水质指标j的测量值,都要计算出其水样属于每个水体的概率可能性;也可以理解为计算水样的每个水质指标测量值属于每个水体的可能性。
4) 分别推求多指标综合下水样属于水体i的各个后验概率
(5)
xjk—第k个水样的第j个水质指标的测量值;
yji—水体为i时,第j个水质指标的标准值;
wjk—经过归一化后第k个水样的第j个水质指标对水源判定的影响权重;
Pi—7个水质指标综合后的后验概率,即综合考虑7个水质指标后水样为水体i的概率大小。
5) 以最大概率原则确定最终的水体
(6)
水体h为矿井涌水的最终水体,从而确定其充水水源。依此实现步骤,就可以对4个水样进行水源判定,结果见表2.
表2 检验水样的水源判定结果表
4 结 论
本文利用已知水质数据的4个待测水样及27个标准水体,选取了参与水源判定的7个水质指标,利用水样的水质指标测量值,以水体的水质指标标准值为依据,利用贝叶斯模型对水样进行了水源判定,结果显示4个待测水样的判定水源完全正确,检验效果良好,证实贝叶斯模型适用于矿井涌水水源的判定。
[1] 齐培培.基于贝叶斯网络的水质污染评价及预测[D].武汉:武汉理工大学,2009:12-15.
[2] 廖 杰,王文圣,丁 晶.贝叶斯公式在河流水质综合评价中的应用[J].四川师范大学学报,2007,30(4):519-522.
[3] 赵金龙.水质分析在矿井涌水水源判定中的应用[J].山西焦煤科技,2013:113-115.
Application of Bayes Model in Determination of Mine Water Source
ZHAO Jinlong, ZHOU Dongdong
In Application of water quality analysis in the determination of mine water source, the water determination method is to use Spss program indirectly for the determination of the mine water gushing source, being a third party Spss program, the method is not convenient for computer programming, also could not find the similar sample, so introduced the Bayes Model, 31 water samples in the Application of water quality analysis in the determination of mine water source as an example, by using Bayes Model instead of the Spss program determined the source of mine water, among them, 27 water samples set up batabase of water quality, 7 water quality indexes were selected, 4 water samples were determined the source of water by using Bayes model, test results is very good, and the Bayes model verified.
Water sources in coal mine; Water sample; Waters; Index of water quality; Bayes model; Water source determination
2017-02-09
赵金龙(1984—),男,山西河津人,2008年毕业于河北工程大学,工程师,主要从事煤矿地质防治水工作
(E-mail)272516652@qq.com
TD74
A
1672-0652(2017)03-0045-04