基于多源信息融合的煤与瓦斯突出动态预警模型
2020-07-18宁小亮
宁小亮
(1.瓦斯灾害监控与应急技术国家重点实验室,重庆 400037; 2.中煤科工集团重庆研究院有限公司,重庆 400037)
煤与瓦斯突出(以下简称“突出”)是发生在煤矿井下采掘过程中的一种极其复杂的瓦斯动力现象,是严重的煤矿灾害之一,而且随着开采深度和强度的增加,部分高瓦斯矿井将逐步过渡转化为突出矿井,开采条件不断恶化,突出灾害防治更加困难[1-2]。对采掘过程中各种突出前兆信息和隐患进行动态监测、采集与分析,并及时预警是有效防突的前提[3-5]。
突出预警技术目前在煤矿现场已得到一定规模的应用,其对突出事故的防范起到了积极作用。预警模型是预警技术的核心,科学的模型是准确预警的关键所在。目前的突出预警模型主要分为单因素模型和多因素综合模型,其中单因素模型多采用临界值比较法进行分析,这类模型仅能反映突出主控的某一方面;而多因素综合模型考虑了突出致因的多个方面,采用的数学算法较多,如层次分析、模糊评价、专家系统、神经网络、可拓理论、粗糙集理论、模式识别等[6-12],这些方法取得了一定的效果,但受主观因素影响大、预警原因难以追溯,如层次分析法在指标过多时,数据统计量大,且权重难以确定。总体而言,现有预警模型融合度不高、相对固化,自分析与优化能力不足,预警的智能化水平还有待提高。
证据理论作为一种不确定性推理方法,具有处理多源不确定信息、表达“不确定”和“不知道”的能力[13-15],允许将信度分配给单个元素及其子集,类似人类的证据收集过程,而突出预警涉及到瓦斯、应力、煤体等相关不同来源的多种信息,具有多源、不确定的特征,可以应用证据理论进行突出多源信息融合、决策。关联规则算法是分析事物之间的关联关系的重要方法[16-19],可以较好地解决证据理论分析过程中基本置信度分配问题,避免人工确定的主观性。
1 动态预警模型总体设计思路
采用关联规则算法和证据理论算法相结合的方法建立突出多源信息融合动态预警模型,实现多指标自动融合分析与决策,同时达到预警模型自修正和预警原因可追溯的目的,其总体设计思路如图1所示。主要步骤如下:①收集整理突出相关的历史数据,得到同一时空范围内各预警指标值及实际突出危险情况,并进行数据归一化处理;②利用关联规则算法对各预警指标进行关联分析,计算出各指标的支持度和置信度,并进行指标优选;③建立证据理论识别框架,并以关联规则分析优选得到的指标及其置信度为基础,建立证据理论算法所需要的基本置信度分配规则;④预警过程中,以基本置信度分配规则为依据,根据新获取的指标值,确定各指标(证据)基本置信度,形成基本置信度分配表,并进行证据合成,得到融合决策结果,发布预警结果;⑤采用专家判定的方式,定期对预警结果进行准确性考察和确认,并根据考察结果重新利用关联规则算法计算各指标置信度,形成新的基本置信度分配规则,实现模型动态调优。
图1 煤与瓦斯突出动态预警模型总体设计思路
2 预警模型建立
2.1 关联规则算法参数的确定
设项目为im(m=1,2,…,k),则项集I={i1,i2,…,ik},项目由预警指标Zn或其演化事件,以及“实际具有突出危险”构成,其中预警指标既有定量指标又有定性指标,而“实际具有突出危险”是一种定性描述。根据规则中处理的变量类别,关联规则可以分为布尔型和数值型,其中布尔型关联规则处理的值都是离散的、种类化的,即定性指标或项目;而数值型关联规则主要是处理数值型字段,即定量指标,需要将其进行动态的分割,或者直接对原始数据进行处理,数值型关联规则中也可以包含种类变量。具体确定方法为:①若预警指标Zn为定性指标,则将该指标定义为一个项目,例如:预警指标“发生动力现象”即为一个项目;若预警指标为定量指标,假设突出危险程度与指标值正相关或负相关,没有突变情况,则定义Zn≥Zn0+Lj或Zn≤Zn0+Lj(j=1,2,…,k)为一个项目,一个定量指标可以演化成k+1个项目,其中Zn0为分析初始值,L为分析步长,j为步长个数。上述参数可根据各指标测量或计算的精度、量程及现场实际考察综合确定。
设数据集T是事务的集合,对一组同一时空下历史数据的分析处理即为一项事务,其集合用T={t1,t2,…,tn}表示,是一个非空项集,且T是I的非空子集;|T|为分析数据的次数,即项集的事务数,称为项集的频数。
2.2 关联规则分析
关联分析的目的就是通过分析预警指标与实际突出危险的关联关系,从而确定各预警指标反映突出危险的敏感性,为证据理论算法中证据及其基本置信度的确定提供支撑。定义关联规则如下:
A⟹B
(1)
式(1)中项目A为预警指标或其演化事件,项目B为实际具有突出危险,A、B均是I的真子集,并且A∩B=∅。A称为规则的前提,B称为规则的结果,反映当A项目出现时,B项目也随之出现的规律。
支持度S是指数据集D中同时包含A和B的事务所占的百分比,其物理意义是反映指标预测突出危险的漏报情况,支持度越高,漏报率则越低。支持度S计算公式如下:
(2)
置信度C是指包含A的事务中包含B的事务的百分比,其物理意义是反映指标预测突出危险的虚报情况,在合理的支持度情况下,置信度越高,虚报率则越低,说明指标的可信度越高。置信度C计算公式如下:
(3)
2.3 预警指标优选
根据关联分析计算得到的支持度和置信度,可将关联规则划分为4类:①高支持度、高置信度规则,认为该规则为强关联规则,表示相关项目对应的预警指标为关键指标,且设置的临界值合理,能较准确地预测突出危险。②低支持度、高置信度规则,若为定性指标则认为该规则为强关联规则,若为定量指标则认为该规则为弱关联规则。该规则表示预警定性指标所描述现象的发生为小概率事件或定量指标的临界值设置过于严格,指标异常时能较准确地预测突出危险性,但指标正常时,不能确定是否有危险,漏报率较高。③高支持度、低置信度规则,认为该规则为弱关联规则,表示相关项目对应的预警指标是关键指标,但指标临界值设置过于宽松。④低支持度、低置信度规则,认为该规则为弱关联规则,表示相关项目对应的预警指标不能较好地预测突出危险性。
最小支持度Smin的计算方法如下:
(4)
式(4)中α为最小支持度系数,根据现场实际情况确定。若S≥Smin,则认为该规则支持度高,否则支持度低。
最小置信度Cmin的计算方法如下:
Cmin=β
(5)
式(5)中β为最小置信度阈值,根据现场实际情况确定。若C≥Cmin,则认为该规则置信度高,否则置信度低。
根据上述方法可以筛选出强关联规则,相应规则中项目对应的指标即为优选后的指标,也就是证据理论中的证据。若预警指标为定量指标,则会出现同一指标对应多个规则的情况,此时选择高支持度条件下,置信度最高的规则为最终优选规则,该规则中项目对应的指标临界值即为最终确定的临界值,其值为Z0=Zn0+Lj。
2.4 证据理论识别框架及基本置信度分配规则建立
将预警结果划分为绿色、橙色、红色3个等级,预警等级依次升高,因此定义证据理论识别框架如下:
Θ={红色,橙色,绿色}
(6)
(7)
(8)
当预警指标为定性指标,且当指标所描述的现象出现时,则将通过关联规则计算得到的置信度C分配给焦元{红色}或{橙色},将剩余概率C′=1-C分配给焦元Θ;当所描述的现象未出现时,则将所有概率全部分配给焦元Θ。
当预警指标为定量指标时,以关联算法分析得到的指标临界值为基础,将指标划分为3个区间(以指标值为正值,且与突出危险程度正相关的预警指标为例),即Zn∈[Z0,+∞)、Zn∈[λZ0,Z0)、Zn∈(-∞,λZ0),其中λ为区间划分系数,可根据现场实际确定,建议取值为90%。基本置信度分配规则如表1所示,其中ε1、ε2、ε3、ε4为基本置信度分配系数,其取值视现场实际情况确定,可参考表2选取。基本置信度分配的规则是:首先将通过关联算法计算得到的置信度C分配给动态采集的指标值所属区间所对应的焦元;然后再将C′分配给其他焦元。
表1 基本置信度分配规则
表2 基本置信度分配系数 单位:%
2.5 证据合成及融合决策
设m1,m2,…,mn是同一证据理论识别框架下的基本置信度指派值,对应的焦元分别为X1,X2,…,Xn,则这n条证据的合成计算方法如下:
m(X)合=(m1⊕m2⊕…⊕mn)(X)
m2(X2)…mn(Xn)
(9)
采用类概率函数的方法进行决策:
(10)
式中|X|、|Θ|为焦元的基,即焦元中所包含元素的个数,分别为1和3。
若g(Xi)=max{g({红色}),g({橙色}),g({绿色})},则Xi即为融合决策结果。
2.6 预警结果分析
不同的指标反映了不同的突出危险致因,预警结果发布后需要追溯预警的原因,以便采取有效的针对性措施。证据合成后追溯预警原因就是要确定导致预警结果的主要证据,即预警指标。具体方法为:首先找出预警结果对应焦元最大的基本置信度指派值mn,若mn-mn′≤δ(式中n≠n′,δ为预先设定的门限值),则证据n和证据n′对应的指标即为预警原因;若mn-mn′>δ,则仅有证据n对应的指标为预警原因。
预警结果发布后,需要根据现场实际情况,采用专家判定的方式,定期评估预警的准确性,并根据评估结果及新增历史数据对模型参数进行自动调整,以实现模型的动态调优。其关键在于确定更加合理的基本置信度分配规则,随着准确的历史数据的累加,基本置信度的分配将会变得更加科学。
3 模型验证
新景矿采用钻屑瓦斯解吸指标K1、最大钻屑量Smax、瓦斯涌出指标V、煤厚变化率M、是否发生动力现象D、是否处于构造影响区G等6个指标进行预警。选取新景矿11组典型数据(见表3)进行模型测试验证,其中前10组用于确定基本置信度分配规则,第11组用于预警分析验证。指标D和G为定性指标,其他均为定量指标,且与突出危险程度正相关,其关联规则项目设置方法如表4所示。
表3 测试数据
表4 定量指标关联规则项目设置参数
根据设置好的项目,对预警指标进行关联分析,可得到各指标对应关联规则的支持度和置信度,取α=0.8,β=0.7,则Smin=0.48,Cmin=0.7,其中除最大钻屑量指标对应的规则为弱关联规则外,其余均为强关联规则。各指标对应的置信度及临界值见表5。
表5 基于关联规则的预警指标置信度及临界值
对表3中第11组数据进行融合预警分析,首先根据基本置信度分配规则,确定各焦元基本概率分配(见表6);然后通过证据合成计算,可得到各焦元的合成概率分布、信任度、似真度及最终决策结果,如表7所示。
表6 第11组数据的基本概率分配
表7 证据合成结果
由表7可知,“红色”即为最终预警结果,表示工作面具有突出危险,与实际情况一致。令δ=0.2,再根据表6所示基本概率分配可知,钻屑瓦斯解吸指标K1及瓦斯涌出指标V均超标,是此次“红色”预警的主要原因。
4 结论
1)研究得到了关联规则项目的方法,对于定性指标可直接将其定义为一个项目,对于定量指标需要将其动态分割为若干个项目;定义了用于突出预警分析的关联规则,规则的前提为预警指标或其演化事件,规则的结果为实际危险情况;基于支持度和置信度的高低程度,将关联规则划分为4类,得到了强关联规则确定方法和预警指标优选方法。
2)建立了用于突出预警分析的证据理论识别框架,并确定了基于关联分析结果的基本置信度分配规则;给出证据合成方法和基于类概率函数的融合决策方法;研究得到采用基本置信度分配函数进行预警原因追溯的方法,以及采用专家定期对预警结果评估的方式进行模型动态更新。
3)对建立的基于关联规则和证据理论算法的动态预警模型进行了测试验证,结果表明:采用该模型进行突出预警分析,可实现预警指标自动筛选、多指标自动融合分析与决策、预警原因自动追溯,以及模型的动态更新优化。利用该方法进行预警是合理可行的,能有效提高突出预警的智能化水平。