动态权-集对分析模型在矿井突水水源识别中的应用
2019-10-21王甜甜靳德武王心义
王甜甜,靳德武,刘 基,杨 建,王心义,赵 伟
(1.煤炭科学研究总院,北京 100013; 2.中煤科工集团西安研究院有限公司,陕西 西安 710077; 3.陕西省煤矿水害防治技术重点实验室,陕西 西安 710077; 4.河南理工大学 资源环境学院,河南 焦作 454000)
煤炭资源安全高效开采是关乎我国经济和发展的大事,然而,我国煤矿水文地质条件复杂,煤层开采时矿井水害频发[1]。据统计从2000年至2014年,4 500人死于矿井突水事故,造成了巨大的人员伤亡与经济损失[2-3]。矿井一旦发生突水,快速准确地判断突水水源,是治理水害的关键[4]。
矿井突水水源识别通常使用地下水化学、同位素、水温、地下水位动态观测等方法,地下水化学因能反应地下水的本质特征,且能准确、快速、经济地进行水源识别,在矿井突水水源识别中得以广泛应用[5-6]。从20世纪90年代起众多学者就开始利用水化学特征进行突水水源判识,孙福元[7]、陈朝阳[8]、王广才等[9]利用矿井水质特征及变化规律与目标水源进行对比,成功地进行了突水水源判识,为水化学识别突水水源奠定了深厚的基础。21世纪以来,随着基础理论以及计算机科学的发展,逐步发展出基于数学方法(多元统计学方法、灰色系统法、模糊数学法)的判别模型和结合计算机技术的其他判别法(BP神经网络法、GIS法、SVM 法、可拓识别法)[10-14]。王心义[15]、周健[16]等使用距离判别法识别了矿井突水水源;武强等[17]借助层次分析法进行煤矿突水水源判识;孙亚军等[18]借助计算机,基于GIS识别了突水水源。这些方法提高了矿井突水水源的准确性,但是仍存在一定的缺陷,例如距离判别法将所有识别因子同等看待,扩大或缩小了不同识别因子对整体的影响,层次分析法权重计算一定程度受人为因素的影响,且需要一致性校验,计算过程复杂繁琐;GIS法依据模糊综合理论,其评价因子权重及最终隶属度难以确定,直接影响水源识别的准确性。灰色系统、模糊数学法等均存在以上类似问题或缺陷。
1 动态权-集对分析模型
1.1 集对分析原理与改进
集对分析是处理不确定性问题的系统分析方法,其核心思想是将事物中客观存在的不确定性,以辩证分析(同、异、反)表示,即以某种联系度来描述事物的不确定性[19]。假设这种联系度用μ表示,A,B两集合构成集对D,即D=(A,B),若集对D中有N个特征,其中S个特征共属于A,B集合,P个特征分别属于两者,其余F个特征不属于两者。具体联系度μ可通过数学表达式表述,即其表达式为
(1)
其中,a=S/N为同一度,b=F/N为差异度,c=P/N为对立度,并且N=S+F+P,同时a,b,c∈[0,1],a,c相对确定,b相对不确定,a+b+c=1;i为差异标记符;j为对立标记符。
单纯地从同、异、反3个侧面刻画不确定性显得过于粗糙,因此,可将联系度进一步细化,将式(1)改写为
μ=a+(b1-+b1+)i+(b2-+b2+)i+…+
(bn-+bn+)i+(c1-+c1+)j+(c2-+
c2+)j+…+(cn-+cn+)j=a+b1-i-+
b1+i++b2-i-+b2+i++…+bn-i-+bn+i++
c1-j-+c1+j++c2-j-+c2+j++…+cn-j-+cn+j+
(2)
式中,i-,j-为i,j的反方向;i+,j+为i,j的正方向。
当n=1时得到五元联系度公式:
μ=a+(b1-+b1+)i+(c1-+c1+)j=
a+b1-i-+b1+i++c1-j-+c1+j+
(3)
式中,a+b1-+b1++c1-+c1+=1,对于突水水源识别,假设b1-,b1+为与所属水源类型相邻的邻左区和邻右区系数,c1-,c1+为与所属水源类型次相邻的次邻左区和次邻右区系数。
如图1所示,属区、邻区和次邻区在整个区间各占1/3,邻左、次邻左、邻右、次邻右各占当1/6,即Y4-Y1=2(Y3-Y2);识别处于所属水源类型中,则a=1,其他为0;当在邻左区时,则越靠近属区,a越大,b1-越小,反之,越远离属区,a越小,b1-越大;当在邻右区时,则越靠近属区,a越大,b1+越小,反之,越远离属区,a越小,b1+越大;当在次邻左区时,则越靠近属区,则a,b1-越大,c1-越小;当在次邻右区时,越靠近属区,则a,b1+越大,c1+越小。
图1 改进集对分析分区解释Fig.1 Zoning interpretation map of improved set pair
联系度μ的确定,将各类水源各指标按上述分5个区域,设X∈[Y2,Y3),X为待测数据,Y2,Y3为所属区水源类型的下限和上限,上文介绍,当识别水源处于所属区中,则a=1,其他为0,所以其联系度μ=1。当X∉[Y2,Y3]即处于次邻左、邻左、邻右与次邻右时的μ[23]为
(4)
1.2 动态权重值的确定
动态权重是一种将客观与主观权重结合的一种随着待评对象不同情况变化的综合权重,综合考虑了主客观情况,使得权重的赋值更加合理[24]。客观权重采用熵权法计算,反应识别因子的固有性[25]。
令:
(5)
式中,sij为各类水源各指标的平均值;vij为各指标归一化值;m为样本个数;Hi为熵值。
其熵值为
(6)
若式中vij=0,则Hi=0。其熵权重值为
(7)
主观权重通过改进层次分析法确定,考虑不同识别因子的实际情况,引入最优传递矩阵计算主观权重,省去一致性校验[3]。首先对6项识别因子的重要性进行比较,建立判断矩阵A:
其中,如果aij=1表示i比j重要;aij=0表示i和j同样重要;aij=-1表示j比i重要。
A的最优传递矩阵为R:
(8)
R的判断矩阵为D:
式中,
dij=exp(rij)
(9)
利用式(10),计算各项识别因子的主观权重值θi:
(10)
最后确定动态权重wi:
(11)
式中,λi为熵权法计算的客观权重;θi为改进层次分析计算的主观权重。
1.3 集对势的确定
由式(4)确定联系度μ,并组成联系度矩阵U,因此可与动态权重矩阵W相乘计算综合联系度矩阵Z,其公式为
Z=U·W
(12)
Z反映待评对象中整体的联系度,由l,m和n组成。由其可计算联系度的集对势nSPT[26],其公式为
(13)
2 矿井突水水源识别
2.1 研究区域概况
葫芦素井田位于内蒙古自治区东胜煤田呼吉尔特矿区,面积约为92.76 km2,井田位于鄂尔多斯高原的东北部,东边与陕西省交界。周围的中深埋矿区还包括新街、呼吉尔特、纳林河等,如图2所示。
图2 研究区地理位置Fig.2 Location of the study area
图3 研究区主要含水层Fig.3 Main aquifers of study area
2.2 水源识别模型建立
根据葫芦素井田5种突水水源,将各个指标的质量浓度绘制成箱型图(图4),图4中矩形盒上下分别为离子质量浓度的上、下四分位数,中间横线为中位数,小方块为平均值,两端分别为质量浓度最大值和最小值[28]。从箱线图可以形象直观地观察到各个离子在不同含水层中质量浓度变化情况。
表1 不同含水层53组水样水化学特征
Table 1 Fifty-three groundwater samples from different aquifers
mg/L
续 表
由图4对各类水源类型的分析,将图中的下四分位数(Q1)和上四分位数(Q3)设定为所属突水水源的限值Y2和Y3。根据图1,将Q1-0.5(Q3-Q1)和Q3+0.5(Q3-Q1)设定为所属突水水源邻区的限值Y1和Y4。
2.3 水源识别模型验证与分析
突水识别区间建立后,将建井、开拓、回采3阶段取得的已知来源矿井水样10组(表2),代入动态权-集对分析模型,对模型进行验证、分析。下面以水样S7为例,详细介绍利用动态权-集对分析模型进行水源类型判识。
图4 6项识别指标的箱型Fig.4 Box-plot of six parameters
mg/L
Xs7=[311.72,0.35,0.62,61.62,430.21,140.09]T
与集对区间进行对比,如将K++Na+=311.72代入第四系突水水源类型中,与K++Na+区间[10.09,29.20]和[0.54,38.76]对比,其值大于邻后区限值38.76,即Xs7(1)∈[38.76,],因此利用式(4)中次邻右式计算属于第四系的联系度为μs7(1)=0.06+0.03i++0.90j+,同理可算的各指标各突水水源类型的联系度矩阵Us7为
表3 识别指标动态权重
Table 3 Dynamic weights of identification parameters
权重类型K++Na+Ca2+Mg2+Cl-SO2-4HCO-3客观权重0.180.200.100.290.210.01主观权重0.190.110.060.150.310.19动态权0.200.120.030.250.380.02
利用式(12)将联系度矩阵Us7和动态权重相乘得到综合联系度矩阵Zs7为
再利用式(13)计算各类突水水源类型的集对势,nSPT1=0.29,nSPT2=0.68,nSPT3=2.21,nSPT4=7.68和nSPT5=1.23,将集对势归一化处理后,并用百分数表示,依次为2.39%,5.59%,18.28%,63.56%和10.18%。根据集对势结果可知直罗组2段含水层的占比为63.56%,可将突水水源判定为直罗组2段。
按照上述方法与步骤,将其余水样分别代入到动态集对模型中,其归一化后的集对势见表4,并根据表4绘制出集对势比例柱状图,如图5所示。
表4 矿井水样集对势计算结果
Table 4 Set pair trend results of ten mine water samples to be tested
水样序号归一化集对势/%第四系白垩系直罗组1段直罗组2段延安组识别结果实际类型S183.625.684.851.674.18第四系第四系S235.4036.0614.734.319.50白垩系第四系S311.2872.427.273.085.96白垩系白垩系S49.4868.2610.423.468.37白垩系白垩系S50.250.3198.070.291.09直罗组1段直罗组1段S60.050.0499.710.030.17直罗组1段直罗组1段S72.395.5918.2863.5610.18直罗组2段直罗组2段S82.688.0926.1250.6312.49直罗组2段直罗组2段S90.060.030.160.0499.71延安组延安组S100.080.050.330.0699.48延安组延安组
图5 集对势比例柱状Fig.5 Box-plot of six parameters
由集对势柱状图可以明显识别出所占比例最大的水源类型,即识别突水水源类型。由图5可知水样S1第四系集对势比例最大,为83.03%,其识别水源类型为第四系含水层;水样S2,水样S3和水样S4中白垩系集对势比例最大,分别为36.06%,72.42%和68.26%,其识别水样类型为白垩系含水层;水样S5和水样S6中直罗组1段集对势比例最大,分别为98.07%和99.71%,其识别水样类型为直罗组1段;水样S7和水样S8中直罗组2段集对势比例最大,分别为63.56%和50.63%,其识别水样类型为直罗组2段含水层;水样S9和水样S10中延安组煤系含水层集对势比例最大,分别为99.71%和99.48%,其识别水样类型为延安组煤系含水层。
利用动态权-集对分析模型的识别结果与实际的水样类型进行对比,显然,应用动态权-集对分析模型识别的10组待测水样,9组与实际类型相符,仅1组结果与实际情况不符。水样S2的水源识别结果来自于白垩系,但实际来自为第四系,笔者发现该水样的识别结果第四系为35.40%,白垩系为36.06%,两者相差甚小只有0.66%。因此可用式(13)中l,m和n的大小来判断这两类水源nSPT的“强弱”。水样S2的综合联系度矩阵Zs2为
可判断出第四系和白垩系识别综合联系度中l,m和n的比较结果均为l>n>m即nSPT+(强同势)。所以其最终的识别结果仍然来源于白垩系。识别错误的原因在于第四系水样建模数据过少,致使模式识别区间没有充分考虑到第四系突水水源的特征。
2.4 水源识别模型预测
2015-04-26,葫芦素井田21102工作面主回风巷施工至3 411 m位置时,距离巷道右侧0.7 m位置中下部出现突水,初始水量为120 m3/h,之后增至180 m3/h,并最终稳定至150 m3/h。经调查分析,判断突水原因为地面“大53”天然气孔未封闭。为查明气孔与上下含水层沟通情况,突水过程中连续采集水样9组(2015-04-26—05-03),05-14采集水样1组,气孔治理后06-09采集水样1组,共计11组进行水化学分析(具体数据见文献[27]),利用已建模型,对11个突水水样进行水源预测,并与实际突水水源对比,结果见表5。由表5可知,突水初期,突水水源主要是直罗组含水层,先是直罗组1段,然后是直罗组2段;突水中期,水源主要为白垩系含水层;治理过程中的水源为直罗组2段。这均与文献[27]的研究结果一致,11组突水水样识别结果均与实际情况相符合,并未出现异常。这是由于突水水源主要为直罗组和白垩系含水层,建模过程中直罗组与白垩系样本量充足,为准确的突水水源识别奠定了坚实的基础。
表5 工作面11组突水水样集对势计算结果
Table 5 Set pair trend results of eleven mine water inrush samples from working face
水样序号取样日期归一化集对势/%第四系白垩系直罗组1段直罗组2段延安组识别结果实际类型D53-12015-04-265.805.2070.613.1515.24直罗组1段直罗组1段D53-22015-04-277.977.4032.4533.6918.49直罗组2段直罗组2段D53-32015-04-278.045.4330.7437.5018.28直罗组2段直罗组2段D53-42015-04-288.056.3232.2935.0418.29直罗组2段直罗组2段D53-52015-04-298.475.5931.7634.5319.64直罗组2段直罗组2段D53-62015-04-308.324.9931.8834.8819.94直罗组2段直罗组2段D53-72015-05-0111.5228.4623.7617.3918.86白垩系白垩系D53-82015-05-0311.7727.5823.2618.8418.55白垩系白垩系D53-92015-05-030.340.240.570.6898.17延安组延安组D53-102015-05-1410.4725.0822.4021.3620.69白垩系白垩系D53-112015-06-094.124.7322.5828.3540.22直罗组2段直罗组2段
3 结 论
(1)动态权充分考虑了指标权重的客观固有性和主观经验性,利用信息熵值计算客观权重,使用改进层次分析计算主观权重,既削弱了人为因素的影响,又考虑了识别指标的实际情况,使得权重赋值合理,有利于突水水源识别。
(3)利用10组矿井水样对动态权-集对分析水源识别模型进行验证,结果表明,9组水样的识别结果与实际情况完全吻合,识别准确率达到90%。1组水样与实际情况不符,为建模时第四系样本量小,待测水样超出识别区间所致 。
(4)利用所建模型对21102工作面11个突水水样进行水源判别,判别结果均与实际相符合,识别准确率达到100%。大量的水质样本为动态权-集对分析模型准确识别突水水源奠定了良好的基础。