APP下载

基于文本挖掘的煤矿瓦斯事故致因分析

2022-05-23田水承

煤矿安全 2022年5期
关键词:瓦斯节点煤矿

田水承,黄 权

(1.西安科技大学 安全科学与工程学院,陕西 西安 710054;2.西安科技大学 安全与应急管理研究所,陕西 西安 710054)

瓦斯事故以其破坏性强、经济损失大、人员死亡多等显著特点对煤矿安全生产造成严重危害[1]。在我国发生的煤矿事故中,瓦斯事故占煤矿事故总数的35%以上[2]。因此探究煤矿瓦斯事故致因,对于矿井防治瓦斯事故具有重大意义。为了更好的实现对煤矿瓦斯事故的预控,国内学者针对煤矿瓦斯事故致因进行了大量研究[3-4]。这些研究方法在识别事故致因时主要通过人工研读统计事故案例,在提取事故致因时存在一定的主观性。因此选用文本挖掘技术对煤矿瓦斯事故致因进行分析,文本挖掘是指从大量的文本集中发现隐含的模式并提取有用信息[5],现阶段被不少学者应用各个领域的研究[6-8]。目前在煤矿领域使用文本挖掘技术的研究较少,为减少主观性对提取事故致因的影响,在相关研究的基础上,为此,借助文本挖掘技术和社会网络分析方法识别煤矿瓦斯事故致因及其作用关系,为煤矿瓦斯事故的预控提供依据。

1 煤矿瓦斯事故致因的文本挖掘流程

1.1 文本挖掘语料库构建

对于文本挖掘中事故致因的分析,需要选取详细的事故调查报告。事故调查报告对事故发生的过程、直接和间接原因及各方责任有较为全面的描述[7]。因此从中国煤矿安全生产网、应急管理部以及各省市相关的行政管理部门网站收集2012—2020 年煤矿瓦斯事故调查报告126 例,作为文本挖掘的语料。事故类型包括煤与瓦斯突出事故、瓦斯爆炸事故和瓦斯中毒窒息事故等各类瓦斯事故,以确保在使用该语料库分析煤矿瓦斯事故时的客观性。

1.2 煤矿瓦斯事故致因挖掘

R 语言是一套完整的数据处理、计算和制图软件系统,可以根据用户需求选择对应的程序包来实现文本挖掘过程中所需要的数据统计、分析处理以及结果可视化等功能,因此选用R 语言对煤矿瓦斯事故进行文本挖掘[9]。在进行文本挖掘时需将126例煤矿瓦斯事故调查报告整理成文本集导入R 语言,为了提高分词的准确性,需自定义归并词表群和停用词表群后再进行分词处理,归并词表群主要源与搜狗细胞词库中安全工程、采矿工程、煤矿工作、安全生产等领域的专业词汇,由于事故调查报告的表述不同,会导致分词结束后出现同意义但不同表述的词组,例如“安全管理混乱”、“安全管理人员未履行职责”、“安全管理不到位”、“缺乏有效的安全管理”等词组,因此需要将这些词组归并。

在分词过程中共分析出334 项原始特征值,其中包含着许多无用的信息,会影响后续的分析及计算速度,所以需对文本的特征项进行降维处理和选择。由于χ2统计χ2(t,ci)在召回率和查准率方面比其他降维手段更优,因此通过χ2统计对煤矿瓦斯事故文本集的特征项进行降维处理[9]。公式为:

式中:m 为特征项的维数。

通过m 值移除多余的特征项后,即可达到特征项降维的目的。降维时在R 语言中调用Boruta 和Caret 这2 个程序包,并用χ2统计实现特征项降维,煤矿瓦斯事故调查报告特征项降维结果如图1。

图1 煤矿瓦斯事故调查报告特征项降维结果Fig.1 Dimension reduction results of characteristic items in coal mine gas accident reports

1.3 煤矿瓦斯事故致因词云分析

根据分词后的词频结果,对挖掘所得的煤矿瓦斯事故致因重要性程度进行展示,在R 语言中加载Wordcloud2 程序包,得到煤矿瓦斯事故致因词云(图略),在词云中各致因字体呈大到小从中间向四周分布,越重要的因素位置越靠近中央且字体越大。

在这31 项致因中,根据各项致因的排列位置,可将其分为关键致因和一般致因。关键致因包括安全管理混乱、安全监管不到位、违规操作、安全培训与教育不足这4 项,其余项为一般致因。分析词云可知在煤矿生产过程中发生瓦斯事故往往是作业人员的违规操作所引起的,而违规操作的背后就隐藏着企业中安全管理的混乱以及安全培训与教育的不足,缺乏对作业人员的管理与培训是现在大多数煤矿企业发生瓦斯事故的间接原因。因此煤矿企业需要针对以上关键致因做出合理的管控,同时相关部门的安全监管对保障煤矿企业的安全生产也具有着重要作用。

2 煤矿瓦斯事故致因社会网络分析

2.1 煤矿瓦斯事故致因共现网络构建

在煤矿生产过程中上述的4 种关键致因造成了多数的瓦斯事故,但是事故往往是由多种致因共同作用所导致。因此选用共现分析来探讨各致因间的共现规律,共现分析是对每2 个致因在文本集中出现的次数进行统计,当这组致因在文本中共同出现时计为“1”,不共同出现时则计为“0”进行累积,最后得到的煤矿瓦斯事故致因共现矩阵见表1。将所得的共现矩阵导入Gephi,绘制的煤矿瓦斯事故致因共现网络结构如图2。

图2 煤矿瓦斯事故致因共现网络结构图Fig.2 Co-occurrence network structure of coal mine gas accident causes

表1 煤矿瓦斯事故致因共现矩阵(部分)Table 1 Co-occurrence matrix of causes of coal mine gas accidents(part)

在网络图中,每一节点对应着相应的致因,节点越大且节点颜色越偏向红色,则表明该节点在网络中处于越为重要的地位且具有较大影响力,节点越小且节点颜色越偏向蓝色则反之。节点间的连线表示其共同出现在同一事故中,而节点之间的连线越多,则表明这2 项致因间的关联性越强。在图中安全管理混乱T1、安全监管不到位T2、违规操作T3、安全培训与教育不足T4这4 个节点均偏大且颜色偏向红色,体现了这4 个关键致因在共现网络中的重要地位。并且这些关键致因与其他节点的连线也较多,表明这些关键致因与其他节点的关联性较强。在煤矿瓦斯事故中,加强对这4 项关键致因的防控能有效的预防事故的发生并适当减少一般致因的出现。

2.2 网络中心性分析

中心性分析是社会网络分析的主要方面,反映了某个节点在网络中的重要性程度。因此借助Ucinet 软件对煤矿瓦斯事故的致因进行点度中心性分析,得到了共现网络中的绝对点度中心度、相对点度中心度以及点度中心度占比,煤矿瓦斯事故致因点度中心性分析见表2。

表2 煤矿瓦斯事故致因点度中心性分析(部分)Table 2 Point centrality analysis of causes of coal mine gas accidents(part)

第1 列Degree 列为绝对点度中心度,表示为1个节点与其他节点直接连接的总和,反映了网络图的整体中心性。如表中所示,安全管理混乱、安全监管不到位、违规操作、安全培训与教育不足这4 项致因度值较高,与致因词云和网络图所示情况相同,体现了这4 项关键致因在网络中的重要地位。第2 列NrmDegree 列为相对点度中心度,表示为1 个节点的绝对点度中心度与图中节点最大可能的度数之比,可用于展示整体网络的集中程度。最后1 列Share 列为点度中心度的占比,表中前4 项致因的占比达到了0.307,表明这些致因在网络中发挥着主要作用,因此在煤矿生产作业中需要重点防控。

通过点度中心性分析明确了4 项关键致因在网络中的重要地位,为进一步探求一般致因在煤矿瓦斯事故中所发挥的联系和传递作用,对煤矿瓦斯事故致因进行介数中心性分析,得到去除关键致因后一般致因的介数中心度,煤矿瓦斯事故一般致因介数中心性分析见表3。其中通风管理混乱、缺乏有效的安全监控、领导重视程度不足、人员配备不到位、对火工品管理不规范这5 项致因具有高水平的介数中心度,表明这些致因在事故发生的最短路径中出现并与其他致因间的关系紧密,因此需对这些致因加强管控,切断其与事故的联系。

表3 煤矿瓦斯事故一般致因介数中心性分析(部分)Table 3 Betweenness centrality analysis of general causes of coal mine gas accidents(part)

2.3 网络核心边缘结构分析

通过2 类中心性分析后,进一步的核心边缘结构分析能够区分网络中高密度的网络核心,以及低密度的网络边缘[10],煤矿瓦斯事故致因的边缘结构分析如图3。图中的红色节点群为核心区域,蓝色节点群为边缘区域,其中核心致因包括安全管理混乱、安全监管不到位、违规操作、安全培训与教育不足、通风管理混乱、技术管理薄弱、缺乏有效的安全监控、瓦斯治理不到位、防突措施不到位、瓦斯检查不到位。核心区域内各节点联系紧密,为避免多米诺骨牌效应的产生,需对这些节点采用对应的防控措施以加强干涉,从而避免事故的发生。

图3 煤矿瓦斯事故致因的边缘结构分析Fig.3 Analysis of core edge structure of coal mine gas accidents

3 结 语

1)通过收集126例2012—2020 年发生的煤矿瓦斯事故调查报告后,借助文本挖掘技术和R 语言进行语料库构建、文本分词、特征值降维等文本挖掘处理流程,得到了31 项煤矿瓦斯致因,并通过词云进行可视化处理后划分了安全管理混乱、安全监管不到位、违规操作、安全培训与教育不足4 项关键致因以及27 项一般致因。

2)通过共现网络结构图展现了各致因间的共现关系,并对致因网络进行了点度中心性分析明确了4项关键致因在网络图中的重要地位。通过介数中心性分析得到通风管理混乱、缺乏有效的安全监控、领导重视程度不足、人员配备不到位、对火工品管理不规范这五项致因在瓦斯事故中起着联系和传递作用。进一步的核心边缘结构分析划分了网络中的核心区域和边缘区域,为煤矿瓦斯事故的防控提供参考。

猜你喜欢

瓦斯节点煤矿
基于RSSI测距的最大似然估计的节点定位算法
煤矿党支部如何推进党风廉政建设
PLC技术在煤矿提升机控制系统的应用
逐级降压解吸过程中解吸瓦斯膨胀能变化特性
分区域的树型多链的无线传感器网络路由算法
矿井井下高瓦斯治理措施研究
一种基于能量和区域密度的LEACH算法的改进
基于点权的混合K-shell关键节点识别方法
浅谈煤矿开采技术的发展及存在的问题
平煤股份八矿己五采区瓦斯治理综合优化