APP下载

矿工不安全行为特征的关联规则分析

2022-02-10岳雪娇陈侠君

煤矿安全 2022年12期
关键词:班次项集置信度

李 琰,岳雪娇,陈侠君

(西安科技大学管理学院,陕西西安 710054)

煤矿安全事故的发生主要是由于物的不安全状态和人的不安全行为引起的,但随着煤矿作业机械化程度的不断提高,作业中机器设备出现故障的概率逐渐降低,由矿工的不安全行为造成的煤矿安全事故风险的概率持续上升[1]。2020 年全年发生煤矿安全事故共122 起,死亡人数共225 人,其中造成事故发生最为突出的原因仍然是矿工安全红线意识不强和存在违法违规的不安全行为。因此,深入探究矿工不安全行为隐含关联对矿工安全生产管理尤为重要,是识别和把控煤矿事故发生的有力举措[2]。国内外学者对于矿工不安全行为已经进行了大量的相关研究,1996 年,Donald 等[3]最先从人格特质的研究角度出发发现矿工的人格特点与事故的发生之间密切相关。目前对矿工不安全行为的研究主要集中在单方面和多方面影响因素的研究,从单方面研究来看,国外学者认为矿工工作环境与工作压力[4]、不安全心理状态[5]以及煤矿倒班制度[6]都会对矿工不安全行为产生消极影响。从多方面因素研究来看,学者大都通过利用构建模型的方式来探究影响因素,但传统的方法存在诸多局限性,对于影响矿工不安全行为的因素讨论较为分散。近年来,相关研究将数据挖掘技术应用于煤矿安全管理过程中,力求实现煤矿企业安全可视化管理[7]。2013 年,田水承等[8]首次构建了矿工不安全行为数据库,对工作环境与矿工不安全行为之间的关联性进行了初步分析。现有研究虽从不同角度对矿工的不安全行为进行了分析,但并未对矿工不安全行为之间的动态交互进行深层次和系统性的研究。基于以上研究,认为矿工的不安全行为应该是一个相互影响相互作用的整体系统,找到行为之间相互关联相互影响的特征来发现矿工不安全行为存在的关联性与必然性,从而针对找出的关联规律来提出相应的解决对策措施。为此,从不安全行为的特征分析出发,结合不安全行为内容本身对煤矿企业不安全行为管控记录数据进行分析,利用关联规则算法从大量不安全行为记录中得到矿工不安全行为的强关联规则和关键因素;深入挖掘矿工不安全行为隐藏关系,为矿工不安全行为的治理提供更具针对性的意见,进而有效地控制不安全行为的发生率。

1 矿工不安全行为特征分析

以我国某西部煤矿企业年的不安全行为管控表内44 070 条管控记录作为数据源,剔除掉无用、空白数据,从不安全行为发生的内容描述、所处时间段、所处部门单位等角度用统计性数据分析矿工不安全行为规律,以期用频次来解释不同类型的矿工发生不安全行为的数量区间,得到不同约束条件下的最为突出的特征。

1.1 基于不安全行为描述的分析

煤矿不同类型的作业区域中自然条件、设备设施、作业人员和管理水平有很大差异[9],因此需要对不安全行为的具体描述性内容进行统计,从而明确常出现的矿工不安全行为类型,深化认识矿工不安全行为。经统计剔除掉偶发行为,提取矿工不安全行为描述内容频数的前25 项,得到的不安全行为描述频次分布如图1。

图1 矿工不安全行为描述及数量分布Fig.1 Description of unsafe behavior and quantity distribution of miners

由图1 可见:25 种高频不安全行为中发生次数超过1 000 次的有7 种行为,超过2 000 次的有3种行为;其中频数最多的不安全行为是“不佩戴安全帽”高达3 872 次,频率为8.78%,其次是“迟到、早退”和“疲劳上岗”分别达到了3 771 次(占比8.56%)与2 033 次(占比4.61%);上述不安全行为出现的频率远超过了其他不安全行为,占全部不安全行为总数的1/4。究其原有主要还是员工欠缺对风险的规避意识,没认识到“佩戴安全帽”与“按时上下班”的重要性。所以,应该加大对这些行为的管理,可以通过提高安全教育、安全宣传力度,增加员工的安全意识,也可以通过阶梯式递增惩处力度,增加不佩戴安全帽,迟到、早退和疲劳作业的经济损失,从而树立矿工“安全无小事”的安全意识。

1.2 基于其他基础变量的分析

班次频数分布情况如图2。对于不同班次的行为特征中“8 点班”发生的不安全行为数量最为突出,远超过了其他的班次点,超过了时间段总和的1/2,“16 点班”和“0 点班”次之,“2 点班”最少,可见,矿工工作的所处班次与不安全行为之间存在显著关联关系。因此,需要重视班次与工人状态的交互,加强“8 点班”的作业行为管理,防止不安全行为事故的发生。

图2 班次频数分布Fig.2 Distribution of shift frequency

煤矿企业根据其企业的特殊结构特征,每一个部门单位员工的不安全行为都易成为煤矿事故的直接或者间接原因。各单位不安全行为统计前10 项频数及比率见表1。

表1 各单位不安全行为频数及比率Table 1 Frequency and ratio of unsafe behaviors of each unit

不安全行为发生超过了4 000 次的单位只有1个安全管理部门,其次超过了2 000 次的单位部门有运转队以及连采队与综采队。安全管理办公室本身就是对矿工不安全行为管理的部门,自身却发生了不安全行为,这极易影响其他矿工的心理,因此安全管理办公室以身作则的态度是煤矿安全生产的必要保证。由此可见,应加大对安全管理部门的硬性规章要求,对安全管理部门人员的招聘尤为重要,其决定了对其他单位的不安全行为进行管控效果。而连采队、综掘队、通风队、运转队和综采队等是煤炭生产的重要环节,其作业环境具有线路长、环节多的特点,作为煤矿生产中的重要一环,其顺畅运转是煤矿安全生产的必要保障[10]。由此可见,若能对这些部门的不安全行为加强管理,将有效提高煤矿企业的安全生产率。

将不安全行为危险等级进行分类是为了对不安全行为危险性进行把控,加深对不安全行为危险程度与严重程度的认识。不安全行为危险等级耦合情况统计分析如图3。特别重大风险的不安全行为仅有26 次,所占比重仅为0.06%,中等风险的不安全行为最多,有21 927 次属于这个级别的不安全行为,占比高达49.76%,接近所有等级不安全行为统计总频数的一半,而中等危害的行为同样存在造成人身伤害等安全事故,因此需要各级管理人员突出重点的监督检查,基于经济和行政双重管理。

图3 不安全行为风险等级分布Fig.3 Distribution of unsafe behavior

预警情况表现了企业对不安全行为管控力度的准备情况和负责态度,预警能在矿工在安全意识缺乏时,达到一个点醒、提醒的作用,从外部约束矿工的意识。煤矿企业矿工不安全行为发生时,有25 878次没有预警,可见煤矿企业对不安全行为的重视程度还有待提高,企业监测预警信息系统的建设还需要进一步优化。

综上,以上分析只是对不安全行为自身行为内容和各要素做了独立的特征统计分析,明确了每一类特征的频数分布以及关键要素,为了进一步明确各要素之间的相关性及事件链,需要对矿工不安全行为内容描述以及各个要素间进行关联规则数据挖掘。挖掘出矿工不安全行为的潜在致因以及要素间的潜在关系,为矿工不安全行为管制提供数据支撑和指明实践方向,使矿工行为管理措施更具针对性。

2 基于关联规则的矿工不安全行为过程模型构建

2.1 关联规则概念及算法

因为关联规则法在实际运用的过程中具备有利条件,所以,当下关联规则挖掘是数据挖掘中最常用且最活跃的分支之一,关联规则挖掘是指用于发现事物之间存在的关联关系的一个过程。关联规则的内涵是指2 个不存在交集的非空集合A 和B 如果有A⇒B,那么A⇒B 就是1 条关联规则。关联规则中包含1 次完整条目链的集合称为“事务”,每1个“事务”内的每1 个特征都代表1 个项,其中包含至少一个项的集合被称为项集。

支持度是关联规则中表示项目出现的频次与总项目数间的比例关系的数据,支持度越高的项出现的频率也越高,即:

式中:Support 为支持度;Count 为项数;D 为项数总和。

频繁项集是指支持度大于等于最小支持度阈值的项集。置信度是指出现了“项A”的同时,出现“项B”的概率,亦可称之为“项A”发生时,“项B”发生的概率,即:

式中:Confidence 为置信度。

强关联规则是指支持度与置信度均大于或者等于设定的最小支持度和最小置信度的关联规则。关联规则挖掘的算法包括Apriori、PF-growth、Eclact等,由于数据量适中,选用Apriori 算法具有简单且直观的特点,能够满足当前挖掘数据和挖掘目标的需要。因此,利用Apriori 关联算法对矿工不安全行为管控记录数据进行关联规则数据挖掘分析。

2.2 基于Apriori 算法的关联规则挖掘模型

首先根据数据集生成候选项数据库,并设置好最小支持度和最小置信度;过滤掉不符合最小支持度的项,生成频繁项集,再组合形成新的项集集合,直到无法筛选出满足最小支持度的新项集。而后,根据最终频繁项集集合数据、计算频繁项集集合所含项之间的置信度,筛出小于最小置信度的项集,生成关联规则,并选出符合置信度和支持度阈值的强关联规则。

然而,只依赖支持度和置信度指标有可能产生误差,因为在置信度满足条件时,置信度与原有的支持度相比,支持度可能反而会下降,这说明2 个项目之间产生了排斥作用,因此需要增加提升度(lift)这一指标来判断所挖掘的关联规则是否有效,提升度代表了规则的可靠性,即:

式中:Lift 为提升度,Lift=1 说明了条件间不存在关联,相互独立,Lift<1 说明了条件是相互排斥的,规则的可靠性随Life 值得增大而增大。

在进行矿工不安全行为的特征关联关系挖掘之前,需要对前期采集的不安全行为管控数据进行数据清理,将数据转换成事务项候选集形式,然后利用关联规则算法,进一步探索不安全行为发生的单位、班次、不安全行为描述内容和不安全行为危险等级之间的关联性,得到满足需求的关联规则,最后进行规则的提升度评价,选取最优规则并加以解释。从而协助管理者和安全部门进一步了解矿工不安全行为,并据此做出更为有效的决策。

3 基于关联规则算法的矿工不安全行为分析

3.1 矿工不安全行为内容的关联规则挖掘

以我国某西部煤矿企业1 年的不安全行为管控表内44 070 条管控记录作为数据源,通过矿工不安全行为项目集的首次筛选,得到矿工不安全行为的因素频繁结果,生成一阶频繁项目集。按照频繁程度从高到低的排序方式从中提取出支持度排序的前10 项规则,其中,单项频率最高的项目为不同班次中的“8 点班”,达到了24 852 次;“中等”风险排第2名,有21 927 次;“一般”风险排第3 名,出现了16 218 次;不同班次中的“16 点班”和“0 点班”出现的频次分别排名第4 名和第5 名;“重大”事故风险出现频次排第6 名;行为内容描述中的“不系安全帽”和“迟到、早退”分别排名第7 名和第9 名;各个单位中出现频数最多的为“安全管理办公室”,排在前10项规则中的第8 名;单项频繁前10 项中最低的是行为内容描述中的“精神恍惚、疲劳上岗”,也高达2 033 次。支持度反映了矿工不安全行为影响因素中单项事务的频繁程度,为了加深矿工不安全行为形态的印象,所以需要将频繁项目进一步处理。

为了能够更深入地提取出矿工不安全行关联规则的总体规律和重要规则共性,基于上述的矿工不安全行为频繁项集,利用关联规则分布矩阵进一步分析矿工不安全行为间的关联关系,分布分析可视化结果可以通过圆形的颜色深浅和大小来观测关联性。圆形颜色的深浅程度指提升度大小,颜色越深则提升度越大;圆形大小指支持度大小,圆越大支持度越大。由关联规则分布矩阵结果可得到如下结论:“井下在岗睡觉、脱岗”、“精神恍惚、疲劳上岗”、“迟到、早退”“不戴安全帽、超速行车”这4 类行为都极易造成不安全行为事故的发生。其中“井下在岗睡觉、脱岗”的行为事务项具有重大风险,极易直接引发事故;“精神恍惚、疲劳上岗”;“迟到、早退”现象出现的频次相对较低,属于一般的不安全行为,集中出现于8 点班次;“不戴安全帽、超速行车”行为属于中等的不安全行为,容易出现在8 点班次;生产办,机电信息中心是引发中等危害不安全行为的主要单位;一般和中等的不安全行为极易在8 点班次发生,且发生频率属于所有事务项中最高。

3.2 关联规则提升度评价

为了能够更深入地提取出各矿工不安全行为中最优关联规则,并找到关键要素,在软件中将横坐标设置为支持度(support),纵坐标设置为置信度(confident)和提高度(lift)对上述关联规则提升度进行计算并离散可视化处理,得到矿工不安全行为关联规则分布散点图。再对强关联规则的提升度进行计算提取出提升度最优的10 项关联规则如图4。圆形颜色的深浅程度指提升度大小,颜色越深则提升度越大;圆形大小指支持度大小,圆越大支持度越大。

图4 矿工不安全行为最优强关联规则Fig.4 Optimal strong association rules for miners’unsafe behaviors

在这10 条最优强关联规则中有7 条规则与一般的不安全行为强相关,它们分别是“串岗”、“会车不减速、不变光、不避让”、“停车驾驶员离开不熄火、不取钥匙、不关车门”、“不了解工作岗位上岗”、“驾驶员不系安全带”、“作业人员未随身携带资格证书上岗”、“不参加班前会上岗”。“0 点班,井下在岗睡觉”、“井下在岗睡觉”与“脱岗”都与重大行为强相关。据此,得到如下信息:包含驾车的不安全行为在时空分布上都存在关联程度较高的组合状态,极易在此状态下发生一般危害性不安全行为;而“井下在岗睡觉”与“零点班”高度组合,且“井下在岗睡觉”和“脱岗”是容易造成人身危害事故的重大危害行为。

以上行为大多数都会直接造成安全事故的发生,故在日常安全管理工作中必须对驾驶员的工作状态和工作内容进行严格的预防与控制,要加强针对“单位”、“班次”以及“工作内容”方面的深度监管,如在生产办、机电信息中心等工作单位安设检查监督人员和设施;在0 点班次的工作前和工作中都要对矿工的工作状态和精神状态进行严格把控,例如在0 点班次工作前组织矿工进行“提神醒脑操”让矿工工作精神和意识达到最佳状态;同时安全管理工作要意识到安全教育培训的重要性,让矿工充分了解不安全行为导致事故发生的危害性和风险性。

4 结 语

以西部地区煤矿企业不安全行为管控数据表作为矿工不安全行为特征关联性分析的数据源,首先,对矿工不安全行为相关的要素进行了频次分析,初步认识了矿工不安全行为的具体特征形态;其次,再基于关联规则中的Apriori 算法对矿工不安全行为指标及相关要素进行关联分析,得到强关联规则;最后,基于强关联规则得出不同不安全行为的主要关联性。相比于传统的分析方法,使用的关联规则算法不仅对矿工不安全行为影响因素进行了定量分析而且定性地指出在不同情况下具有不同特征的不安全行为发生的可能性,能够对矿工不安全行为治理提供科学可靠的支持,可为安全监管部门提供合理的监管建议与数据支撑。

猜你喜欢

班次项集置信度
一种基于定位置信度预测的二阶段目标检测方法
硼铝复合材料硼含量置信度临界安全分析研究
考虑编制受限的均衡任务覆盖人员排班模型①
公交车辆班次计划自动编制探索
系统可靠性评估与更新方法
客服坐席班表评价模型搭建及应用
基于矩阵相乘的Apriori改进算法
不确定数据的约束频繁闭项集挖掘算法
正负关联规则两级置信度阈值设置方法
分布式数据库的精简频繁模式集及其挖掘算法*