APP下载

空间数据挖掘算法在煤矿能源保护监管中的应用

2022-06-25

能源与环保 2022年6期
关键词:训练样本粗糙集数据挖掘

潘 燕

(福建农业职业技术学院,福建 福州 350007)

煤矿开采是我国一项基本工业生产活动,但由于工作环境恶劣,被划分为高危行业。近年来,国内外矿难事故频发,不仅造成巨大经济损失,也为工作人员的生命安全带来威胁。因此,煤矿能源安全问题引起社会关注,政府等相关部门对该行业进行大力整顿与规范,通过制定严格的管理措施将矿难风险降到最低。但针对煤矿能源而言,除了加大管理力度外,还需利用先进技术和设备做好矿难预防和及时救援等工作。国外的煤矿监测技术起步较早,在开采过程中布置大量监测点,采集海量相关信息,将这些信息作为监测依据[1],但是方法没有深层次挖掘信息,无法发现隐藏的危险因子。目前,国内一些学者也纷纷投入到此项研究中。借鉴了国外的监测经验,再利用数据挖掘算法预测可能发生的事故。有关学者将互联网和云计算技术相结合,采集并储存海量数据,利用数据挖掘和视频分析技术发现现场生产规律,挖掘出潜在的安全风险和隐患[2]。还有相关学者设计一种数据分析模型。利用小波分析、偏离均值分析、轨迹相似性分析等多种模型,建立监测大数据分析架构;采用数据挖掘技术选取价值较高的数据,构建远程监管大数据分析系统,通过散点图等多种可视化工具展示出挖掘分析结果[3]。

煤矿能源监管数据主要包括有关空间定位等类型的地理数据,这些数据通常存在空间性、抽象性和非线性特征。通过数据挖掘算法在海量信息中找出隐含细节,其中关联规则挖掘是数据挖掘的重要部分,能很好地满足非线性数据处理要求[4],通过实时监测数据样本,达到煤矿能源监管目的。本文将粗糙集和神经网络算法相结合构建数据挖掘模型[5],将该模型应用在煤矿能源保护监管中,根据关联规则,获得煤矿安全和瓦斯浓度与日生产量有关的结论[6]。该方法能够提供更加有效的措施确保煤矿安全生产,提高经济与社会效益。

1 煤矿能源保护监管模型构建

1.1 煤矿能源监管保护系统组成

监测系统主要监测煤矿瓦斯浓度、温度等信息[7],需结合煤矿实际情况,布置各监测点,每个监测点之间距离应适当。由于监测的数据需从井下发送到地面,易受环境干扰,所以监测系统必须具备超强的抗干扰性能。监测系统结构如图1所示。

由图1可以看出,监测系统包括信息层、控制层、设备层。①信息层[8]:负责煤矿所有职能部门的数据共享,利用资源管理平台,充分调用各方面资源,实时全面地掌握作业过程。②控制层[9]:处理煤矿开采过程中系统和站点间的全部数据,是连接信息层与设备层的桥梁。控制层又可分为主干网与子网[10],为提高通信效果,在总线中安装中继器提高信号质量。③设备层:是监测系统最底层的处理单元,包括传感器和执行器等设备[11],这些设备安装成本低,工作效率高,可达到减少开支的目的。

图1 监测系统结构Fig.1 Structure of monitoring system

1.2 煤矿能源保护监管数据挖掘模型构建

1.2.1 模型整体结构

根据煤矿监测系统结构和特点,利用空间数据挖掘技术设计一种适用于该系统的保护监管模型。

为快速、准确地处理煤矿能源相关信息,采用粗糙集和神经网络相结合的关联规则挖掘算法深度挖掘信息,发现不同因素之间的关联[12],确定保护监管方案。结合数据挖掘结构,该模型由数据采集、处理、挖掘等模块构成,模型整体结构如图2所示。

图2 数据挖掘模型整体结构设计Fig.2 Overall structure design diagram of data mining model

1.2.2 粗糙集和神经网络算法的融合

庞大的数据量会给数据库带来很多问题,例如数据冗余、失真等现象,严重影响数据挖掘的精准度。而粗糙集理论比较擅长处理这些冗余数据,将处理后的数据输入到神经网络中,网络模型的训练时间大大缩短,提高网络泛化能力[13]。

粗糙集和神经网络相结合的数据挖掘核心是属性约简,主要难点是确定粗糙集约简的停止条件,也可以说成是神经网络训练样本数量的确定问题。

训练样本数量影响着神经网络精度,通常利用均方根误差表示学习能力[14],表达式如下:

(1)

式中,m、n分别为训练样本和神经网络输出单元数量;i为第i个样本;j为第j个输出单元;x为系数;y为代价指标。

通过公式可知,若样本数量增加,则误差减少,但如果样本数量过大,网络训练时间也会增多。基于这一矛盾,引入代价函数概念[15],则误差函数改写为:

(2)

能够看出公式中增加了自变量U,若U=1则函数为原来形式。通过代价函数形式为:

(3)

利用上述方法,设定理想误差阈值,当满足粗糙集约简条件时,停止迭代,确定了神经网络输入样本数量。

1.2.3 挖掘过程分析

计算出代价函数,就确定了训练样本的选取依据,基于粗糙集和神经网络的空间数据挖掘算法在煤矿能源监管中的应用过程如下。

第一步:采集数据,确定挖掘条件和目标[16]。

第二步:结合粗糙集相关理论,去除冗余属性,完成数据的离散、约简处理。

第三步:若当前约简表为属性最少,选择训练样本集合,反之结合代价函数与约简属性计算全部样本,如果结果远低于约简后的数量,则返回步骤二继续处理,反之根据推荐代价范围选择训练样本集合。

第四步:按照训练样本数量设计神经网络。本文建立BP形式的神经网络,在数据挖掘过程中,输入神经元数量必须低于数据表中的属性数量。使用粗糙集预处理采集到的瓦斯浓度、温度等数据,数据种类决定了输入层神经元数量;结合煤矿能源监管要求,将输出神经元数量设置为3个,包括低安全、中安全和高安全。

隐含层设计包括隐含层数量与神经元数量确定,确定过程一般依赖专家经验[17],神经元数量确定方式如下:

(4)

(5)

式中,k为训练样本数量;u和u′分别为输入神经元和隐含层神经元数量[18-20];h为输出神经元神经元数量;a为一个常数取值范围,[1,10]。

第五步:通过神经网络训练得到空间数据挖掘规则。算法整体流程如图3所示。

图3 挖掘过程Fig.3 Mining process

2 数据挖掘在煤矿能源保护监管中的应用

本文将某地区监控分站和所有传感器采集的信息作为初始数据。选用Tip DM数据挖掘平台,将Java作为开发语言,支持上述挖掘模型的实现。该平台能够完成数据挖掘的所有流程,同时可提供应用接口,满足不同类型应用需求。平台在煤矿井内的具体应用现场如图4和图5所示。

图4 安装在煤矿井内安全监管系统Fig.4 Safety supervision system installed in coal mine well

图5 煤矿内基于空间数据的无线监控传输设备Fig.5 Wireless monitoring and transmission equipment based on space data in a coal mine

根据各监测信息类型,构建的监管数据库如图6所示。

图6 某煤矿安全监管数据库Fig.6 A coal mine safety supervision database

(1)应用步骤。将本文建立的数据挖掘模型应用在煤矿能源保护监管中的主要过程如图7所示。

图7 应用过程Fig.7 Application process

(2)模型参数输入。参数输入包括原始采集数据和建模参数2部分。其中采集的数据是有关煤矿资源安全的预警数据,例如瓦斯浓度、一氧化碳浓度、温度等,分析这些数据能够为煤矿安全监管提供辅助信息。将2020年12月某日的监测信息作为初始数据,每隔2 h监测1次,构建初始数据库,初始监测数据信息见表1。

表1 初始监测数据信息Tab.1 Initial monitoring data information

建模参数见表2。

表2 建模参数Tab.2 Modeling parameters

(3)数据预处理。由输入到模型中的初始数据可知,这些数据都是多维的、随机的,来自不同监测站和传感器。因此,在数据挖掘前,需做预处理,处理结果见表3。

根据表3所示的数据预处理结果针对初始数据做事务转换,将转换后的数据输入到本文建立的数据挖掘模型中,将初始支持度阈值和置信度阈值分别设置为50%和45%,获得的关联规则见表4。

表3 数据预处理结果Tab.3 Data preprocessing results

由表4可以看出,当瓦斯浓度和开采量二者同时较高时,关联规则的支持度高达78.9%;当瓦斯浓度和开采量之间有一个指标较高时,支持度较高;关联规则中如果没有出现这2个指标,此时支持度普遍偏低。因此能够得出,要想保证煤矿能源安全,必须掌握每日开采量和瓦斯浓度。管理人员应结合挖掘结果,当瓦斯浓度或开采量较高时及时对现场进行控制,将安全隐患在源头消灭。

表4 关联规则生成Tab.4 Association rules generate

3 结论

安全生产是现代工业管理中尤为关键的内容,为了减少经济损失,保障工人生命安全,本文将空间数据挖掘技术应用在煤矿能源保护监管中。将粗糙集和神经网络算法相结合,建立空间数据挖掘模型,确定挖掘过程,并将该模型应用到实际场景中,通过数据采集、处理等过程生成关联规则,通过关联规则得出影响煤矿能源安全的主要因素。该方法满足了现代工业管理需求,为煤炭企业决策提供可行依据,不仅提高了生产效率,也为工人安全提供了保障。

猜你喜欢

训练样本粗糙集数据挖掘
粗糙集与包络分析下舰船运行数据聚类算法
改进支持向量机在特征数据挖掘中的智能应用
基于Pawlak粗糙集模型的集合运算关系
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
人工智能
多粒度犹豫模糊粗糙集*
软件工程领域中的异常数据挖掘算法
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究