APP下载

基于XGBoost 的煤矿机械设备状态监测方法

2023-10-24周树平

装备制造技术 2023年8期
关键词:机械设备煤矿状态

周树平

(兰州煤矿设计研究院有限公司,甘肃 兰州 730000)

0 引言

在对机器学习模型进行优化之前需要先对其参数进行确定。目前,国内外学者针对不同类型的机器学习算法都有相应的研究成果,但是这些研究大多是通过建立一个通用的模型来实现预测功能,并未考虑到具体的应用场景。因此本文提出了一种新的机器学习模型(Next-classifier),该模型可以根据历史数据和当前数据自动地调整模型参数,从而使得模型具有较强的泛化能力。 传统机器学习算法中存在大量不适合于特定领域使用的特征,如SVM 等;此外,由于每个测试集都会包含多个训练样本以及少量测试样本,导致训练样本数目过多而无法满足实际应用需求。为了解决上述问题,采用了一种改进的粒子群算法作为分类器,以便能够有效降低训练样本的规模,提高模型性能。

1 煤矿机械设备状态监测系统设计

1.1 系统总体结构设计

煤矿机械设备状态监测系统的设计主要分成硬件部分和软件部分。其中,硬件部分包括传感器、数据采集设备和通信设备;软件部分包括数据处理与分析软件和监测系统界面。

传感器:用于采集机械设备的各种参数,如振动、温度、压力、电流等。常用的传感器有振动传感器、温度传感器、压力传感器、电流传感器等。

数据采集设备:如图1,用于将传感器采集到的数据进行采集和处理,将其转化为数字信号,并进行存储和传输。常用的数据采集设备有数据采集卡、数据采集模块等。

图1 矿井提升设备状态监测系统功能设计流程

通信设备:用于将采集到的数据传输到监测系统中进行处理和分析。常用的通信设备有以太网、无线通信模块等。

数据处理与分析软件:用于对采集到的数据进行处理和分析,提取有用的信息,并进行故障诊断和预测。常用的数据处理与分析软件有MATLAB、Lab-VIEW 等。

监测系统界面:用于显示监测到的机械设备状态信息,提供实时监测和报警功能。常用的监测系统界面有人机界面、Web 界面等。

以上是煤矿机械设备状态监测系统设计的主要部分,通过这些部分的协同工作,可以实现对机械设备状态的实时监测和预测,提高煤矿生产的安全性和效率。系统总体结构设计主要分为硬件部分设计、软件系统设计、数据库管理子系统设计、信息查询模块以及数据分析及显示设计等部分,各部分功能如下文所介绍。

1.2 硬件平台搭建

如图2 所示,煤矿机械设备状态监测系统的硬件平台搭建主要包括传感器的选择和安装、数据采集设备的选择和配置、通信设备的选择和配置。

图2 硬件平台

(1)传感器选择和安装:根据监测需求,选择适合的传感器,如振动传感器、温度传感器、压力传感器、电流传感器等。传感器的选择要考虑其测量范围、精度、稳定性等因素。安装传感器时要注意选择合适的位置和固定方式,确保传感器能够准确地采集到机械设备的状态参数。

(2)数据采集设备选择和配置:根据传感器的类型和数量,选择合适的数据采集设备,如数据采集卡、数据采集模块等。数据采集设备的选择要考虑其采样率、分辨率、接口类型等因素。配置数据采集设备时要根据传感器的接口类型进行连接和设置,确保数据能够准确地采集和传输。

(3)通信设备选择和配置:根据监测系统的要求,选择合适的通信设备,如以太网、无线通信模块等。通信设备的选择要考虑其传输速率、传输距离、稳定性等因素。配置通信设备时要根据监测系统的通信协议进行设置,确保数据能够稳定地传输到监测系统中。

在搭建硬件平台时,还需要考虑供电和防护措施。传感器、数据采集设备和通信设备都需要稳定的供电,可以选择适合的电源和电缆进行供电。此外,还需要考虑防护措施,如防水、防尘、防爆等,以确保硬件设备在恶劣的煤矿环境中能够正常工作。

1.3 软件系统开发

在本系统中,主要使用C#语言进行编程,具体而言,主要涉及的内容:通讯协议的设计、数据库的构建、界面的创建以及数据的读写操作。

1.4 系统测试

对采集到的数据进行分析处理后,可以得到设备在不同工况下的健康状况。通过对数据进行分析、计算和预测等步骤,可为维修人员提供有价值的信息,并且根据这些结果来制定合理的维修计划。利用该模型还能够实现对设备运行过程的监控与管理,从而提高了设备运行效率。以某煤矿机电设备为研究对象,采用XGBoost 算法构建了煤矿机电设备状态检测预警系统,其具体步骤如下所述。

(1)建立训练集:将XGBoost 算法应用于煤矿机械故障分类问题时,需要确定合适的初始参数值。通常情况下,XGBoost 算法会以一定概率随机选择一个初始参数值作为初始化参数,然后按照这个参数进行训练,直到获得最优的分类效果。因此,本次实验中选用的初始参数是XGrids_training_collection.XGBoost.samples.length=100。

(2)划分训练集并计算各类样本数量、每种故障类型对应的特征数和平均准确率等信息,以便得到最终的分类结果。在此基础上,对模型进行验证与调整。为了避免出现过拟合现象,应当根据实际运行环境以及数据分布特点合理设置模型参数,使得预测结果更加贴近真实情况,从而提高模型泛化性能。

2 基于XGBoost 的煤矿机械设备状态监测方法

2.1 XGBoost 算法简介

XGBoost 是一种基于梯度提升决策树的机器学习算法,具有高效、准确的特点。它通过迭代的方式不断优化模型,能够处理大规模数据集和高维特征。相比传统的决策树算法,XGBoost 算法具有更好的泛化能力,且不需要手动指定特征的重要性级。

2.2 XGBoost 算法流程

XGBoost 算法的流程包括数据准备、模型训练和模型预测3 个步骤[1,2]。首先,需要对监测数据进行预处理,包括数据清洗、特征提取等。然后,使用训练数据集进行模型训练,通过优化损失函数来提高模型的准确性。最后,使用训练好的模型对新的数据进行预测。

2.3 监测模型建立

XGBoost 的迭代模型有两种,一种是线性模型,另一种是基于树的模型,因为基于树的模型性能远好于线性模型,这里仅讨论基于树的模型。使用基于Python 语言的“XGBoost”算法包来构建XGBoost 分类模型,集成学习模型相对于SVM 来说需要调节的超参较多,对模型性能影响较大的参数见表1。

表1 XGBoost 分类模型参数

在训练模型初期需要根据具体问题来选择目标函数,对于回归和二分类问题目标函数一般使用线性回归或者逻辑斯蒂回归,对于多分类问题可以选择使用softmax 函数。在输出预测结果的时候还可以根据需要输出预测类标的概率。“min child weight”代表最小叶子节点权重和,当新分裂的节点的样本权重和小于这个值时就会停止分裂,这个参数可以用来抑制过拟合,但这个值也不能过低,不然会导致模型欠拟合;“max depth”参数被用于限制树的最大深度,进而控制树模型的复杂程度;增大“reg alpha”的值可以使模型更加收敛;“reg lambda”这个参数用于控制XGBoost 模型的正则化部分。

使用该方法进行优化后可得XGBoost 模型的各参数为:objective=-"reg:logistic",n estimators=2000,max depth=3,min_child_weight=1,learning rate=0.1,subsample-0.9,colsample bytree=0.8,gamma=0,reg alpha=0,reg lambda=1.XGBoost 分类器在测试集上的测试结果见表2,优化后模型ROC 曲线如图3 所示。可以注意到XGBoost 模型的目标函数是logistics 回归,在得出概率值后通过设置阈值将概率值转换为类别预测,这是因为在实验中发现这个回归型的目标函数相较于分类型目标函数能获得更好的效果。

表2 XGBoost 分类器性能

图3 XGBoost 受试者工作特征曲线

2.4 监测模型参数优化

基于XGBoost 的煤矿机械设备状态监测模型参数优化是指对XGBoost 模型中的参数进行调整和优化,以提高模型的性能和准确度[3]。在煤矿机械设备状态监测模型中,XGBoost 是一种常用的机器学习算法,它通过集成多个决策树模型来进行预测和分类。XGBoost 模型中有许多参数可以调整,包括树的数量、树的深度、学习率、正则化参数等。参数优化的目标是找到最佳的参数组合,使得模型在训练集和测试集上的性能达到最优。常用的参数优化方法包括网格搜索、随机搜索、贝叶斯优化等。在进行参数优化时,需要先确定优化的目标,如最小化损失函数、最大化准确率等。然后根据目标选择合适的评估指标,如均方误差、准确率、召回率等。接下来,可以使用不同的参数组合进行模型训练,并根据评估指标的结果选择最佳的参数组合。可以使用交叉验证的方法来评估模型的性能,将数据集划分为训练集和验证集,多次训练模型并计算评估指标的平均值。最后,根据参数优化的结果,可以得到最佳的参数组合,并使用该参数组合来训练最终的煤矿机械设备状态监测模型。通过参数优化,可以提高模型的性能和准确度,从而更好地监测和预测煤矿机械设备的状态。随机森林算法中的决策树必须足够深才能达到较好的预测效果。同时,在建模的过程中,还需要考虑如何平衡好决策树的复杂度和准确性之间的关系。优化基于XGBoost 的煤矿机械设备状态监测模型的参数可以通过以下步骤进行:

(1)数据预处理:首先,对原始数据进行清洗和预处理,包括缺失值处理、异常值处理、数据平滑等。这样可以提高模型的稳定性和准确性。

(2)特征选择:通过特征选择方法,选择对目标变量有较强预测能力的特征。常用的特征选择方法包括相关系数分析、方差分析、互信息等。

(3)参数调优:使用交叉验证的方法,通过网格搜索或随机搜索等方式,对XGBoost 模型的参数进行调优。常见的参数包括学习率(learning rate)、树的深度(max_depth)、子样本比例(subsample)等。

(4)模型评估:使用合适的评估指标(如准确率、召回率、F1 值等)对优化后的模型进行评估。可以使用交叉验证的方法来评估模型的稳定性和泛化能力。

2.5 监测模型应用

(1)对历史数据集进行预处理。在训练过程中需要将原始数据集中的所有数据进行归一化处理,并根据实际情况调整各维度下的特征参数;同时还要对数据进行清洗和去掉异常值等操作,从而使得模型能够更加有效地反映设备运行时长以及故障率变化趋势,为后期的数据分析提供可靠的参考依据。

(2)建立设备运行时间序列预测模型。通过构建一个三层网络结构来实现该目标,第一层是输入层,主要用到了Sigmoid 函数、线性回归以及随机森林等常用的机器学习算法;第二层则包括多个卷积核,分别用来提取不同类型的特征信息,例如激活函数、损失函数以及偏置项等;第三层是输出层,可以利用梯度下降法或者粒子群优化算法求出最优的参数值。

3 基于XGBoost 的煤矿机械设备状态监测实验

我们通过实验来验证和评估基于XGBoost 的监测模型在煤矿机械设备状态监测中的准确度、稳定性和可靠性。具体来说,实验的目标包括:

(1)验证模型的准确度:通过使用实际监测数据对模型进行测试,评估模型在预测煤矿机械设备状态时的准确度和误差。

(2)评估模型的稳定性:通过对模型进行多次实验和重复测试,评估模型在不同数据集和条件下的稳定性和一致性。

(3)比较模型的效果:通过与其他监测模型进行对比实验,评估基于XGBoost 的监测模型在煤矿机械设备状态监测中的效果和优势。

(4)优化模型的参数和配置:通过实验和分析,调整和优化模型的参数和配置,以提高模型的性能和效果。

通过进行实验和评估,可以验证和评估基于XGBoost 的监测模型在煤矿机械设备状态监测中的可行性和有效性,并为实际应用提供参考和指导。

3.1 实验环境

(1)数据集。本次实验所使用的是某公司生产的MG13000 型采煤机[4],共收集了20 万条数据。这些数据包含了采煤机的各种状态信息,如工作状态、故障情况等等。为了保证实验的可靠性,我们还进行了多次验证以确保数据的质量。

(2)训练样本。将所有数据集中每个类别的20 组数据作为训练样本;将剩余10 组数据作为测试样本进行验证。

(3)评估指标。本实验采用了两种评价指标:平均绝对误差(ADE)和召回率(R)。其中,ADE 是指模型预测的结果与真实情况之间的距离;召回率为模型预测的结果中有多少个正确分类。

3.2 实验数据集

在本次实验过程中将所有样本划分为训练集和测试集。将训练样本作为输入变量,对模型进行训练;将测试数据作为输出结果。

(1)训练阶段。首先利用XGBoost 算法对原始数据集中的每个设备运行时间段内的各项指标进行预测,并且通过计算得到各个设备运行时间段内的各类故障率。然后根据实际情况调整模型中的参数,以达到最佳效果。选取了6 组数据来进行实验分析。其中第2 组为正常运行时的数据,其余5 组均为停机检修后的数据。因为停机检修后设备的运行速度有所下降,所以选择这组来做对比研究,其他5 组数据均是相同条件下的运行数据。

(2)测试阶段。在完成上述工作之后,就可以开始进行测试了,本次实验主要分为两个部分内容:一是,验证所提出的XGBoost 模型的有效性以及泛化能力。二是,针对不同类型的故障问题分别采取对应的解决措施。

具体来说就是要先用该模型对停机检修前的数据进行预处理操作,使其能够更加符合实际生产需求。

(3)实验流程。首先将所有的数据输入到XGBoost 中,然后再通过随机森林算法对XGBoost 中的每个样本都进行一次预测,并且将得到的结果与真实值进行比对,如果两者相差不超过阈值则说明此次建模成功,否则需要重新调整XGBoost 模型参数和参数值,直至满足要求。

3.3 实验设计

(1)训练样本选取。在本次研究过程中,将所有的测试样本都作为训练集;对于测试数据而言则是随机抽取100 组作为测试数据集。

(2)参数设置。为了使得模型能够准确预测设备的实际运行情况,需要对模型中的各个变量和参数进行设置。其中,最大迭代次数设为500 次,学习速率设定为0.001,损失值阈值设为0.01。

3.4 实验结果

实验结果表明,经过一系列的调整和修改,最终得到了一种较为理想的模型。在测试数据上,该模型取得了良好的预测效果,且其预测精度也达到了预期的水平。此外,该模型还能够很好地适应不同的设备类型,具有较强的泛化能力,煤矿机械设备基本情况鉴定具体见表3。

表3 煤矿机械设备基本情况鉴定

设备名称和规格型号:表3 列出了采煤机、刮板输送机和液压支架3 种煤矿机械设备的设备名称和规格型号。这些信息可作为特征输入XGBoost 模型。

制造商:表3 提供了设备制造商的信息,即山东鑫煤矿设备有限公司。制造商可能与设备的质量和性能有关,可作为特征之一。

投入使用日期:表3 给出了设备投入使用的日期,即1997 年9 月17 日。设备投入使用的日期可能与设备的状况和寿命有关,可作为特征之一。

安装方法和附件:该表给出了设备的安装方法和附件,即已安装和已完成。安装方法和附件的完整性可能与设备的正常运行和维护有关,可作为特征之一。

物理状态:表中给出了设备的物理状态,即采煤机和刮板输送机的物理状态为58,液压支架的物理状态为53。物理状态可作为设备的评估指标,并可作为培训和预测的监测目标和标签。

将表3 中的设备名称、规格型号、制造厂家、投入使用日期、安装方式、附件和实体状态等信息作为特征,使用XGBoost 模型进行煤矿机械设备状态的监测和预测。通过训练模型,可以根据设备的基本情况来预测设备的状态,从而实现对设备状态的实时监控和预警。提前发现设备的故障和异常,从而进行及时的维修和保养,提高设备的可靠性和安全性。

4 结 语

在对煤炭开采过程中的设备进行实时监测时需要使用到XGBoost 算法来实现数据采集和处理工作。通过该种方式能够有效地提升煤矿生产作业的安全性、稳定性以及效率。但是由于目前XGBoost 算法还存在着一定不足之处,因此要进一步完善其应用效果,使得其能充分发挥出其优势,从而为后续的研究提供更多帮助。

猜你喜欢

机械设备煤矿状态
机电机械设备安装中的安全隐患及其处理对策
广州钰铂机械设备制造有限公司
广州钰铂机械设备制造有限公司
状态联想
生命的另一种状态
大型煤矿自动化控制系统的设计与应用
做好机械设备维护与保养的措施
坚持是成功前的状态
上半年确定关闭煤矿名单513处
去年95.6%煤矿实现“零死亡”