基于IGWO-BPNN的露天矿卡车故障预测方法
2023-12-26张津鹏刘光伟郭直清郭伟强
张津鹏,李 林,刘光伟,郭直清,郭伟强
(1.国能宝日希勒能源有限公司,内蒙古 呼伦贝尔 021000;2.辽宁工程技术大学 矿业学院,辽宁 阜新 123000)
半连续开采工艺作为当前我国露天煤矿中常采用的一种作业方式,因其单位能耗少、能量消耗低、设备定员少等优点被公认为是“最有生命力”的露天开采工艺[1,2]。而露天矿卡车作为露天矿半连续开采工艺系统中的重要组成部分之一,卡车的有效利用直接影响了企业的经济效益和生产效率[3]。但在实际露天矿生产过程中,由于外部环境、人员等多方面因素的影响,露天矿卡车的故障十分频繁,维修费用极高,几乎占据了整个生产成本的30%~50%[4,5],同时卡车的突然故障还易导致安全事故的发生[6]。因此,提前预知露天矿卡车故障情况并基于此制定合理有效的维修管理方案对实现安全智慧矿山具有十分重要的现实意义和经济意义。
针对露天矿卡车的事前维修和故障预测问题,胡明振等[7]运用数理统计回归分析等方法综合分析某露天矿电动轮汽车的维修成本数据,建立了露天矿电动轮汽车运行效率和维修成本模型,成功实现了对露天矿电动轮汽车寿命的有效预测;白润才等[8]通过分析露天矿卡车的故障时序数据,建立了一种基于小波分析与自回归滑动平均模型的露天矿车故障率预测方法,实现了对露天矿卡车故障率的有效预测;刘威等[3]建立了基于MCMC的露天矿典型设备预测方法,预测了露天矿典型设备的发生时间和故障类别,揭示了露天矿典型设备的故障规律;PERALTA[9]和ANGELES[10]等通过分析露天矿卡车的历史故障数据,分别提出了相对应的可靠性数学模型,对实现和制定露天矿卡车的维修计划起到了关键作用。
本文以神华宝日希勒露天煤矿的TR100类型卡车维修数据为研究目标,提出了基于改进灰狼优化算法的BP神经网络(BP neural network,BPNN)模型,并将其用于预测TR100类型卡车故障情况,突破了传统以经验式为主的卡车故障类型分析方式,成功实现了以数据为驱动的露天矿卡车故障分析预测新方法。
1 灰狼优化算法(GWO)
灰狼优化算法[11,12](GWO)作为一种典型的受生物启发的仿生智能优化算法,其数学模型主要来源于对自然界中灰狼群等级制度和捕食狩猎行为的模拟。假设灰狼种群数为N,第i只灰狼的位置为Xi,α狼所在位置为群体最优解,β狼所在位置为第二最优解,δ狼所在位置为第三最优解,则根据灰狼群捕食狩猎行为,灰狼优化算法可分为三个部分。
1)算法迭代中前期—迭代搜索过程:
D=|CXP(t)-X(t)|
(1)
Dα=|C1Xα-X|
(2)
Dβ=|C2Xβ-X|
(3)
Dδ=|C3Xδ-X|
(4)
式中,t为当前的迭代次数;D为灰狼与猎物两者之间的距离;P为猎物;XP(t)为第t次迭代时猎物所在的位置;X(t)为灰狼个体所在位置;Dα、Dβ和Dδ分别为α狼、β狼和δ狼与ω狼间的距离;Xα、Xβ、Xδ和X分别为α狼、β狼、δ狼和ω狼所在位置;C为控制算法收敛性能的关键参数之一,表示为:
C=C1=C2=C3=2r2
(5)
式中,r2为[0,1]间的随机数。
2)算法迭代中后期—迭代包围过程:
X(t+1)=XP(t)-AD
(6)
X1=Xα-A1(Dα)
(7)
X2=Xβ-A2(Dβ)
(8)
X3=Xδ-A3(Dδ)
(9)
A=A1=A2=A3=2ar1-a
(10)
式中,X1、X2和X3分别为α狼、β狼和δ狼在第t次迭代更新时的最佳位置;A为控制算法收敛性能的另一关键参数;r1为[0,1]间的随机数;a为算法收敛因子,其取值范围随迭代次数由2线性递减到0;t为当前迭代次数;tmax为最大迭代次数。
3)算法迭代终止条件—迭代更新方程:
式中,X1、X2和X3分别为α狼、β狼和δ狼在第t次迭代更新时的最佳位置;X(t+1)表示灰狼群中第t+1次迭代时的种群个体位置;当第t+1次和第t次迭代时种群内个体不发生明显变化时,算法迭代终止,即认为算法找寻到当前搜索空间中的最优值。
2 融合多策略的改进灰狼优化算法
2.1 基于Circle映射的种群初始化
对智能优化算法来说,初始群体在解空间中的分布越均匀,算法最终逃逸极值取得全局最优值的概率越大[13]。当灰狼优化算法产生的初始灰狼群在搜索空间中的分布越均匀,那么灰狼搜索捕获猎物的概率越大,即求解全局最优值的概率越大。与传统随机搜索策略生成初始种群相比,混沌搜索策略生成初始种群能更好的覆盖搜索空间,能保证初始群体在搜索空间的分布性[13]。因此,本文引入混沌映射对灰狼群进行初始化。然而由于不同混沌映射生成的初始群体对算法性能有影响。故本文对随机搜索、Gauss映射、Tent映射和Circle映射进行对比分析,选择更优的策略来生成初始灰狼群,以保证灰狼群在初始解空间中的均匀分布性。综上,得到四种初始种群生成策略的映射值如图1所示。
图1 四种策略生成的映射值
图1(a)—(d)代表使用随机搜索、Gauss映射、Tent映射和Circle映射在1000次下生成的映射值。由图1可知,随机搜索、Gauss映射和Tent映射生成的函数值未有效覆盖整个解空间,易导致生成的初始种群多样性不足,进而使得算法在搜索过程中陷入局部极值。而对于Circle映射来说(图2(d)),其映射值在解空间中的分布更均匀,各映射值间不存在重叠现象,故由Circle映射生成的初始灰狼群效果更佳。综上,本文采用Circle混沌策略生成初始灰狼种群,表示为:
图2 原始参数a的函数值
式中,mod为取余函数;C(t)和C(t+1)分别代表第t次和第t+1次的Circle混沌迭代值;初始值C(0)为0到1间的随机数。
2.2 控制参数的非线性更新机制
在GWO中,参数A是保证算法收敛性能的重要参数,而a的取值是决定参数A的唯一参数。因此,参数a对GWO的寻优性能十分重要。参数a在迭代过程中的函数值如图2所示。
由图2可知,在GWO中,参数a随算法迭代依次由2线性递减到0。这表明随算法迭代的进行,参数a对算法性能影响呈现线性趋势,这与自然界中的灰狼捕食行为不符。在自然界中,灰狼群在追捕猎物过程中,狼群和猎物的体力都会发生下降,这种下降趋势应该呈现非线性下降趋势。因此,为模拟自然界中的灰狼群速度下降过程及更好提升算法收敛性能,参数a被修正为:
式中,t表示当前的迭代次数;tmax为最大迭代次数。为保证生成的参数a的取值范围在0到1之间,式(14)被修正为:
式中,min(a)和max(a)分别为在1000次迭代过程中利用式(14)生成的参数a的最小值和最大值。根据式(14)和式(15)绘制出更新后的参数a的图像如图3所示。
图3 修正参数a函数值
由图3可知,在迭代前期,参数a先由0非线性增长到1,模拟灰狼群体力充足时追踪搜索并包围猎物过程。在迭代后期,参数a从1呈现非线性递减趋势,模拟后期灰狼群体力下降但快速捕获猎物的过程。同时参数a在迭代前期数值呈现非线性增加是为了增大算法在解空间中的搜索步长,增强算法逃逸局部极值的能力;而在迭代后期呈现非线性递减是为了加快算法的局部收敛性;当算法进入全局最优邻域而未寻到全局最优点时,参数a非线性递减可有效加快算法收敛速度。因此,对比图2和图3可知,修正后的参数a不仅可以增强算法全局勘探能力,而且还能加快算法局部开发性能。
2.3 基于线性插值的种群更新方式
在自然界中,灰狼群虽然是由α狼领导其余灰狼对猎物进行追踪搜索,但各等级间的灰狼存在着相互交流,用于实时共享每个个体信息。但在GWO中,由式(12)可知,在最后的灰狼种群更新时,各等级间的灰狼权重一致,表明各等级间的灰狼没有交互过程。因此,为更好模拟灰狼群体间的个体交互过程,受线性插值启发,得到新的更新公式为:
式中,由于β狼是作为中间等级的狼负责联系更低等级和更高等级的狼群,故在新的种群更新公式中,β狼占据交流的主导地位。
综上,将三种改进策略相互融合并作用于GWO中即可得到改进的灰狼优化算法,如图4所示。
图4 改进灰狼优化算法流程
3 露天矿卡车故障预测方法研究
3.1 基于IGWO的BP神经网络优化方法
传统BP神经网络通过反向传播算法和梯度下降法调整网络权值和阈值,从而对网络训练结果和测试结果进行误差修正,直到输出值与理论值满足约束条件时完成任务[13]。而露天矿中卡车发生故障的数据集为非线性的非结构化数据,这导致传统以梯度下降法来修正网络权值和阈值的方法不再适用。
因此,为避免因非结构化数据带来的梯度爆炸问题,本文将改进灰狼优化算法(Improved Gray Wolf Optimizer,IGWO)引入到BP神经网络的权值和阈值搜索中,提出了一种基于IGWO的BP神经网络优化方法用于预测卡车故障问题。
假设BP神经网络结构为Net(Ω,Φ),其中Ω∈[ωmin,ωmax]为BP神经网络的权值空间;Φ∈[θmin,θmax]为BP神经网络的阈值空间。则本文优化的BP神经网络表示为:
minNet{Ω,Φ}
(17)
但在BP神经网络中,网络权值和阈值的好坏实质上是通过优化最小误差来确定的,也即是用最小均方误差来衡量每次网络结构的好坏程度从而筛选出最优的权值和阈值空间。因此,基于IGWO-BPNN模型优化的目标应为:
假定IGWO中的每个灰狼个体都对应一个BP神经网络结构,则最优网络结构的搜索即是对式(18)的优化求解过程。假设IGWO算法的初始种群个数为N,最大迭代次数为tmax,上下边界分别为ub和lb,则IGWO-BPNN的实现流程如图5所示。
图5 IGWO优化BP神经网络流程
3.2 工程应用实例
宝日希勒露天煤矿位于内蒙古呼伦贝尔市,其露天煤矿的开采面积达43.7 km2,地质储量为15.73亿t,可采的煤矿储量达13.28亿t[14]。据2020年有关数据统计,在宝日希勒露天矿山上同时工作的100~220 t的电动轮自卸卡车超过了60台,同时还有外委土方施工单位不同型号的采装和运输设备超过了500台[14]。
3.2.1 实验数据说明
1)原始数据来源及采集。从神华宝日希勒能源有限公司露天煤矿的设备维修管理系统提取了30多辆卡车的维修数据,其中卡车类型主要以TR100型、108型和220型为主,采集的时间维度为2010年1月1日到2013年12月31日,共采集原始卡车故障数据超过5万条,其中包括空值数据、重复数据及各种混乱不符合常识的数据。
2)原始数据的简单预处理。因原始数据中包含各种有噪声的数据,故在对卡车数据进行分析预测前需要先对原始数据进行简单预处理,即:平滑法填补缺失值,去除重复值及不合常理数据,得到简单预处理后的卡车故障数据见表1。
表1 简单预处理后的卡车故障数据
3)数据预处理与整合。由表1可知,简单预处理后的卡车故障数据仍存在日期与车型混乱、故障持续时间不清晰等情况,而若要精准分析卡车故障情况,应针对某一类型卡车在某一段时间内的具体情况进行分析。本文以TR100类型卡车为主进行研究。同时为更好的对卡车故障数据进行分析,对表1数据再次进行预处理和整合,具体过程如下:①时序排列,为更好分析卡车发生故障与卡车运行时间的联系,将采集的数据按照时间顺序依次排列;②计算故障持续时间。根据卡车进厂维修和出厂工作的时间计算其故障持续时间;③故障分类,卡车故障持续时间的长短直接影响到了矿区内正常工作质量,当卡车故障时间越长,现场正常工作的卡车数量就越少。因此,根据卡车故障时间长短划分故障类型对后续制定生产计划有着重要意义。本文采取论文[3]的故障划分规则见表2。
表2 卡车故障分类
综上,得到预处理好的卡车故障数据见表3。
表3 预处理后的卡车故障数据
3.2.2 实验结果及分析
因不同类型卡车设备软硬件老化程度不同会导致故障情况不一致,故在研究预测时需以同一类型卡车为例进行研究。
1)卡车发生故障次数预测研究。以TR100类型卡车为例,因卡车发生故障次数为离散型整数变量,故基于IGWO-BPNN模型的卡车发生故障次数预测研究是一个预测问题。同时因本文根据卡车故障持续时间对卡车故障类型进行了分类,故对TR100类型卡车发生故障的次数预测应分为卡车整体发生故障的次数预测和不同故障类型卡车发生故障的次数预测。针对于此,本文对预处理后的数据再次进行整合,得到以月份为基础的数据进行模型预测。
对TR100类型卡车发生故障的次数研究分为两部分。①对整体TR100类型卡车的故障数据进行预测,用于研究TR100类型卡车整体故障情况;②对TR100类型卡车每一类故障数据分别进行预测,用于研究TR100类型卡车每一类型故障情况。同时为验证IGWO-BPNN模型具有更好的性能,将BP神经网络模型(BPNN)和基于GWO的BP神经网络模型(GWO-BPNN)作为对比算法。
以数据集中的前三年数据作为训练集,最后一年数据为测试集;分别利用BPNN、GWO-BPNN及IGWO-BPNN对TR100型卡车2010年1月—2013年12月发生故障的次数进行预测,得到实验结果如图6所示。(注:为更好的分析TR100类型卡车故障情况,图中卡车发生故障总次数预测结果并非5类故障的加和,而是单独的模型预测结果)。由图6可知,在同一实验环境中,相较于BP神经网络模型和GWO-BPNN模型,IGWO-BPNN模型预测得到的结果更接近于真实的TR100类型卡车的发生故障次数。
图6 不同算法的TR100类型卡车发生故障次数预测结果
为更清晰的对比三种模型的预测性能,得到其预测结果数值见表4(受篇幅所限,仅展示2013年1月份和2月份的数据)。在表4中,加粗字体表示与真实卡车发生故障次数最接近的预测值,GBPN代表GWO-BPNN,IGBPN代表IGWO-BPNN。由表4可知,整体而言,IGWO-BPNN具有最好的性能。结合图6可知,对于TR100类型卡车而言,无论是从故障发生总次数还是5类故障发生次数的预测结果来说,在同一实验环境下,本文提出的IGWO-BPNN具有更好的预测性能。
表4 不同算法TR100类型卡车故障次数预测结果
2)卡车故障持续时间(故障类型)预测。因每辆卡车的故障持续时间都不一致,故为更合理分析卡车故障情况,以1#、10#和20#三辆卡车为例进行分析。由于对卡车故障持续时间进行了分类,故基于IGWO-BPNN的卡车故障持续时间预测研究是一个多分类问题。
与基于IGWO-BPNN的预测模型一样,基于IGWO-BPNN的分类模型本质上也是寻找BP神经网络的最优权值和阈值。为使提出的算法适用于分类问题,需将连续空间的值映射到二元空间,其主要方法为当适应度值大于0.5时取1,小于等于0.5时取0。
利用基于IGWO-BPNN模型对三辆卡车2010年1月—2013年12月的故障类型进行分类预测,得到其故障类型分类结果如图7所示。
图7 各算法对3辆卡车发生故障类型的分类精度
由图7可知,利用三种方法分别对3辆TR100卡车故障情况进行研究时,IGWO-BPNN模型的分类精度高于其余两种方法,验证了本文提出的方法具有更好的分类性能。
综上所述,针对TR100类型卡车的故障情况,IGWO-BPNN不仅能很好地对每个月卡车发生故障类型进行有效分类,而且还能有效预测出卡车每月具体发生故障的次数。
4 结 论
1)本文针对传统灰狼优化算法在寻优能力上的不足,通过引入Circle映射,非线性收敛因子和线性插值理论,提出了改进的灰狼优化算法(IGWO)。然后再将该算法引入到BP神经网络的权值和阈值优化中,提出了一种(IGWO-BPNN)模型。
2)以神华宝日希勒露天煤矿提取的TR100类型卡车维修数据为研究目标,通过大量的数据预处理分析过程,基于提出的IGWO-BPNN模型对TR100类型卡车故障情况进行了有效预测,实验结果可为卡车维修管理计划安排以及智慧矿山建设提供基础数据支撑。