人工智能技术在工业设备预测性维护中的应用
2022-11-12牛冲丽卢凯杰
牛冲丽 卢凯杰
(1.广东省电信规划设计院有限公司 广东省广州市 510000)
(2.广东工业大学 广东省信息物理融合重点实验室 广东省广州市 510006)
1 人工智能在工业设备预测性维护中的发展
在现代化、工业化社会发展趋势下,为满足生产力的发展,工业设备的应用和需求迎来了爆发式增长。为避免工业设备突发故障导致出现重大生产事故的问题,工程人员需对设备制定有效的维护计划[1]。工业设备的预测性维护是提高制造业竞争力的一个关键因素,因为维护的效率对生产的产品或提供的服务的成本、期限和质量等方面有直接影响。在这一大背景下,运行和维护这两个领域必须同时进行升级,以保证人力和物力资源的可用性和对运行问题的快速响应,从而确保在最大化可用资源的情况下实现目标。
在工业4.0的背景下,可以通过使用高级信息技术和先进的工业互联网设备,来提高工业和生产过程中的自动化和数字化水平。这种技术发展的关键点之一是收集与设备运维相关的高质量数据,现在机器和人类之间的数据读取、数据处理、数据存储、数据分析和数据共享更容易实现。随着传感器和通信成本的下降和传感器、数据传输和存储设备可靠性的提高,工业设备状态监测系统的升级换代步伐正在加速。同时,物联网允许实时传输由不同监控设备捕获的系统状况的有关信息。这一进步为在预测性维护中智能地使用状态监测数据提供了一个很好的机会,同时可以将收集数据的能力与对数据高效整合分析的能力相结合[2]。
从这个意义上说,人工智能技术,更具体地说是机器学习,使我们能够以提高系统可用性、降低维护成本、提高运营性能和安全性以及提高对实施维护干预的理想时间和理想操作的决策能力。人工智能是模拟和扩展人类智能的理论、技术和方法,并开发相应应用系统的前沿科学技术。把部分人类的智能操作通过机器来实现,以取代人类原有的识别、决策、认知、分类等诸多功能,人工智能技术以数据分析为主,机器学习算法直接从数据中学习信息,而不使用预定义的公式作为模型[3]。机器学习技术正被越来越多的研究人员用于设备的运维管理研究中。
机器学习项目必须始终从建立严格而清晰的目标定义开始,因为系统只能完成非常具体的任务,设置模糊的目标可能意味着开发的模型无法准确预测它的意图。机器学习项目最重要的部分是理解所使用数据以及它与我们想要解决的任务的关系。随机选择一个算法、使用我们可用的数据集并期望得到好的结果是无效的。在开始构建模型之前,有必要了解数据集中发生了什么。机器学习算法和方法只是解决特定问题的复杂过程中的一部分,记住这一点很重要。有时,很多时间都花在构建复杂的机器学习解决方案上,但最终却发现它们并没有解决待处理的问题。而且执着于深入机器学习的技术方面,很容易忽视最终目标。在构建机器学习模型时,记住所有明确或隐含的假设是很重要的。
2 机器学习在工业设备预测性维护中的具体实施流程
机器学习在工业设备预测性维护中的具体实施流程图如图1所示。首先,用于工业设备预测性维护任务的数据必须是真实且合理的。然后,这个机器学习应用程序的目标需要是严格而明确的,通常为故障诊断或者预测任务。随后,通过数据预处理和特征工程对数据集进行处理,创建新特征以从模型中寻求更好的性能。解决机器学习问题的关键是数据集的使用。明智地选择使用哪些数据以及如何处理这些数据对于提高算法的性能至关重要。特征工程是机器学习项目的关键,而且通常测量的信号不适合学习过程,因此有必要从这些信号中构建特征。
图1:机器学习具体实施流程图
然后,将数据集划分为训练、验证和测试子集,并进行机器学习模型的首次应用,对各种算法进行训练和评估。算法的训练过程在训练子集中进行,验证子集提供了对模型与训练数据的拟合度的公正评估,同时微调模型及其超参数以寻求更好的性能。最后,测试集用于获得模型性能的估计,模拟其未来数据的行为。
2.1 确定目标
如前所述,机器学习项目首先要做的是建立严格明确的目标。以工业设备的预测性维护为例,使用的模型的主要目标是预测在定义的时间窗口内设备发生故障的概率[4]。
然后,鉴于已经设定了一个特定且明确的目标,可以就机器学习本身提出更具体的问题:
(1)为了实现预定的故障诊断或者预测任务,应该选择有无监督的、监督的还是强化学习模型,或者可能是这些模型的组合?
(2)监督学习、分类还是回归?
(3)模型是否打算在获得新数据后立即进行训练(批量学习或在线学习)?
在分析了问题并牢记所提出的目标之后,由于工业设备的预测性维护可以转化为多分类问题,因此通常选择监督学习。鉴于问题的范围和数据的性质,模型在获得新数据时立即进行训练不是必须的。因此,在实际生产中,通常面临着批量学习的问题。
2.2 数据预处理和特征工程
在机器学习驱动的预测性维护研究中,数据预处理和特征工程通常没有明确的界限。数据预处理是从数据中检测、更正或删除不准确或不可用记录的过程。目的是使数据适应模型并满足模型的要求。数据预处理通常涉及数据规范化、缺失值处理和非数字标签处理。特征是模型的属性。特征工程的目的是提高机器学习算法的预测能力,从可用数据中创建新特征。通常,先进行特征工程,再进行特征选择,消除不相关或冗余的特征。工业设备的数据集通常由多个传感器和信息源收集形成,并应用于预测模型。在工业数据集的收集过程中通常会有干扰(例如噪声),使预测任务更加困难。
通过数据在时间窗口中聚合这种方式,使数据更加“平滑”,最大限度地减少噪声对模型使用的特征的影响[5]。考虑到模型应该能够预测到未来发生的故障。因此,需要开发出能够预测给定目标时间窗口中的故障的分类器、例如,故障可能在大约两周内发生。对于每条数据记录,都会创建一个维度为N的时间窗口,并对该记录的日期/时间之前的时间段N计算滞后特征。N的值通常以分钟或小时为单位,具体取决于所收集数据的长度以及所需达到的精度。文献[6]指出在某些特定应用中,通过减小目标窗口的宽度来提高精度是合理的,然而这通常是不合适的,因为它可能阻止用户及时获得警报,从而丧失预测性维护的机会。模型性能的下降也可能因为过短的窗口。为了增强预测建模对预测的适用性和有效性,杨春生等人[4]改进了现有方法,提出了一种新的两阶段分类器的分类方法,该方法可以在不影响足够宽的预警目标窗口灵活性的情况下提高故障时间估计的精度。
通常,并不是所有的数据都可以被直接识别为期望的输入[7]。因此,在分类步骤之前,探索合适的原始采集数据预处理方法势在必行。基于数据驱动的方法通常结合信号分析方法来提取特征,信号分析方法可分为三类:时间范围、频率范围和时频范围。时域分析技术可以从原始信号中提取缺陷特征,如均方根、偏度、峰度、脉冲因子等。快速傅立叶变换(FFT)用于将时域信号转换为频域信号。与时域方法相比,频域分析技术可以观察到一些重要的频率特性信息,而这些信息对噪声和干扰不敏感。近年来许多学者在这方面取得了成果。Xu等人[11]为了降低噪声对轴承振动信号的影响,提出了一种基于小波包变换和支持向量机的智能轴承故障诊断方法。结果表明,信号去噪后的振动特性好于未去噪前的振动特性,对各种故障的诊断率超过92%。实际应用表明,该方法不仅可以大大提高轴承故障诊断的准确性和效率,而且可以有效地诊断其他复杂故障。Zou等人[12]针对构成训练样本的信号,较短的信号会降低频率分辨率,即频率信息的利用率不足,较长的信号会增加训练样本的维数和模型训练的复杂性的问题,提出了一种移动最大值法,由于频谱上的峰值可能更好地代表故障,该方法通过移动滑动窗口,选取每个滑动窗口内频谱的峰值,来提取训练样本。通过实验表明,使用移动最大值法获取的训练样本可以在不增加样本维数的情况下可以有效地提高样本抗噪声性能。
需要注意的是,基于维护数据的特征创建不像以前的情况那样线性。这种特定于案例的特征工程在预测性维护中非常常见,其中领域知识和经验在理解和创建相关特征方面起着至关重要的作用。在获得与故障相关的特征后,才可以建立准确的模型,为运维决策提供有力支持。
2.3 模型训练与应用
数据划分:在处理相关的日期和时间数据时,必须仔细划分训练集、验证集和测试集,以确保获得的评估符合预期的实际性能模型,因为数据之间存在固有的时间相关性(时间接近的数据之间的高度相似性)。在预测性维护问题中,在大多数情况下,最好的选择是基于时间进行划分,即选择一个时间点,使用此点之前的所有记录来训练模型,并使用剩下记录来验证模型。这种方法还允许在实践中模拟模型的真实行为。
模型在验证集中的应用:使用验证集来了解各种模型的行为方式,以及寻找某些模型的超参数的调整。因为不可能在一开始就确定哪种算法最适合给定问题。在早期阶段训练和评估各种模型时,可以看到哪些模型具有最大的潜力,但是,要使此步骤成功,就必须根据既定目标选择评估模型的指标。
模型在测试集中的应用:检查模型在测试集中的性能很重要。通常,测试集中评估指标的性能会普遍下降。如前所述,在预测性维护中,作为一般规则,最重要的是模型能够预测的实际故障的数量,即模型的召回率的值。这个参数十分重要,因为假阴性的后果超过了假阳性的后果,即模型不能预测真正故障的后果远大于对故障预测错误的后果。
在实际应用中,可能会了解预测性维护的工业设备的更多信息(例如成本、过程中的重要性、设备中的位置、更换的难易程度),分析可能涉及尝试优化被认为具有更大相关性的某些指标。
2.4 深度学习在工业设备预测性维护中的运用
深度学习是机器学习中的一种新方法。它最初用于计算机视觉、语音、图像识别和自然语言处理。近年来,越来越多的研究将深度学习方法应用于健康监测,出现了许多深度学习故障诊断技术。传统机器学习方法在分析先验知识较少的复杂故障时仍然不理想。由于性能和泛化能力较差,它们在表示复杂函数方面也存在困难。这些事实表明了传统机器学习方法的局限性,促使人们探索如何通过深度网络来提取特征并表示复杂的函数。深度学习为分析这些机械大数据提供了非常有效的方法且不需要专业的领域知识和专家经验来创建特征[8]。
深度学习在工业设备预测性维护中的具体实施流程与机器学习相似,但在深度学习方法中,故障特征提取和分类器结合在一起,具有一定的泛化能力。通过深度学习的自动特征学习,对于工业设备运维中所产生的时序数据进行特征提取,可有效识别到与故障相关联的隐性特征。通过反向传播算法对模型进行梯度更新,从而实现模型的优化,实现更强的故障诊断或预测效果。深度学习方法是一种多层模型,与浅层诊断方法相比,它可以充分避免维度的畸变和诊断能力的不足等问题[9]。但相比于传统的浅层机器学习算法,深度学习在调参方面需要更多的投入,对模型层数,激活函数和损失函数等参数进行调整,从而获得更好的性能。
3 类不平衡问题和评价指标的选取
在预测性维护中需要考虑的一点是,与正常运行相比,在给定机器的生命周期中,故障的发生很少见。这会导致故障数据的样本量远低于正常数据的样本量,夹具了不同类之间的不平衡.这通常会导致算法出现虚假的表现,这些算法倾向于以牺牲不太常见的标签为代价来更频繁地对最常见的示例进行分类,以此达到不正确的分类变得更少的目的。在评价指标中表现为尽管准确率很高但召回率和精度可能很低。因此,有必要查看其他评估指标。在许多关键设备的应用中,模型无法预测故障的代价可能会非常昂贵。在预测性维护中,作为一般规则,最重要的是模型能够预测的真实故障的数量,即模型的召回率。这个参数变得更加重要,因为模型不能预测真正故障的后果远大于对故障预测错误的后果。这种现象被称为“错误分类成本”,企业可以根据维修成本、零件成本和人工成本进行估算。通常,模型出错作为预防措施是更可取的,因为执行维护检查比部分或全部中断操作更经济。但是,对故障的错误预测(即误报),也会导致设备工作时间和资源的损失。在这一方面,必须让模型克服样本不平衡问题,实现更加高精度的诊断。但是,如前所述,召回率和精度指标不是独立的:一个指标的增加通常意味着另一个指标的减少。因此,有必要仔细衡量。
一般来说,有三种解决类失衡的方法,即基于数据扩展的方法、基于迁移学习的方法和基于模型的方法。这三种方法的目的是以不同的方式解决小样本问题。数据扩展和迁移学习方法都试图扩展数据量。然而,区别在于基于数据扩充的方法可以充分利用合成数据,而基于迁移学习的策略使用来自其他领域的数据。最后一种称为基于模型的策略,试图简化神经网络,如紧凑模型构建算法。在这三钟策略中,生成对抗网络是应用最广泛的技术。如李伟等人[10]在把数据输入模型训练之前,先使用改进的辅助分类器生成对抗网络生成故障数据,先扩充数据样本,再把扩充后的数据集输入神经网络进行模型训练以预测故障状态。赵博等人[11]则在迁移学习领域提出了一种带注意力的深度多尺度对抗网络(MSANA)用于机械故障诊断。
4 总结与展望
本文介绍了人工智能技术在工业设备预测性维护中的发展及应用、人工智能技术在工业设备的预测性维护中的具体实施流程以及实施过程中注意的相关问题。现代工业设备结构复杂,各环节相互关联,基于物理模型的方法,可能表现不佳,因为系统内的相互作用经常以非常复杂的方式发生,并且不能容易地被物理模型捕获,而数据驱动的方法试图从经验数据中获取隐藏的知识,推断当前设备健康状态,并预测其剩余使用寿命。故在工业设备的预测性维护开始流行基于数据驱动的方法。基于数据驱动方法主要使用机器学习技术,而传统的基于数据驱动方法,如支持向量回归、人工神经网络和随机森林,主要包含两个步骤:手动特征设计和退化行为学习。这些方法需要太多的人工干预,并且需要专业的领域知识来提取特征,这意味的低效率和高劳动力成本。近些年,随着机器学习中深度学习的发展,数据驱动方法可以通过直接从原始监测数据中学习退化信息来有效减少人为干预。深度学习方法如卷积神经网络,深度神经网络,深度信念网络,深度自动编码器,递归神经网络,可以自动进行特征工程,内部表示的学习和原始数据的特征向量的创建,而不需要人工干预,从而减轻对领域专家的需求。
上述深度学习方法虽然在工业设备的预测性维护中显示出其强大的能力。然而,在工业领域中时常面临着由于故障数据不足导致的类样本不平衡问题,深度学习方法难以解决。 在未来的工作中,可以尝试从迁移学习和数据扩充方面深入研究以解决此问题。