大数据环境下离散制造车间异常事件发现方法
2017-09-23徐迭石张淑丽刘胜辉
马 超 徐迭石 张淑丽 刘胜辉
(哈尔滨理工大学软件学院 黑龙江 哈尔滨 150080)
大数据环境下离散制造车间异常事件发现方法
马 超 徐迭石 张淑丽 刘胜辉
(哈尔滨理工大学软件学院 黑龙江 哈尔滨 150080)
针对大数据环境下离散制造企业车间生产过程中生产异常难以有效管控的问题,先从理论上研究建立车间异常事件预警模型的合理性和实用性。然后从技术实现角度给出异常触发事件的数据来源及其计算方法。接着综合时间序列和因果关系两个维度,建立基于时序序列上多决策树的车间异常事件预警模型,保证了预测结果的准确性和可靠性。最后采用某型号燃气轮机转子的生产过程数据验证模型的有效性。
异常事件发现 时间序列 决策树 预警
0 引 言
随着物联网、云计算、大数据等新一代信息技术与制造业的逐步融合,传统的制造执行系统MES已开始向云制造执行系统转化,为企业提供按需使用的、质量可控的、高满意度、低成本的制造全生命周期服务[1]。毋庸置疑,云环境下的制造生产过程将产生海量的车间生产数据,而车间生产数据的不断增长使得人们更注重对数据的分析和挖掘。由此可见,大数据环境作为MES变革的契机,为MES发展提供了全新的思路。
在离散制造企业的车间生产过程中,不可避免地会出现各类车间生产异常(例如,物料未能按时送达、设备故障、工件工序拖期等),这不仅会对在制品的质量造成影响,甚至会影响订单的按期交付[2]。一旦无法及时发现并处理车间生产异常,将直接影响车间生产流程的正常运行,甚至产生大量直接经济损失。因此,对离散制造企业车间生产过程中的生产异常进行有效预警,将有助于生产异常的处理与规避。高效的系统化车间生产异常预警方案缺失已成为当今制造型企业亟待解决的重要问题之一。
目前,针对制造车间中生产异常预警问题,一些研究主要关注如何实现高效的生产异常预警方法。例如,文献[3]将灰色理论与BP神经网络相结合,建立了工序质量(即工序的轴径尺寸)预测模型。文献[4]将遗传算法与BP神经网络相结合,建立了物料质量损失预警模型(例如,直接经济损失、质量问题处理成本等方面)。文献[5]采用径向基函数神经网络建立了生产异常损失预警模型(例如,产品质量损失、异常事件处理成本等方面)。
文献[6]采用BP神经网络建立了异常事件预警模型,该模型预测了设备故障率、物料短缺率等异常事件所导致的结果的严重程度。文献[7]采用BP神经网络建立了工序工时预测模型,该模型依据零件几何特征、零件材料等工时影响因素来预测工序的加工时间。
在上述预警模型中, 一类是从时间序列上,依据某一属性的历史和当前取值预测该属性在未来取值的变化趋势;另一类是从因果关系上,依据某一属性的影响因素取值预测该属性所属类别。此外,也有一些研究关注如何建立高效的预警系统,从系统实现层面来解决生产异常预警问题。例如,文献[8]针对生产车间普遍面临的因设备、质量、物料、人员等异常事件不能及时反馈和处理而影响生产进度的问题,构建了可支持异常事件预警的车间生产异常事件实时管理系统。
从上述内容可以看出,在当前的研究中尚缺乏解决制造车间中生产异常预警问题的整体技术框架。文献[9]对生产异常的监控、发现和处理这一完整过程进行了初步探索,给出了基于云MES的体系结构解决方案。本文则进一步重点关注生产异常发现阶段中异常事件预警模型方面的研究。通过车间异常事件、异常触发事件、预测提前期等概念的阐述,本文首先论述了车间异常事件预警模型的合理性和实用性。接着给出了异常触发事件相关取值的来源和计算方法,论述了预警模型的可实现性。最后,综合时间序列和因果关系两个角度,建立了基于时序序列上多决策树的车间异常事件预警模型,保证了该模型的准确性和可靠性。
1 大数据环境下云MES的体系结构
云MES是一个从作业计划静态制定,到作业执行情况实时监控与主动感知,再到异常事件智能发现与处理,最后到作业调度动态调节的闭环系统[9]。目前,针对离散制造企业车间生产数据呈现出的多源、海量这一特征,物联网技术常被用来实现对车间生产数据的实时采集与传输[10]。文献[9]采用RFID、传感器、串口通信、无线传感网络等物联网技术实现了云MES中的实时监控与主动感知组件。如图1所示,该组件负责实时监控和主动感知来自SFC的异常信息,并将这些信息统一交由异常信息挖掘与分析组件处理(即对与异常触发事件相关的车间生产数据进行采集与传输)。
图1 云MES的体系结构
异常信息挖掘与分析组件依据异常信息,并利用数据挖掘算法来预测异常事件的发生情况,并将异常事件输入到支持异常处理的智能驱动机制组件。智能驱动机制组件在作业计划与调度组件和算法云服务子平台的支持下,实现对异常事件的处理。从云MES的执行过程中可以看出,异常信息挖掘与分析组件是云MES核心软构件,异常事件发现的准确程度和可靠程度将直接影响云MES的执行效率。因此,有必要进一步研究高效的车间异常事件发现方法。为此,本文后续重点关注离散制造企业中车间异常事件发现问题的定义与求解。
2 车间异常事件发现问题的定义
车间异常事件的发现问题可以描述为预测在不久的将来异常事件是否会发生。在时间序列数据中,通常异常事件不是孤立存在的,在异常事件发生之前,时间序列数据的演变会呈现出一定的规律。具体而言,在时间序列上,会有一组异常触发事件呈现出一定的特征模式。因此,可以通过研究异常事件发生之前,这组异常触发事件在时间序列上的变化情况,发现与异常事件相关的特征模式,进而达到预测异常事件是否会发生的目的。
定义1车间异常事件Ee在MES中,车间异常事件被用来描述订单拖期和产品不合格情况。订单拖期是指加工工件的完成时间超出了订单上要求的需向顾客交付的时间,而产品不合格是指加工工件的质检合格率无法满足制造企业的质检要求,导致无法向顾客进行交付。这两种情况均会给制造企业带来经济损失,因此,需要极力加以避免,即在二者真实发生之前,就需要进行预测并及时进行处理。
定义2预测提前期L,预测往往需要提前一段时间做出,因为在这段时间内车间调度员可以采取相关的处理行动,使得预测结果具有实际意义,称这段时间为预测提前期。预测提前期需要由经验丰富的车间调度员根据具体车间加工情况具体设置。
定义3异常触发事件TEe,指可能导致车间异常事件发生的事件,在MES中,一般指工件加工状态、设备运行状态以及资源使用情况等超出了作业计划的正常范围。在车间的实际加工过程中,车间异常事件的发生一般是多个异常触发事件共同作用的结果。本文依据IEC/ISO 62264 KPI指标[11]以及哈电车间实际生产数据来具体刻画异常触发事件。
定义4异常触发事件模式P(TEe),指在一段时间内,一组异常触发事件在时间序列上呈现出的特征行为,可以依据它来预测异常事件的发生情况。
定义5预测阶段Y,用来发现模式进行预测的时间段。假定从Y时间段中发现某一模式,那么就认为其对应的异常事件发生。
上述关键概念的定义如图2所示。对于车间异常事件的预测是发生在一次工件加工任务过程中的。工件加工过程主要包括加工准备阶段和加工执行阶段。如图2所示,预测提前期L=[tL,t2],tL的取值范围是[t1,t2]。tL越接近t1,预测阶段越短,异常触发事件的时间序列就越短,预测的准确度就越低,但是提前期会更长,车间调度员处理异常情况的时间会更充分,更利于异常事件的避免;而tL越接近t2,预测阶段越长,异常触发事件的时间序列就越长,预测的准确度就越高,但是提前期会变短,车间调度员处理异常情况的时间会变少,避免异常事件的难度变大。因此,在数据挖掘算法中参数tL的合理设置尤为重要。
图2 异常事件预测问题
3 车间异常事件预警模型
为了求解车间异常事件发现问题,本节给出了基于时序序列上多决策树的车间异常事件预警模型。
3.1 异常触发事件的分类与计算
异常触发事件是预警模型的输入,其可细分为两类:加工准备阶段的触发事件PTE和加工执行阶段的触发事件ETE。加工准备阶段的触发事件包括:工艺准备就绪程度pte1、物料准备就绪程度pte2、人员准备就绪程度pte3、设备准备就绪程度pte4,因此,PTE={pte1,pte2,pte3,pte4}。加工执行阶段的触发事件包括:生产员工的技术熟练程度ete1、设备故障程度ete2、工序偏离计划程度ete3、工艺更新程度ete4、车间噪音程度ete5,因此,ETE={ete1,ete2,ete3,ete4,ete5}。
针对准备阶段的4种触发事件,本文统一采用“时间偏离程度”这一概念来度量其准备就绪程度。具体地说“时间偏离”是指实际就绪时间与计划就绪时间的差值。根据差值的大小,可以将“准备就绪程度”划分成5个阶段:好、较好、差、较差、很差(预警模型运算时分别标识为{R1,R2,R3,R4,R5})。而工艺、物料、人员、设备的实际就绪时间可以通过物联网技术(传感器、RFID技术等)实时获取。
针对执行阶段的5种触发事件,本文依据其不同的物理含义,给出相应的计算方法。生产员工的技术熟练程度对是否产生异常事件有很大影响[6]。本文利用“一段时间内员工的平均相对技术熟练程度”来度量生产员工的技术熟练程度ete1,具体公式如下:
(1)
式中,N表示在时间段P内,此次车间加工任务中的员工总数;Tmax表示当前车间中员工累计工时的最大值,其对应的员工代表着当前车间中最佳的技术成熟度;Ti(P)表示在进入时间段P时,第i个员工的累计工时。
设备故障程度直接影响着异常事件的产生。本文利用“一段时间内设备故障持续时间总数与加工任务时间总数的比值”来度量设备故障程度ete2,具体表示为:
(2)
式中,M表示在时间段P内,此次车间加工任务中的设备总数;PTi(P)表示在时间段P内,第i台设备的计划加工时间;BTi(P)表示在时间段P内,第i台设备处于故障状态的持续时间,其实际值可以通过传感器技术进行采集。
与设备故障程度类似,工序偏离计划程度也直接影响着异常事件的产生。本文利用“一段时间内工序的实际执行情况与工序的计划执行情况的偏差程度”来度量工序偏离计划程度,具体表示为:
(3)
式中,Q表示在时间段P内,此次车间加工任务中的工序总数;STi(P)表示在时间段P内,第i道工序的实际加工开始时间,PSTi(P)表示第i道工序的计划加工开始时间;类似地,ETi(P)和PSTi(P)分别表示在时间段P内,第i道工序的实际加工结束时间和计划加工结束时间。
工艺更新也在一定程度上会影响异常事件的发生。本文利用“一段时间内更新的工序占工序总数的百分比”来度量工艺更新程度ete4,即ete4=UQ(P)/Q。其中UQ(P)表示在时间段P内,属于更新的工序的总数。
车间噪音会对生产员工的心理和生理造成一定的损害,进而影响车间加工任务的正常进行,导致异常事件的发生。车间噪音的实际值是指在一段时间内车间噪音的平均值。依据噪声等级的5个级差{(0,30],(30,50],(50,80],(80,100],(100,∞]},对车间噪音程度进行了划分,等级反映了车间噪音程度对异常事件产生的影响程度,等级越高,越易于导致异常事件的产生。通过比对车间噪音的实际值隶属于哪一等级的级差,即可获得对应的噪音程度。
3.2 预警模型的建立方法
预警模型的建立需要采用数据挖掘预测方法,而与聚类分析、神经网络等其他数据挖掘分析方法相比,决策树方法在解决分类与预测上有着极强的能力[12]。因此,本文以决策树学习算法(C4.5)[13]作为理论基础构建车间异常事件预警模型。
为了提升车间异常事件预警结果的准确率,本文提出了时间序列上的多决策树预警模型。通过对预测阶段Y内的多个时段内的生产状况进行决策分析处理,每个决策树对应一个生产时段内的异常事件发现处理。通过多决策树预警模型的建立,向车间管理人员提供了一系列具有不同时效价值的预测结果。例如,处于预测阶段早期的决策树的预测精确度相对较低,但为管理人员保证了足够的预测提前期,方便对异常事件进行早期的预防处理。随着生产进度的推移,处于预测阶段末端的决策树的预测精确度相对较高,却由于预测提前期的缩短会产生异常事件处理不及时的情况。因此,通过多决策树预警模型的使用,可以在时间序列的发生路径上有效地提供及时、合适的异常预测建议。最终通过综合多决策树预警模型中的各决策树的预警结果,在恰当的生产时刻得到最为准确的异常事件预测结果。
决策树算法应用的前提是具有大量的训练数据,同时训练数据的属性集必须同时包含条件属性和决策属性。通过3.1节对异常触发事件的分类与计算的相关叙述,可以获得条件属性部分的训练数据。在本文中决策属性对应的概念是车间异常事件,将其值域定义为{11,10,01,00},其中11表示订单拖期且产品不合格,10表示订单拖期但产品合格,01表示订单按期交付但产品不合格,00表示异常事件未发生。这样就获得了决策属性部分的数据,从而为决策树算法准备了完整的训练数据。接下来,就可以快速构建用于预测制造车间异常事件的决策树,并建立时间序列上的多决策树预警模型。时间序列上多决策树预警算法伪代码如下所示:
输入:预测时间段总数N、预测提前期L、车间任务生产过程数据集DS、属性集A
输出:多决策树预警模型MDT
步骤:
1. For (j=1,j≤|DS|, j++)
2. 计算第j项车间任务的预测时间段长度ΔPj=(tj2-tj1-L)/N
3. 初始化预测时间段序列PSj=
4. 依据PSj对DSj进行划分,得到DSj(PSj)={DSj(P0), DSj(Pj1), DSj(Pj2) ,…, DSj(PjN)}
5. For (h=1,h≤|PTE|, h++)
6. CI(pteh)=Search(pteh, DSj(P0))
7. pteh=fpte(CI(pteh))
8. 将pteh填入TS0j
9. End For
10. For (i=1,i≤N, i++)
11. 初始化训练集TSi:填入决策属性dj的取值
12. For (k=1,k≤|ETE|, k++)
13. CI(etek)=Search(etek, DSj(Pji))
14. If (CI(etek) ≠∅) Then
15. etek=fete(CI(etek))
16. Else
17. etek=NULL
18. End If
19. 将etek填入TSij
20. End For
21. TSij= TSij∪TS0j
22. 将TSij插入训练集TSi
23. End For
24. End For
25. For (i=1,i≤N, i++)
26. DTi= DTAlgorithm_C4.5 (A, TSi);
27. End For
28. MDT=g(DT1, DT2, …, DTn)
属性集A=C∪{d},其中,条件属性集C=PTE∪ETE,决策属性d表示车间异常事件。数据集DS中的一条记录DSj描述了一项车间任务的生产过程信息,DSj中不仅含有用于计算条件属性的各类相关指标的取值,还包括决策属性d的取值;|DS|表示数据集DS中车间任务的总数。tj1和tj2分别表示第j项车间任务的加工执行开始时间和加工执行结束时间。
DSj(P0)中含有用于计算加工准备阶段条件属性pte的相关指标的取值。而方法Search(pteh,DSj(P0))的功能是从DSj(P0)中遍历得到与条件属性pteh计算相关的指标取值集合,并存入CI(pteh)。函数fpte用于依据计算指标的取值CI(pteh)计算条件属性pte的取值。
DSj(Pji)中含有在时间段Pi中用于计算加工执行阶段条件属性ete的相关指标的取值。例如,当etek表示条件属性“生产员工的技术成熟度”时,CI(etek)中不仅包含具有最佳技术成熟度的员工在进入时间段Pi时的累计工时Tmax,还包括在时间段Pi中执行车间任务j的全部员工在进入时间段Pi时的累计工时,此时函数fete的计算公式为式(1)。子算法DTAlgorithm_C4.5表示经典的决策树算法C4.5[12]。
预警模型的N个决策树算法针对不同的生产进程发展趋势提供具有不同实效价值的预警结果。但对于N个决策树,越接近tL时刻的决策树,预测准确程度相对越高,因此采用时间加权平均方式来综合n个决策树的预警结果,函数g表示为:
P(ETe)=Max(∑w11,∑w10,∑w01,∑w00)
(4)
式中,∑w11表示n个决策树中预测结果为11的多个决策树的权重之和。其中,第i个时间段对应的决策树的权重计算公式为:
(5)
由此,最大权重对应的预警结果即为当前时段最有可能发生的异常事件,旨在为车间决策人员提供特定生产时刻下的最准确的预警结果。
4 案例验证
本文使用的制造数据来源于哈尔滨电机厂某型号燃气轮机转子生产任务,包括从2010年-2014年间生产的某型号燃气轮机转子的共627组生产加工数据。由于本文篇幅有限,故取其中五个生产任务的第一个加工时段作为示例进行数据展示。设定预测提前期L=621.4天(即预测提前期为生产结束前91.2天),通过分析多决策树预警模型的预测精确度的评估结果,取评估精度峰值时的决策树数量取值N=30。如表1所示。
表1 时段训练数据举例
为了使构建的多决策树预警模型具有更高的实用价值,本文采用SPSS数据统计分析软件分别针对“预测提前期L”和“决策树数量”对“预测精度”产生的影响进行了统计分析。在设置决策树数量初始值为N=20的情况下,分析预测提前期L的变更对预警模型的预测精度影响。分析结果如图3所示。从图3中可以看出,随着预测提前期不断趋近于生产任务结束时间,多决策树预警模型的预测精度呈上升趋势,这与本文阐述的生产预测提前期越短,预测值越精确的结论保持一致。然而过短的预测提前期势必对生产异常的处理产生影响,间接导致预警效果的降低。因此,在权衡两者利弊的基础上,选择预测提前期L=621.4天,该点预测精确达到64.2%且后续发展趋于稳定。与此同时,预警模型中整合的决策树数量也将导致模型预测精度的改变,在设定预测提前期最优的情况下,决策树数量对预测精度的变化影响如图4所示。分析图4可知,预警模型的预测精度在一定范围内随着决策树数量的增加而增加,但决策树数量过大时,预测精度稳定性出现了较大幅度的下降。因此,在实际应用中,可根据不同生产任务的实际状况进行设定,从而保证预警模型在特定的生产环境下提供最恰当的预警信息。
图3 预测提前期L对预测精度的影响趋势图
图4 决策树数量对预测精度的影响趋势图
可以看出,为了分析制造车间生产过程中多源、海量的实时数据,本文以C4.5决策树为理论基础,在不增加决策树算法复杂性的前提下,通过对生产过程在时间序列的分割,减少了单一算法的数据样本容量。与此同时,时间加权的计算方式强化了对预测结果的趋势性分析,采用简单的渐进学习来规避冗余数据特征造成的影响,使预测值更趋近于实测值。同时,本文提出的预测模型在时间维度上将异常事件发现问题映射为多个相互独立的子问题,接着利用时间权值法将它们规约在一起,符合MapReduce映射与规约的思想。在实际的云MES开发中可以基于分布式并行计算框架Hadoop予以实现。
5 结 语
本文针对制造车间生产过程中生产异常的预警问题,首先从系统实现层面给出了综合采用云计算、物联网、大数据分析等技术的制造执行系统的软件体系架构,阐述了在MES中获取生产异常影响因素相关数据的方法。接着给出了车间异常事件、异常触发事件和预测提前期等一系列概念的具体含义,建立了概念化的车间异常事件预警模型。最后,利用时间序列上的多决策树算法建立车间异常预警模型,并将其在哈尔滨电机厂某型号燃气轮机转子生产过程中进行应用验证,表明该车间异常预警模型可以有效地对生产过程中的生产异常进行预警,为车间生产管理者提供预防控制生产异常的决策支持。
[1] 李伯虎,张霖,任磊,等.云制造典型特征、关键技术与应用[J].计算机集成制造系统,2012,18(7):1345-1356.
[2] 张芬,杜朋,杨亚非.离散制造企业MES中的生产数据采集实践[J].机械设计与制造,2011(3):245-247.
[3] 王秋明,刘科成,高慧颖.基于灰色理论与BP神经网络的工序质量预测研究[J].北京理工大学学报,2011,31(2):249-252.
[4] 尹超,甘德文,梁忠权,等.复杂机电产品关键装配工序物料质量损失评估及预警方法[J].计算机集成制造系统,2014,20(6):1432-1441.
[5] 尹超,郭晨,赵旭.微车后桥关键工序生产异常损失评估及预警方法[J].计算机集成制造系统,2014,20(10):2532-2540.
[6] 闪四清,毛中慧,辛腾龙.基于BP神经网络的飞机装配车间异常事件预警[J].装配技术,2014(8):42-47.
[7] 李亚杰,何卫平,董蓉,等.基于制造执行系统数据采集的工时预测与进化[J].计算机集成制造系统,2013,19(11):2810-2817.
[8] 尹超,马春斌,刘飞,等.车间生产异常事件实时管理系统研究[J].计算机集成制造系统,2009,15(4):719-725.
[9] 徐迭石,刘胜辉,马超,等.大数据环境下MES作业计划与调度能力云服务化研究[J].计算机工程与科学,2016,38(4):624-633.
[10] 张映锋,赵曦滨,孙树栋,等.一种基于物联技术的制造执行系统实现方法与关键技术[J].计算机集成制造系统,2012,18(12):2634-2641.
[11] IEC/ISO 62264.Enterprise-control system integration[EB/OL].[2016-11-01].http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=56847.
[12] 栗然,刘宇,黎静华,等.基于改进决策树算法的日特征负荷预测研究[J].中国电机工程学报,2005,25(23):36-41.
[13] Quinlan J R.Induction of Decision Trees[J].Machine Learning,1986,1(1):81-106.
ABNORMALEVENTDISCOVERYMETHODOFDISCRETEMANUFACTUREWORKSHOPINBIGDATA
Ma Chao Xu Dieshi Zhang Shuli Liu Shenghui
(SchoolofSoftware,HarbinUniversityofScienceandTechnology,Harbin150080,Heilongjiang,China)
To deal with the problems of effectively controlling abnormal events happened during the production process of the discrete manufacture enterprise in big data, this paper firstly studied the rationality and utility of building the early warning model of abnormal events in workshop in theory. Then the paper gave the data source and its calculation method of the abnormal triggering event from the technical realization aspect, combined the time series and the causal relationship, and established the early warning model of the workshop anomaly based on the multi-decision tree on the time series, which ensures the accuracy and reliability of the forecast. Finally, the validity of the model was verified by the production process data of a gas turbine rotor.
Abnormal event discovery Time series Decision tree Early warning
TP3
A
10.3969/j.issn.1000-386x.2017.09.056
2016-10-12。国家自然科学基金项目(51375128);黑龙江省教育厅科学技术研究项目(12541159)。马超,讲师,主研领域:云制造与智能制造,服务计算与价值计算。徐迭石,硕士生。张淑丽,教授。刘胜辉,教授。