基于极限学习机的车间节能目标预测方法
2020-09-22刘大铖李少波魏宏静
刘大铖,李少波*,2,魏宏静
(1.贵州大学 现代制造技术教育部重点实验室,贵州 贵阳 550025; 2.贵州大学 机械工程学院,贵州 贵阳 550025)
智能制造领域的任务分配和资源优化方法可以解决大量智能车间存在的设备闲置多、资源利用低等现实问题,对于车间生产提高效率、降低能耗具有重要意义。通常,制造车间节能优化问题是一类存在不相关并行机、多阶段和多目标特点的混合流水线调度(hybrid flow-shop scheduling problem, HFSP)问题[1]。特殊的,两阶段至少一阶段存在并行机实例已经被证明是NP(非确定性多项式,non-deterministic polynomial)难问题[2]。
基于种群迭代的智能优化算法具有收敛速度快、不易陷入局部最优等优点,广泛应用于制造车间节能优化问题。基于最广泛应用的改进遗传算法(genetic algorithm, GA),王亚良等[3]提出动态变异策略解决作业车间布局问题。陈帆等[4]采用遗传模拟退火算法求解面向冲压车间的优化调度模型。王雷[5]和王春[6]等改进初始化、解码、交叉、变异等操作方法,求解多目标柔性作业车间调度。王小蓉等[7]采用遗传算法解决传统的作业车间调度问题。改进的遗传算法虽然能够提高求解效率和求解质量,但是仍普遍存在参数较多、编程复杂、搜索速度慢、依赖初始种群等问题。基于改进经典粒子群(partical swarm optimization, PSO)算法,协同粒子群和引力搜索的混合算法[8]用于解决车间作业调度问题。采用余弦递减系数选择策略的量子粒子群算法[9]和教与同伴学习粒子群算法[10]被用来求解多目标柔性作业车间调度问题。混沌量子粒子群算法[11]用于解决模糊环境下柔性作业车间的调度问题。改进的粒子群算法虽然算法较为简单,但算法本身容易存在陷入局部最优等缺陷。除此之外,在车间节能问题上,参数知识鸽群算法[12]、改进教与学算法[13]、生物地理学算法[14]等均有较好的应用。由此看来,大量成熟智能算法被广泛应用于车间调度问题。但是,基于种群迭代的智能优化算法存在迭代种群大、迭代次数多等特点,导致目标及约束适应值计算成本高。同时,车间节能优化模型建模困难,较难获取大量真实适应值。针对已知有限的适应值样本点,可通过机器学习算法训练得到代理模型,该模型采用预测的适应值替代真实值,可显著减少计算成本,提高计算效率。因此,如何建立代理模型用于预测适应值是当前智能优化算法研究的热点和难点,具有重要的科研和应用价值。
极限学习机(extreme learning machine, ELM)最早被Huang G B等[15]提出并定义为一类单隐层前向神经网络(single-hidden layer feedforward neural networks, SLFNs)学习算法。ELM随机选取输入层与隐含层的连接权值及隐含层神经元的阈值,输出层权重通过由训练误差项和输出层权重范数的正则项构成的最小化损失函数,依据广义逆矩阵(moore penrose, MP)理论计算求解得到。ELM具有训练参数少、学习速度快、泛化能力强的优点,广泛应用于智能制造领域的故障诊断[16]、缺陷[17]和误差[18]检测、测量补偿[19]、参数[20]和状态[21]辨识、设计优化[22]等。
本文对之前基础工作作出说明,对某制造车间进行能耗分析,建立以最小化最大完工时间和最小化总能耗为多目标的节能HFSP模型,改进多目标多元宇宙优化算法(improved multi-objective multi-verse optimizer, IMOMVO)进行求解。其中,适应值即IMOMVO算法中所涉及的宇宙膨胀率值,等于目标函数值的倒数。本文以适应值为研究对象,针对基于种群迭代的IMOMVO算法中存在的计算成本较高等问题,首先获取50 000组真实适应值,进行简单统计学分析,发现具有类似正态分布规律。选择均匀分布变量的拉丁超立方采样方法,抽样得出500组真实适应值作为初始化样本,改进ELM算法训练得出代理模型并设计预测实验,相对于误差反向传播算法(back propagation, BP)神经网络提高了预测准确率,减少了计算时间。
1 基于矩阵编码机制的特征向量提取
1.1 参数设置
以最小化最大完工时间和最小化总能耗为多目标的HFSP节能优化模型的相关参数设置如表1所示。
1.2 混合流水线矩阵编码方式
制造车间多目标HFSP节能模型采用的编码方式为矩阵编码。一个矩阵表示IMOMVO算法中的一个宇宙,即一种具体的调度情况。矩阵的行位置表示工件的序号,矩阵的列位置表示各工件的加工阶段序号。矩阵内部元素X(j,s)表示混合流水线车间节能问题中第j个工件在第s阶段的调度情
表1 参数设置Tab.1 Parameter setting
况对应的实数。其中,整数部分表示第j个工件在第s阶段选择的机器序号;当矩阵内部某列多个元素整数部分相同时,小数部分表示加工顺序;规定较小者优先加工。编码矩阵An×i可表示为:
(1)
本文研究采用ELM算法预测某多目标HFSP实例在IMOMVO算法求解下的适应值问题。实例相关细节如下:12个加工工件,3个加工阶段,各加工工件的并行机数量分别为3、2、4。其布局流程如图1所示。
图1 HFSP实例布局流程图Fig.1 HFSP example layout flow chart
1.3 车间节能目标
最小化最大完工时间f1和最小化总能耗f2是多目标HFSP实例的两个目标函数,可表示为:
(2)
(3)
式(1)中,各机器最大完工时间最大值即整个加工阶段最大完工时间。式(2)中,各机器加工能耗和采用“关机—重启”策略后空闲能耗之和即整个加工阶段总能耗。
建立加权加性效用目标函数U和节能目标F,表示为:
U=w1·f1+w2·f2,
(4)
(5)
f′=(f-fmin)/(fmax-fmin),
(6)
(7)
1.4 特征向量提取
张嘉琦等[23]选取一些与释放时间、加工时间、权重和均值相关的统计特征量作为训练代理模型的特征向量。该方法存在两个难点:一是需要解码和相关计算获得调度状态关键特征,仍需要一定计算量;二是关键特征的不可逆推性,即根据关键特征(输入量)无法倒推调度情况。综合,在数据驱动的进化计算问题中,本文提出一种基于矩阵编码机制的特征向量提取方法,针对文中实例,具体选取编码矩阵内部全部36个实数元素作为36组特征向量作为输入量,车间节能目标作为输出量。利用预测适应值取代费时的精确求解,降低繁冗评价过程带来的计算代价。
2 ELM预测模型
2.1 IMOMVO算法计算复杂度
IMOMVO算法的计算复杂度取决于迭代次数、宇宙数、轮盘赌算法和宇宙排序机制。每次迭代过程中对宇宙采用快速排序算法进行排序,最佳和最差复杂度分别为O(nlogn)和O(n2)。轮盘赌机制针对迭代过程中各宇宙的变量进行选择。IMOMVO算法、快速排序算法和轮盘赌算法分别用I、K、L表示。算法总体计算复杂度可表示为:
O(I)=O(l(O(K)+n×d×O(L))),
即O(I)=O(l(n2+n×d×logn))。
(8)
其中,n表示宇宙数量,l表示最大迭代次数,d表示变量数量。
2.2 基于ELM的代理模型
ELM是一种新型的快速学习算法。该算法的核心思想是随机选取网络的输入权值和隐层偏置,训练过程中保持不变,仅需优化隐层神经元个数。网络的输出权值则是通过最小化平方损失函数,求解广义逆运算,得到最小范数最小二乘解。ELM理论表明,当隐层神经元的学习参数独立训练样本随机生成,只要前馈神经网络的激活函数是非线性分段连续的,就可以逼近任意连续目标函数或分类任务中的任何复杂决策边界。
设输入层有n个神经元,即n个输入变量,隐含层有l个神经元,输出层有m个神经元,即m个输出变量。输入层与隐含层的连接权值w表示为:
(9)
设隐含层神经元的阈值b为:
(10)
隐含层输出矩阵H为:
H(w1,…,wl,b1,…,bl,x1,…,xQ)=
(11)
设隐含层与输出层的连接权值为β,网络输出T为:
(12)
j=1,…,Q。
(13)
(14)
其中,H+为隐含层输出矩阵H的广义逆。
2.3 算法流程框架
为了快速有效求解多目标HFSP实例,设计整体算法流程框架如图2。
图2 算法框架流程图Fig.2 Algorithm framework flow chart
通过代理模型评价出预测值,不但对较优个体具有筛选作用,同时能显著提高计算效率。
断路器触头不到位,或触头损坏,都会导致断路器内部的气体内部的性能有所下降,造成气体内部气压不足,从而导致内部放电而引起闪烙声或因线夹松动、断股而引发外部放电声,这些都是异常声形成的原因。
3 实验结果与分析
3.1 实验条件
为了验证ELM算法的车间节能目标预测性能,本文以64位Windows 10操作系统为开发平台环境,在笔记本内置MATLAB进行编程。笔记本性能为Intel(R) Core (TM) i5-3230 CPU@2.60 GHz和4 GB内存。
3.2 基于均匀分布变量的拉丁超立方抽样
考虑编码矩阵随机生成符合均匀分布特点,利用基于均匀分布变量的拉丁超立方抽样方法获得样本数据。结合HFSP实例,设36维向量空间抽取500个样本。其中,1~12维向量取值范围为[1,4);13~24维向量取值范围为[1,3);25~36维向量取值范围为[1,5)。具体步骤:(1)各维划分m个不重叠区间,可根据m值等分区间,保证相同概率;(2)各维的各区间随机抽取一个点;(3)将(2)中抽取的点进行错排排序,组合新的36维向量。拉丁超立方优势在于抽样效率和运行时间,保证一个维度向量因子的每个水平只被研究一次,使得抽样更加均匀和分散。
3.3 ELM预测性能验证
本文实验数据源自课题组前期工作的某HFSP实例,采用拉丁超立方抽样500组特征向量作为训练集输入量,组成500组编码矩阵,带入HFSP节能模型中计算真实适应值,作为训练集输出量。为验证ELM预测性能有效性,采用BP神经网络进行实验对比。抽样15组特征向量作为测试集。测试集适应值预测对比实验结果如图3所示,预测值数据如表2所示。
图3 适应值预测结果对比图Fig.3 Comparison chart of fitness prediction results
表2 适应值预测结果Tab.2 Prediction results of fitness values
(15)
(16)
(17)
(18)
ELM和BP算法的相关性能指标数据如表3所示。
表3 算法相关性能指标数据Tab.3 Algorithm-related performance index data
采用BP神经网络算法和ELM算法的拟合优度分别为0.661 77和0.973 81。综合图3、表2和表3可知,ELM算法预测方法能够真实反映HFSP节能目标。通过拟合优度R2以及性能指标可知,ELM与BP相比具有显著优势。
表4 大量抽样适应值区间分布统计表Tab.4 Statistical table of interval distribution of fitness values of large sampling
由表4可知,车间节能HFSP实例的适应值分布类似正态分布,呈现两端区间较少,中间区间集中的特点。一方面,可解释图3测试集分布大致介于[1.5,3]的原因。另一方面,在使用ELM预测适应值时,当适应值介于[1,4]时,采用预测值替代真实值降低评估代价;适应值大于4时,直接计算真实适应值进行节能目标优化。
3.4 ELM计算时间对比
ELM预测适应值由实例数据训练建立代理模型评价得到,用预测值代替真实解对优化问题解进行评估,选出真实问题的比较好的解,以减少真实问题的评估次数。另外,预测模型和真实问题存在偏差,用真实问题对解进行评估,以防止模型误导解偏离真实问题,将真实问题评估的解加入训练数据集修正模型。分别在多目标HESP节能模型中求解真实解、BP预测解和ELM预测解共计3种情况下,设置种群为10 000迭代500次计算,即每组计算500万组适应值。本实验进行15组实验,每次实验结果取平均值。求解单个适应值平均时间的实验数据如表5所示。
表5 3种实验类型求解单个适应值平均时间Tab.5 Three types of experiments to solve the average time of a single fitness value ×10-4 s
由表5可知,ELM算法平均评估代价仅为真实问题评估解的18.5%,占BP算法的78.3%。ELM算法能够显著降低智能算法求解多目标车间节能HFSP过程的评估代价,且计算耗时较稳定。
4 结语
本文主要研究了车间多目标HFSP求解适应值时的近似替代问题。首先提出一种基于矩阵编码机制的特征向量提取方法,将特征向量定义为编码矩阵内部元素,能够避免预测过程中因为解码及其相关计算带来的计算成本,同时解决了通常相关均值作为特征向量所带来的不可逆推问题。对前期IMOMVO算法的计算复杂度作出分析,建立ELM代理模型,设计数据驱动优化的车间节能目标算法框架。采用均匀分布变量的拉丁超立方抽样建立训练集,并与BP算法对比,进行节能目标预测性能和计算时间对比实验。实验结果显示,ELM算法的拟合优度为0.973 81,比BP算法的拟合优度高0.312 04,预测性能指标均小于BP算法相关指标。单个适应值平均计算时间为5.4×10-4s,仅为真实解计算时间的18.5%,在解决车间多目标HFSP节能目标寻优问题具有良好的效果。接下来会尝试采用支持向量机(support vector machine, SVM)算法进行其他算法的对比实验,或者引入加权组合的核函数,从另一个角度考虑并行计算方法,进一步降低适应值的评估代价。