CNC机床能耗预测
2021-09-26西北大学周祎璠
西北大学 周祎璠
CNC机床生产能耗巨大,其海量生产数据存储在不同机器上,具有高噪声,多维度等特点。如何从存储在不同机器上的生产数据中挖掘工艺参数对机床能量消耗影响规律,以及从众多工艺参数中剔除冗余变量成为了业界关注问题。本文通过建立L1/2正则子模型,算法上将原模型转换为自适应Lasso,再通过线性变换转化为Lasso求解问题,通过坐标下降法求得其迭代公式,最终迭代形式易于将算法推广至分布式。后通过Spark计算框架进行实现。结果表明,在CNC机床能耗预测方面,分布式L1/2正则子可以达到预期效果。
能源是人类社会赖以生存和发展的重要物质基础,如何在社会发展的同时节约资源,减少污染始终是社会关注的热点。周大地在《我国工业能耗占总能耗比重过高》一文中提出,世界各国工业能源消耗一般只占能源消耗总量的三分之一左右,而在我国,工业能耗占比近70%。许多经济大省工业能耗占比甚至显著高于70%。而机床作为装备制造业的“母机”,量大面广,耗能巨大。徐敬通等人在《CNC机床的能耗模型及实验研究》中提出,机床能量的利用率十分低,普遍低于30%。更有研究发现自动生产线上的大型加工中心能量利用率甚至低于15%,因此,机床节能降耗潜力巨大。此外,为实现我国从制造业大国向制造业强国转变的目标,李克强总理提出了“中国制造2025”的宏大计划,此计划以体现信息技术与制造技术深度融合的数字化网络化智能化制造为主线,主要关注十大领域,其中第二个领域,即为高档数控机床和机器人。
本文将紧跟国家规划,将工业化与信息化紧密结合,助力“中国制造2025计划”五大工程中“智能制造”与“绿色制造”这两部分,促进数字化工厂的实现与升级。致力于研究机床的能耗特性,降低机床能耗,促进我国发展循环经济、推行绿色制造。
目前我国多数CNC加工企业还在凭经验、参考手册、通过试切来选择切削参数,这往往难以实现能量效率的最优化。为了解决此问题,周志恒等人在《CNC车床切削参数的能量效率优化》一文中通过正交实验给出CNC车床切削阶段的能量估算函数,设计一种改进多目标教与学优化算法解决切削参数的能量效率优化问题,采用层次分析法选择更合理的切削参数,实现切削用量从定性的随机选取到定量选取。Hu等建立了以CNC铣削过程的铣削速度和每齿进给量为优化变量以最少电能消耗和最低加工成本为优化目标的多目标节能优化模型。引入加权求和法将多目标优化模型转换成单目标优化模型并采用粒子群算法对模型进行优化求解。这些模型算法主要基于机床运作机理来解决这类问题,但由于机床生产过程于能耗预测本身十分复杂,因此涉及机电液多学科背景结果表明其还是具有很大的局限性。
本文考虑基于徐宗本等人在《L1/2regularization》一文中提出L1/2正则化方法,在挖掘机床工艺参数与能耗相关关系的同时,对切削参数进行变量筛选。以结合模型合理调整关键参数来降低机床能量损耗、提高企业能源管理效率及最大化最终收益的目的。
此外,随着信息技术的飞速发展,切削参数面临着数据量级过大的挑战。据此,众多学者基于分布式存储这一新特点提出了不同的分布式算法,Mateos等人在《Distributed sparse linear regression》提出了分布式Lasso算法,并证明出此算法与非分布式算法具有相同的解;王璞玉等在《分布式L_(1/2)正则化》一文中基于ADMM算法给出分布式L1/2正则化算法,并证明了算法的收敛性,通过实验验证了提出算法的有效与实用性。
据此,本文进一步考虑建立L1/2正则子模型,算法上将原模型转换为自适应Lasso,再通过线性变换化为Lasso求解问题,通过坐标下降法求出其迭代公式后,通过Spark计算框架进行实现。实验结果表明L1/2在CNC机床能耗预测方面可以实现预期效果。
1 L1/2正则子算法
1.1 L1/2正则子
降低制造成本,提高工艺效率是现代工业日益增长的需求。由于车间在运行过程中产生的制造数据具有海量、高维、多源异构、多尺度和高噪声等特性,本文考虑通过建模找到对能耗影响较强的参数,删除冗余变量。线性回归方法要求模型参数具有强解释性,为了去除多余变量,本文关注线性回归方法中的稀疏模型,一般地,考虑如下线性回归模型:
其中,X∈RN×P为解释变量,Y∈RN为被解释变量,ε为随机干扰项。具体的稀疏正则化方法有如下形式:
其中第一部分是损失函数项,度量经验误差的大小,另一部分是正则化项,包含数据的先验信息,λ>0是调控参数,控制模型的复杂度。当k= 0时对应AIC与BIC准则(以模型中非零系数个数作为惩罚项),称之为L0正则子,当k= 1时对应Lasso模型,称之为L1正则子,当k= ∞时对应L∞正则子。对于正则子的选择,Fan J等在《Nonconcave penalty likelihood with a diverging number of parameters》中提出,好的正则子应具有剔除冗余变量的能力,无偏性,连续性(抗随机影响的能力)以及oracle性质(事先已知模型时,可以正确辨识模型)。L2、L∞的解不具稀疏性,L1正则子虽稀疏易求解,但具有非凸惩罚项的L1/2正则子的解会相比于L1更具稀疏性,因此本文关注徐宗本等人在《L1/2regularization》一文中提出的L1/2正则化模型:
1.2 单机算法求解L1/2正则子
本部分给出在一台计算机上L1/2的具体求解算法,其主要思想是化未知为已知:将原模型转换为自适应lasso后,通过线性变换转化为lasso求解问题,最终采用坐标下降法将其转化成一维求解问题。
对(3)式,考虑引入:
对其进行迭代。下面给出L1/2正则子具体计算的细节:
1.3 分布式算法求解L1/2正则子
由于车间生产运行中产生的大量数据来自于可编辑逻辑控制器、传感器和其他智能感知设备对制造过程的不断采样,这些数据采样按时间序列快速且大量地涌入数据库,是影响机床能耗的参数并且是可调整的能耗需求,存储在不同机器上。为了提高数据分析效率,本节考虑采用分布式计算方式求解L1/2正则子。此外,其他固定消耗的能量例如照明,水电等在具体计算中暂不考虑。
根据分布式存储原理,对于输入数据xi,yii=1,2...N,将其分散存储在J台不同的worker端上,每台机器上存储nj条数据(如图1所示):
图1 每台机器上存储nj条数据
2 实验及结论
本节通过1个实验证明分布式L1/2正则化的有效性。
本实验采用于University of California,Berkeley测得的实际生产数据,目的在于通过挖掘这些参数中对机床能量影响较大的工艺参数,降低机床可控能耗、提高机床加工能效。具体对其构建多元线性模型,采用上文提及的具有变量选择的L1/2正则子对其进行求解。由于其存在数据量大的问题,因此存在用分布式计算的必要性,下面给出分布式L1/2正则子对其进行求解的过程及结果。
针对实际运行环境,本文在某一台windows实体机上,使用虚拟机模拟三台Linux服务器,将其中一台同时作为server和worker,另外两台作为worker。由于Spark计算框架将中间结果存储在内存里,适合迭代算法,稳定高效,已经在工业界有很多实际应用,因此使用其实现上述分布式算法进行求解。
原始数据集中共有1415个数据,17个变量,将数据中送料率、主轴旋转速度、切割方向、切割深度等参数看作解释变量,能量消耗看作被解释变量,对其进行数据标准化、类别变量转化为哑变量、对原始特征进行平方变换作为新的特征。其中,对于数值型缺失值,用0进行填补,对于非数值型特征的缺失值,认为其单独作为一种取值类型,用null进行填补,最终得到53个特征。
在实验中将具体数据存储在HDFS(Hadoop Distributed File System)中,利用Spark计算框架筛选出的重要参数及其对应的系数如表1所示。
表1 利用Spark计算框架筛选出的重要参数及其对应的系数
其中,各参数分别代表Energy、Modal G-Codestandard、Cut/No Cut、Spindle speed、Z Loadstandard2、X(mm)standard2、Y(mm)standard2、Z(mm)standard2、IdX(mm)standard2、IdY(mm)standard2。
最终的能量预测结果如图2所示。
图2 最终的能量预测结果
其中,红色虚线代表预测值,黑色实线代表真实值。同时,模型求解对应的R2约为0.999659,调整后的R2约为0.999646。上述实验结果表明,拟合结果良好,因此在CNC机床能耗预测方面,分布式L1/2正则子在筛选重要变量的同时,对于变量间的相关关系挖掘较为充分。由于实验设备的限制,能够满足机床正常运作的能耗的下限需要在实际的机床中进行实验来获取。但是本文提供的重要特征已经为进一步实验提供了重要的信息,即进行试验时只需调整筛选出来的主要特征即可。通过机床实验获取到的不同切割策略的最低能耗以及其对应的参数信息将大大提升工业生产的效率,降低资源浪费。
3 总结
本文主要提出一种基于加权lasso的求解L1/2正则子的算法,将其从单机扩展到分布式,在实验中将其应用到机床数据中进行求解,从而说明其在CNC机床变量选择及能量预测方面的可行性。最后实验结果表明,在CNC机床能耗预测方面,对于非分布式算法单机很难处理的数据量较大的问题,推广的分布式L1/2正则子算法对其可以进行变量选择及能量预测。