基于卷积神经网络的制孔出口毛刺预测方法
2020-04-24周越田威廖文和张霖李波
周越,田威,廖文和,张霖,李波
(南京航空航天大学 机电学院,江苏 南京 210016)
0 引言
近年来,随着材料轻量化的发展,轻质合金(钛合金、铝合金等)和碳纤维增强复合材料(CFRP)等在制造领域被更多地使用。随之而来的难题是:大量的复合材料、钛合金及铝合金零部件等需要通过制孔铆接的方式连接装配在一起。在航空领域内的失效形式主要为疲劳失效,75%以上的疲劳失效发生在装配连接件上[1],而航空装配中70%以上的装配结构连接由铆接和螺接形式完成,连接制孔的数量十分庞大[2]。由于加工误差、壁板变形等多种因素影响,不能保证装配连接的稳定性,装配连接孔的加工无法在零件加工时一次成型[3]。因此,航空制造单位通常将具有装配关系的零件预先装夹在一起,一次性钻削连接孔,其装配制孔的质量是保证飞机构件连接可靠性和寿命的关键。图1为航空铆接装配试样。
图1 航空铆接装配试样
与此同时,卷积神经网络的相关研究发展十分迅速,早已在深度学习技术领域得到较为广泛的应用。早期的神经网络在建模、机器学习、模糊控制等方面取得了良好的效果,但受深层网络模型的技术瓶颈限制,很长时间以来没有获得可观的发展[4]。伴随近十几年来深度学习理论的不断进步,深层网络模型的技术难点得以攻破,它提取抽象深层关联特征的能力被不断挖掘,在音频、文字和图像处理等诸多领域取得巨大成功[5]。
本文受此启发,使用卷积神经网络针对航空装配制孔工艺过程进行分析学习,以不同的工艺参数和对应的制孔过程主轴电流信号图为输入,实验设备、材料与刀具型号固定不变,对制孔工艺结果进行预测,并设计实验验证预测结果的准确性与方法的有效性。
1 卷积神经网络
卷积神经网络是当下应用最为广泛的几种深度网络之一,与以往的神经网络结构有着较大的不同,它由多个卷积层与亚采样层组成。其中,由神经元矩阵组成的特征平面构成一个卷积层。而亚采样层使得输入维数大幅降低,提高了整个网络的鲁棒性。在这种网络中,单个神经元不会与全部神经元产生连接关系,而只会与部分神经元产生连接[6]。卷积神经网络区别于传统神经网络的两大特点为共享权值和亚采样,降低了网络维数和复杂度,减少了网络各层间的连接,以尽可能消除网络过拟合的情况。图2所示为一个常规的卷积神经网络结构。因其良好的鲁棒性以及可以降低网络复杂度、削弱过拟合的特点,本文选择卷积神经网络进行制孔出口毛刺的预测研究。目前能够建立卷积神经网络的平台很多,本文使用Google的Tensorflow平台完成模型的建立和算法的实现。
图2 常规卷积神经网络结构
2 数据获取与处理
2.1 数据来源
本文数据来源于所在课题组实验中获取的相关制孔实验数据。样本数据量:共采集了符合要求的数据2 462条。数据输入包括制孔过程中从第1层钻入到第1层钻出,再到第2层钻入,最后到第2层完全钻出的分阶段制孔主轴电流信号图,以及各阶段制孔工艺参数中的主轴转速、主轴实际进给速度、主轴每转进给速度。数据输出包括对制孔的后续铆接工艺影响较大的出口毛刺高度。表1列出了所有输入、输出数据的取值范围,其中主轴电流信号包括所有符合标准制孔样本的电流信号,不在表内列出。图3为未归一化处理前的制孔样本电流信号。
表1 输入输出数据范围表
图3 未经归一化处理的部分典型电流信号图
2.2 数据清洗
数据清洗采用了下述几种策略进行:遇到超出表1数据范围的奇异值时,移除该项数据;同工艺参数的多组实验中,出现偏差较大单个数据时,移除该项数据;同参数组数据过于不一致时,移除整组数据。在上述过程清洗后,对移除数据进行部分补充采样。
2.3 数据归一化
数据归一化对模型训练至关重要,影响着模型收敛至最优解的能力,归一化中采用了下述几种策略:对每一维的数据量纲和数量级进行调整;对制孔过程阶段进行标准划分;对数据集本身进行Z-SCORE标准化;使用滤波和去噪算法对电流信号进行处理后作为输入。
3 模型建立与影响因素分析
首先为建立模型必须要确定一种模型可靠性评估方法,目前针对预测问题常用的评估方法有平均绝对百分比误差(MAPE)、均方误差(MSE)、绝对平均误差(MAE)和预测精度(ACC)等。以上方法的评价均为指标越趋近于0,模型预测效果越好[7]。本文经过分析,采用MSE作为预测模型的评估标准。MSE定义如下,其中predicted为预测值,label为实际值:
卷积神经网络模型的建立主要分为以下几个部分:激活函数选择;目标优化算法选择;卷积核个数的设置;卷积层层数的设置;卷积神经网络的网络窗口大小设置;学习率的设置。为单独确定每个部分的设置,利用所获取的数据设计了4组实验,其中每组实验的超参数只有待测试项为变数,其余超参数均为可用范围内的固定值。非待测试项超参数设置如表2所示。
表2 非待测试项超参数实验设置表
在激活函数的选择上,本文通过对比分析常用的Relu、Tanh、Sigmoid等几种激活函数,选用了较为简单的Relu函数,以提高收敛能力[8]。在目标优化算法的选择上,选用了经过改良的随机梯度下降算法(adaptive moment estimation, Adam),以简化学习率的调节[9-10]。为简化超参数的设置调整,本文还加入了批量标准化算法(Batch Normalization)[11]。
卷积核核数、卷积层层数、窗口大小和学习率通过多组对比实验,获得MSE变化趋势的方式进行确定。
卷积神经网络的特征识别提取能力很大程度上取决于卷积核个数。本文设置了卷积核个数从8个到128个,间隔8的多组对比实验。实验过程数据如图4所示。
图4 卷积核个数对预测模型的影响
通过分析图4可知,在卷积核<64前MSE呈下降趋势,>64后呈上升趋势。分析原因可能是,卷积核数量在一定程度上是对数据特征提取的角度数量,过多的卷积核可能导致训练提取到对宏观影响很小的特征,而使预测效果下降。
卷积层层数通过设置层数1到层数6的对比实验确定。实验过程数据如图5所示。
图5 卷积层层数对预测模型的影响
通过分析图5可知,在卷积层层数<3前MSE呈下降趋势,>3后呈上升趋势。分析原因可能是,工艺参数、主轴电流信号与最终毛刺有着较为紧密的内在联系,更深层次的模型对内在联系的特征提取更加准确,但本文使用的模型输入域输出相对较少,过多的隐层可能导致训练拟合不充分,影响预测结果。
卷积窗口大小通过设置窗口大小2到大小6的对比实验进行确定。实验过程数据如图6所示。
图6 卷积窗口大小对预测模型的影响
通过分析图6可知,在卷积窗口大小<4前MSE呈下降趋势,>4后呈上升趋势。分析原因可能是,卷积过程实际上就是模型学习卷积窗口特征的过程,合适的窗口大小可以在获得足够感受的情况过滤掉非特征因素。
学习率通过设置学习率0.000 01~0.2的10组对比实验进行确定。实验过程数据如图7所示。
图7 学习率对预测模型的影响
通过分析图7可知,学习率与MSE呈正相关关系,过大的学习率会使模型无法训练到最优。较小的学习率会使得训练结果更优,但训练效率降低,而过小的学习率并不能使训练结果显著改变。
在超参数的影响趋势确定之后,本文引入了Dropout技术优化测试集的测试表现[12-13],设置了随机概率0.1~0.9的多组对比试验,测试过程与测试数据如图8所示。
图8 随机概率取值对预测模型的影响
通过分析图8,设置了0.90的随机概率取值,在众多常见应用Dropout技术的论文与研究中,通常取0.4~0.6范围内的随机概率,即采用相对较大的神经元丢弃概率时,测试集表现改善更加明显。本文取较小的丢弃概率时表现更好,分析原因是本文所采用预测模型复杂程度相对较低,丢弃比率较小就足够达到避免过拟合的优化目标,而丢弃比率较大时会影响训练的拟合。
在以上模型影响因素的影响趋势确定后,采用启发式设置的方法确定最终模型使用的超参数。比较通用的启发式算法一般有模拟退火算法(SA)、遗传算法(GA)、蚁群算法(ACO)、人工神经网络(ANN)。本文采用一种应用较为广泛的基于蚁群算法(ACO)的启发式算法,对超参数进行整体优化调整。通过上述影响因素分析缩小了超参数选取区间,将超参数选取范围选定在各自独立的较优区间内,区间如表3所示。
表3 超参数选取区间
在表3区间内经过启发式设置最终建立的模型设置如表4所示。
表4 卷积神经网络设置表
经过优化的最终测试集效果如表5所示。
表5 最终实验效果
4 实验验证与分析
实验设备与材料如表6所示。
表6 实验设备
模型性能评估的测试集表现并不能十分直观地表现预测的准确性和有效性,因此本文设计了一组预测值和真实值效果的对比实验集。使用相同的实验设备、材料以及同型刀具进行。实验结果如图9所示,其中横坐标为实测值,纵坐标为预测值,上、下4条线内分别10%和15%预测相对误差的误差带。
图9 真实值与预测值效果对比
经过统计,本文卷积神经网络的预测误差分布如图10所示。
图10 毛刺预测相对误差分布图
通过图9和图10可以清楚地看出,本文所建立的卷积神经网络对制孔质量的预测误差主要集中在5%~10%之间,且均<15%,而清华大学所采用的“铝合金叠层板钻削层间毛刺高度预测模型”的预测误差在30%以内[14],与其相比可以证明卷积神经网络具备较好的预测制孔相关性能指标的能力。
5 结语
1) 本文所建立的基于卷积神经网络的制孔出口毛刺预测模型,以工艺参数(制孔转速、进给、每转进给)与主轴电流信号特征矩阵为输入,预测制孔出口毛刺高度,预测平均相对误差9.34%。实验集测试中,预测相对误差均<15%,优于传统理论建模30%左右的相对误差的预测准确度。
2) 以波音公司125 μm的出口毛刺高度合格标准为例,本文的预测模型预测结果为毛刺高度<106.25 μm的制孔结果,其15%相对误差带完全落在合格标准指标内,能够以>95%的准确率满足合格标准。证明本文预测方法具备在一定环境下的工程应用能力。