APP下载

基于迁移学习和特征重用的MIM齿轮缺陷检测*

2021-10-15雷保珍王训伟齐广浩

传感器与微系统 2021年10期
关键词:集上卷积准确率

赵 桐,雷保珍,,王训伟,齐广浩

(1.北京联合大学 北京市信息服务工程重点实验室,北京 100101;2.北京联合大学 北京市智能机械创新设计服务工程技术研究中心,北京 100101)

0 引 言

金属注射成型(metal injection molding,MIM)是一种将金属粉末与其粘结剂的增塑混合料经过注射、烧结等工艺得到成品的一种新型近净成形技术,具有常规粉末冶金、机加工和精密铸造方法无法比拟的优势。同时在运输和生产中也会有一些特有的工艺缺陷,如划痕、变形等,不仅对工件的性能造成影响,还会降低零件的使用寿命。MIM工业生产零件批量大、尺寸小的工艺特点也让其缺陷检测变得极其困难。因此,快速、准确检测MIM零件缺陷的方法在工业中显得尤为重要。

近年来,随着人工智能的飞速发展,卷积神经网络(convolutional neural network,CNN)被应用到各个领域当中。吴涛等人[1]利用K-means++算法确定先验框,基于YOLOV3[2]检测架构构建一种改进的轻量级网络,对绝缘子的检测准确率达到近90 %。谷静等人[3]利用密集连接网络(DenseNet)对焊缝缺陷进行检测识别,并在相同的数据集和训练步数下,与最小二乘支持向量机(least square support vector machine,LS-SVM)[4]与卷积神经网络LeNet算法对比,DenseNet网络提高了模型泛化能力与识别准确率,对焊缝缺陷的识别准确率可达98.969 %。宋念龙等人[5]在涂布的缺陷检测的应用上设计了一种卷积神经网络,模型的识别率可达92 %。卷积神经网络也被广泛应用到林业[6]、铁路[7]等方向。

本文通过研究DenseNet算法,对特征重用层进行改进,轻量化网络结构,提高网络运行效率,并针对训练集数据量小、检测率低问题,用大数据集进行迁移学习完成特征提取层构造,再用小数据集进行分类器的再训练,为MIM零件缺陷检测提供了更高效准确的方法。

1 DenseNet网络结构模型

1.1 特征重用

DenseNet是一种密集连接网络,通过对特征图的密集连接达到特征重用的效果,打破了改进神经网络要么深度增加,要么宽度增加的传统思想观念。通过特征重用的方式,加强了特征图的传递的同时,也减轻了神经网络层数过深时出现的梯度消失现象,并且在一定程度上减少了参数的数量。图1为密集连接层的网络结构。

图1 密集连接结构

对于n层网络,DenseNet网络具有n(n+1)/2层连接,即每一层都会接受前面所有层的特征图,第n层的特征图可表示为

Xn=Hn-1([X0,X1,…,Xn-1])

(1)

式中 [X0,X1,…,Xn-1]为X0,X1,…,Xn-1层特征图在channel维度上的拼接,Hn(•)为非线性化转换函数,可包含批处理归一化(batch normalization,BN),ReLu[8]激活函数及卷积(convolution)等操作。

1.2 密集块和过渡层

将特征图在Channel维度上进行拼接,需要每个特征图的尺寸都要一致。设置大小为3×3的卷积核,并且步数(stride)为1,边缘填充(padding)为1,如此每层输出的特征图即可在channel维度上进行拼接,并且设置每层卷积核的数量为k。随着网络深度的增加,前面特征图的拼接channel维度会成线性增加,k在这里也被称为增长率(growth rate)。为了在一定程度上抑制不断增长的数据输入量,DenseNet中设置了密集块(DenseBlock)和过渡(transition)层来抑制参数输入量过度增长的问题。由3个密集块和2个过渡层构成的DenseNet如图2所示。

图2 DenseBlock和Transition

通过控制每个DenseBlock中的层数来控制输入特征图的维度上限,并且在Transition层中,用1×1卷积核以及池化(pooling)层对输出特征进行压缩,最终将特征图交给分类器进行处理,从而得到预测结果。

1.3 改进的特征重用

通过DenseBlock以及Transition可以有效地抑制特征输入的数量,但是如果将增长率设置的较大,或DenseBlock中的层数较深,则后面层数的数据输入量依旧无法得到控制。所以,本文在此基础上提出一种改进的特征重用方法,结构如图3所示。

图3 改进的特征重用

在n层输出特征图与其他特征图拼接之前,首先对1,2,…,n-1层输出特征图进行1×1卷积操作,设置卷积核的数量为k个,在将结果与本层输出进行拼接,即可将每层特征图的输入在Channel维度都控制在2k,可表示为

Xn=Hn-1([Xn-1,hn-1([X0,X1,…,Xn-1])])

综上所述,在素质教学理念不断发展的当今时代,运用信息技术开展小学语文教学能够有效地帮助教师提升整体的教学质量,完成教学任务,促进学生综合素养的提升。在小学语文教学的过程中,开展翻转课堂教学能够有效地激发学生的主体意识,使其形成一定的自主学习能力以及自主学习欲望,在降低自身学习难度的同时,提升自身的学习质量,促进自身的全面发展。

(2)

式中hn(•)为k个1×1卷积卷积核进行卷积操作。

加入了1×1卷积操作,不仅会减少每层输入特征图的Channel达到轻量化网络的目的,还会令每层的输出都是k张本层输出特征图以及k张重用特征图,改变了网络对每层特征的重视程度,在有效加快网络训练的同时,对减轻梯度消失依然有很好的效果。

2 迁移学习

没有过多的公开数据集是卷积神经网络在工业检测方面发展缓慢遇到的最大问题之一。深层卷积神经网络具有良好的检测效果,需要大量的数据作为支撑,然而在工业中,每种生产工艺会伴随着特定的缺陷,不同零件的缺陷特征也截然不同,甚至同种工艺的不同零件都需要不同的模型来检测,否则无法达到预期效果。因此,如何运用较小的数据集来训练深层的网络结构以达到高效、准确的识别效果成了重中之重。

迁移学习[9]是一种机器学习的方法,指的是一个预训练的模型被重新用在另一个任务中,将预训练模型网络参数进行迁移,并且对已有数据集进行再训练的一个过程,可以高效地提升针对小数据集的识别准确率。ImageNet数据集是一个最初拥有100万张图片的数据集,发展到如今约有1 400万张图片,每一张图片都被手工标定好类别,共1 000个大类,是一个大型的公开数据集。

本文利用ImageNet数据集在模型上进行预训练,将训练好的参数迁移到缺陷检测的模型上,再利用已有的少量数据对模型进行再训练,从而提升模型的准确性。

3 实验与结果分析

3.1 数据采集及预处理

齿轮零件来源于金属注射成型机,并为本次实验专门搭建了数据采集平台,硬件包括CCD相机、远心镜头、方形白色光源、环形红光光源。具体如图4所示。

图4 硬件设备

在该平台下对齿轮表面进行拍摄,得到齿轮表面图像,并且根据表面特征将图片分为3类,分别是变形、划痕以及无缺陷,如图5所示。并且对图像进行平移,旋转,裁剪等操作对数据集进行扩充,按照4︰1的比例对数据集进行训练集和测试集的随机划分,最终的数据集如表1所示。

图5 特征种类

表1 数据集分布

3.2 模型训练

本文基于DenseNet121网络进行优化以及训练,网络中共有4个密集块,内部网络层数依次为6,12,24,16。整体网络结构如表2所示。

表2 DenseNet121网络结构

在pytorch框架下完成对网络的训练任务,首先在ImageNet数据集上进行模型的预训练,将得到的预训练模型在本文获取的数据集上进行迁移学习。由于数据量的限制,仅对分类器进行再训练,每次迭代用的图片数(batch_size)为64张,训练轮数设置为100,并使用随机梯度下降(stochastic gradient descent,SGD)[10]作为基础迭代器,交叉熵函数作为分类器的损失函数。

3.3 结果对比与分析

本文网络模型与resNet50,vgg16网络模型经过训练,得到三种模型下的损失函数值变化曲线,如图6所示。

图6 损失函数变化

三种模型在相同的迭代步数下,Vgg19由于层数较低的原因,损失函数的收敛速度是最快的。ResNet50的收敛速度最慢体现了特征重用层对加速网络训练有着很好的效果。最终三种模型的损失函数都在0.06左右发生了收敛。表3为三种模型在测试集上的准确率。

表3 模型准确率评估 %

Vgg19在无缺陷这一特征的识别率与本文模型相同,在130张图片的测试集上仅有一张图片判断错误,而变形和划痕的准确率仅有75 %左右。ResNet50在划痕和变形的识别准确率到达了97 %以上,但在无缺陷的特征集上效果相对较差。本文模型在三个特征的识别上都有较好的结果,模型识别效果相较于ResNet50和Vgg19有更高的准确率和稳定性,在总测试集上的识别准确率可达98.14 %。

4 结 论

针对MIM齿轮的缺陷检测,提出了一种基于迁移学习和特征重用的网络模型,自动提取零件缺陷特征完成高效率的缺陷检测任务。并与ResNet50,Vgg19两个经典模型进行对比,识别准确率有较大幅度的提升。由于零件数据集获取较为困难,只对已有数据集上验证了算法的性能,未来将获取包含更多种类缺陷数据集,以便进一步研究。

猜你喜欢

集上卷积准确率
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
Cookie-Cutter集上的Gibbs测度
链完备偏序集上广义向量均衡问题解映射的保序性
分形集上的Ostrowski型不等式和Ostrowski-Grüss型不等式
从滤波器理解卷积
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法