APP下载

基于Alexnet的金相识别研究

2021-09-25谭兆湛官振林

机械工程师 2021年9期
关键词:金相卷积准确率

谭兆湛,官振林

(华南理工大学 广州学院,广州 510800)

0 引言

在高校工科机械类各专业的人才培养计划中,《机械工程材料》是所有学生的必修课。对于这门理论性与实践性都较强的课程,我校单独设置了《机械工程材料综合实验》课程(32学时,1学分),通过综合实验把抽象的理论与生动活泼的实践教学结合起来,从而让学生加深对理论和概念的理解,培养独立获取知识的自学能力、解决问题的实践技能和综合素质[1]。每学年多个专业的学生进行了综合实验,金相图片的拍照量上千张,金相图片的分类与处理占用教师的大量时间与精力。传统的金相分析和识别大多是依靠经验在显微镜下观察来分辨金属的组织,不仅效率低,而且受人为主观影响,容易造成视觉误差。20世纪70年代,随着计算机的发展,美、日等国率先利用计算机图像处理技术进行金相的分析与识别,实现金相图像的快速、准确分析和识别[2]。近年来,随着人工智能技术的快速发展,以BP神经网络为基础的深度学习成为计算机处理图像问题的一种新方法[3],并在人脸识别、医学图像诊断和语音识别等多个领域不断取得成功[4]。深度学习由Hinton等[5-6]在2006年提出,主要通过BP网络自动获取多层次的图像特征。Lecun等[5-6]提出了卷积神经网络(Convolutional Neural Network,CNN),CNN是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现,是近年发展起来,并引起广泛重视的一种高效识别方法[7]。目前较为常用的深度学习模型有Alexnet、VGG Net、Google Net等[8-13]。在图像分类领域,使用CNN手写数字识别率已达99%。

金相图像的人工识别需要一定的经验,甚至有部分金相组织形态较为接近,人工识别难度较大,容易出现失误。对实验所得的大量金相图像进行人工识别与分类,所耗费时间也较大。所以本工作采用深度学习模型中的Alexnet对批量的金相图像进行分类、识别。

1 4种不同材料的热处理工艺及其金相组织特征

为激发学生对机械工程材料综合实验的兴趣,实验设计了自行车飞轮、自行车链条、轴、轴承、手动锯条、弹簧、冷作模具、热作模具、塑料模具、滚动轴承等多种源于实际生活与生产的任务,每个同学任选其中一种任务进行实验,实验过程中每位同学会对自己的材料进行预先热处理和最终热处理,并分别拍两张热处理金相图片。本文选取其中4种材料进行热处理后的不同金相组织进行识别,分别是45钢的正火、GCr15球化退火、Cr12淬火+低温回火、65Mn淬火+中温回火。

45钢的正火工艺是850 ℃加热30 min,空冷,在显微镜下放大500倍所得组织为珠光体和铁素体(白色),如图1(a)所示。GCr15球化退火后的组织是铁素体基体上均匀分布的颗粒状碳化物和粒状珠光体,在显微镜下放大500倍观察,如图1(b)所示。Cr12经980 ℃加热油淬+低温回火后,得到基体为回火马氏体,白色颗粒状及块状的共晶碳化物,如图1(c)所示。65Mn经过850 ℃油淬+中温回火的组织为回火托氏体,如图1(d)所示。

图1 4种不同材料的金相组织

可以看出,不同的金相组织其形态特征是有区别的。金相组织的组成可能是单一组成物,也可能有两种或两种以上组成物。不同的组成物受溶液浸蚀的程度不同,使得其在金相显微镜下具有不同的明暗程度或不同的色彩差。而一些特定的组成物具有片状、针状、块状、颗粒状、条状、网状等显著的特征,如典型的珠光体具有层片状(或称指纹状)特征;羽毛状物是上贝氏体;白色的块状物可能是铁素体、奥氏体或碳化物;针状物不是马氏体就是下贝氏体等等。

根据不同的金相组织特征,利用Alexnet神经网络对输入的金相图像进行特征提取、选择和分类,能很好地避免人工提取特征的缺点,减少人工提取的工作量。

2 基于Alexnet的金相图像识别

2.1 Alexnet神经网络模型

基于卷积神经网络的图像分类过程包括图像输入、提取图像特征、前向传播和后向传播、预测等4个阶段。Alexnet神经网络作为高效的图像识别网络,包含8个带权重的层[14]。图2为Alexnet神经网络模型图,前5层是卷积层,主要进行特征检测,即对数据执行卷积、池化或修正线性单元(ReLU)等操作。其中前2个卷积层和第5个卷积层包含有池化(Pooling)操作,其它2个卷积层没有池化操作。后3层是全连接层,主要进行分类。

图2 Alexnet神经网络模型图

根据图片的局部关联性质,卷积层利用局部区域通过卷积计算出特征映射神经元并组合成特征图,卷积核是算法自己学习得到的,n个特征图就提取了这个图片的n维特征。同时,图像的某个特征出现的位置并不是固定的,通过池化合并图像特征相似的局部区域,既降低了各个特征图的维度,又保持了大部分重要信息。全连接层相邻2个层中的输入与输出的所有神经元都有权重连接,最后一层全连接层输出各类的概率,依据概率大小来判断图像的种类。Alexnet的输入图像为227×227像素的3通道RGB图像,经过卷积层中卷积、池化或修正线性单元等操作,特征图像尺寸逐层递减,最后由全连接层输出1000个特征图单元。表1为网络层级结构和特征图维度变化情况。

表1 特征图维度变化情况

2.2 面向金相图像识别的Alexnet迁移学习

使用Alexnet对未在原有网络中训练的对象分类,可以利用迁移学习重新训练。迁移学习是将一个类型问题的知识应用于不同类型但相关的问题的学习方法, 通过把已训练好的模型参数迁移到新的模型来帮助新模型训练[15]。本研究的金相图片数据集只有4个分类,修改最后一层全连接层输出神经元个数为4再进行训练。

设金相图片样本集为{x(1),y(1),…,x(m),y(m)},样本总数为m,x(i)、y(i)分别对应第i个样本的预测特征值和分类标签值。网络训练过程由图像特征信号的前向传播和误差的逆向传播组成[16]。训练样本输入到网络中,样本通过神经网络输出预测值,整个过程如式(1)所示:

对式(2)的最小值进行求解,采用批梯度下降法更新wl和bl,迭代更新公式如下:

式(3)与式(4)中,α是学习率。根据更新后的wl和bl,通过反向传播算法反向调整网络中的参数大小,使误差值不断降低,从而使得整个网络模型达到更好的分类效果。通过重复以上步骤,进行反复迭代,使得网络模型达到收敛状态,就可完成分类方法的训练。图3是经过多次迭代后,输出到最后一层全连接层的4种金相组织的特征图。

图3 Layer8中4种金相组织的特征图像

3 实验与结果分析

3.1 实验环境与数据集

本实验是在MATLAB R2019a软件环境下进行的。图片样本数据集是4类金相图片,分别是45钢、GCr15、Cr12和65Mn在不同热处理工艺下的不同金相组织,选自多个学年间的学生作品。所有图片都是通过徕卡显微镜DMI3000采集得到,放大倍数是500。经过筛选,每类选出500张,共2000张,并以每一类数量的80%作为训练集,20%作为测试集。

3.2 结果分析

设置学习率为0.001,金相图片的训练迭代次数与识别准确率如图4所示。可以看出,随着迭代次数的增加,准确率也不断增加,迭代次数达到60次时准确率接近99%,往后准确率基本在99%上下小幅波动。

图4 迭代次数与准确率

图5为某一次训练试验中4类不同材料的金相组织的识别情况,可以看出,45钢平衡组织与GCr15球化组织有自身的特点,识别准确率达到100%;Cr12与65Mn淬火组织都有一些白色块状物且腐蚀后颜色较深,或在对焦不准的情况下拍摄后都有可能被误判。图6为同一次训练中,随机抽取的4个带有预测标签和预测概率的测试图像。对金相图片测试集进行10 次无重复训练验证,最终平均识别准确率达99.63%,满足较高识别率的要求。

图5 实际类别与预测类别

图6 测试图像的预测概率

4 结语

针对《机械工程材料综合实验课》课程中的金相图片人工分类工作量大的问题,本文分析了4种金相组织不同形态特征,提出利用深度学习的方法进行机器分类;分析神经网络Alexnet结构及其训练过程,通过迁移学习方法调整了Alexnet训练模型的网络结构,并应用该训练方法在4类金相组织图像样本库上进行深度学习,达到99.63%的识别准确率,可大大提高图片分拣效率,缩短教学资料的整理时长,减少人工识别的工作量。

猜你喜欢

金相卷积准确率
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
从滤波器理解卷积
纯锆显微组织的显示方法
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法
球墨铸铁件金相组织分析与控制
一种基于卷积神经网络的性别识别方法