基于卷积神经网络的织物缝纫平整度客观评价
2021-01-05王萌萌刘成霞
王萌萌,刘成霞,2
(1.浙江理工大学 服装学院,浙江 杭州 310018;2.浙江理工大学 服装数字化技术浙江省工程实验室, 浙江 杭州 310018)
织物缝纫平整度是纺织品外观的重要量度标准[1],现有研究多采用标样对照、直接测量等方法对织物缝纫平整度等级进行评定。近年来,由于标样对照法易受观察者自身主观因素及环境条件的影响,测量误差较大,相关学者开始采用智能化评价、建立预测模型等方法对缝纫平整度进行研究。在智能化评价方面,YoungjooNa等[2]使用图像处理技术研究缝纫平整度等级,Kang等[3]使用几何分析法客观评价了织物缝纫平整度,经过与主观评价的相关分析后发现该方法的准确率较高;李艳梅[4]运用小波分析及图像处理技术建立了多元回归模型和概率神经网络模型;蒋真真[5]利用BP神经网络建立了客观评价缝纫平整度的模型。研究者们主要先用图像处理技术提取织物缝纫平整度特征值,再利用人工智能技术评价织物缝纫平整度等级,但上述方法中织物种类、色彩会在一定程度上影响织物缝纫平整度等级评价的准确率。在建立预测模型方面,Tasaki等[6]日本学者致力于建立一个二元回归方程来评价缝纫平整度等级;刘侃[7]运用数学方法建立了织物缝纫皱缩预测模型;范蕤[8]用模糊神经网络建立了缝纫平整度的预测模型。上述模型的预测准确率虽达到了一定程度,但适用的织物种类范围较少。
综上,目前评价织物缝纫平整度方法的准确率易受测量方式、拍摄光线及角度、织物颜色、种类乃至组织结构的影响,且样本图片的获取比较耗时,不易推广,达不到广泛适用的效果[9]。因此,本文以织物缝纫平整度作为研究对象,试图找到获取样本简便、快速实现缝纫平整度等级分类的方法,且该方法能降低样本种类及其他因素对分类准确率的影响。
1 织物缝纫图像数据集采集与预处理
1.1 图像采集
由于卷积神经网络模型的训练需以大量数据为基础,因此本文制作了一个包含10种常用服装织物共1 200个样本的缝纫平整度数据集[10]。织物规格参数如表1所示, 将每种织物裁剪成10 cm×10 cm的缝条,整烫后由同一车工统一在同一时间段沿经向缝布条,使每块布条线迹相同且清晰可见。然后人工控制5种抽褶量(沿缝纫线迹抽褶)0、0.5、1.0、1.5、2.0 cm以制作样本缝条。同种织物不同抽褶量及产生的效果见图1,可以看出抽褶量越大,织物表面越不平整。
表1 织物规格参数
图1 同织物不同抽褶量及产生的效果
接下来使用佳能数码相机按照控制变量的方法,分别变化光照条件(强光、中强光、弱光)、拍摄角度(水平和倾斜45°)中的一个参数,对样本图像进行采集。其中,光照强度由LED灯来控制,将样本置于暗室的水平桌面上,固定LED灯,使其光线与被摄物体呈90°。调节LED灯的开关,强光为三档,光照强度为50 mcd(毫坎德拉);中强光为二档,光照强度为30 mcd;弱光为一档,光照强度为10 mcd。再将佳能数码相机固定于待测样本正上方,采集水平角度的样本图像,然后将相机顺时针旋转45°固定,采集45°的样本图像。每种织物同一抽褶量分别裁剪出4个 10 cm×10 cm的缝条,变化光照条件及拍摄角度后,可获取24个样本图像,10种面料共240个样本图像,5种抽褶量一共1 200个样本。然后随机截取样本图像的上半部分、中间部分或下半部分,替换原图像,保持同一抽褶量样本的总数不变,增加样本多样性。以往研究多需要专门的织物图像采集设备,且针对某一类织物展开研究,与之相比,本文在采集样本图像时使用的是普通相机,没有限制织物种类及拍摄条件,随机选取了不同的织物,在3种不同光照条件(强光、中强光、弱光)下,拍摄了水平、倾斜45°的图像,且选取了不同位置(上半部分、中间部分、下半部分)的图像。这样采集的织物缝纫样本更加丰富,同时分类难度也有所增加。
1.2 标签制作
训练卷积神经网络模型不仅要以大量样本数据为基础,还需要对训练样本进行分类标签。因此先用主观评价法对1 000个训练样本进行分类,根据GB/T 13771—2014《家庭洗涤后接缝平整度》标样规定:SS-5为第5级,SS-4为第4级,SS-3为第3级,SS-2为第2级,SS-1为第1级,等级越高,织物表面越平整。请10位专业人士对照GB/T 13771—2014单针迹接缝评级对比样照,对每个样本图片打分,0~20分为SS-5,21~40分为SS-4,41~60分为SS-3,61~80分为SS-2,81~100分为SS-1。对有争议的样本重新打分,直到得出比较合理的等级为止。
2 卷积神经网络模型的设计
2.1 卷积神经网络
卷积神经网络早期用在识别图像、文本、音视频等方面,其识别步骤是先利用训练样本建立模型,然后再对测试样本进行分类。本文中的训练样本为确定好平整度等级(即带标签)的织物缝纫试样,测试样本为待确认平整度等级的织物缝纫样本,需使用训练完成后的卷积神经网络模型来对其进行等级评定。卷积神经网络模型学习识别织物缝纫平整度等级的过程即为训练过程,它主要通过前向传播来提取样本图片特征,再经过反向传播更新权重。输出值由激活函数计算得到,激活函数见式(1)。
xl=f(Wlxl+bl)
(1)
式中:x为特征图;f为激活函数;l为层数;W为权值;b为偏置值。
前向传播中上一层的特征图通过一个可学习的卷积核进行卷积,再由激活函数来获取新的特征图。激活函数见式(2)。
(2)
在下采样层中,样本图片的倾斜和旋转产生的位置变化可忽略不计,其优点是对算法的性能和鲁棒性有较大提高的同时,对特征图的维数也有一定的降低,还可以减少过度拟合出现的概率。下采样层计算方式见式(3)。
(3)
式中:down()为下采样函数;β和b为输出特征的偏置值。反向传播可不断更新权值达到降低分类误差的目的,通常采用交叉熵损失函数运算误差损失。
2.2 残差卷积神经网络模型设计
目前,在图像分类中最出色的卷积神经网络模型是ResNet模型[11]。ResNet模型成功地训练了152层超深卷积神经网络,分类效果显著,且适用性非常广泛。
残差结构如图2所示,可以看出,残差卷积神经网络的基本残差结构特点是在高层和低层之间增加了一条短连接,输入x,通过F(x)进行一系列的乘和加操作之后输出F(x)+x。假设最优的拟合输出为H(x)=F(x)+x,则最优的F(x)就是H(x)和与x的残差,拟合残差可提高网络效果。由图2可以看出,残差结构的实现只是增加了1个短连接,并没有多出额外的权重,且高层和低层之间的特征融合也只是简单的加运算,所以具有残差结构的网络在提高分类精度的同时,并没有给网络带来过多的负担。不断地叠加残差结构就可获得1个较深的ResNet模型,最新的研究表明残差结构的卷积神经网络可以叠加至1 001层[12]。故残差卷积神经网络有三大特征:一是既实现了训练极深网络的目的,又能避免由于神经网络加深而导致的梯度丢失和梯度爆炸等现象;二是通过短连接形成残差结构操作简单,且模型易于训练;三是ResNet模型适用性很强,易与其他网络相结合。因此在对织物缝纫平整度图像进行分类时,残差结构的卷积神经网络比其他结构更有优势。
图2 残差结构
基于ResNet模型的三大特性,结合缝纫平整度等级评价的研究现状,本文设计了基于残差卷积神经网络的织物缝纫平整度客观评价模型如图3所示,可以看出,该模型以残差结构为基本结构,输入为织物缝纫样本图像,经过5个残差模块的叠加,完成织物图像的特征提取,输出为织物缝纫平整度的5个等级。
图3 基于残差卷积神经网络的织物缝纫平整度客观评价模型
与图2不同的是,在本模型采用的残差结构中,短连接跨越了3层网络层,分别是由2层1×1的卷积层和1层3×3的卷积层组成。其中1×1的卷积层主要用于特征图的降维和升维,目的是减少模型的计算量,增加模型的运行效率,而3×3的卷积层主要用于提取平整度图像的特征。此外,虚线表示短连接,该连接将低层的特征直接和高层特征相融合,不仅能有效避免梯度弥散、爆炸,还能增加网络结构的复杂程度,提高模型的鲁棒性。
全连接层的作用是将平整度特征映射为一个行向量,最终通过Softmax函数输出平整度的5个等级概率,Softmax函数的计算见式(4)。
(4)
式中:i为类别;j为类别的个数;Ci为每个等级类别的概率。通过交叉熵损失函数反向传播误差,更新权重,交叉熵损失函数如下:
(5)
式中:yi为每个类别的标签。此外,激活函数为relu函数[13]:f(x)=max(0,x)
3 实验部分
3.1 预处理
将1 200个实验样本按照5∶1分成1 000个训练样本与200个测试样本。训练时,为进一步满足卷积神经网络模型训练时的大数据需求,通过对每张图像加入随机噪声、随机旋转,以及颜色抖动等方式对训练集进行扩充。本模型的训练环境为:GPU NVIDIA tesla k80 24G,CPU E5 2680 V4,Cuda 9.0,Cudnn 7.1,Tensorflow 1.11。其中Tensorflow为谷歌出品的卷积神经网络框架,搭载GPU NVIDIA Tesla k80来进行加速训练,Cuda与Cudnn为调用GPU加速的工具。训练的图像批次(每次输入的训练样本个数)大小为16个,学习率为0.01%。
3.2 实验结果
将训练好的模型在包含200个样本的测试集上进行结果运行与验证,得到的Accr精度见图4,其中横坐标是Nepoch迭代次数,纵坐标是模型对测试集进行分类的准确率。可以看出,随着交叉熵损失函数不断进行误差的反向传播及网络权重更新,织物缝纫平整度等级分类的准确率也不断提高。图中的曲线有些微震荡,是由于网络在训练时不断地更新权重,会短时间陷入局部最优的情况,但随着训练次数的增加,训练精度整体呈增长趋势,最终稳定在96%左右。
图4 Accr精度图
3.3 与其他分类方法的结果比较
将卷积神经网络与模糊识别模型[14]、BP神经网络以及粗糙集-BP神经网络[15]这3种分类方法进行比较,在样本数量是其他方法10倍的情况下,卷积神经网络的精度比其他方法至少高出了3.25%。因此本文设计的卷积神经网络模型可快速地对常用服装织物的缝纫平整度进行等级分类,且分类结果客观准确。此外,利用卷积神经网络客观评价织物缝纫平整度的方法还具有如下优势:样本种类没有限制且适用范围广、样本图像采集时对拍摄条件和实验环境等要求低。
4 结 论
本文选取10种常见服装织物,将其定量抽褶、制作成具有不同平整度外观的1 200个缝纫样本,将其中1 000个作为训练样本,200个作为测试样本,对构建的残差卷积神经网络模型进行训练和测试,经过研究得到以下结论:
①该卷积神经网络模型可以有效地对缝纫平整度等级进行分类,分类精度比其他方法高出约3%。
②卷积神经网络模型的适用范围广,其缝纫平整度等级分类结果不易受织物种类、组织结构、花色等影响。
③设计的卷积神经网络模型样本图像采集流程简单,对拍摄条件、实验环境等要求低。
本文只采集了10种织物作为研究对象,市场上织物种类繁多,要提高卷积神经网络模型对织物缝纫样本分类的普适性,还需要进一步完善和优化该模型。因此,如何优化网络结构、提高织物样本的分类精度等都是值得进一步研究的问题。