APP下载

基于ResNet-50垃圾分类算法的改进及应用

2022-11-05万兆江周瑜杰刘雨衡

智能计算机与应用 2022年10期
关键词:预处理光照分类

王 超,万兆江,周瑜杰,刘雨衡

(1 西南石油大学 工程训练中心,四川 南充637001;2 西南石油大学 工程学院,四川 南充 637001)

0 引言

垃圾分类是保护生态环境、促进经济发展的有效措施。据有关组织统计,中国每年产生的垃圾总量约1.5亿吨,因而当下则亟需采取行动来有效缓解垃圾治理压力。基于此,将垃圾进行分类回收,不仅能够有效提高垃圾的回收利用率,而且还有助于降低垃圾的处理成本。

目前,垃圾分类多是采用人工自主方式,不仅效率低、成本高,而且较易导致误分类。如何解决效率成本的问题,施行有效、智能的处理具有重要的研究意义。郑佑顺等人通过残差结构,采用幻象模块代替ResNet18,减少了网络参数量,提高识别精度。崔文婧等人通过VGG16的卷积神经网络对海洋漂浮垃圾进行分类识别,结果表明,该方法能有效区分干扰因素,得到有效特征点。许玉蕊等人通过Inception模 块 提 取 垃 圾 特 征,并 加 入Batch Normalization层提高了模型的训练速度和准确率。

综上可知,采用卷积神经网络对垃圾进行分类值得做更进一步的研究,旨在用来切实解决垃圾分类问题。同时,在图像和视频处理采集过程中,由于受各种客观因素影响,图像特征提取和细节信息可能出现一些意想不到的问题,采用图像预处理算法将能够较好地解决图像采集中手工覆盖提取不全和选择困难繁杂的问题。

因此,本文提出了一种改进ResNet-50的垃圾分类识别算法。通过二维Gamma函数对图像进行光照校正预处理,并且,采用激活函数和层优化了50网络结构,得到最优的网络模型。该算法可实现可回收垃圾、厨余垃圾、其它垃圾和有害垃圾四类垃圾的分类。

1 算法理论研究

1.1 图像预处理算法

在进行垃圾分类工作的过程中,由于工作环境多变、垃圾与其他物体发生相互遮挡以及环境的光照条件多变等因素的影响,难免会产生白噪声、并造成场景的光照不均匀现象,导致待分类垃圾的一些重要特征信息缺失,严重影响了正常垃圾分类工作。针对这些问题,本文采用滤波算法和光照自适应校正算法来对图像进行预处理。图像预处理设计如图1所示。

图1 图像预处理设计Fig.1 Images pre-processing design

本文图像预处理选择色彩空间中的通道中进行。因为,相较于色彩空间,色彩空间更符合人眼的视觉特性,且其通道直接对应图片的亮度,相比于处理的3个通道,既减少了卷积的次数,也有利于提高算法的运行速度。对预处理算法内容拟展开研究分述如下。

(1)图像的滤波处理:由于相机采集的图像中多为高斯噪声,故采用高斯滤波的方法来对图像进行滤波操作。高斯滤波公式可写为:

其中,为滤波后的图像;为高斯模板;为摄像头采集的原图片。

(2)提取光照分量:基于Retinex理论,图像主要由光照分量、反射分量和噪声组成。本文采用Retinex理论中多尺度高斯函数卷积的方法,来提取光照分量,提取的数学表达式如下:

其中,为估计的光照分量;为需要提取的光照分量的图像;为高斯函数。

(3)函数校正:通过刘志成等人构造出的二维函数。对源图像的色彩空间中的通道进行校正。二维函数的数学定义式见如下:

其中,为校正后的图像;为估计光照分量的均值;为光照分量。

本文采用预处理流程为:将摄像头采集的原图像进行高斯滤波,再将色彩空间转化为色彩空间,分离出通道。对分离后的通道采用公式(2)的方法进行光照分量的提取,接下来使用函数进行校正。得到校正后的通道,在此基础上可将校正后的通道和原来的、进行合并,并转化为色彩空间。由此得到的预处理流程如图2所示。

图2 图像预处理流程Fig.2 Images pre-processing process

1.2 深度学习算法

1.2.1 模型的选择

本文要甄别的垃圾种类较多,需要提取数目可观的图像特征,此时若采用较深的网络结构,确实可以牺牲训练的速度来增强网络的特征提取能力。但是网络层数的增加,不仅会使训练的速度大大降低。模型难以收敛、甚至不收敛,还会使模型出现网络退化、信息丢失等复杂问题。因此,在2015年,He等人提出了ResNet网络即残差神经网络,网络结构如图3所示。

图3 残差块结构Fig.3 Residual block structure

研究可得,对于图3中残差块的基本设计原理可给出如下的阐释论述。

该残差块输出为:

故其中卷积网络的学习目标为:

若此时卷积神经网络发生了梯度弥散问题,无法继续学习,即()0,此时有()0,即输出与输入为恒等映射,这样就解决了前文所述的训练收敛难、网络退化和信息丢失等问题。

在本文中,选用ResNet-50网络作为基础框架。原始的ResNet-50网络采用了作为激活函数,而激活函数在负区间没有输出,故易出现神经元失活等问题,影响网络的广度和深度以及收敛速度。因此,本文优化了原始的ResNet-50的一些网络结构来减少模型的信息丢失和提高模型的泛化能力。主要优化部分可做分析表述如下。

(1)采用函数代替作为激活函数。函数在负区间内仍有梯度。即输入值为负的时候,函数在负区间内仍有梯度。可以说函数继承了函数优点并且弥补了其不足。

(2)改变()层和激活函数的位置。 通过He等人的实验研究,可知在中将层和激活函数放在卷积操作之前可以更进一步地提高模型的泛化能力。

至此,本次研究得到的网络结构则如图4所示。

图4 优化后的ResNet-50网络结构图Fig.4 Optimized ResNet-50 network structure diagram

1.2.2 损失函数和优化算法的选择

(1)损失函数。损失函数()是经常在监督学习(深度学习的一种学习方法)中用到的一个函数。 函数的作用是可以衡量预测分布与真实分布的误差大小,作为深度学习的优化的目标函数,为训练中的模型指引优化的方向。

本文进行的垃圾分类研究属于多分类问题,因此,在深度学习算法中将交叉熵选为损失函数。交叉熵是信息论中的一个概念,在深度学习中,会将其用于评估预测分布和真实分布的相似度(混乱程度),非常适合用于多分类问题。交叉熵函数的数学定义公式具体如下:

其中,表示交叉熵;P表示预测分布中的第个值;R表示真实分布中的第个值;表示分布长度。

(2)优化算法。在深度学习中,基本优化算法使用的是梯度下降算法(Gradient Descent),此后出现的各种优化算法都是以该算法为基础改进得来的。

随机梯度下降(Stochastic Gradient Descent,SGD)算法可以对模型进行优化训练。SGD是通过随机采样少量的训练样本来计算梯度,故而计算速度快,对硬件设备要求低,但却也存在着收敛不稳定的问题。研究中,通过引入动量和随机分布样本在一定程度上能够减缓其不稳定的收敛状态。此外,在优化算法中,还使用了权值衰减()、神经元失活()等算法来防止模型过拟合,进一步提高模型的泛化能力。

2 算法实现与结果分析

2.1 垃圾分类算法验证

2.1.1 数据集的收集和预处理

(1)数据集收集和标注。由于开源的垃圾分类数据集的图片分类标准不同,并且图片涵盖的种类也颇多,故本文数据集由2部分组成:抽取的开源数据集中生活常见垃圾图片、及收集的日常生活中所产生的垃圾图片。图片的标注参照的是《成都市生活垃圾管理条例》的分类标准,其中包含了可回收物垃圾、有害垃圾、厨余垃圾、其他垃圾图片各1000张。数据集中部分图片如图5所示。

图5 数据集部分图片Fig.5 Images of part of the dataset

(2)数据集的预处理。本文数据集预处理(数据增强)方法是对图片进行一些操作(随机翻转、随机裁剪、随机缩放、随机旋转),以此来增加其数据信息量,并按照16:3:1的比例划分为训练集、验证集、测试集。3种数据集的种类和数量见表1。

表1 数据集种类和数量Tab.1 Types and numbers of the dataset

2.1.2 算法验证

在深度学习算法开始训练前,由于原始的ResNet-50上的线性输出层有1000层,为符合最终将垃圾分4类的要求,故还需要在模型中将线性输出层改为4层。

本文进行训练采用超参数为:批处理大小为每批16张图片,训练轮数为80轮,学习率为0.001。训练过程中训练集和测试集的损失值和准确率如图6所示。由图6可知,该模型损失值下降收敛较快,而且准确率上升也很快,准确率最终达到了99%。

图6 训练集和测试集的损失值和准确率Fig.6 Loss value and accuracy of training set and test set

2.2 算法实现效果

研究中,还将使用训练后的模型与预处理算法对不同类型的垃圾类别进行识别,算法识别的不同效果如图7所示。经测试可知,该模型能准确识别出4种类型的垃圾,效果较佳。

图7 算法预测结果Fig.7 Prediction results of the algorithm

3 结束语

保护生态环境是当今社会的热点话题之一,而做好垃圾分类则是其中的关键环节。本文通过分析大量文献与实验数据,提出了一种改进ResNet-50网络的垃圾分类模型。对比传统的分类模型,利用残差神经网络实现垃圾分类具有更高准确性和更快响应的特点,在达成目的的同时,还能够节省大量的人力和物力。在实际应用场景测试中,垃圾分类识别的精准率也接近预期值。但本文测试算法也存在一定问题,诸如:测试环境单一、图片数量有限、训练时的干扰项较少等。未来工作还会对在不同的环境条件下进行测试、增加数据集大小、以及设置更多的干扰项等诸多方面继续丰富研究成果,致力得到更为精准、且符合实际分类环境的算法。

猜你喜欢

预处理光照分类
肉种鸡的光照不应性对养殖生产的不良影响分析
非水溶剂预处理木质纤维原料研究进展
不同预处理对铁皮石斛热风干燥特性及品质的影响
手术器械预处理在手术室的应用
污泥预处理-厌氧消化体系的能源经济性评价
隐蔽的力量
按需分类
教你一招:数的分类
说说分类那些事
水禽舍的光照及其控制