基于深度学习的智能垃圾分拣系统设计
2022-11-03李平原宋晓炜王玉莹
李平原,宋晓炜,王玉莹
(1.中原工学院 电子信息学院,河南 郑州 450007;2.开封大学,河南 开封 475004)
0 引 言
随着社会经济的发展,人类对资源的需求越来越大,由此产生的大量废弃物造成严重的环境问题,居民产生的生活垃圾逐渐成为制约城市发展的问题。传统的垃圾处理方式是混放且由市政管理部门收集处理,收集难度大,处理效率低,管理成本高。垃圾自动化分类对于城市发展至关重要,根据垃圾的性质和可利用价值,人类需要制定合理的垃圾分类准则,提高垃圾收集和处理的效率,改善人类的生存环境,促进可持续发展,提高人们的环保意识。
随着生活垃圾产量的增加,垃圾种类繁多,垃圾分类的工作量不断增加,利用人工智能技术去实现垃圾分类成为一个新的方向。人工智能技术发展很成熟,但与实际应用场景结合还是有很多难点。在判断垃圾种类时,由于深度学习的分类网络众多,选择准确率高的分类网络对各个种类的垃圾进行训练是主要难点,不仅是网络的选择,垃圾样本训练也是一个难点,需要收集尽可能多的垃圾种类。同时硬件分拣系统整体设计也是一大难点,需要选择成本相对较低、稳定性高的控制器。最后还要考虑测试系统与实际应用系统的差距,以及外部情况对本设计的影响。
随着人工智能和机器视觉的发展,普通垃圾分类也升级成智能垃圾分类。通过神经网络对目标进行模型训练实现垃圾的智能分类,其中卷积神经网络应用的范围最广,利用率最高。
吕文杰等人利用InceptionV3 模型对部分生活类的垃圾进行了检测识别并分类,将整个分类过程与手机APP 结合起来,能够快速对简单类别的垃圾实现分类。吴碧程等人则是通过构建卷积神经网络实现对垃圾的分类,不光对网络模型进行了改进,还设计了硬件的分类器。这些研究是对智能垃圾分类的不断探索,仍然存在很多不足。
本设计期望解放人们双手,通过训练目标检测网络模型,利用图像目标识别完成垃圾分类工作,旨在正确分类并增进人们对垃圾分类的认识。本文参照常用垃圾分类标准,将生活垃圾分为可回收垃圾、厨余垃圾、有害垃圾、其他垃圾四大类,并按照四类标准制作数据集,完成网络模型的训练与验证。
1 硬件设计与分析
设计利用HuskyLens 视觉传感器和树莓派4B 两个核心模块结合实现相应功能。总体设计框图如图1所示。本设计硬件包含HuskyLens 视觉传感器,树莓派,显示屏,红外溢满报警模块,二自由度舵机平台以及四个垃圾箱。首先利用HuskyLens 视觉传感器中摄像头对物体进行识别,显示屏上显示树莓派主页面,调试好目标检测模型的代码后开始运行,将物体放置在二自由度舵机平台上对准摄像头中心检测框进行识别。分类成功后,将分类信息通过控制器在显示屏显示并语音播报其分类属性,同时,二自由度舵机平台将垃圾自动投掷到相应的垃圾箱内。当垃圾箱内垃圾过多时,红外对管感知溢满后报警,提示管理人员更换垃圾箱。
图1 系统设计框图
1.1 HuskyLens 视觉传感器
HuskyLens 视觉传感器是一款简单易用的AI 视觉传感器。其中图像传感器分别为SEN0305 HuskyLens:OV2640(200W 像素)和SEN0336:HuskyLenspro:OV5640(500W像素)。如图2所示,显示屏为2.0 寸IPS,分辨率为320×240,其内置处理器为KendryteK210,K210 使用台积电超低功耗的28 纳米先进制程,具有RISC-V64 位双核CPU,每个核心内置独立FPU,拥有较好的功耗性能,稳定性与可靠性。该处理器集成了机器视觉与机器听觉能力。包含用于计算卷积神经网络的KPU。该视觉传感器包括快速傅里叶变换加速器,所以具备高性能处理能力。同时K210内嵌AES 与SHA256 算法加速器,为用户提供基本安全功能。
图2 HuskyLens 视觉传感器
1.2 控制器、红外传感器模块
本设计选用树莓派做为控制器。由于是实验阶段,选择控制器主要以功能齐全、体积小、成本低作为优先选择条件。树莓派接口丰富,二次开发的首选。显示器部分选择一个七寸显示屏并配有语音播放的功能。树莓派系列显示器常用分辨率为480×320,800×480,1 024×600,这里选用1 024×600 的显示屏。红外传感器的作用是判断垃圾箱的装载情况,这里采用红外对管搭载蜂鸣器来检测垃圾箱是否溢满。若溢满,则红外发射二极管亮灯并且蜂鸣器发出声响;若未溢满,红外传感器不做反应。
1.3 舵机分拣模块
如图3所示,是由两个舵机控制的二自由度平台与四个垃圾箱配合完成本设计中垃圾自动投递操作。二自由度舵机平台向四个方向的摆动是通过树莓派控制PCA9685 输出PWM 信号给舵机来完成。PCA9685 控制器由I2C 总线控制,具有16 个通道的LED,每个LED 的输出都包含12 位分辨率固定频率。接通和断开延时对于16 个通道中的每个通道都是独立可编程的。
图3 舵机分拣模块
2 软件设计与流程
在硬件系统的支撑下,通过软件部分的设计使得整个系统有序进行,如图4所示,先进行初始化,执行各个模块向相应模型的信息传送,首先将目标垃圾通过训练好的网络模型下进行检测分类,然后将检测到的信息送入到主控模块,主控模型按照垃圾类别,发出相对应的控制信号操控舵机执行分拣操作,并且在屏幕显示垃圾信息并伴随语音播报功能,最后通过传感器检测垃圾桶的装载情况并作出是否溢满的判断。
图4 主控程序流程图
针对垃圾的分类,本设计对比几类经典的分类网络后选择ResNet 网络。基于卷积神经网络的分类网络主要包括两部分,特征提取部分和分类部分。特征提取就是对输入的图片进行特征提取,主要包括各类卷积操作,通过卷积核的大小来控制学习的像素范围。分类部分主要是将学习到的特征进行分类,主要通过全连接层实现。常见的分类网络包括AlexNet、VGG-16、GoogLeNet、ResNet 等。如表1所示,按照图像识别竞赛提出的这几类网络的准确率,本文直接选择准确率最高的ResNet网络模型作为垃圾分类的分类网络。
表1 图像识别竞赛中不同网络的准确率比较
是2015年ImageNet 竞赛中图像识别任务冠军,错误率仅为3.5%,甚至超过了人类一般的识别能力。在ResNet之前,深度学习一直朝着更深层的网络方向发展,但加深网络层数未必在训练集和测试集上效果更好。虽然ResNet 层数更深,但是总参数量反而减少,准确率和速度均有提升。ResNet首次提出的残差模块,解决了深层卷积网络模型难训练的问题。当残差为0 时,此时堆积层仅仅做了恒等映射,至少网络性能不会下降,实际上残差不会为0,这也会使得堆积层在输入特征基础上学习到新的特征,从而拥有更好的性能。ResNet 有两个基本的块,分别是卷积块和残差块,其中卷积块的输入和输出的维度不一样,不能连续串联,可用于改变网络的维度;残差块的输入输出维度相同,可以串联,用于加深网络。
本设计制作的垃圾数据集包括四大类共计2 000 张图片。其中有害垃圾483 张,其他垃圾517 张,可回收垃圾542 张,厨余垃圾458 张。其中四类垃圾都包括日常生活的垃圾,还包括一些不常见的有害垃圾,确保数据集的多样性,这样训练出来的模型准确率高而且学习的类别也更多样。模型训练所使用的GPU 是技嘉GTX 2080Ti、显存11 GB,CPU 是Intel E5 2678 V3。训练过程中,损失函数起始条件一致,训练时不加载预训练权重。将训练好的模型权重文件烧录进HUSKYLENS 视觉传感器的处理器K210 中,利用训练好的模型对垃圾进行测试,结果如图5所示,三种垃圾的类别均测试正确。
图5 模型训练测试结果
3 实验与结果分析
按照四类垃圾的分类标准,通过传感器中的摄像头采集目标垃圾的信息进行检测识别分类。随机挑选几种垃圾进行测试,根据分类标准,桃子、茶叶属于厨余垃圾,镜子、便签属于可回收垃圾,电池为有害垃圾,纸为其他垃圾。挑选了一个测试结果如图6所示,便签属于可回收垃圾,放在置物台上,被判别为可回收垃圾,然后主控模块发出信号,舵机将便签扔进蓝色的可回收垃圾箱内,并且会语音播报其类别。红外检测溢满模块检测结果如图7所示,当将废旧电池扔进有害垃圾箱,垃圾箱满后,红外模块检测到溢满情况,发出指令,指示灯亮并语音提示有害垃圾箱已满。经检测,各部分功能均达到稳定准确的标准。
图6 便签分拣图
图7 红外测溢满模块测试图
4 结 论
目前,本设计通过进行模型设计确定了目前最优方案,用到的硬件价格适中,软件网络稳定性较强,准确率高,系统完整度高。但是经过多次测试发现,红外检测溢满模块易受到光照的影响出现误差,后期将对红外检测溢满模块进行封装,降低光照影响。根据生活垃圾分类智能投放箱企业标准的现状和对策,后期可以通过工程实践投入实际场景中应用。根据本设计硬件组成,将其进行封装,只展露出二自由度舵机平台,增强其可管理性和视觉美观性。
垃圾分类是建设文明家园的关键,保护地球生态是每个人的责任。而随着人工智能时代的到来,智能垃圾分类也逐步发展。本设计顺应科技发展,结合人工智能技术,通过训练ResNet 卷积神经网络结合以树莓派为主控板,以HuskyLens 视觉传感器为控制器的智能垃圾分拣系统可以实现对日常生活垃圾的准确识别和分拣。同时,垃圾分类的各项数据可以显示在显示屏上并且会通过语音播报出来,方便使用者实时了解垃圾箱的满溢情况、收集类型等。本设计与计算机视觉相结合,为垃圾分类提供一种新的方式,与智能硬件的配合使得垃圾分类工作更加便捷,本设计依然存在不足之处,由于着重实现各个模块的功能,忽略整个设计的外观设计,同时,对一些不常见垃圾识别率偏低的问题有待进一步学习与改进。