基于深度学习的智能分类垃圾桶的研究与设计
2021-08-23魏家豪姜楠楠
魏家豪 姜楠楠
(哈尔滨华德学院,黑龙江 哈尔滨 150000)
习近平提出“绿水青山就是金山银山”。环保是民生的大课题,而垃圾分类则是环保的重头戏,从源头控制垃圾的产生和归类,是一个难点亦是一个重点。生活垃圾裸露在空气中,会释放出大量有害气体,粉尘和细小颗粒物随风飞扬,危害周围大气环境。在堆放过程中会产生大量的酸性、碱性等有机污染物,随雨水渗入地下,造成地下水水体污染。此外,生活垃圾也是病菌滋生地和繁殖场,影响周围环境卫生,危害人体健康。据相关部门统计,人均每天会产生约1.5 公斤的生活垃圾,每年会有接近200 多亿元的生活垃圾因分类难度大而被浪费。因此,为了达到更大程度上保护环境和节约资源的目的,智能分类垃圾桶便应用而生。本文试在学界相关研究的基础上,使用深度学习方法中的一种用于图像分类、Inception-v3 卷积神经网络模型,设计一种新型智能化分类垃圾桶。研究旨在有效进行生活垃圾分类,提高垃圾分类效率,尽可能达到资源有效利用和环境保护的目的。
1 结构设计
该智能垃圾桶框架为圆角矩形柱体。桶体高60cm,直径40cm。内部设有四个规格相同的长方体垃圾仓,待装不同种类的垃圾,分别为可回收垃圾、有害垃圾、其它垃圾及厨余垃圾。由于厨余垃圾比较特殊,液体部分会污染垃圾桶,因此,将厨余垃圾提前人工的装入特制的厨余垃圾袋(应用RFID 射频识别技术,在垃圾袋上贴上制作好的电子标签)。当垃圾仓装满垃圾后,打包器自动打包并发出警报声,以作向人提示。另外,此垃圾桶具有语音识别功能和驱动系统,它能根据人类说出的指令,自行到达指定位置。结构如图1、图2、图3 所示。
图1 框架结构图
图2 内部剖面图
图3 俯视结构图
图1、2、3 中:1-桶盖;2-感应垃圾窗口;3-桶体;4-桶轮;5-驱动系统;6-机械控制系统及语音识别系统;7-树莓派扩展板及供电系统;8-垃圾仓;9-分拣转盘及打包器;10-摄像头;11-LED 补光灯及RFID 读写器;12-垃圾隔板;13-铰链(合页)。
2 实现过程
当人手提拎垃圾距垃圾桶约10 厘米时,具有红外感应功能的垃圾窗口自动打开,垃圾进入分拣转盘后LED 补光灯和摄像头自启,对垃圾进行多角度全方位拍照。将捕捉拍摄的垃圾图片传至CNN 垃圾识别系统,识别此垃圾是何种类别,将识别结果发送给分拣转盘。转盘根据对应垃圾的种类旋转到对应类别的垃圾仓,随后,转盘上的垃圾隔板打开使垃圾掉入垃圾仓,投放成功。
3 架构基础
该智能垃圾桶总体架构由识别系统和智能硬件两大部分组成,在智能硬件上运行识别系统,该整体设计选用计算机程序设计语言Python。
3.1 识别系统训练思路
识别系统主要基于深度学习卷积神经网络CNN,(百度百科)卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(Deep Learning)的代表算法之一,具有表征学习(Representation Learning)能力。此系统简要概括为样本采集和模型训练,在模型训练中使用相关算法起到优化的作用。
3.1.1 样本采集及处理,将网上爬取或手动拍摄的垃圾图片,进行Tensorflow 图像处理[1]。
3.1.1.1 图像编码处理:将垃圾图像还原成一个三维矩阵。三维矩阵重新按照jpeg 格式编码,从而得到与原始垃圾图像一致的图像。
3.1.1.2 图像色彩调整:调整垃圾图像的亮度、对比度、饱和度、色相,使得训练得到的模型受无关因素的影响最小。
3.1.1.3 处理标注框:截取垃圾图片上信息含量较多的部分,提高模型的健壮性,使得训练得到模型不受被识别垃圾物体大小的影响。
3.1.2 模型训练,基于卷积神经的Inception-v3 模型。
3.1.2.1 卷积神经网络由5 部分组成[1-2],如图4,其各部分简略功能如下:
图4 用于图像分类问题的一种卷积神经网络架构图[1]
(1)输入层:是整个神经网络的输入。
(2)卷积层:(Convolution Layer)将神经网络中的每一小块进行深入地分析,从而得到抽象程度更高的特征。卷积过程所用数学公式:s(i,j)=(X*W)(i,j)+b=k=∑n_ink=1(XK*WK)(i,j)+b。其中,Xk代表第k 个输入矩阵。Wk代表卷积核的第k 个子卷积核矩阵。s(i,j)即卷积核W 对应的输出矩阵的对应位置元素的值。激活函数是ReLU,ReLU(x)=max(0,x)。
(3)池化层:(Pooling Layer)缩小全连接层中节点个数,进而减少整个神经网络中的参数。
(4)全连接层:(Fully Connected Layer)具有多层感知机分类器,完成分类任务。
(5)Softmax 层:用于分类问题,得到当前样例属于不同种类的概率分布情况。
3.1.2.2 Inception-v3 模型
经典的卷积神经网络架构有识别数字的LetNet-5 模型,不同卷积通过串联的方式连接在一起,而Inception-v3 模型中的Inception 结构是将不同的卷积层通过并联的方式结合在一起。Inception 模块给出方案,卷积层同时使用边长为1、3、5 不同尺寸的过滤器,然后再将得到的巨型拼接。如图5 所示。
图5 Inception 模块示意图[1]
Inception-v3 模型总共有46 层,由11 个Inception 模块组成,显示了Inception-v3 模型中的数据流向,这是一个带有许多层的,有着复杂结构的卷积神经网络[3]。如图6 所示。
图6 Inception-v3 模型架构图
3.1.3 优化过程
训练模型时使用前向传播算法使优化过程。输入1 个垃圾图片样本,CNN 模型的层数L 和所有隐藏层的类型,对于卷积层,需要定义卷积核的大小K,卷积核子矩阵的维度F,填充大小P,步幅S。对于池化层,需要定义池化区域大小k 和池化标准(MAX 或Average),对于全连接层,需要定义全连接层的激活函数(输出层除外)和各层的神经元个数[4]。得到CNN 模型的输出aL。
3.1.3.1 根据输入层的填充大小P,填充原始图片的边缘,得到输入张量a1。
3.1.3.2 初始化所有隐藏层的参数W,b。
3.1.3.3 for l=2 to L-1:
(1) 如果第l 层是卷积层, 则输出为:al=ReLU(zl)=ReLU(al-1*Wl+bl)
(2)如果第l 层是池化层,则输出为al=pool(al-1),pool 是指按照池化区域大小k 和池化标准将输入张量缩小的过程。
(3)如果第l 层是全连接层,则输出为:al=σ(zl)=σ(Wlal-1+bl)。
3.1.3.4 对于输出层第L 层:aL=softmax(zL)=softmax(WLaL-1+bL)
3.2 智能硬件构建基础
智能硬件基于树莓派,它是一款基于Linux、信用卡般大小的卡片式计算机[5-6]。在树莓派硬件上进行相关的配置以及附属电子器件。
(1)数据信息传输需网络环境。通过无线接入点的方式联通网络。
(2)配备供电系统。
(3)添加与树莓派兼容的摄像头。
(4)添加LED 补光灯。为了使拍摄效果更好,建立良好的照明区域,可以同时从四周和顶部均匀给光(深色圈圈代表LED灯,深色长方形代表摄像头),如图7 所示。
图7 照明区域
(5)添加机械控制系统,使其控制分拣转盘运转。
(6)添加移动驱动系统。安装电机驱动扩展板以及小轮,电机驱动扩展板是一种安装在树莓派顶部的附加硬件,能够在符合电压和电流要求的情况下同时为多个电机供电(如:PaspiRobot Board V3),从而为电机提供相应的驱动信号。
(7)添加语音识别系统,使智能垃圾桶可以理解人类语音命令后发起动作,到达人类指定的地点。
语音识别的基本原理如图8 所示。语音识别包括两个阶段:训练阶段和识别阶段,需要对输入语音的信号进行预处理和提取其特征值。训练阶段所做的具体工作是采集许多的语音语料,经过不断地处理和提取后得到特征矢量参数,最后通过特征建立数学模型来达到建立训练语音的参考模型库的目的。而识别阶段所做的主要任务就是将输入语音的特征矢量参数和参考模型库中的参考模型进行类似的度量比较,然后把类似的度最高输入语音特征矢量作为识别结果输出[7]。
图8 语音识别的基本原理
4 研究意义
综上所述,依据本设计核心,可以根据不同的使用环境,增加更细致的垃圾分类类别,构造出相适应环境的智能分类垃圾桶。其可用于个人家庭、办公场所、公共场合等。
人类日常生活中,会产生大量的纸屑、饮料瓶、塑料袋、果皮、食物残渣、废旧金属及报废电池等。垃圾放入该智能分类垃圾桶,经内部自行操作,从识别到垃圾袋打包再到垃圾仓套袋,整体过程为一体化操作,不需要人为参与(仅提前将垃圾袋安装到桶内的特定位置),在忙碌的生活中,极大的简化了人工投放的过程,也解决了对于某些垃圾类别不明确的难题,同时也避免了垃圾对环境的二次污染。
由于不需要再次分拣,因此简化了垃圾后期再次回收和处理的过程,减小了人力、物力及财力重复的投入和浪费。通过智能分类垃圾桶将已分类好的垃圾,如纸屑、饮料瓶、金属等有效分类管理,可直接用于相关工厂二次生产,厨余垃圾可用于发电或制作肥料。据中国财经观察网预测,住建部推进生活垃圾分类,垃圾回收利用率将会高于35%。若使用该智能分类垃圾桶,回收率在此基础上会有所增加,极大程度上实现了资源的节约。
5 结论
本文设计的智能垃圾桶,在识别系统部分,采用一种用于图像分类、Inception-v3 卷积神经网络模型。该系统搭载于树莓派等智能硬件上,整体为模块化设计,实现了垃圾桶自动识别与分拣垃圾的功能。利用语音及传动技术,赋予智能垃圾桶交互和移动功能。智能化和科技化是社会发展的必经之路,科技与文明共存,用先进的科技手段,努力“建设资源节约型、环境友好型社会”[8]。