APP下载

一种基于卷积神经网络的烟叶分级处理算法

2020-04-30王士鑫云利军叶志霞王一博

关键词:正确率烟叶卷积

王士鑫,云利军,2,叶志霞,王一博

(1.云南师范大学 信息学院,云南 昆明 650500) (2.云南师范大学 云南省光电信息技术重点实验室,云南 昆明 650500)

目前国内的烟叶分级一般还是采用人工分级的方式,这种方式往往存在烟叶分级的差异性、分级结果不稳定、合格率低等问题[1],同时会造成烟叶资源的浪费,烟农与收集站的矛盾等一系列问题;所以利用先进的信息技术对烟叶进行科学合理的分级,能够提高烟叶资源利用率,解决烟农与收集站的纠纷,对缓解民生问题和烟叶资源的可持续发展有着重大意义.随着图像处理方法技术的日趋成熟,越来越多的运用到烟叶分级中.2017年,宾俊等[2]提出了一种基于NIR和ELM的技术方法来对烟叶进行自动分级,避免高低价位烟叶之间的误判,但存在使用近红外光谱手动扫描烟叶时,每片烟叶仅有一条代表光谱,对残缺烟和杂色烟适用性不好的问题.同年,李航[3]提出了基于聚类和加权K近邻的烟叶分级研究,得到的识别正确率为94.59%.2018年,姚学练等[4]提出了基于PCA-GA-SVM的烟叶分级方法,利用PCA对烟叶特征进行降维去除交叉冗余信息,然后再利用GA对SVM的模型惩罚参数和核函数参数进行优化,对烟叶进行分级.同年,赵世民等[5]提出一种基于图像特征的烟叶分级方法,通过提取颜色、形状、纹理等特征对烟叶进行检测.2019年,赵树弥[6]根据机器视觉的技术检测分类手段,对送烤前的烟叶进行成熟度划分检测,并设计了全自动化的鲜烟叶检测分级装置.从以上分析可以看出,虽然国内外均对烟叶分级进行了研究,但都存在着样本数据量少、特征采集不完善等问题.同时,在图像识别技术发展过程中,相较于浅层网络依旧依靠人工手段对数据模型进行特征的提取,深度学习可以对数据模型进行逐层的特征提取,同时,深层网络结构对数据进行特征处理时,得到的特征值更易于图像分类和识别的分析.

1 本文烟叶分析算法

1.1 卷积神经网络

卷积神经网络(CNN)是一种具有深度结构的前馈神经网络(feedforward neural networks),具有表征学习(representation learning)能力,可以从输入数据中提取需要的数据特征[7-10].同时,卷积神经网络仿造生物的视知觉机制进行构建,其卷积层和池化层可以识别位于空间不同位置的相近特征,可以实现监督学习和非监督学习.卷积神经网络中的隐含层卷积核参数共享和层间连接稀疏性的特点,可以减少参数数量,使运算变得简洁、高效[11-12],因此被广泛应用在计算机视觉和语音识别等各个领域.

1.2 Inception V3

Inception V3模型是卷积神经网络中一种具有优良局部拓扑结构的网络,它最重要的改进是分解(factorization),也就是把对称的空间卷积分解成为不对称卷积(spatial factorization into asymmetric convolutions);相当于把一个大的二维卷积分解成为2个小的一维卷积,这样一方面节约了大量参数,提高了运算速度并减轻过拟合,让多余的计算能力用来加深网络;另一方面,网络深度获得了进一步提升,增加了网络非线性扩展模型的表达能力;不对称卷积结构模型如图1所示[13].

同时,将网络输入从224×224变为了299×299,使得35×35/17×17/8×8 三个inception模块组更加精细,并通过平衡每阶段的过滤器数量和网络深度实现网络的优化,达到扩展宽度和深度以及提高网络质量的作用.inception V3网络结构模型如图2所示.

1.3 烟叶数据集

本文实验样本数据来源于实地采集的云南省曲靖市某烟叶收集站.本文烟叶图片数据采集选用的设备为FUJIFILM X-A3,其图像传感器规格为23.5 mm×15.7 mm,采集的图片分辨率为6 000×4 000,输出的文件格式为JPEG.图3给出了本次采集的部分原烟中部叶组图片数据.

对所采集的12个等级的烟叶图片数据进行整合汇总,其分别为:上部叶组:B1F、B2F、B3F、B4F;中部叶组:C2F、C3F、C4F;下部叶组:X2F、X3F、X4F;以及杂色组B1K、CX2K.12个等级中每个等级的烟叶图片为 1 000 张,其中700张用于训练,300张用于测试,总计为 12 000 张烟叶图片.具体分类情况如表1所示.

表1 烟叶种类表

1.4 算法实现过程

1) 训练机器学习分级算法时,首先对数据进行预处理,接着对输入的烟叶图像并行地执行多个卷积运算(conv)和池化操作(pooling),将所有输出结果拼接为深度特征图[14],然后进行1×1、3×3 和 5×5 等不同的conv与pooling(设定卷积步长stride=1,分别设定padding =0、1、2)运算,将得到的烟叶图像特征进行拼接后获得烟叶图像的特征信息,最后对烟叶图像的信息进行并行处理得到烟叶的图像表征.

2) 在Inception V3网络中,将1×1、3×3、5×5的conv和3×3的pooling堆叠在一起,既可以增加网络的宽度,又可以提高网络的适应性;将一个二维的卷积分解成2个一维的卷积,一方面增加了网络非线性的扩展模型表达能力,另一方面可以使网络的深度获得进一步提升.图4为Inception V3模块组的结构图[14].

3) 在空间聚合之前降低烟叶的输入表征,使相邻单元结果的强相关性在降低维度时损失较小;同时,信号得到有效地压缩,使学习变得更快,减少训练所需的时间.

4) 为了避免训练过程中出现过拟合,采用迁移学习的方式来训练样本集;将卷积层的输出结合网络层完成迁移学习后,对烟叶图像进行特征向量提取,将提取得到的特征向量作为输入,来训练全连接层神经网络进行烟叶分级.定义网络架构为:

F(X)=Y′.

(1)

其中X为输入图像,Y′为真实类别,F为神经网络;选取交叉熵函数作为损失函数categorical cross-entropy loss,表示为:

C=-[YlnF(x)+(1-Y)ln(1-F(x))].

(2)

其中C为交叉熵损失函数值,Y为是实际输出,F(x)为期望输出;当Y=1时,交叉熵损失函数表示:

C=-ln[F(x) ].

(3)

当期望值输出越接近1时,损失函数越小,相反期望值越接近于0时,损失函数越大.当Y=0时,交叉熵损失函数表示为:

C=-ln[1-F(x)].

(4)

当期望值输出越接近0时,损失函数越小,相反期望值越接近于1时,损失函数越大.

5) 在训练过程中经过N个极值点,分别为M1,M2,…,Mn.表示为:

Mn=Max(M1,M2,…,Mk).

(5)

极值点进行跳跃时,以Mn作为起跳点,从n点开始起跳,如果跳出极点值时发现第k个极值点的性能Mk要优于Mn,则后面从Mk的位置开始起跳,当从Mk跳跃X次都没有发现比Mk性能更好的极值时,则取Mk为最优解值.

在网络层中偏置项w,b为变量,冻结inception参数,对全连接层中的参数进行训练;使用自适应矩阵(Adam)优化器对其进行预热,设置学习率(lr)=0.001,迭代训练20次,作为预热全连接层神经元;激活inception网络层,对损失函数中每个w,b求偏导.偏导公式为公式(6)、公式(7):

(6)

.

(7)

设置学习率,进行迭代训练时使损失函数C跳出所在的局部极小值;迭代20次,得到model_1,重复该算法依次得到model_1,model_2,model_3.由于每个model都处于不同的局部极小值点,当预测样本时,通过对模型进行融合作为预测值;训练一次可以得到3个模型进行融合.具体表示为式(8):

F(X)=(F(X1)+F(X2)+F(X3))/3.

(8)

2 仿真实验与结果分析

2.1 仿真实验

首先对输入的烟叶图像数据并行执行多个卷积和池化运算操作,通过不同的卷积运算与池化操作获得烟叶图像的特征信息,将输出结果综合为烟叶图像的深度特征图;然后将卷积层的输出结合网络层完成整个迁移学习过程;最后通过交叉熵损失函数来表示烟叶样本和预测概率之间的差值.交叉熵损失函数曲线如图5所示.

2.2 结果分析

对所采集的12个等级的烟叶样本数据进行仿真实验测试,对输入图像执行卷积运算,随着训练迭代次数的增加,交叉熵损失函数曲线逐渐趋于平滑,识别的准确率也随着训练次数的增加逐步稳定.同时与粒子群算法和遗传算法进行比较,得到优于这2种算法的识别正确率,其具体测试比较结果如表2和图6所示.

表2 不同算法的烟叶识别正确率

注:测试样本数均为3600.

通过以上对3种算法进行仿真实验对比分析可知:粒子群算法和遗传算法的识别正确率曲线呈平缓增涨,增长速度慢,正确率出现骤降现象,会影响烟叶分级的精准度.而从本文算法的实验结果可以看出:随着迭代次数的增加,烟叶分级的正确率有很大的提升,并且分析结果稳定,具体变化趋势如图7所示.

3 结论

针对烟叶分级仍然依靠人工分级为主的现状,本文提出了一种基于卷积神经网络(CNN)的烟叶分级方法.在对数据进行预处理后,将输入的烟叶图像并行地执行多个卷积运算和池化操作,通过不同的卷积运算与池化操作获得烟叶图像的特征信息,然后将卷积层的输出结合网络层完成整个迁移学习过程,最后通过交叉熵作为损失函数来表示烟叶样本和预测概率之间的差值.仿真实验结果表明,本文方法识别正确率优于传统的分级算法,识别正确率达到95.23%,为烟叶分级的理论与实践研究提供了一种新的思路.

猜你喜欢

正确率烟叶卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
门诊分诊服务态度与正确率对护患关系的影响
卷积神经网络的分析与设计
关于新形势下烟叶生产可持续发展的思考
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
烟叶主要真菌病害的发生与防治
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意