APP下载

基于多颜色空间的太阳能电池片智能分类∗

2021-04-04

计算机与数字工程 2021年3期
关键词:卷积准确率神经网络

(淮北师范大学计算机科学与技术学院 淮北 235000)

1 引言

在制作太阳能电池片时,表面成膜工艺的好坏决定了太阳光的吸收效率。目前工业界主要应用等离子化学气相沉积技术经高温把氮化硅沉积于电池片表面,由于各电池片沉积的多少不一,使得电池片表面颜色深浅不一致,业界根据颜色深浅程度,把太阳能电池片分为六类:浅淡蓝(Light-Light Blue,LLB)、中淡蓝(Medium Light Blue,MLB)、深淡蓝(Dark Light Blue,DLB)、浅深蓝(Light Dark Blue,LDB)、中深蓝(Medium Dark Blue,MDB)和深深蓝(Deep Dark Blue,DDB)。一张野外用的大电池板要使用相同颜色的电池片,使光照吸收均匀,外观颜色一致。而太阳能电池片颜色差别小,难以区分,并且人眼长时间工作,会产生视觉疲劳导致无法正确分类太阳能电池片。

针对人工分类太阳能电池片的困难,国内外学者对其花纹和颜色的分类进行了研究。文献[1]利用bp神经网络对不同花纹太阳能电池片进行分类以便于比较不同绒面效果对光电转换效率的影响,但该方法需人为提取特征作为输入。文献[2~3]利用基于颜色直方图统计对太阳能电池片颜色进行分类。但太阳能电池片表面颜色分布不均匀,且需要选择标准样品做对比实验,因此实验无法确定统一标准,实验结果误差大。以上方法都依赖人为主观意识获取太阳能电池片的分类特征,这对太阳能电池片的分类结果有很大的影响。

近年来随着深度学习的发展,通过监督学习式或非监督学习式的特征学习方法已渐渐替代手工获取特征方式。其中卷积神经网络[4]是深度学习的代表算法之一。1990年,Lecun等开发了Lenet-5[5]卷积神经网络。2012年,Krizhevsky等基于Lenet-5网络设计的Alexnet[6]在大规模图像问题上识别率远高于传统的识别方法。Alexnet的成功为其他CNN模式带来灵感,如ZFnet[7]、Vggnet[8]、Googlenet[9]、Resnet[10]、Densenet[11]等。然而,训练像Alexnet、Vggnet和Googlenet等这些深层的网络是非常困难的,且时间复杂度高,难以满足工业实时性要求。这使得国内外学者对初始网络的改进进行了研究。李勇[12]等在LeNet-5卷积神经网络中引入了跨连接的思想进行面部表情识别;林哲聪[13]等使用卷积层代替全连接层,提出一种GMP-LeNet-5卷积神经网络进行车牌识别。白创[14]等提出了通过改进网络结构实现人脸识别的LeNet-FC模型。上述方法都是对LeNet-5网络进行改进并应用在不同领域。因此,本文考虑在太阳能电池片的颜色分类任务中引入LeNet-5网络。然而LeNet-5网络中的Sigmoid激活函数容易产生梯度弥撒、收敛速度慢的问题,导致分类准确率低。除此之外,考虑到是对太阳能电池片的颜色进行分类[15],仅以RGB颜色空间图像作为输入,会忽略其他颜色空间在图像分类模型上的作用[16~20]。

为此提出了基于多颜色空间的太阳能电池片智能分类算法。首先构建太阳能电池片基本分类模型,通过改进LeNet-5的网络结构和修改激活函数提高模型性能;然后分析不同颜色空间在太阳能电池片分类中的作用,并给出多颜色空间分类融合算法。经过实验验证,算法满足工业生产流水作业的要求,达到识别率不低于90%的预期效果。

2 太阳能电池片基本分类模型

2.1 传统LeNet-5网络模型

LeNet-5卷积神经网络是一个多隐层的人工神经网络。如图1所示其基本结构主要包括输入层、卷积层(C1,C3)、池化层(S2,S4)、全连接层(C5,C6)和输出层,激活函数为Sigmoid。

LeNet-5网络最初是应用于手写数字识别,但用于识别太阳能电池片分类时,网络模型收敛速度慢,泛化能力差。由于与手写数字图片相比,太阳能电池片图片颜色丰富,纹理复杂。因此必须对传统的LeNet-5网络进行相应的改进。

图1 LeNet-5网络结构图

2.2 改进的LeNet-5分类模型

针对传统LeNet-5网络在识别太阳能电池片出现的问题,做了如下改进。

1)结构改进

增加了一层卷积层和一层池化层以学习到数据的更高层特征;将全连接层中的第二层改为dropout层,dropout层可以使网络中某些隐藏层节点在训练期间不工作,但它们的权重将根据需要保留。dropout层可以提高训练集的错误率,降低测试集的错误率,提高网络的泛化能力。

另外,太阳能电池片图片的颜色和纹理比手写数字图片更为复杂,原有网络的参数用于太阳能电池提取特征效果并不好。参考文献[14]中9种不同结构CNN的性能测试表明3×3的卷积核是最佳的。因此,本文将原5×5卷积核的尺寸改为3×3。此外,为了获得更丰富的特性,每层卷积核的数量分别设置为32、50和64。全连接层的第一层中的节点数更改为1024。太阳能电池片分类模型网络结构如图2所示。

图2 太阳能电池片分类模型网络结构图

2)修改激活函数

原有的Sigmoid激活函数在训练网络时出现梯度消失现象,导致基于LeNet-5模型的太阳能电池片颜色分类训练中收敛速度慢。根据ReLU和sig⁃moid激活函数的计算公式(1)~(2)可知,ReLU本身计算量远小于Sigmoid激活函数,并且其一阶导数是1,不会造成梯度消失。

另外ReLU激活函数具有单边抑制负输入和正输入线性映射的特性。因此ReLU激活函数的非线性映射具有稀疏性,可以使网络更稀疏,解决了sig⁃moid激活函数引起的梯度消失问题。此外,ReLU激活函数的梯度很好计算,大大缩短了训练时间,提高了收敛速度。

3 基于多颜色空间的分类模型

图像分类是计算机视觉领域最基本的应用之一。大多数用于图像分类的数据集往往由彩色图像组成,并且以往的图像分类算法没有对数据集进行颜色空间转换,而是直接使用RGB颜色空间图像进行分类,忽略了其他颜色空间的作用。因此本小节主要讨论以下几种计算机视觉常用到的颜色空间(包括RGB、HSV、Lab、YUV和YCbCr)对太阳能电池片分类的影响。

3.1 常见的颜色空间

颜色空间是定义在三维空间中,包含定义的颜色域中的所有颜色。RGB颜色空间是目前最常用的颜色空间之一,使用红、绿、蓝三原色来定量表示颜色。RGB颜色空间每个通道值的范围是0到255。在RGB颜色空间,任意色光F都有可以用RGB三种颜色不同分量的相加混合而成。

HSV颜色空间是将RGB颜色空间中的点在倒圆锥体中的表示方式,是从人类如何看待颜色的角度开发的颜色空间。HSV颜色空间即色相(Hue)、饱和度(Saturation)和明度(Value)。H的范围是0~360,S和V的范围是0~1。

Lab颜色空间用数字化的方式描述人对颜色的感知,由亮度L和有关色彩的a、b三个要素组成。a表示从洋红色至绿色的范围,b表示从黄色到蓝色的范围。RGB颜色空间无法直接转换成Lab颜色空间,需先转换成XYZ颜色空间,再转换成Lab颜色空间。

YUV颜色空间是被欧洲电视系统所采用的一种颜色编码方法,Y代表亮度(Luma),U和V代表的是色度(Chrominance)和浓度(Chroma)。YCbCr是YUV经过缩放和偏移的颜色空间。YCbCr颜色空间由亮度Y和有关色度的Cb、Cr三个要素组成。Cb反映的是RGB输入信号蓝色部分与RGB信号亮度值之间的差异。Cr反映了RGB输入信号红色部分与RGB信号亮度值之间的差异。

3.2 各颜色空间在太阳能电池片分类中的作用分析

利用第二节提出的改进LeNet-5网络作为太阳能电池片基本分类模型,研究分析不同颜色空间对太阳能电池片分类的作用。将原始RGB颜色空间的太阳能电池片图片转换为HSV、Lab、YUV和YCbCr颜色空间图片,分别将不同颜色空间图片作为太阳能电池片基本分类模型的输入。另外,基于本文是对太阳能电池片颜色分类的研究,因此考虑直接提取太阳能电池片B通道的值作为输入研究对太阳能电池片分类的影响,而不是直接输入RGB图片。图3展示了不同颜色空间的太阳能电池片数据集在太阳能电池片分类模型上的准确率随迭代次数的增加的变化。

图3 不同颜色空间的识别准确率对比

由图3可知,可发现使用不同的颜色空间会给实验带来不同的结果。基于RGB、HSV、Lab、YUV、YCbCr颜色空间和B通道的太阳能电池片随着迭代次数的增加,准确率以不同的上升速度上升,最后准确率趋于0.8~1之间。为了获得更有用的分类效果信息,将太阳能电池片在不同颜色空间的每一类准确率统计出来,如表1所示。

表1 太阳能电池片每一类在不同颜色空间的准确率

通过对表1更仔细的观察,可发现不同类别的太阳能电池片在不同颜色空间下有不同的准确率。具体表现在LLB和DDB两类太阳能电池片均获得较高的准确率,主要原因在于这两类太阳能电池片的颜色辨别度高,易于分类。而MLB、DLB、LDB和MDB位于中间的四类太阳能电池片颜色差别小,分类准确率较低。其中MLB、DLB、LDB和MDB分别在HSV、YCbCr、Lab和RGB颜色空间取得最高准确率。

另外,通过观察基于B通道分类太阳能电池片的准确率,发现太阳能电池片识别准确率较低。考虑太阳能电池片表面是由蓝色和白色线条组成,若只基于B通道分类太阳能电池片会忽略其他相关隐性特征,因此后续实验去除基于B通道分类太阳能电池片。

基于以上发现,可以得出一个重要结论:不同类别的太阳能电池片可以更好地用不同颜色空间表示并且各颜色空间之间没有存在百分之百的相关性。因此可以利用RGB、HSV、Lab、YUV和YCbCr多种颜色空间相互补充,以获得更好的分类结果。

3.3 多颜色空间分类融合算法

根据上述得出的结论提出基于多颜色空间的太阳能电池片智能分类算法。算法结构如图4所示。

图4 基于多颜色空间的太阳能电池片分类算法图

有图4可知,算法首先将不同颜色空间图片作为太阳能电池片基本分类模型的输入,训练得到各基分类器;然后由多颜色空间分类融合算法决定最终分类结果。多颜色空间分类融合算法具体步骤如下。

1)分别对图像的不同颜色空间做分类,获得各基分类器的分类概率P;

2)选择P最大的作为各基分类标签Pr;

3)利用多数表决原则对不同颜色空间的分类结果做统计,若存在最大概率的分类标签可以决定最终分类结果;否则由4)计算得到分类结果。

4)最终分类结果的标签由式(3)计算得到,定义如下:

其中,y为最终预测分类标签,n为分类正确的个数,c为颜色空间种类个数;Pc为太阳能电池片在各颜色空间预测的标签。w为分类投票权重,当Pc等于Pr时,w赋值为1,否则,w赋值为0。

4 实验结果及分析

4.1 采集实验数据

本实验中太阳能电池片的数据采集平台是由环形无影光源和固定在顶端的工业相机组成,工业相机型号为Basler acA2500。如图5所示。通过拍摄6类不同颜色的太阳能电池片,并随机翻转增强太阳能电池片数据集最终得到2934张图片,图片尺寸大小为224×224。将每类太阳能电池片图片按8∶2的比例分成训练集和测试集。

图5 太阳能电池片的数据采集平台

4.2 太阳能电池片分类结果及分析

本次实验硬件平台显卡为RTX2080Ti,软件平台为python,应用TensorFlow框架构建改进的LeNet-5分类模型,结合不同的颜色空间实现太阳能电池片的智能分类。实验首先比较分析不同模型在太阳能电池片分类中的性能,验证了改进的LeNet-5网络的有效性;然后对不同的颜色空间组合对太阳能电池片分类效果做分析,发现RGB、Lab和HSV三种颜色空间的组合模型分类效果最佳,准确率高达94.56%。

4.2.1 不同模型在太阳能电池片分类性能比较

图6 太阳能电池片在不同网络的识别准确率

为了验证改进的LeNet-5网络性能,本文太阳能电池片基础分类模型与传统的LeNet-5网络、bp神经网络和支持向量机(Support Vector Machine,SVM)进行对比。设置迭代次数为3000次,批量大小为64,学习率为0.0001。太阳能电池片随迭代次数在不同网络上的识别准确率结果如图6所示。由图6可知,改进的LeNet-5网络在识别准确率上均高于其他网络。传统的LeNet-5网络因sig⁃moid激活函数收敛速度慢,学习能力差,实现太阳能电池片分类的准确率维持在45%左右,分类效果差。另外,由于太阳能电池片表面颜色差别小且不均匀,提取的颜色特征容易对Bp神经网络和SVM造成分类影响,因此对太阳能电池片识别准确均低于改进的LeNet-5网络。

4.2.2 不同颜色空间对太阳能电池片分类效果分析

表2 太阳能电池片在结合不同颜色空间的准确率

基于太阳能电池片在不同颜色空间的识别准确率不同,因此结合不同颜色空间相去实现太阳能电池片的分类,表2给出结合不同颜色空间的分类结果。

由表2可知,太阳能电池片在结合YUV和YCbCr颜色空间时,准确率都会有所下降。这是由于太阳能电池片最主要的显性特征是颜色,从YUV和YCbCr颜色空间的物理意义和开发角度可知这两个颜色空间将亮度和色度分离,更加注重亮度,减少了色度分量。而RGB、HSV和Lab颜色空间是基于颜色感知的颜色模型,用饱和度和色调描述色彩,更有利于基于颜色分类的应用。

另外,结合表1和表2可发现当识别太阳能电池片准确率较高的颜色空间结合识别准确率较低的颜色空间时,准确率会有所下降;识别太阳能电池片准确率较高的颜色空间结合识别准确率较高的颜色空间时,准确率都会有所上升。因此结合多个识别准确率高的颜色空间会得到较好的识别准确率。所以针对本文太阳能电池片分类问题,最终选择结合RGB、Lab和HSV三种颜色空间实现太阳能电池片的智能分类,分类准确率为94.56%。

5 结语

本文在对太阳能电池片分类识别问题的研究上引入卷积神经网络方法,针对传统LeNet-5卷积神经网络在太阳能电池片分类识别上的不足进行改进,使太阳能电池片识别准确率均高于传统的LeNet-5网络、bp神经网络和SVM。并在改进的LeNet-5网络基础上,研究不同颜色空间对于太阳能电池片分类的影响。实验结果表明太阳能电池片在结合RGB、Lab和HSV三种颜色空间时获得最高准确,而在YUV和YCbCr颜色空间准确率较低,不适合用于太阳能电池片分类。与传统方法相比,本文算法更加高效,具有较好的泛化性,分类准确率满足工业应用需求。

猜你喜欢

卷积准确率神经网络
基于全卷积神经网络的猪背膘厚快速准确测定
基于FPGA的卷积神经网络加速优化方法
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
MIV-PSO-BP神经网络用户热负荷预测
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察