基于残差网络的光伏组件故障诊断

2023-11-23侯少攀

今日自动化 2023年7期

陈杰，侯少攀，崇锋，李江，李君

（1.国家电投集团青海光伏产业创新中心有限公司，陕西西安 710061；2.青海黄河智慧能源科技有限公司，青海西宁 810007）

新能源技术在近些年受到了广泛的关注，在新能源领域，太阳能是被认可和得到广泛应用的技术。与传统能源相比，光伏发电作为清洁能源，其卫生程度较高，对环境的污染较小，未来的发展前景良好。光伏电池组件作为光伏太阳能的核心组件，电池材料的自身可能会存在缺陷，并且加工电池片时也可能会导致电池片受损，如焊片、黑心片、断栅片等问题，这些缺陷问题不但会减少光伏组件的发电效率和使用寿命，而且有可能引起火灾等不必要的事故。因此，对光伏组件缺陷诊断的研究越来越重要。

如今检测电池组件缺陷的技术主要有红外成像技术、光致发光技术、电致发光成像技术（EL）、可见光检测技术。电致发光检测的原理是通过直流电源向组件注入正向偏置电流，通过适当的信噪比来获得高质量的电致发光结果。探测器会收集光伏组件有源部分所发出的特定波长的发光辐射。被收集到的电致发光会被处理成对比图像，揭示出具有不同发光活性的区域。所以可根据EL 图像判断电池组件中是否存在人眼无法检测到的缺陷。

目前，国内外对光伏组件故障诊断比较典型的成果有：文献[1]通过计算最小外接矩形在光伏电池板所占的比例来判断是否缺陷，该论文主要用的方法是传统的图像处理算法和HSV 空间模型；文献[2]采用传统的图像处理算法，通过模板匹配、图像金字塔结构、霍夫直线检测、干扰直线滤波等算法提取光伏组件，最后使用边缘检测等算法进行故障诊断，也取得了不错的诊断效果。使用传统方法进行缺陷识别准确率较低，所以文章使用深度学习的算法来进行缺陷诊断。

1 样本及样本预处理

试验中所使用的样本来自于BUERHOP-LUTZ C等人公开的数据集[3]。该样本由18个单晶型模块和26个多晶型模块组成。共计2 624个300×300像素的电池组件EL 图像。这些图像中的负样本由黑心片、黑斑片、短路黑片、明暗片、隐裂片等组成。其代表性特征如图1所示。

图1 负样本中包含的电池片缺陷

该数据集按照缺陷的概率对图片进行了标注，但因其正负样本分布不均，数据集相对较少，所以将缺陷概率小于50%的图片作为无缺陷的正样本数据，将缺陷概率大于50%的图片作为有缺陷的负样本。共计1809张无缺陷的正样本图片，815张有缺陷的负样本图片。并且因为其每种故障的样本较少，无法进行多分类，所以本试验将所有故障视为一类，进行有故障和无故障分类。

对于数据集样本不足和分布不均的情况，为避免产生过拟合的现象。文章对训练集图像采用图像增强技术来扩充样本数，有3种方法：①将原本的训练集水平翻转和垂直翻转；②将原始的训练集随机进行角度翻转；③通过改变原始图像的亮度、对比度和饱和度来扩充样本数。并且使用图像去噪的技术，降低图像的噪声以避免无关因素的干扰。因该网络结构的输入需使用三通道的图像，所以最后对其进行单通道向三通道的转换。

软件环境为Windows 64 位系统，使用的编程语言为Python，采用的深度学习框架为Pytorch，CUDA 版本为11.4。

在样本不足的情况下，通常采用80%的样本为训练集，20%的样本为测试集，经过计算选用2276张样本图像为训练集，348张样本图像为测试集。

2 基于ResNet的缺陷诊断网络

随着神经网络的不断发展，越来越多的神经网络结构涌现，如今较为主流且常见的卷积神经网络模型主要有AlexNet、VGGNet、GoogleNet 和ResNet。尽管当网络的深度越来越深，图像的特征会提取的越来越细致，图像识别的效果会越来越好。但如AlexNet、VGGNet、GoogleNe，随着其网络深度一味的增加会出现梯度消失和梯度爆炸等问题，影响网络模型的训练。ResNet 网络出现于2015年，并且在2015年ImageNet 的分类任务上取得了第一名的成绩，ResNet网络能够有效解决网络过深所产生的梯度消失问题，原因是其拥有残差结构。并且ResNet 网络不仅引入了残差结构，还引入了堆叠式残差结构，堆叠式残差结构可有效提高网络的性能和效果。残差模块由多个小尺度的kernel 组成。并且ResNet 网络整个特征提取部分都是使用全卷积的，这可大幅提高计算的速度。

ResNet 引入了残差模块从而解决了网络退化，如图2所示，其主要分为两条路。右边的路将输入原封不动的传到输出，左边的路是3层神经网络，无需拟合复杂的底层映射，只需拟合残差，残差模块最坏的结果是输入与输出相等。但残差只会比恒等映射模型更好，最后将残差与恒等映射相加，再使用非线性激活函数。而传统的线性结构难以拟合“恒等映射”。

图2 残差网络结构

2.1 迁移学习

在数据集有限的情况下，无法有效训练网络模型中的参数，所以采用迁移学习是最好的选择。迁移学习的本质是将一个领域的知识迁移至目标领域，这样目标领域可取得很好的学习效果[4]。简单的来说就是运用已有的知识来学习新的知识，核心是找到已有知识和新知识间的相似性。迁移学习在面对一些基本的规则时，模型无需重新学习，这极大降低了时间成本并且还能有效提高测试集的准确率。文章所使用的迁移学习模型是在ImageNet[5]上训练的，ImageNet 数据集包含了120万张图片，使用此训练集上预训练好的模型，可有效地在不同分类任务上使用[6-7]。本研究使用在ImageNet 上训练好的ResNet 模型来对光伏故障进行诊断。

2.2 空间与通道注意力机制

注意力机制是一种模仿人类视觉和认知系统的方法，主要是使神经网络在处理输入的数据时集中注意于相关的部分，并且弱化其他区域的信息，从而能够有效提高模型的性能和泛化能力[8]。CBAM 注意机制是将空间注意力机制和通道注意力机制相结合，如图3所示。空间注意力机制的目的是为让模型更集中在空间形状更重要的特征上，使得模型加强及减弱空间某些位置的特征，具体模型架构如图4所示，其主要对输入图像使用MaxPool 和AvgPool 聚合空间特征信息，得到特征图，并通过7×7的kernel 进行卷积计算后，通过Sigmoid 函数激活，得到空间注意力特征。

图3 CBAM注意机制

图4 空间注意力机制

式中，σ为Sigmoid激活函数。

在卷积中，一般会有多个通道的特征输出，有些通道的特征对最终的目标影响更大，通道注意力模块如图5所示，其为每个通道分配一个权重值，并调整不同通道间的特征，其主要通过最大池化和平均池化获取图像的特征描述符，通道注意力特征图Mc（F）表达式为：

图5 通道注意力机制

式中，MLP为多层感知机，σ为Sigmoid激活函数，W0和W1分别为权重，为平均池化运算，为最大池化运算。

为有效提取到EL 图像中的纹理、细节和轮廓特征，本研究在ResNet34的基础上加入卷积注意力模块，结果如图6所示，准确率为80.7%。

图6 分类准确率与损失率

3 试验及分析

3.1 梯度下降算法

在训练的过程中，每次的正向传播都会得到输出值和真实值的损失值，这个损失值越小，表示模型越好。梯度下降算法就是用来帮助寻找最小的损失值，从而可反推出在损失值最小的情况下所对应的权值w和偏置项b，以达到使模型优化的效果。

如今较为主流的梯度下降算法主要有SGD 和Adam 算法。SGD 算法保持一个单一的学习速率（称为alpha），其用于所有的权重更新，并且在训练的过程中学习速率不会发生改变。每一个网络权重都保持着一个相同的学习速率，随着学习的展开而单独进行调整。King ma 和LeiBa 这两位学者于2014 年12月，提出了Adam 优化器[9]，Adam 结合了AdaGrad和RMSprop 两种优化算法的优点。对梯度的一阶矩估计和二阶矩估计进行综合的考虑，计算出更新步长。Adam 算法中的修正偏差步骤可极大地缓解算法初期冷启动的问题。Adam 算法的内容如下。

Require：学习率ε，衰减速率ρ，动量系数μ，初始参数θ。小常数σ，用于被小数除时的数值稳定。初始化累计变量r=0，v=0。

当停止标准未满足时：

这两种梯度下降算法的损失率随着训练轮数变化的曲线如图7所示。在训练阶段，Adam 的损失率一直小于SGD。从这里可看出，在训练时使用Adam具有更好的效果。

图7 不同梯度下降算法的Loss

3.2 不同Dropout概率下测试集的准确率

当在数据集有限的情况下，模型可能会出现过分拟合的现象从而导致无法准确地预测训练数据或真实数据，这种现象就是过拟合。虽然神经网络凭借其大量的神经元和庞大的网络结构在分类等计算机视觉任务上表现的非常出色，但过大规模的网络也产生了过拟合的问题，当训练数据有限的情况下，网络会缺乏应有的泛化性。Nitish Srivastava 等人针对这一现象，提出了使用Dropout 的方法[10]。

Dropout 的含义是在深度网络的训练中，以一定的概率使神经元节点随机失活。因为Dropout 的随机失活使得每次训练小批量的数据时，都相当于每次的迭代都在训练不同的网络。简单的来说，Dropout 就是随机抑制神经元的前向和反向的传播[11]。

没有使用Dropout 时：

使用Dropout 时：

图8是当其它条件相同，仅Dropout 不同时，该模型对测试集识别的准确率。从图8 中可得出，当Dropout 为0.3时，测试集识别的准确率最高。在样本数据有限的条件下，神经网络的参数较多，Dropout过小会出现过拟合的现象。当Dropout 概率过大时在神经网络的全连接层网络的节点数量较少，并不能很好地拟合数据，会使得缺陷识别的效果不好。所以选择一个合适的Dropout 概率对减小过拟合的影响有非常重要的意义。

图8 不同Dropout时测试集的准确率

3.3 试验结果分析

试验训练参数见表1。

表1 训练参数

试验设置的初始学习率为0.005，训练迭代120次，在第85次时，模型在测试集上的准确率最高为84.4%。模型训练过程的损失和准确率曲线如图9所示。

图9 分类准确率与损失率

因本次试验的各类故障样本不足，无法实现多分类。下一步的研究将先增加数据集的样本数，在样本数充足的情况下训练神经网络，从而可实现多分类。

4 结束语

文章提出使用残差网络对太阳能电池组件的电致发光进行图像的缺陷识别，其能够有效提取故障电池片的特征，进行正确的分类，对光伏电站的运维具有重要意义。在2 624张样本上，使用加入CBAM的ResNet34 网络进行训练，通过对其Dropout 和随机下降梯度算法的调整，在测试集上的准确率可达到84.4%，未进行调整的模型准确率为75%，准确率提高了9.4%。另外因种类的数据集较少，不能实现多分类，下一步将继续拍摄基于电致发光的光伏组件故障图片，以便在实际的应用中实现电池片组件的缺陷识别。