基于多站支路功率联合学习的分布式光伏支路异常检测方法
2022-08-11苏雍贺谢祥颖任天翔
苏雍贺,左 颖,靳 健,张 贺,谢祥颖,任天翔
(1.北京航空航天大学 自动化科学与电气工程学院,北京 100191; 2.北京航空航天大学 前沿科学技术创新研究院,北京 100191; 3.北京师范大学 政府管理学院,北京 100875; 4.国网电子商务有限公司 光伏云事业部,北京 100053)
0 引言
随着碳中和日渐深入人心,以分布式光伏为代表的新能源蓬勃发展[1-3]。由于分布式光伏发电站运行于恶劣的室外环境,频发的支路异常导致其发电效能损失巨大[4]。“十三五规划”期间,分布式光伏站点大量建设,如何精准和便捷地检测分布式光伏多站支路异常,已成为新能源行业关注的焦点[5-6]。
近年来,由于信息技术不断发展,基于人工智能的分布式光伏异常检测已成为行业共识[7]。当前的分布式光伏支路异常检测方法可分为两类:①利用每个站点支路异常辨识性特征的差异表示,构建异常检测模型[8-10];②采用多个站点支路异常辨识性特征的相似表示,实现异常检测[11-12]。然而,这些研究均未从多站支路异常辨识性特征的相似和差异表示方面来考虑分布式光伏多站支路异常检测。这一构想可能是提升多站支路异常检测精度的有效方法。本文通过分析人工智能技术,采用基于多站支路运行数据联合学习(Joint Learning, JL)[13]的方法实现该构想。
为实现设计的方法,本文利用收集的多站支路功率数据开展了以下研究工作。首先,通过设计的多尺度卷积神经网络有效捕捉了多站支路功率中存在的多时间尺度特征;利用辅助任务优化构建了联合学习模型,从而充分学习支路异常辨识特征的相似表示;采用多阶段训练的策略,并于第二阶段训练中舍弃了辅助学习任务,从而减少了辅助任务对多站支路异常检测主任务的消极影响。最后,通过以上技术实现基于多站支路功率联合学习的分布式光伏支路异常检测方法。此外,通过与当前研究方法进行对比,证明本文所提方法在检测分布式光伏多站支路异常时具有更高的精度和更好的建模便捷性。
1 分布式光伏支路异常检测研究现状
1.1 分布式光伏支路异常的检测数据形式研究现状
随着物联网技术逐渐应用于分布式光伏站点的建设,已存在大量通过采集数据检测分布式光伏异常的研究。根据数据形式的差异,当前分布式光伏多站支路异常检测研究可分为:①基于一维信号的支路异常检测数据形式,例如,AMMICHE等[14]提出一种利用一维功率数据进行分布式光伏异常检测的方法,BAKDI等[10]利用主成分分析法提取电流、电压和功率等多种一维信号数据的特征,并设计了可检测支路异常的方法;②基于转化二维图像的支路异常检测数据形式,如,AZIZ等[15]利用太阳辐照度、温度、电流和功率等支路数据转化的二维图像,对支路异常状态进行了辨识,CHEN等[16]采用温度、辐照度、单流和电压四种支路异常相关数据生成的二维图像,判断支路是否处于异常状态,LU等[17]使用电压和电流两种支路采集数据转化的二维图像,实现了支路异常检测。
由上述内容可知,一维信号和转化的二维图像是光伏支路异常检测领域广泛使用的数据形式。两者相比,转化后的二维图像具有更多的局部特征,可为异常检测提供更具辨识性的特征,从而使得基于转化二维图像的异常检测方法效果更好[16-19]。鉴于此,本文采用基于转化的二维图像样本实现支路异常检测方法。
1.2 分布式光伏支路异常的检测方法研究现状
目前,许多专家学者针对分布式光伏支路异常检测方法开展了大量研究,其方法主要可分为以下两种:①根据单个站点支路异常辨识性特征的差异表示,实现其异常检测。例如,PILLAI等[8]利用不同阴影遮挡下的多类型站点支路异常特征的差异表示,提出了一种支路异常检测方法;PLATON等[9]利用不同光伏站点中的差异性支路运行异常数据,设计了一种低复杂度的异常检测方法;BAKDI等[10]对薄膜、单晶和多晶等多个类型光伏电站异常数据进行了分析,根据其异常的差异性表示提出了支路异常检测方法。②使用多个站点支路异常辨识性特征的相似表示,实现其异常检测。例如,SHI等[11]对不同容量的多个分布式光伏站的异常情况进行了分析,并根据其支路电气数据特征的相似表示,设计了一种多站支路异常检测方法;ZHAO等[12]依据两个不同光伏站点异常运行数据之间的层次化相似性表示,提出了可用于多站支路异常检测的方法。
由上述内容可知,当前研究缺乏对分布式光伏多站点间支路异常辨识特征的相似性和差异性表示的协同关注,而这是提升支路异常检测的关键。联合学习[13]是适合执行这一构想的方法,其通过多个站点支路异常检测任务的同时学习即可实现。然而,如何基于这一方法充分学习多站点支路异常辨识特征的相似和差异表示,从而实现精准的分布式光伏多站支路异常检测,仍需进一步探究。
1.3 分布式光伏支路异常的检测算法研究现状
在分布式光伏多站支路异常检测领域,异常检测算法是研究的热点。根据检测算法的差异,这些研究可主要分为基于统计分析算法、基于传统机器学习算法和基于深度学习算法的分布式光伏支路异常检测。
(1)基于统计分析算法的分布式光伏支路异常检测。例如,SHI等[11]利用支路电压、电流和功率信号,设计了基于多站点反距离加权的支路异常检测分析法;BRESSAN等[20]通过对支路电压和电流数据的标准误差分析,提出了一种可用于检测遮挡情况的支路异常的方法;TAGHEZOUIT等[21]提出了一种基于核密度估计算法的支路异常检测方法,并对不同类型的支路异常进行检测。
(2)基于传统机器学习算法的分布式光伏支路异常检测。例如,HARROU等[22]使用定义的支路异常特征,提出一种基于K最近邻算法(K-Nearest Neighbor, KNN)的光伏支路异常检测方法;ZHAO等[23]根据异常规则提取了支路异常特征,并提出一种基于决策树(Decision Tree, DT)的光伏支路异常检测方法,结合图论增加了提出方法的自学习能力;LIN等[24]使用基于误差反向转播的人工神经网络(Back Propagation Neural Network, BPNN)对其设计提取的光伏异常特征进行学习,并在局部材料老化、遮挡、开路、短路等多种支路异常情况下进行了检测。
(3)基于深度学习算法的分布式光伏支路异常检测。例如,AZIZ等[15]提出一种基于卷积神经网络(Convolutional Neural Network, CNN)的光伏支路异常检测方法;CHEN等[16]利用温度、辐照度、电流和电压等数据对不同的光伏异常进行了分析,提出一种基于残差卷积神经网络(Residual Convolutional Neural Network, ResCNN)的支路异常检测方法;LU等[17]设计了一个由9个卷积阶段和1个分类阶段构成的CNN,并将其用于检测支路异常。
由上述内容可知,基于统计分析算法的支路异常检测方法虽然可快速地检测支路异常,但多站点的外界环境差异大,导致其支路运行数据样本的统计特性易产生较大差别,使得这类方法无法精准检测大数量分布式光伏站点的支路异常。基于传统机器学习算法的支路异常检测方法依赖于人工提取的特征,但由于对支路异常机理认知的局限性,人工提取的特征无法精确体现原始支路运行数据的辨识性异常特性。因此,这类方法难以准确判断分布式光伏多站支路异常。基于深度学习的方法普遍使用CNN直接从二维图像中自动提取特征,进而实现分布式光伏支路异常检测。与其他算法相比,基于CNN的支路异常检测精度较高。然而,如何利用CNN构建和训练提出的基于多站支路功率联合学习的分布式光伏支路异常检测方法的模型,是需要关注的问题。
2 基于多站支路功率联合学习的分布式光伏支路异常检测问题定义
(1)
(2)
(3)
(4)
与fp相同的是,fq也被用来学习分布式光伏多站支路的相似性特征,但它从全部站点支路异常检测的角度考虑。fq帮助学习该任务的标签yi,q={0,1},其中0和1分别代表支路功率样本的正常和异常类。因此,fq的支路异常检测作用可表示为:
(5)
(6)
fp和fq学习的相似性特征无法全部有助于提升f1,…,fJ的支路异常检测效果。为了减弱fp和fq对f1,…,fJ的消极影响,本文借鉴文献[26]对预训练的AJL模型设计了多阶段的训练策略。在第一阶段的训练中,将常规执行AJL;在第二个训练阶段,构建的模型将舍弃fp和fq,而仅联合执行f1,…,fJ。本文将以上方法称为基于多阶段训练策略优化的AJL模型,即AJL-MTS(Auxiliary Joint Learning with Multi-stage Training Strategy)。这种方法将AJL初次学习的参数Wz,bz进行微调,然后得到新的参数Wj′,bj′,其中j′=j∈{0,…,J}。在第二个训练过程中,辅助任务学习的相似性特征将被模型再次进行选择,有利于提升分布式光伏多站异常检测表现的差异性异常辨识特征表示也将予以保留。结合以上方法的损失函数LAJL-MTS,AJL-MTS的异常检测作用可表示为:
(7)
3 基于多站支路功率联合学习的分布式光伏支路异常检测方法
如图1所示,本文提出的方法主要包括基于支路功率信号的二维图像转化、多尺度残差卷积神经网络设计、基于多站支路功率联合学习的分布式光伏支路异常检测模型构建和基于多站支路功率联合学习的分布式光伏支路异常检测模型训练4个方面。
3.1 基于支路功率信号的二维图像转化
受限于运维资金短缺,大部分分布式光伏站点仅采集了可代表支路运行状态的一维功率信号。借鉴文献[17]中基于滑窗(Time-Window, TW)法的二维图像转化法,本文生成了用于检测分布式光伏多站支路异常的数据样本。如图2所示,若将TW法复现于一维支路功率数据到二维图像的转化中,其方法可描述为:首先,将采集的支路功率信号于折线图中展现;其次,使用一个滑窗选择功率折线图中m个时间点的功率数据;最后,滑窗中的数据被用来生成尺寸为m×m的二维图像样本。在本文中,所有原始收集的支路功率数据样本的纵坐标表示功率值,横坐标表示采集时间。
在本文中,通过功率信号数据转化二维图像样本的规则为:在使用上述方法转化图像样本时,本文将以站点的异常告警记录中的异常终止时间为异常图像样本滑窗的最后时间点,并选择此时刻前连续的m个时间点的支路功率数据转化其图像样本;正常图像样本的转化则避开异常告警记录的时间段,仅采用正常且连续的m个功率信号数据。由于本文的支路功率数据是以12次/小时的低频率进行采样的,较长的滑窗需要融入更多时间采集的数据,这导致早期发生的故障延迟被高延迟检测。因此,在两种转化图像方法中,与滑窗长度紧密相关的参数m被设定为24,这意味着两小时内的支路功率信号被转化为二维功率图像。
3.2 多尺度残差卷积神经网络设计
本节从3个方面详细介绍MS-ResCNN的结构:
(1)MS-ResCNN的残差模块设计。由于文献[28]已经验证了其设计的ResNet-18在检测图像样本时的有效性,本文依据ResNet-18构建MS-ResCNN。在MS-ResCNN阶段1-1、2-1中的所有卷积模块和1-2、2-2中的第二个卷积模块,第一个卷积模块输出的特征直接与最后的卷积模块建立跳接。同时,在MS-ResCNN的阶段1-2和2-2的第一个卷积模块中,第一卷积模块输出的特征图经过一个1×1卷积核后,跳接到其对应的第二个卷积模块中。在MS-ResCNN中,上述两种跳接分别表示为实线跳接和虚线跳接。
(2)MS-ResCNN的多尺度卷积核设计。为了充分提取生成图像样本中存在的多时间尺度特征,MS-ResCNN使用多个尺度(3×3和5×5)的卷积核从同一输入的图像中,提取了两种尺度的特征图。
(3)MS-ResCNN的整体结构设计。MS-ResCNN仅包括两个卷积阶段和一个分类阶段,而这是由于转化的图像尺寸较小,不宜设计过多的卷积阶段。输入的转化图像经两个卷积阶段的提取后,生成的特征图尺寸为6×6,较为适合执行特征的分类。在阶段3前,阶段1-2和2-2提取的两个尺度特征图被压缩成为向量,并依据串联融合策略[27]将它们进行拼接。最后,在阶段3中,全连接层和设置的损失函数对提取的特征进行分类。
5.并购价值的效应体现。一个是效益效应,据某些资料显示,对于双方融资成立的新公司,首次融资已经超33亿元,融资后公司的估值可超180亿元,这是全球范围最大的私募融资之一,这有利于新企业在未来的时间内上市。两家的合并重构使得用户数量急剧上升,覆盖的群体范围以及地域范围也扩大。新公司覆盖了超过2800个县、市、区,日订单量突破1000万单,移动端月度活跃用户超1.5 亿人,年购买用户近2亿人,2015年总交易额超过1700亿元人民币。另一个是战略效应,对于企业来说,拿下O2O市场,就有在互联网领域的主动权,未来发展的潜力不可限量,美团与大众点评的战略整合,两家企业优势互补,有利于公司的长远发展。
用于分布式光伏多站支路异常检测的单一尺度残差卷积神经网络(Single-Scale Residual Convolutional Neural Network, SS-ResCNN)与MS-ResCNN的结构存在相似之处,但SS-ResCNN只使用一种卷积核进行特征提取,因此不存在多个尺度特征的融合阶段。如图4所示为一种使用3×3卷积核的SS-ResCNN。
3.3 基于多站支路功率联合学习的分布式光伏支路异常检测模型构建
如图5所示,4个案例显示了分布式光伏多站点收集的支路功率数据样本。通过分析发现,它们之中存在一些差异和相似的特征。例如,同一地区站点的支路最大功率非常相似(即区域级支路异常辨识特征的相似表示),并且不同地区不同站点的样本存在近乎一致的功率变化趋势(即全站级支路异常辨识特征的相似表示)。此外,各站在每日的功率数据分布均有差异,特别是每日的最大功率值。
由文献[8-12]可知,这些相似性和差异性特征均有利于准确检测分布式光伏多站支路异常。其中的一部分研究利用每个站点的支路异常检测任务,学习支路的差异性异常辨识特征表示,并称之为DL(difference learning)[8-10]。其他研究则利用一个全站级的支路异常检测任务,学习支路运行数据样本的相似性异常辨识特征表示,而这种方法被称为SL(similarity learning)[11-12]。由于SL和DL方法均缺乏同时对多个站点支路运行数据样本的相似性和差异性异常辨识特征的关注,导致其检测精度存在不足。此外,DL方法需要为每个分布式光伏站点建立异常检测模型,导致训练时间成本较高。如图6和图7所示,本文利用设计的MS-ResCNN,对SL和DL方法的模型进行复现。
3.4 基于多站支路功率联合学习的分布式光伏支路异常检测模型训练
在第3.3节提出的AJL模型基础上,本节讨论如何通过训练策略的优化,实现更高精度的分布式光伏多站支路异常检测。在AJL模型的训练中,{f1,…,fJ,fp,fq}是通过MS-ResCNN同时学习的。然而,这影响了本文主要关注的{f1,…,fJ}的支路异常检测效果。鉴于此,{f1,…,fJ}也被称为主任务。为解决此问题,本节提出了基于多阶段训练策略(multiple-stage training strategy)的AJT-MTS模型。
4 实验与分析
4.1 实验数据样本描述
虽然不同站点的装机功率有差异,但同站内的各支路功率差异微乎其微。鉴于此,本文的实验样本将同站不同支路的采集样本进行合并。同时,各实验使用的数据样本均由本文介绍的图像转化方法生成。功率信号数据的采集周期处于2016年7月1日~2019年9月30日,每日的数据采集时间为6:00~19:00,数据收集频率为每5分钟记录一次。每个站点的正常类支路运行数据样本是从各日提取的支路正常样本中随机抽取的100份;异常类功率图像样本是根据国家电网分布式光伏云网的告警记录和分布式光伏站点本地端的巡检异常记录转化的。实验的训练数据和测试数据是通过K-fold交叉验证方法分离的,而它们分别占总样本数量的80%和20%。这些分布式光伏站点的基本信息和图像数据样本的统计信息如表1所示。
表1 分布式光伏多站支路功率数据样本描述
续表1
4.2 实验算法介绍
为分析设计的MS-ResCNN的有效性,本文复现了多种机器学习算法。KNN是一种广泛应用且具有快速训练速度的机器学习算法[22];DT是一种经典的树形分类算法[23];BPNN是一种人工神经模型,它包括了输入层、隐层和输出层[24]。参照LeNet[17]和VGGNet[16],本文还构建了LeNet-CNN和VGG-CNN两种CNN。LeNet-CNN对原LeNet的每个卷积层中都使用了Zero-padding填充提取特征图的边缘;VGG-CNN只使用了VGGNet的前两个卷积阶段。它们的分类阶段的全连接层和分类器与展示的MS-ResCNN保持一致。除以上算法外,本文依靠设计的CNN复现了相关文献中SL方法与DL方法的模型。以上描述的模型均在英特尔酷睿处理器CPU-i7-8750-2.2 GHz和英伟达显卡GPU-1080Ti-11G的实验平台中搭建,实验编程采用Python语言在Pytorch框架下实现,实验使用的软件库包括Pandas、NumPy和Scikit-learn等。
4.3 实验结果评价指标
评价第j个站点的支路异常检测结果的指标是各站精确度(ypre,j),这个指标涉及2个测评量:真阳性(ytp,j)是支路异常功率图像样本数据被正确预测为异常类,假阳性(yfp,j)意味着正常功率图像样本被错误预测到异常类。ypre,j可表示为:
(8)
为了更直观地感受本文对分布式光伏各个站点支路异常检测的综合评价,依据ytp,j和yfp,j定义了全站精确度评价ypre
(9)
4.4 实验分析
4.4.1 SS-ResCNN和MS-ResCNN的参数敏感性分析
CNN的性能对卷积核的尺寸和全连接层的神经元数都较为敏感。鉴于此,本节将在这两个方面对SS-ResCNN和MS-ResCNN的参数进行评估,其他参数设定按照第3.2~3.4节的描述设定。在SS-ResCNN和MS-ResCNN中,采用两个卷积核(即3×3和5×5)建立各自的卷积阶段。全连接层的神经元数在{64,128,256}范围内选取。原始采集的支路功率数据已使用本文复现的TW方法转化为图像样本,训练与测试集按照4.1节的描述划分。SS-ResCNN和MS-ResCNN被用于构建分布式光伏多站支路异常检测的RJL模型,其实验结果选择全站精确度评价,并记录于表2和表3。
表2 SS-ResCNN的参数敏感性分析
表3 MS-ResCNN的参数敏感性分析
由以上结果可知,SS-ResCNN使用2×128的全连接层和5×5卷积核时,其异常检测的全站精准度最高。这说明多站支路功率样本中的长时间尺度支路异常辨识特征较为显著,SS-ResCNN的5×5大尺寸卷积核更适合提取这一特征。MS-ResCNN在全连接层为2×128时的支路异常检测表现最好,这说明上述两种CNN设置的2×128全连接层参数,适合对本文生成的小尺寸二维功率图像样本中的提取特征进行分类。以上两种网络的参数将在以下的分布式光伏支路异常检测相关实验中使用。
4.4.2 多种机器学习算法的多站支路异常检测实验
为分析提出的SS-ResCNN和MS-ResCNN的有效性,本节的实验将对比不同的机器学习算法在分布式光伏多站支路异常检测的RJL模型中的表现。对比算法为4.2节介绍的DT、KNN、BPNN、LeNet-CNN和VGG-CNN算法。实验样本采用TW法生成的支路功率图像,实验结果采用全站精确度进行评价,并记录于图11。
从实验结果可知,在通过RJL模型检测多站分布式光伏支路异常时,4种CNN算法的表现更好。这验证了CNN的自动特征提取方式,可基于支路功率图像样本提供较全面的支路异常辨识特征。同时,SS-ResCNN和MS-ResCNN的表现均比其他CNN算法更有效。这说明本文设计的两种CNN能帮助RJL模型从转化的二维功率图像样本中,准确提取具有辨识度的支路异常特征。此外,MS-ResCNN的全站精确度表现最佳。这表明MS-ResCNN的多尺度特征提取设计,可帮助RJL模型从多站功率图像样本中,有效学习各站不同时间尺度的支路异常辨识特征。
4.4.3 基于多站支路功率联合学习的异常检测模型关于多阶段训练策略的消融性实验
为分析提出的多阶段训练策略的有效性,本实验将比较构建的RJL和AJL模型在多训练策略(Multi-stage Training Strategy,MTS)下的表现。由于RJL模型不存在辅助任务,MTS的第二阶段训练策略是失效的。两种模型均采用MS-ResCNN构建,并使用TW方法生成输入的功率图像样本。实验结果的评价将使用全站精准度,实验结果如图12所示。
通过{RJL+MS-ResCNN,AJL+MS-ResCNN}两组实验的结果对比,可发现AJL模型的表现高于RJL模型。这说明AJL模型通过先验知识设计的两个辅助任务,可帮助各站点的分布式光伏异常检测任务学习更充分的相似性支路异常辨识特征。此外,在缺少MTS训练策略的情况下,AJL+MS-ResCNN在检测分布式各站光伏异常时的表现较差。这表明在MTS的第一阶段训练中,AJL模型通过辅助任务学习的部分相似性支路异常特征存在局限性,无法有效辨识所有站点的支路异常。在MTS的第二阶段训练中,AJL模型通过微调第一阶段训练模型的参数,舍弃了辅助任务学习的多站支路异常辨识特征中存在局限性的相似表示,继承了其他任务学习的典型支路异常辨识特征,从而进一步提升了多站支路异常检测的精度。考虑到AJL+MS-ResCNN+MTS模型的表现最佳,后续实验将采取该方法构建基于多站功率联合学习的分布式光伏异常检测模型。
4.4.4 多种方法的多站支路异常检测实验
本节使用提出的基于多站支路功率联合学习的异常检测方法和复现的SL与DL方法,在分布式光伏各站的支路异常检测实验中进行对比。基于多站支路功率联合学习的异常检测模型采用设计的AJL+MS-ResCNN+MTS,而SL和DL方法的模型已展示于第3.3节。所有模型的训练和测试样本均使用TW法生成,实验结果采用各站精确度进行评价,并记录于图13。
由实验结果可知,本文提出的方法和DL方法均比SL方法在实验中取得了更好的表现。这说明,不同站点间的支路异常辨识特征差异较大,仅学习多站点支路功率样本异常辨识特征的相似表示,难以准确检测分布式多站光伏支路异常。进一步分析提出的方法和DL方法的实验结果发现,虽然DL方法在多站点的支路异常检测中均有稳定表现,但本文提出的方法在各站支路异常检测中的准确度更高。这揭示了采集的分布式多站光伏支路运行数据样本中,确实存在相似性的支路异常辨识特征,并且各站点的支路异常检测可受益于这种特征。同时,提出的方法在学习各站支路异常辨识特征的相似表示外,仍保留了对各站差异化的支路异常辨识特征提取,从而提升了各站支路异常检测的有效性。从建模数量角度看,该方法仅需建立一个模型便可对多站的支路异常实现检测,比DL方法的大量建模方式更加便捷。
5 结束语
随着新能源行业不断发展,分布式光伏站点建设数量激增,当前的支路异常检测方法难以满足快速增长的多站支路异常检测需求。本文根据分布式光伏多站支路异常辨识特征的相似和差异表示,对分布式光伏支路异常检测方法展开研究。首先,通过复现的TW法,将收集的支路一维功率信号转化为二维功率图像样本。其次,设计了MS-ResCNN,并将其用于捕捉多站支路运行数据样本中的差异性异常辨识特征。此外,利用设置的辅助任务充分学习多站支路异常辨识特征中存在的相似表示。最后,对关注的各站支路异常检测主任务和帮助其学习的辅助任务采用多阶段训练策略,减少了辅助任务对多站支路异常检测精度的消极影响。实验表明,本文提出的基于多站支路功率联合学习的分布式光伏支路异常检测方法效果更好,并且仅需构建一个模型便可实现。在应对大数量的分布式光伏多站支路异常检测时,本文提出的方法在模型管理中比其他方法更加便捷。
为进一步提升分布式光伏多站支路异常检测精度,笔者在未来工作中将关注不同站点收集样本的不平衡性。此外,随着分布式光伏的蓬勃发展,在联合学习模型中如何检测新增站点的支路异常也是笔者重点关注的问题之一。