APP下载

面向分布式光伏智慧运维的虚拟采集关键技术

2022-06-21方磊张玮亚姜小涛牛睿刘嘉恒葛磊蛟

电力电容器与无功补偿 2022年3期
关键词:网格化电站分布式

方磊,张玮亚,姜小涛,牛睿,刘嘉恒,葛磊蛟

(1.国网江苏省电力有限公司南京供电分公司,南京 210019;2.天津大学电气自动化与信息工程学院,天津 300072)

0 引言

随着传统能源短缺问题的日益突出,节能减排和可持续发展需求日益增强,可再生能源发电已成为世界能源变革以及能源和电力行业发展的新方向。尤其是光伏发电具有清洁、无噪声等优点,得到了世界各国的大力支持而迅速发展。

光伏发电作为一种新能源发电技术,主要分为集中式和分布式两种形式。其中,分布式光伏具有能源利用率高、环境污染小、就地消纳灵活、弃光率低等优点,得到国家大力支持[1-2],其装机容量逐年上升。随着我国《可再生能源法》实施,一系列有利于分布式光伏的并网政策及上网电价补贴政策陆续出台,其发展更加迅猛[3-5]。然而,分布式光伏电站的安全稳定运行依靠技术人员对其多方面运营与维护。传统放养式的运维方式效率低、人力成本高,故障发现、维修不及时等问题日益突出,其核心关键是运维数据缺失。随着分布式光伏电站的规模化发展,在大范围的分散无序光伏接入背景下,分布式光伏运维数据的精准获取变得至关重要:一方面他为技术研究提供实验数据,另一方面亦为运维人员的科学决策提供数据支撑[6,4]。借助于人工智能技术,充分挖掘利用分布式光伏运维数据中的信息,实现光伏电站多层次、多维度数据采集,提高工作效率,是推动分布式光伏电站智能化运维的重要途径。

随着对光伏电站智能化程度不断升级,运维数据采集的全面性与准确性变得尤为重要。然而,由于分布式光伏电站具有容量小、分布广以及数量多等特点,全覆盖的运维数据采集配置方式势必造成光伏运维数据获取成本高的问题,最终造成所采集的数据对于提升分布式光伏收益的效果不显著,经济性较弱,甚至出现得不偿失的现象,反而会制约分布式光伏行业的发展[7-8]。目前,针对降低分布式光伏运维数据采集成本的研究,主要集中在光伏出力预测与光伏运维数据补全技术。随着当前计算机技术、人工智能技术的发展与全国新能源光伏云平台的建立,提出一种面向分布式光伏电站行业困境的光伏运维数据低成本采集方法,是顺应当今新能源技术蓬勃发展与广泛应用的时代潮流,更是推进我国分布式光伏行业的必然要求。

为此,本文提出一种面向分布式光伏运维数据的虚拟采集技术路线框架,在已构建的全国新能源光伏智慧运维云平台的基础上,通过人工智能方法对已采集到的光伏运维大数据进行处理与分析,以当前标杆电站实时采集数据(辐照度或部分运维数据)为参照,共同完成分布式光伏电站运维数据虚拟采集,达成分布式光伏运维数据”实时+虚拟”全覆盖低成本采集,最终实现分布式光伏电站低成本智慧运维,以期为解决分布式光伏系统运维数据采集成本高的问题提供一套完整的解决方案。

1 分布式光伏虚拟采集的运维数据来源与分类

目前,各行业对分布式光伏数据的关注点主要聚焦于分布式光伏的功率、发电量数据[9]等,这些数据对保障电网企业和光伏业主计量计费的公平公正起着至关重要的作用。然而,光伏运维数据不仅包括上述功率与发电量数据,还包括电站内各个设备的所有电气参数、状态信息以及电站内外环境信息等,这些数据对业主和电网企业的重要性虽然不及功率与发电量,但对维持分布式光伏电站内外部的安全稳定起到至关重要的作用。

1.1 分布式光伏系统的数据来源

一般而言,光伏系统的数据来源主要有两个方面:一方面来源于包括光伏组件管理器、电能表、汇流箱、逆变器、环境监测仪、一体化电能质量故障录波监测装置等光伏电站现场安装的运营设备数据信息。

另一方面的数据来源于通过复用原有的电力通信链路采集的电网侧数据,即从电网企业网省营销基础数据平台抽取的光伏相关数据,主要包括电站基本信息、小时功率、发电量及结算相关等数据。

显而易见,光伏运维数据采集装置主要采集分布式光伏电站内的运维数据信息,因此如不作特殊说明,本文中光伏运维数据的虚拟采集目标仅为区域范围内分布式光伏站内采集的运维数据。

1.2 分布式光伏虚拟采集运维数据的分类

分布式光伏站内的运维数据主要包括电站内光伏设备的电气参数、状态信息以及环境数据。下面分别对各个光伏设备中的光伏运维数据进行详细说明,见图1。

图1 各个光伏设备的光伏运维数据Fig.1 Photovoltaic operation and maintenance data of each photovoltaic equipment

1)分布式光伏电站内主变压器高低压侧开关的三相电流、三相相电压、线电压、有功功率、无功功率、频率、功率因数等数据。

2)分布式光伏电站箱变/光伏子阵的三相电流、有功功率、无功功率、日发电量、总发电量、线电压、频率、箱变油温度等数据。

3)分布式光伏电站箱变/光伏子阵下的逆变器的组串电气参数、直流侧日发电量、交流侧日发电量、直流侧电压电流、交流侧电压电流、交流侧频率有功、无功视在功率功率因数、告警信息、输入侧对地绝缘阻抗等遥测信息、逆变器的工作状态等遥信遥控信息。

4)分布式光伏电站每个逆变器分别对应的汇流箱、支路的总直流功率、各支路直流功率、各支路输入电压电流、总直流、母线电压等数据。

5)分布式光伏电站有关实时气象信息,包括风速、风向、太阳辐照度、站内环境温度、湿度等数据。

6)分布式光伏电站电度表信息,包括正向有功、反向有功、正向无功、反向无功、电流电压、日发电量等数据。

7)分布式光伏电站电能质量的遥测信息,遥信信息等数据。

2 虚拟采集概念与内涵

2.1 虚拟采集提出的必要性

目前的光伏运维数据低成本处理技术主要有光伏出力预测和光伏数据填补技术等,这两种技术均是基于数据驱动的方法,需要海量历史数据作为支撑,其适应范围大大受限于历史运维数据。

另外,目前类似数据处理的采集技术,例如状态估计方法等,他可根据拓扑结构对电力系统内部状态进行实时预测和校正,但是分布式光伏电站拓扑结构分散多样,无法有效获取类似配电网中支路以及节点,较难通过状态估计方法进行运维数据预测和修正。

因此,随着当前装机容量逐年提升和分布式光伏数量喷井式发展,对于分布式光伏行业低成本、高效率运维的需求越来越迫切,现有的数据外推技术已经不能完全满足现代分布式光伏行业的需求,如何在不需要海量历史数据以及不清楚内部状态的条件下,有效实现满足运维需求的数据精准预估,即虚拟采集技术,具有重要的工程应用价值和非常广泛的前景。如今,计算机技术与物联网、大数据在光伏领域均具有十分广泛应用,虚拟采集技术是顺应当今新能源技术的蓬勃发展与广泛应用的时代潮流,也是推进我国分布式光伏行业的必然要求。

2.2 关于虚拟采集的含义与认识

虚拟采集技术中“虚拟”一词表明,该技术并未通过现场的传感器、采集器和集中器等采集设备对光伏数据进行采集,因此,虚拟采集实质上是对当前实时采集不到、采集困难的数据进行预估以替代实际采集的一种新型预估技术。

目前我国的分布式光伏电站在同一区域范围或相邻区域内基本都为统一安装,气象因素以及各设备的各项参数基本相同,其数据情况以及变化比较相似,虚拟采集正是基于上述原理扩展,具体思想是:利用全国新能源光伏云平台进行数据分析,将完整实时采集的分布式光伏站的运维数据作为标准,根据部分光伏运维数据判断待采集电站的相似子站,通过挖掘该电站与该电站相似子站的实时采集数据的内在映射关系,结合相似子站的本身具有的部分实时采集数据,对相似子站剩余数据实现预估,实现分布式光伏运维数据的全覆盖采集。因此,虚拟采集技术虽然与实时采集有差异,但又不能完全脱离于实时采集。

其中,上述的相似可以指二者具有相似的电气参数,或相似的状态信息,或相似的外界环境信息、报装信息等。内在映射关系即多个分布式光伏电站之间运维数据的关系。

2.3 虚拟采集的前提条件与核心思路

本文将已配置完整光伏运维数据采集装置,且与当前待采集的分布式光伏电站相似子站称为标准电站,在通过全国新能源光伏智慧运维云平台进行数据建模分析后,实现虚拟采集。虚拟采集一般需要满足的条件如下:

1)已知需要进行虚拟采集分布式光伏电站的部分实时数据。

2)已知标准电站的历史运维数据。

3)已知待虚拟采集电站的标准电站的报装信息。

4)选取的标准电站与气象因素、气象因素变化以及各设备的各项参数基本相同。

在满足上述条件的前提下,虚拟采集的核心思路具体为:

1)相似子站确定;结合全国新能源光伏智慧运维云平台,通过灰色关联度分析,得到虚拟采集电站与配置完整光伏运维数据采集装置的光伏电站的相似程度,即关联度,以确定待测电站的标准电站。

2)虚拟采集模型建立;确定标准电站后,利用全国新能源光伏智慧运维云平台,通过人工智能、大数据分析的方法建立二者运维数据的映射关系,即虚拟采集模型。

3)数据预测与结果修正;对未知的光伏运维数据进行虚拟采集,并利用已知的光伏运维数据对采集结果进行修正,进一步提高虚拟采集精度。

3 虚拟采集与光伏出力预测技术、光伏数据补全技术、状态估计技术的区别与联系

虚拟采集作为一种新型的光伏运维数据实时预估技术,不同于基于历史数据的预测技术-光伏出力预测技术、光伏数据补全技术等,也不同于需要提前获知内部一定拓扑结构的实时预测技术-状态估计。下面重点阐述上述3 种技术与虚拟采集技术的区别与联系。

3.1 虚拟采集与光伏出力预测

目前主流的光伏出力特性预测方法有两种,分别是直接法与间接法[10],见图2。

图2 光伏出力预测方法Fig.2 Photovoltaic output prediction method

3.1.1 直接法

直接法依赖于大批量光伏出力序列的历史数据,并采用拟合回归分析等数学方法,对功率数据特性进行提取与分析,其预测精度较高且实验结果受外界环境变动的影响较低,但直接法对输入数据规模的要求较高。直接法分为数据统计预测法与人工智能预测法[11-14]等。

1)数据统计预测法。

数据统计预测法基于历史光伏出力数据对其进行数据统计与深入研究,从中总结出一系列规律,进而归纳出光伏出力预测理论,建立起光伏出力预测数学模型。数据统计预测法可划分为灰色理论预测方法[15]、时间序列预测方法[16]、多元线性回归预测方法[17]等。

2)人工智能预测法。

数据统计预测法需要以当前的历史观测数据为基础才能够进行光伏出力特性的预测。由于难于收集准确的光伏出力数据,将影响光伏出力预测的实现效果。伴随大数据、信息通讯等技术的成熟,人工智能技术逐步应用于光伏出力预测中来。人工智能预测法包括支持向量机[18]、人工神经网络[19]、模糊神经网络法[20],深度神经网络法[21]等,其准确性要比数据统计预测法更高[10]。

3.1.2 间接法

不同于前文介绍的直接法,间接法不依赖于历史数据,即可预测未来的天气变化。间接预测法中需要应用高精度的天气预报[22]。其中,数值天气预报(numerical weather prediction,NWP)和基地云图是当前光伏出力间接预测的一种主要方法[23-25]。间接预测方法是不需要任何光伏的历史数据,直接根据天气预报数据进行预测的方法,减少了大量的历史数据统计负担。但由于其预测的精度取决于计算机的处理能力,如何提高其预测精度是未来一段时间研究的重点和难点。

3.1.3 虚拟采集与光伏出力预测的联系

虚拟采集与光伏出力预测的区别在于:

1)预测对象不同:虚拟采集的预测对象是所有分布式光伏运维数据,不仅包括对分布式光伏最重要的光伏功率数据,而且包括分布式光伏站的电气参数以及状态信息等;而光伏出力预测技术仅仅针对功率。

2)预测时间点不同:二者在预测目标时间点上有本质的区别;虚拟采集到的数据是实时数据或历史数据,而光伏的功率与发电量预测目前都是对未来时间点上的功率或者发电量。

虽然虚拟采集与光伏出力预测有本质的不同,但二者均是为了光伏事业稳定安全的数据预测技术。虚拟采集出的实时功率数据可以作为光伏功率预测的历史数据,光伏功率预测出的未来数据也可以采用虚拟采集的方式,去预测其他光伏电站的功率数据或者运维数据,二者可一同使用。

3.2 虚拟采集与光伏运维数据补全技术

3.2.1 光伏运维数据补全技术的分类

即使光伏电站配置了完备的光伏运维数据采集设备,但是光伏数据的缺失具有随机性[26],不可避免还会发生光伏数据采集不全面、数据缺失的问题。光伏数据补全技术就是针对这一情况的解决方法:在海量历史数据作为支撑的前提下,利用历史数据通过某种方法实现对缺失数据的补全,以避免光伏运维数据的缺失对数据分析、功率预测、故障检测的作用。光伏数据补全技术主要应用多项式填补法,热卡填补法,均值填补法,人工智能填补法等[27-28],见图3。

图3 光伏数据填补方法Fig.3 Photovoltaic data filling method

3.2.2 虚拟采集与光伏数据补全技术的区别与联系

虚拟采集与光伏出力预测的区别在于:

1)预测的目标电站不同:光伏运维数据补全针对集中式光伏电站与分布式光伏电站两种类型的分布式光伏电站,而虚拟采集技术仅针对分布式光伏站,而不针对发电量较大集中式分布式光伏站。

2)预测时间点不同:数据补全技术是根据历史数据对实时或者历史光伏运维数据进行补全的技术;而虚拟采集技术是根据电站之间外部条件与内部条件的相似性对实时数据进行补全的技术。

二者之间的联系在于:

1)光伏数据补全技术与虚拟采集技术预测的目标一致,均为分布式光伏运维数据。

2)可以利用光伏数据补全技术对电站实时采集缺失的数据进行补全,并应用于虚拟采集技术。

3)虚拟采集技术的使用可以防止数据缺失,从而取代光伏运维数据补全技术。

3.3 虚拟采集与状态估计的区别与联系

状态估计(state estimation,SE)是一种基于有限的系统量测数据来实现动态系统内部状态估计的方法[29]。系统的外部特性通常由系统的输入和输出的量测数据来反映,而通常无法直接测量的内部状态变量被用来反映系统的动态规律。下面以配电网的状态估计为例,就配电网状态估计的方法进行阐述[30-32],见图4。

图4 配电网状态估计方法Fig.4 Estimation method of condition of distribution network

3.3.1 加权最小二乘估计器

作为一类研究成熟和应用广泛的估计器,加权最小二乘(weighted least square,WLS)估计器可归类为状态量分别是节点电压、支路电流、支路功率的3 类算法。

1)基于节点电压电流方程式的算法。其通常设定状态变量为节点电压的虚、实部,量测变换被引入其中,但环网的出现将会导致虚实部无法实现解耦,无法适应环网环境。

2)以支路电流为基础的算法。其通常设定状态量为支路电流,采用量测变换的方法来转换所有的量测量为等效电流量测,但该方法难以处理电压量测,并且环网环境下三相无法实现解耦。

3)以支路功率为基础的算法。其通常以支路功率为状态量,但难以处理功率量测之外的其他量测类型,且计算精度较低,缺少将其适配于环网情景的研究。

3.3.2 抗差估计器

1)经典抗差估计器。

作为一种基础状态估计方法,最小二乘状态估计具有收敛性强、估计精度高的优点,但其处理粗差的能力不强,且数据粗差将极为影响状态估计的精准度。粗差可定义为离群的误差,其来自于失误、观测模式差、分布模式差,实际是不可避免的。抗差估计指在粗差不明显的情况下,所选择的状态估计方法能尽可能地减少粗差对于估计值的影响,从而得到最佳估计值。

典型的抗差估计方法为广义极大似然估计,又称M 估计。M 估计包括LAV 估计(least absolute value,LAV)、WLAV 估 计(weighted least absolute value,WLAV)、QL 估计(quadratic linear,QL)、QC 估计(quadratic constant,QC)等[33]。

2)基于测点投票思想的抗差估计器。

基于测点投票思想的抗差估计器不再通过某类范数来衡量量测值和估计值之间的距离,而是考虑量测自身的不确定度。其不再聚焦于量测值的精确拟合,而是考虑了由先验知识确定的区间信息集,以此来求解量测赞同最佳的状态,大幅避免了坏数据的影响,求解的状态较为合理。

3.3.3 虚拟采集与状态估计的区别与联系

状态估计的数学模型是基于反映网络结构、线路参数、状态变量和实时量测之间相互关系的量测方程,但是对于目前的分布式光伏电站而言,无法建立这样的数学模型[34],进而运维数据不能用状态估计的方法得出。

另外,状态估计与本文提出的虚拟采集虽然都是一种实时预测技术,但是状态估计仅仅基于配电网本身的结构,而本文的虚拟采集方法主要是基于的是一个配置完整光伏运维数据采集装置的分布式光伏电站,通过挖掘其与待测电站之间的相互能力关系,实现虚拟采集,这是状态估计与虚拟采集所利用对象的区别。

综上所述,虚拟采集与出力预测、数据补全、状态估计的差异,见图5。

图5 虚拟采集、状态估计、数据补全与虚拟采集的区别Fig.5 Difference among virtual acquisition,state estimation,data completion and virtual acquisition

4 虚拟采集的关键技术

虚拟采集技术是分布式光伏运维的重要基础,下面将从准入原则、技术基础、前提条件、典型场景等4 方面阐述。

4.1 虚拟采集的准入原则:灰色关联分析方法判定相似子站

灰色关联分析是一种基于灰色系统理论的多因素分析方法[35],其通过计算序列曲线的几何形状的相似程度来量化各个因素之间的联系,灰色关联度可以定义为各个因素之间的不确定性关联程度,又称系统各因子对主因子的不确定性关联程度。与常规的数据分析方法不同,灰色关联分析的实质在于比较分析,而且是有测度的、有参考系的综合比较。灰色关联分析的实质是比较各个序列数据曲线的相似性。常用的灰色关联度模型有广义关联度模型、邓氏关联度模型、欧几里德关联度模型、灰色斜率关联度模型等。

灰色关联分析的特征量影响灰色关联度的判断精度,进而影响虚拟采集的效果。因此,可以利用的特征量越多,关联度分析的准确性越高。

4.2 虚拟采集的技术基础-大数据与人工智能技术

人工智能技术可大致分为两个大类:传统人工智能技术和新一代人工智能技术[36-39]。其中,传统人工智能技术,如专家系统(expert system,ES)、BP神经网络(back propagation neural network,BPNN)、贝叶斯网络(Bayesian network,BN)、支持向量机(support vectormachine,SVM)等机器学习算法被用于特征数据的处理环节,有利于非线性映射关系的拟合,相比于阈值分析和人为判断,大大提高了计算性能和识别精度。但传统机器学习算法大多为浅层算法,数据分析能力弱,应用效果依赖于特征的表达能力。

新一代人工智能技术以深度学习为代表,包含迁移学习、强化学习等多种机器学习方式。新一代人工智能技术的机器学习模型主要包括堆栈自编码器(stacked auto⁃encoder,SAE)、深度置信网络(deep belief network,DBN)、卷积神经网络(convolution neural network,CNN)等。

如今,大数据与人工智能技术广泛用于分布式光伏领域,全国新能源光伏智慧运维云平台的构建,为实现全国范围内数以百万计的分布式光伏电站联网提出了基础,使得每个分布式光伏站不再是单一的电站,而是可以利用该平台上大量分布式光伏数据,实现基于数据驱动和机理分析相集合的区域化分布式光伏建模分析,为分布式光伏的虚拟采集提供技术基础。

4.3 虚拟采集的前提条件-网格化区域划分

光伏运维数据与外界条件的关联度最为紧密,安装地点的地理位置与环境因素等因素对虚拟采集模型预测精度具有重要影响。因此,实现虚拟采集所假定的前提之一是实时采集电站与虚拟采集的电站具有相同或者相近的外界因素。然而,在实际中,对于光伏运维数据的影响因素复杂多样,详细考察每一种因素即无可能也无必要,因此,本文提出一种网格划分方法,以保证全部外界环境与环境变化的相似性。在全国新能源光伏智慧运维云平台中,也是以区域为单位,对于不同天气类型以及报装信息划分出多个预测模型类型的分布式光伏电站,分别建立该网格下的预测模型。

分布式光伏电站虚拟采集网格划分原则:

1)对于处于海拔较低的平原或丘陵地区的分布式光伏扶贫电站(低于1 000 m),光伏电站分布较为密集,容量小。此时可以划分1 km×1 km 的单元网格。

2)对处于高海拔地区(大于1 500 m)的分布式光伏扶贫电站而言,考虑到极端气候、用户需求和后期维护成本的影响,通常多为大容量光伏电站,且分布较为稀疏;应当因地制宜地划分3 km×3 km 的单元网格。

3)由于各地分布式光伏的当地情况并不相同,一些地区由于特殊的地理情况导致该地区的气候条件差异较大。因此,对于这类地区,在地理位置划分的基础上,可以考虑0.5 km×0.5 km(低海拔)的网格区域,或者1.5 km×1.5 km(高海拔)。网格划分的流程如下:

1)选定光伏云网覆盖下的待测电站所在区域,确定方块区域的经度、纬度,设经度、纬度最低点为起始点A。

2)根据方块区域的海拔高度,气候情况,选定网格大小。

3)根据网格大小,对方块区域划分出N 个网格,如图1 所示,对于落在网格边缘的分布式光伏电站,选择靠近点A 最近的网格作为自己的所属网格。

网格化划分完成后,网格化区域的分布式光伏站可以作为相似子站,进行虚拟采集。

网格化划分的所有电站数据均具有相同的外界环境条件,可提高虚拟采集的准确度。但由于网格区域内标准电站数量的限制,网格化区域不能适用于所有情况。此时,也可以借助相邻区域内的标准电站与电网数据库的标准电站实现虚拟采集。因此,本文虚拟采集分为3 个场景、基于区域内标准电站的虚拟采集、基于相似环境区域的标准电站的虚拟采集、基于新能源光伏智慧运维云平台数据的虚拟采集。

4.4 典型场景的虚拟采集方法

4.4.1 基于大数据与人工智能技术的新能源光伏云平台的预测模型建立

随着计算机技术的不断发展,人工智能,大数据技术迎来黄金期[40-41],并迅速应用到多个工程领域中。对于分布式光伏运维领域,这些技术的应用还较少,因此,在构建新能源光伏智慧运维云平台的基础上,对其中多个分布式光伏电站,以区域为单位对其运维数据进行大数据分析并建立数学模型,具有十分重要的意义。

在本文中,首先新能源光伏智慧运维云平台对分布式光伏电站分布区域进行网格化划分,同区域内的分布式光伏电站默认具有相同的环境因素。针对每个区域,预测模型按天气类型(晴天,阴天,雨天,突变天气)以及报装信息(容量,光伏板倾角等)划分模型类型,并针对不同的天气类型与报装信息根据配置完整数据采集设备的标准电站进行大数据分析,建立该区域的多种预测模型。在单一网格区域中,不满足2.3 节所提出虚拟采集的前提条件时,也可以利用相似区域、新能源光伏智慧运维云平台数据库中的实时电站数据,完成待测电站虚拟采集。

下面对基于网格化区域的虚拟采集法,基于相邻区域与高精度天气信息的虚拟采集法,基于新能源光伏智慧运维云平台数据与部分分布式光伏运维数据的虚拟采集法分别进行介绍:

4.4.2 基于网格化区域的虚拟采集法

光伏运维数据与当前区域的环境有关以及环境变化有关,通过前文所述的网格化区域的划分,该区域下所有分布式光伏电站的其余实时运维数据是在同样的外界条件下得出的,且各个环境前后的变化状态也一致。另外,处于同一网格区域电站的同一区域范围或相邻区域内的分布式光伏电站基本都为统一安装,设备参数基本一致,此时虚拟采集相对来说具有最高的预测精度。具体步骤如下:

1)确定同一网格区域内待预测电站P 的相似子站:以电站的报装信息(如容量,光伏板倾角,表面积灰情况,组件情况等)对区域内的标准电站与待测电站进行灰色关联度分析,选取灰色关联度最大的标准电站作为待测电站的标准电站Q。

2)通过预测当前所处的天气状态,以及待测电站P 与标准电站Q 报装信息,确定预测模型类型。

3)采用标准电站Q 当前实时运维数据值作为该类型下所建立模型的输入、输出待测电站P 的虚拟采集数据,得出虚拟采集数据粗集。

4)在网格化区域内随机选取标准电站A 与B,采用标准电站A 当前实时运维数据值作为该类型下所建立模型的输入,输出待测电站B 的虚拟采集数据。

5)根据标准电站A 与B 之间预测误差的关系,与待采集电站P 与标杆电站Q 的灰色关联度,修正虚拟采集数据粗集,完成虚拟采集操作。

4.4.3 基于相邻区域与高精度天气信息的虚拟采集法

当区域内分布式光伏较少时,此时网格化内的标准电站较少,不满足进行虚拟采集的前提条件,此时可根据相邻网格化区域高精度天气信息(天气类型、辐照度、温度、湿度)进行虚拟采集模型的建立,该方法相对于基于网格化区域的虚拟采集法操作较复杂且精度相对较低,具体步骤如下:

1)确定待预测电站相似区域的相似子站:设待测电站P 所在网格化区域为M,根据高精度天气信息计算,选取天气信息与待测电站P 相似度高的网格化区域N,计算电站P 与网格化区域N 内标准电站的灰色关联度,选取灰色关联度最大的标准电站作为待测电站的标杆电站Q。

2)根据网格化区域M 与网格化区域N 的天气状态,以及待测电站P 与标准电站Q 报装信息,确定预测模型类型。

3)采用标准电站Q 当前实时运维数据值作为该类型下所建立模型的输入、输出待测电站P 的虚拟采集数据,得出虚拟采集数据粗集。

4)在相邻区域内随机选取标准电站A 与B,采用标准电站A 当前实时运维数据值作为该类型下所建立模型的输入,输出待测电站B 的虚拟采集数据。

5)根据标准电站A 与B 之间预测误差的关系,与待采集电站P 与标杆电站Q 的灰色关联度,修正虚拟采集数据粗集,完成虚拟采集操作。

4.4.4 基于新能源光伏智慧运维云平台数据与部分分布式光伏运维数据的虚拟采集法

当区域内及相邻区域的标准电站较少或者相似区域内天气信息差异较大时,上述两种方法无法使用。但若待测电站本身具有一定的光伏运维数据采集装置,可以利用部分光伏运维数据,结合新能源光伏智慧运维云平台数据库中存储完整的光伏电站运维数据信息完成虚拟采集。该方法由于没有相同环境或者环境相似的光伏电站作为参考,仅能利用其所处地区的天气类型,所以该方法精度最低,具体步骤如下:

1)新能源光伏智慧运维云平台数据筛选。根据实时的天气信息与电网数据库中的天气信息进行比较,选取一批与当天天气类型最接近的光伏电站。

2)确定待预测电站能源光伏智慧运维云平台数据库中的相似子站,计算新能源光伏智慧运维云平台中的运维数据与进行虚拟采集的电站的灰色关联度,选取灰色关联度最大的标准电站作为待测电站P 的标准电站Q。

3)在新能源光伏智慧运维云平台中,随机选取标准电站A 与B,对区域范围外标准电站A 与B 的历史光伏运维数据作为样本集,建立光伏运维数据虚拟采集模型。

4)利用3)中建立好的模型,采用标准电站Q 当前实时运维数据值作为所建立模型的输入、输出待测电站P 的虚拟采集数据,完成虚拟采集。

综上所述,基于相似子站的分布式光伏虚拟采集关键技术,见图6。

图6 基于相似子站的虚拟采集关键技术Fig.6 Key technology of virtual acquisition based on similar substation

4.5 虚拟采集方法的未来展望

虚拟采集作为一种新兴的新能源相关技术,是为解决好分布式光伏运维成本高难题而专门设计的,他可以有效解决当前分布式光伏产业困境,改变分布式光伏固定的运维模型以及产业结构,促进光伏产业的智能化与自动化,对推动我国乃至世界分布式光伏事业的发展起到重要作用。

随着化石能源的不断减少与环境污染的日益加剧,新时代对我国新能源产业提出了更高的要求,新能源技术同样将会得到国家的大力支持,国家电网有限公司也已经搭建了全国新能源数据云平台。本文基于大数据与人工智能技术建立了光伏运维数据预测模型,该方法具有良好的普适性,不仅可以应用于分布式光伏领域,还可逐渐推广至风能、核能等新能源产业中来,完成整个新能源技术的产业改革。目前针对虚拟采集的研究仅仅处于起步阶段,采集精度还有待更加多的实际工程案例应用和验证。随着人工智能与大数据技术的不断发展,专门面向虚拟采集的人工智能技术也会在未来得到不断完善与发展。

5 结语

面向目前我国分布式光伏产业链快速发展而出现的光伏运维数据采集成本高、效率低的问题,提出了一种新型的分布式光伏运维数据虚拟采集技术的思路,以期为解决分布式光伏行业运维难题提供数据基础。

随着国家对分布式光伏事业的重视程度加深,分布式光伏装机容量逐年提升,虚拟采集将会对分布式光伏事业的发展起到至关重要的推动作用。随着当前计算机技术、人工智能技术与大数据的发展,以及光伏运维数据智慧平台的建立与完善,虚拟采集的精度与实用性也会得到进一步提升。作为一种新型新能源数据预估技术,在未来也可以逐渐推广至集中式光伏、风电等多个新能源工程领域。

然而,虚拟采集技术的研究还处于起步阶段,目前虚拟采集技术的应用效果还有待进一步结合实际工程验证,机遇和挑战并存。另外,结合实际情况与本文结论,下一步的研究考虑寻找将人工智能算法、大数据技术、现场数据紧密结合的方法,以期提高光伏运维数据的虚拟采集精度。

猜你喜欢

网格化电站分布式
居民分布式储能系统对电网削峰填谷效果分析
蔚来部署第二代换电站最大容量13块电池
智慧社区视野下网格化社会服务客体研究
基于Paxos的分布式一致性算法的实现与优化
城市社区网格化管理实践及启示
河北发力网格化监管信息化
农村网格化建设专题