基于数据挖掘的分布式光伏发电量异常检测方法
2022-12-02王恭庆娜日娅
王恭庆,娜日娅
(国网牙克石市供电公司,内蒙古 牙克石 022150)
0 引 言
尽管产业生产技术的更新在一定程度上带动了市场经济的发展,但随之而来的生态破坏、资源短缺等问题也成为了社会发展不可忽视的重点关注问题。为解决此方面问题,国家电网公司在组织了数次大型会议后,提出了将发展新能源、加大可再生资源的开发与循环使用作为电力行业未来建设的核心[1]。但根据电力行业相关工作人员的反馈信息可知,光伏发电存在随机性与不可控性,发电过程经常出现日发电量较低的问题。而出现此种问题的原因大多是光伏组件或电网构件“带病”运行导致,因此需要及时对光伏电网发电异常进行检测。现阶段的检测方法一般采用电压谐波检测方法,若总谐波失真超出规定阈值,则断开逆变电源,当逆变电源监视电压失真低于可检测点,所产生的谐波电流即流向负载,通过电压谐波的变化来判断是否出现了孤岛故障。但是该方法对于光伏发电量异常检测范围较小,不能够满足实际应用的需求[2]。
因此,本文引进数据挖掘技术,以分布式光伏电网为例,设计一种发电异常检测方法,为电力企业用户提供更加优质和全面的供电与保障服务。
1 基于数据挖掘的分布式光伏发电量异常检测方法
1.1 分布式光伏发电监测与发电量信息获取
为实现对分布式光伏发电量异常的精准检测,应在光伏发电终端的太阳能电池上安装传感器,根据实际需求,布置发电监测环境[3]。监测环境布置可参照图1。
在监测过程中,为避免环境中异常因素对监测结果造成影响,应做好对空间监测数据的强化与标注,根据标定结果,进行发电量在空间中信息的调配,以此种方式,确保监测的数据为最优路径数据[4]。可将传感器1~传感器3获取的发电量数据作为二维数据,将此部分数据放置在空间环境中,对数据进行转换,此过程计算公式为
式中:V为分布式光伏发电监测数据的转换过程;S为空间数据传输信道;Q为空间数据位置标定方式;t为转换时间;a为调配电能数据。完成上述计算后,为获取更多的分布式光伏发电监测数据,在现有的空间数据中选择位于3个不同维度的数据作为代表数据,完善三维监测环境[5]。根据监测的实际需求,在环境不同位置配置监测装置与监测设备,调试传感器与汇流箱,提高监测范围[6]。对分布式光伏发电监测范围的扩大过程进行描述,计算公式为
式中:J为分布式光伏发电监测范围扩大系数;N为光伏电网基础配置参数;C为数据管理中心;e为初始化监测范围;U为信息安全存储率;S为空间维度,通常取为常数。完成对监测空间的放大后,再按照上述步骤进行分布式光伏发电监测,以此完成发电量信息的获取。
1.2 基于数据挖掘的分布式光伏发电类型划分
完成上述研究后,引进数据挖掘技术,利用此项技术进行监测电量信息的深度挖掘,从而实现对分布式光伏发电类型的划分[7]。可在挖掘过程中,结合现有数组建立1个超小球形结构,将监测结果作为训练样本,导入结构中,设定挖掘过程中的训练集合为X,测试数据样本数量为n,从球形结构的边缘进行数据的训练[8]。对此过程进行描述,计算公式为
式中:F为分布式光伏发电监测数据训练过程;R为超小球形结构半径;Xi为第i个训练样本;ξ为训练过程中受到外界环境等因素的影响出现的损失。完成计算后,参照二次规划方法,设定分布式光伏发电类型共有λ种,计算现有数据在挖掘处理后,与λ的空间直线距离。计算公式为
式中:λi为第i个样本的发电类型;z为惩罚因子;α为近邻算法;j为空间连接线段。按照上述计算公式,完成对分布式光伏发电类型的划分。
1.3 基于离散点分析的发电量异常检测算法设计
对不同类型的分布式光伏发电数据在其所属空间内进行离散化处理,通过对离散后数据的呈现与表达方式,设计发电量异常检测算法,从而实现对异常发电数据的筛选与识别。
考虑到现有的发电数据已经经过离散处理后,在空间内呈现单维度表现方式,因此,可采用统计分析的方式,进行发电站单日正常发电量阈值的计算[9]。计算公式为
式中:E为发电站单日正常发电量阈值;ϖ为太阳能电池板的接收光源照度;σ为分布式光伏发电装机有效容量。假设发电站单日发电量均值为,可以通过下述计算公式,进行与实时发电标准差的计算。
式中:η为发电站单日实时发电标准差。完成上述计算后,将η作为标准,对±η进行分析,筛选±η中是否存在数据超出离散点安全阈值范围。当筛选后发现±η中存在数据超出安全阈值范围时,输出数据,将其作为分布式光伏发电量异常数据。匹配数据对应的时间点,将其作为检测结果[10]。如果筛选后发现±η中没有存在超出安全阈值范围的数据,则需要跳过此时间点,进行空间中其他数据的进一步筛选。完成所有数据的筛选后,输出所有异常数据结果与此结果对应的时间点,以此完成分布式光伏发电量异常检测方法的设计研究。
2 对比实验
在完成基于数据挖掘的分布式光伏发电量异常检测方法设计之后,为了检验所设计方法的可靠性,本文以郊区某大型发电站为例,展开如下所示的对比实验。
考虑到分布式光伏发电数据具有庞杂性、随机性,因此在设计实验前先对发电站中实验环境进行综合部署。实验发电站在为该区域用户供电服务时,其终端发电板采用的是多组相同规模与瓦数的非晶体硅太阳能电池板集成构成,为避免检测时操作步骤过于复杂,将不同发电组件采用串联方式连接。同时,将逆变器、传感器等监测设备按照标准集成在发电终端,获取在发电过程中的电能数据。设置双路数据稳定传输信道,进行完整数据的录入与传输,为避免获取电能数据时相关信息对检测结果造成影响或干扰,在太阳能电池板的连接段安装逆变器进行数据清洗。根据本次实验需求,设计初始化检测环境技术参数。相关内容如表1所示。
表1 检测环境技术参数
完成对实验环境的布置后,在该电力企业数据库中随机提取某天存在发电异常现象的电力数据,使用本文设计的检测方法进行分布式光伏发电量的异常检测。检测前,按照上述技术参数,布置检测环境,进行分布式光伏发电监测,获取光伏发电量信息。在此基础上,引进数据挖掘技术,识别分布式光伏发电类型,通过对获取数据离散点的分析,设计发电量异常检测算法,记录在不同时间点下的检测结果,按照时序进行分布式光伏发电量异常检测结果的输出。通过对此次研究发电站规模的分析可知,该发电站在光照充足的条件下,持续发电量应在3.0×104~4.0×104kW·h内,无论发电量超出此范围或少于此范围,都属于发电量异常现象。按照此种方式,即可实现对分布式光伏发电量异常的检测。将监测结果呈现在监测终端显示屏幕上,截取连续时间点检测结果,检测结果如图2所示。
从上述图2所示的检测结果可以看出,在1~2时间段、3~4时间段、7~8时间段内,存在分布式光伏发电量<3.0×104kW·h的现象,说明在对应的3个时间点内存在发电量异常问题。通过上述实验证明,本文此次研究设计的基于数据挖掘的分布式光伏发电量异常检测方法具有可行性。
在完成上述研究后,引进基于扩展卡尔曼滤波器(Extended Kalman Filter,EKF)算法的检测方法作为传统方法,将方法有效检测范围作为对比指标。根据已知信息,此发电站的发电规模为15.0 km,在不同距离设置检测点,使用本文方法与传统方法在对应的测点位置进行发电量异常检测,统计检测结果如表2所示。
表2 检测方法有效检测距离对比
从上述表2所示的实验结果中可以看出,在14.00 km范围内,本文方法发电量检测结果与传统方法发电量检测结果相同,说明两种检测方法都可以实现对分布式光伏发电量的异常检测,但在检测点距离>14.00 km后,传统方法无检测结果输出,而本文方法可以照常进行分布式光伏发电的检测。因此,可以得出本文对比实验的最终结论:相比传统的检测方法,本次设计的基于数据挖掘的分布式光伏发电量异常检测方法,不仅可以实现对发电量异常的精准检测,同时也可以提高传统检测方法的检测范围,为发电站在市场内的安全发电提供全面的保障。
3 结 论
部分电力用户表示,分布式光伏发电并网的日发电量显著高于或低于标准值,这些问题在不同程度上影响或干预了我国电力产业的持续化建设与发展。为优化分布式光伏发电,本文引进数据挖掘技术,以分布式光伏电网为例,开展发电异常检测方法的设计研究。完成设计后,通过实验证明了此次设计方法的可行性,以此种方式为我国电力行业的持续发展提供全面的技术指导与帮助。