APP下载

基于大数据挖掘的发电系统异常数据识别系统设计

2022-04-13于楚凡郭大亮张秋霞宋子涛

电子设计工程 2022年6期
关键词:先验发电量数据处理

于楚凡,郭大亮,张秋霞,宋子涛

(1.国家电投集团中央研究院,北京 102209;2.国家电力投资集团有限公司,北京 100029)

电力作为一种可再生的清洁能源,在能源危机的背景下得到了广泛的发展和应用。因为直接从环境中获取能量,发电设备主要安装在建筑物顶部或沙漠无人区[1]。受外部环境和使用寿命的影响,PV板经常出现开裂、老化等故障[2]。电池板故障将影响整个发电系统的效率,严重时会引起火灾。当前发电系统故障检测技术主要有红外图像法和基于深度Q 网络法两种检测方法。使用基于红外图像的检测方法,利用光学图像作为电路板的背景图像,并与红外热图像进行配准,实现元件定位,在此基础上,提取待测板构件红外温升序列的多个特征向量,并与标准库中的数据进行对比,判定构件失效。采用该方法成本较高,且受外部环境影响较大;使用基于深度Q 网络法来判断部件故障,在基于网络的入侵检测系统中,入侵预警与安全响应相结合,但随着技术的不断发展,攻击变得越来越普遍,检测也越来越困难。所以提出了基于大数据挖掘的发电系统异常数据识别系统设计。在数据处理子系统中,关联规则是通过数据采集子系统中的监测数据建立的,监测数据模块在发电异常情况下,利用关联规则生成实时监测数据的实时规则,比较了先验原理和实时原理,实现了发电设备运行状态的自动监测和诊断。

1 系统硬件结构设计

为了改善发电系统装备老化问题而导致的设备发电异常情况,提出了基于大数据挖掘的发电系统异常数据识别系统,系统硬件结构如图1 所示。

图1 系统硬件结构

由图1 可知,系统硬件结构是由数据采集子系统、数据处理子系统、数据存储子系统、设备状态显示子系统组成的[3-4]。通过设备状态显示子系统,可将其他子系统识别结果显示在界面上,供工作人员查看[5-7]。

1.1 数据采集子系统

该子系统主要实现对数据的实时采集,即自动从模拟和数字装置(如传感器等)进行数据采集的过程。A/D 转换器是数据采集系统中的一个关键部件,它主要用于把采集到的直流电压转换成数字数据,测量出的电压可以与特定发电量、光照强度、温度、湿度对应[8-9]。A/D 转换器主要有两种类型:积分和非积分。积分法可以根据一定的时间间隔测量平均输入值,因此可以抑制多种噪声源,非积分法是在很短时间间隔采样输入瞬时值[10]。数据采集子系统结构如图2 所示。

图2 数据采集子系统结构

由图2 可知,系统硬件结构主要依据模块化设计思路,包含发电量、光照强度、温度、湿度数据接口,LCD显示器及按键,RTC实时时钟[11-12]。采 用LM12H458 高度集成数据采集芯片,将采样结果与A/D 转换集成结果存储在同一芯片内,大大减少了外围线路的连接[13]。LM12H458 是一个多功能数据采集系统,内部含有28 个16 bit的寄存器,其配置是采集系统的控制中心,可用于控制系统采集的启动和停止[14]。

1.2 数据处理子系统

数据处理子系统是利用计算机处理信号的系统,采用数据处理系统对数据信息进行处理、排序,计算各种分析指标,便于用户接收、保存处理后的数据信息[15]。数据处理子系统的结构如图3 所示。

图3 数据处理子系统结构

由图3 可知,该子系统负责对所收集的资料进行实时处理,它旨在将数据采集系统中的“原始数据”转化为“成熟数据”,即将采集的数据转化为满足上位机系统需要的、便于使用的数据结构,并且将数据存储到实时数据表和历史数据库中[16]。在此基础上,将上位机发出的控制指令通过数据处理分系统发送到相应的控制器,完成对测控装置的控制。SCADA 系统的数据核心是数据处理子系统,同时要求系统具有高可靠性、实时性、鲁棒性和较强的数据处理能力。

1.3 数据存储子系统

存储器通过计算来处理数据,其中主要包括CPU (辅助或三级存储器)无法直接存取的存储设备和介质,通常是比RAM 慢但非易失性的硬盘、光驱等设备。

使用半导体存储芯片,如果字节长为4 Byte,则使用半导体存储芯片一次性读取4 Byte,按字节寻址,总共1 000 个单元,每个单元1 Byte;按字寻址,总共256 个单元,每个单元4 Byte;按半字寻址,总共512 个单元,每个单元2 Byte;按双字寻址,总共128个单元,每个单元8 Byte。主存块调入系统,与缓存块建立对应关系,使用标记记录与某缓存块建立了对应关系的主存块号,使用先访问Cache 再访问主存方式,无论命中还是不命中,耗时均较短。

1.4 设备状态显示子系统

发电机组发生故障时,LED 看板能自动接收和显示外部控制器发送的数据信息。将参数读取到计算机作为主站的外部设备,输出到显示设备。支持VGA 多达8 屏的分屏输出,每屏可以单独显示不同数据,互不影响。能显示信息,如动画、图形、图表、文本值等。LED 看板数量不限。能独立显示不同字符、数字等信息,能对各种信息和数据进行处理和显示。

2 系统软件部分设计

在系统硬件结构支持下,设计系统软件流程,如图4 所示。在图4 所示执行流程支持下,设计异常数据详细识别流程。

图4 系统软件流程

step1:光强采集模块和温度采集模块分别用于数据处理子系统的发电量W、太阳光强G、温度T和湿度S采集模块,用于发电设备的数据输入;

step2:关联规则提取模块从step1 中提取数据作为先验数据,利用先验数据构造F1、F2、F3规则,再结合先验的F1、F2、F3规则生成先验的规则集F{F1,F2,F3},将其存储在先验规则存储模块中。先验规则集是用apriori 算法构建的,具体步骤如下:

1)关联规则提取模块提取正常情况下的发电量W、光强G、温度T和湿度S,设置项目集D={D1,D2,…,Dn-1,Dn](n>2)输入到数据处理子系统中,并确定项集集合D最小支持阈值,其中Di={Gi,Ti,Si,Wi} (0

2)依据1)中得到的最大项集产生的候选项集,需从集合D中确定项集支持度,并与最小支持度进行对比分析,获取最大项集;

3)循环处理上述内容,直到不会出现新的项集为止;

4)通过上述得到最大项集的先验规则集F{F1,F2,F3}中,F1表示发电量W与光照强度G之间的关系、F2表示发电量W与温度T之间的关系、F3表示发电量W与湿度S之间的关系。

step3:在发电系统中,一旦发现发电量异常,数据采集子系统将采集到的异常数据传送到关联规则提取库中,通过step2 构建新的实时规则集K{K1,K2,K3}。

对发电量异常的判别方法如下:设置发电量阈值U,提取step1 中构造先验规则中的发电量W1,将其与发电系统实际运行状态时相同时间内的发电量W2进行对比分析。如果W1与W2之间差值小于阈值U,那么说明发电系统正常;反之,则说明发电系统异常运行。

3 实 验

3.1 系统环境部署

在系统Linux 集群环境下,包含4 台虚拟服务器,各个服务器节点资源配置如表1 所示。

表1 集群虚拟服务器节点资源配置

整个集群包含了一个主节点和3 个子节点,充分考虑节点分配负载,给节点设置较高的物理内存。

3.2 实验数据集

该系统适合于光伏发电监测,为测试系统的功能,采集真实光伏监测设备上载的感测数据,包括设备上载的静态和动态数据、雷达探测的plot 数据、高清摄像机拍摄的目标照片等。这些数据中,雷达波纹13 万像素、静态波纹6 万像素、AIS 动态波纹15 万像素。

对于多个预定义的异常行为,在实际场景中观测到的目标不能被全部触发,即在实际的数据集上不能进行异常行为测试。然后,对实际传感器数据进行修正,如改变模拟场的异常和篡改行为,消除目标轨迹中某些图形的模拟沉默行为,构造实验数据集等。

3.3 实验结果与分析

分析正常情况下发电系统异常数据更新频率,如表2 所示。

表2 正常情况下发电系统异常数据更新频率

在上述实际更新频率情况下,分别使用基于红外图像的故障诊断方法、基于深度Q 网络故障诊断方法和基于大数据挖掘异常数据识别系统识别异常数据,识别结果精准度对比分析如图5 所示。

由图5(a)可知,使用基于红外图像的故障诊断方法、基于深度Q 网络故障诊断方法异常数据识别结果与实际数据相差较大,当实验次数为7 次时,故障状态下的识别结果依次为120 bit和160 bit。而停止状态下的识别结果与实际数据也不一致。使用基于大数据挖掘异常数据识别系统故障状态下的识别结果、停止状态下的识别结果均与实际数据一致,误差为0。

由图5(b)可知,3 种方法非周期内异常数据识别结果一致,周期内异常数据识别结果不一致。使用基于红外图像的故障诊断方法、基于深度Q 网络故障诊断方法异常数据识别结果与实际结果不一致,而使用基于大数据挖掘异常数据识别系统异常数据识别结果与实际结果一致,只有在实验次数为1次时,出现10 bit误差。

图5 不同方法异常数据识别结果精准度对比分析

4 结束语

基于大数据挖掘的发电系统异常数据识别系统实现了发电设备运行状态的自动监测与诊断,降低了人力、物力成本,具有较高的实用性。将数据挖掘技术应用于故障诊断与检测中,能够快速有效地检测出故障源和故障原因,提高了电力系统故障诊断的效率。这种方法不仅可以对电池板电路故障进行诊断,而且可以对电池板老化状态下的低发电量异常进行诊断,具有很强的实用性。

猜你喜欢

先验发电量数据处理
BOP2试验设计方法的先验敏感性分析研究*
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
基于低频功率数据处理的负荷分解方法
4月份全国发电量同比增长11% 火电同比增长12.5%
青海成为中国首个以新能源为主要电源的省份
无人机测绘数据处理关键技术及运用
一种考虑先验信息可靠性的新算法
基于MATLAB语言的物理实验数据处理探讨
中国区域发电量与碳排放的实证检验
先验的风