电力系统运行多维数据存储及优化处理
2022-02-21隽增明陈向晖李志勇梁伟康
隽增明,陈向晖,李志勇,梁伟康,苏 通
(广西电网有限责任公司贵港供电局,广西 贵港 537100)
0 引 言
调度自动化作为电网调度领域的基石,需要在调度工作中提供重要的技术支撑。自动化系统在数据采集方面需要具备大规模多样化接入和高频采集能力,在数据价值释放方面需要具备海量数据分析、挖掘能力,从而持续开展电力系统历史数据深化应用[1]。
1 调度自动化系统现状及存在的问题
针对电网运行中的薄弱环节,现有的调度自动化告警系统缺乏一套完整可靠的数据清洗、分析、预警以及决策的技术手段,无法通过简单修补满足应用需要。相关系统建设周期长、间隔大且开发相对独立,导致信息条块分隔,出现各种信息孤岛,严重制约着电网服务的质量和效率[2]。大部分告警数据均采用传统的数据直采入库方式,对采集的数据轮询解析,仅通过自定义的字符组合匹配正则表达式,将最终的告警信息呈现在前端,没有基于电网大数据进行详细的治理解析,同时并未建立完整的数据关联信息体系,有用的数据没有得到有效利用,直到最终价值消亡。受限于存储技术和空间约束,未采集历史数据,无法满足电网历史数据关联分析与趋势分析等需求[3]。
调度自动化系统作为电网数字化分析与管理的重要工具,在加快数字化转型和全面建设安全可靠、绿色高效的现代化智能电网过程中,提升其自动化数据分析及处理能力日益迫切。随着电网架构越来越复杂,对调度员故障处理的及时性和准确性要求越来越高。当前的电网运维方式是故障事后处理,即在电网发生故障后对故障进行处理,重大故障发生时往往会出现准备不足、应对不及时等问题,无法对故障进行提前预知,只能采取被动应对的方式,严重影响了故障处理的效率[4]。
2 电力系统数据多维化存储及优化处理分析
为了克服现有技术的不足,对电力系统数据多维化存储及优化处理方式进行分析,初步实现了故障信息分类分级和故障信息多维化处理,在此基础上对电网未来故障进行提前预测,从而实现故障处理的快速准确响应。
电力运行多维数据存储及优化处理方法包括以下步骤:获取电力设备运行数据信息并进行预处理;对预处理数据进行多维化处理,增加数据维度,提高大数据预测的可靠性;实时数据传输处理;历史数据加权处理;对优化后的多维数据处理结果高效入库。
3 电力系统数据多维化存储及优化处理关键技术
3.1 数据清洗
采集变压器、断路器、环网柜等配电主设备运行数据信息,开展实时缺陷诊断分析、劣化动态跟踪监视以及历史数据清洗。
数据清洗具体措施包括预先分类定义数据的清洗规则和清洗策略,将不必要的域信息、空缺数据、频发数据、抖动数据以及处理告警内容进行优化处理,最终只保留告警信号动作时间、信号名称以及动作信息。
数据清洗过程必须满足以下3个条件:一是不论是单数据源还是多数据源,都要检测并去除数据中所有明显的错误和不一致;二是尽可能减少人工干预和用户编程工作量,便于扩展到其他数据源;三是与数据转化相结合,要有相应的关系表达式来指定数据转化和数据清洗操作,上述所有操作应该在一个统一的框架下完成。
清洗处理机制包括自动清洗处理和手动触发清洗处理。程序应在实时数据采集过程中进行自动清洗,对于历史数据应在一次性采集完成后手动触发清洗机制对其进行清洗。
3.2 数据多维化处理
对告警数据内容进行多维化处理,在告警数据原有告警时间、告警内容及动作情况的基础上增加告警发生区域及该区域当天的气象情况,实现厂站区域与气象数据的深度融合[5-7]。具体的扩展情况如图1所示。
图1 数据多维度扩展
3.3 实时数据传输
利用D5000电力调度控制系统Java消息服务(Java Message Service,JMS)传输接口与E格式文件对实时告警数据和图形模型文件进行传输,通过该传输方式可以实现实时数据的秒级传输,同步数据时间低于5 s,数据传输实时性完全满足要求。通过连接JMS接口进行实时数据采集与数据加工融合,解析E格式文件中的图形模型数据,与采集模型管理定义的数据模型进行匹配转换后再进行存储。按照统一的存储规则保存解析后的数据,具体的存储源依赖于采集模型的定义[8]。
3.4 历史数据加权
由于电网运行方式的转变和电网扩建,历史数据可信度随着时间的延长逐渐降低,需要对历史数据进行加权处理。对数据进行时间加权处理,采用时间因子加权的方式对满足特定变量或指标的所有样本数据赋予一定权重,用于区分历史告警数据样本中不同时间段数据的可信权重比,从而提高数据的精确性[9]。
3.5 多维数据入库
电力系统历史数据存储量通常以TB为单位,面对巨量数据,如果无法优化数据入库方式,对整个系统的可用性将会造成明显影响。通过优化存储方式,能够多线程、多节点同时进行数据存储,从而提高数据存储效率[10]。
对于数据库中复杂的表结构和关联关系,可采用以下处理方式。通过非结构化数据库存储预处理结果,将预处理结果数据沉积为1个庞大的离线数据库。通过分析现有结构化数据中有效表之间的数据对应关系,确定上下游连接,从而构建数据表中字段之间的连接关系。多维数据入库流程如图2所示。
图2 多维数据入库流程
基础数据处理从根本上决定了大数据预测的准确程度,而电网数据的特殊性进一步提升了数据处理的要求,实际处理过程中应采取多种方式并行处理。在不丢失原始数据的情况下,对原始数据的加权处理、维度添加以及抖动处理都将成为大数据预测的关键。
4 结 论
合理应用电力系统运行多维数据存储及优化处理方式,结合网站前端页面,有效统计电网中长期过负荷运行线路、频繁过流跳闸线路及装置原因造成开关故障与线路跳闸,实现故障内容的快速准确判断。充分利用大数据的计算能力对供电网区线路薄弱点进行分析,最终使用图形化的方式将其直观地展示出来,实现设备故障信息的智能捕捉和实时分析校验,针对故障问题及时采取处理措施。