APP下载

基于线性相关序列的Markov算法在监控信息校核中的应用

2020-11-30黄晨贵罗一王志文韦凤梅

价值工程 2020年31期
关键词:校核

黄晨贵 罗一 王志文 韦凤梅

摘要:随着变电站无人值守及电网规模的逐步扩大,对变电站监控信息的接入质量、规范性提出更高的要求。为提高存量监控信息的规范性,本文通过研究基于线性相关序列的Markov算法,对长序词条进行分段预处理,建立监控信息标准库、监控信息比对知识库,实现监控信息与标准信息的自动校核。通过监控信息校核能够准确的、快速的对比出监控信息与标准信号的差异情况。对在运站点表进行标准性校核,为监控信息表管理提供有效技术支持。

Abstract: With the unattended substation and the gradual expansion of the scale of the power grid, higher requirements are put forward for the access quality and standardization of substation supervision information. In order to improve the standardization of inventory supervision information, this paper uses the Markov algorithm based on linear correlation sequence to preprocess the long-order entries in segments, establish a supervision information standard library and a supervision information comparison knowledge base, and realize supervision information and standard information automatic verification. Through the supervision information check, the difference between the supervision information and the standard signal can be accurately and quickly compared to perform standard checks on the station tables in operation and provide effective technical support for the management of supervision information.

关键词:线性相关序列;Markov算法;文本处理;监控信息;校核

Key words: linear correlation sequence;markov algorithm;text processing;supervision information;check

中图分类号:TP301.6;O211.62                          文献标识码:A                                  文章编号:1006-4311(2020)31-0215-03

0  引言

随着智能电网的逐步推进以及调控一体化的全面实施,电网监控数据的及时性、准确性的要求日益凸显,电网监控人员所面临的压力也逐日增加。变电站监控信息表作为调控一体化运行的基础数据,对电网设备健康运行状态监控具有重要作用[1]。变电站监控信息的规范程度直接影响着监控工作的效率甚至是电网的安全稳定运行。对于存量变电站监控信息的标准化梳理、处置,是减轻监控人员工作强度,提高工作效率的重要保障。变电站监控信息的标准化这项基础工作对于调度、监控人员日常的监控信息分析、电网故障判断起着举足轻重的作用,有利于对电网的运行状态进行有效的监控和评估。

1  监控信息预处理方法

变电站的遥信、遥测、遥控、遥调等信息都是以文本弄的方式进行存储的,且传统的监控信息编制都以纯手工的方式实现,各站监控信息点表差异较大。由此导致了虽然已发布相关规范,但存量监控信息不规范情况仍较为普遍。

基于上述问题,为了避免文本数据中因为不规范的写法造成的分析错误,在进行信息处理抽取前,需要根据规则对文本内容进行标准化处理,使得同一类数据有相对统一的写法。非结构化的监控信息在结构化分析过程中,采用自然语言处理技术进行分析[2]-[3]。具体方法如下:

1.1 设备类型信息处置

同一个设备类型,可能有不同的名称描述,需要在分析之前对相关信息进行标准化处置,方便后续对设备的定位与辨识。表1为主要设备的类型名称规范表。

1.2 序号类信息处置

对于变压器、电容器、电抗器、站用变等,有“1#变压器、#1变压器、1号变压器、变压器1”等多种不同的写法,需要进行规范化处置。在处置的过程中,注意信息之间的分割。比如针对1#电容器间隔,对应的开关编号为231,有些不规范的文本描述中,会把开关编号、电容器序号混写在一起,写成“2311#电容器”;在分析的过程中,需要根据变电站信息查找包含的电容器列表,根据拓扑判断电容器包含的开关编號信息,根据电容器、开关编号的组合,将文本分割为231、1#电容器这样的信息组合。

1.3 数字类信息处置

针对数字(比如XX三线中的“三”),可能有汉字、阿拉伯数字、罗马数字、不规范的罗马数字(比如Ⅲ可能会用英文字母组合III代替),需要对多种写法的数字进行统一。在此过程中,处理的目标信息是单独的数字,注意不要对设备编号、保护型号等信息中的数字信息造成干扰。

另外,还需要对全角半角等各类信息进行规范化处置。

2  隐马尔科夫模型研究

隐马尔科夫模型(Hidden Markov Model,HMM)[4]:先由隐藏的马尔科夫链随机生成的不可观测的随机状态序列,再由产生的状态生成一个可观测的随机序列的过程。其中,把由隐马尔科夫链随机生成的状态序列,称为状态序列(State Sequence);把每个状态生成观测组成的随机序列称为观测序列(Observation Sequence)。因此,HMM 就是定义了观测序列 x 和状态序列 y 的联合概率 p(x,y)。由于状态序列是一个马尔科夫链,并且状态序列不可见,因此称该过程为隐马尔科夫过程。

3  基于线性相关序列的Markov算法实现监控信息知识库的构建

变电站监控信息表是一种按电网调度规则,电网设备信息等组成的具有规律性的中文词条。但由于不同的编制人员的对监控信息规范理解的差异性,导致监控信息的标准化程度因站而议,各站信息差距较大,人工辨识的难度、工作量都非常大。

通过研究变电站一、二次设备的信号命名规则,根据典型监控信息的组成原理进行深入探究[5],最终将通过预处理的监控信息分为电压等级、间隔、设备类型、设备编号、信号描述等部分,对应本体监控信号的标注为:V(电压等级)、S(间隔)、D(设备类型)、N(设备编号)、I(信号描述)。

对于监控信息的描述不完备的情况,需基于具体的信号描述進行补充,实现数据的完整性评估及填充工作。

下面以“2051水车Ⅱ线RCS-923A保护跳闸”信号为例展开说明:

①电压等级:无,通过开关编号命名规范补充电压等级为220kV;

②间隔:2051/水车Ⅱ线;

③设备类型:无,通过“RCS-923A”补充设备类型为线路保护;

④设备编号:RCS-923A;

⑤信息描述:保护跳闸。

详细的拆分及标注情况示例如表2所示。

中文长词条中缺少对分词的明显分隔符,通常需要依靠人为分断对长词条进行分界点判别。因此如何对监控信息的分词间断点判别成为了监控信息文本处理的关键。基于线性相关序列的Markov算法可以有效对该类长词条中文信号进行分词[6]。

首先通过对电网规程的深入分析与解读,构建一套经典电网词库,包含电网变电站的电压等级、间隔、设备、常见告警等信息,提取变电站遥信、遥测、遥控监控信号表中的经典词,与空间向量建立映射关系,假设监控信息点表中含有x个经典词库收录短词,将它们按顺序编号为1, 2, …, x。x维空间向量可采用下面的公式表达:

W=[w1, …, wk, …, wx]

通过对监控信号的分词,实现监控信息文本的向量化,以此构建空间向量模型。对于监控信息的文字信息处理,采用语义框架槽填充的方法实现对监控信息的挖掘;运用Space Vector探索了监控信息中文文本的挖掘方法。

标准信息的词条分断方式同监控信息,不再赘述。

通过上述方法完成监控信息、标准信息的词条分断,完成监控信息标准库、监控信息校核知识库,为标准化校核提供数据支撑。

4  监控信息与标准信息的校核

基于监控信息及标准信息的长序词条分断技术,构造监控信息知识库。随着测试样本的增加,基于监控信息知识库将不断更新完善,并通过“最优可信度占位”理论的监控信息的匹配算法,实现监控信息与标准信息的自动校核与匹配,整体方案路线见图1。相似度在70%以上的信息可实现自动校核,准确性可达到92~95%。

5  结束语

在电网调控一体化模式下,集中监控变电站数量及监控数据数量庞大,因信息错漏和相关管理不到位导致的安全风险始终存在。本文通过基于线性相关序列的Markov算法实现监控信息的词条分断,完成监控信息知识库的构建,进而实现对监控信息标准化的自动校核,将存量的监控信息与标准信息实现精准匹配,发掘存量信息存在的问题,提高监控信息管理的效率和信息表质量,为后续监控信息智能化分析奠定坚实的基础,保障监控运行安全。

参考文献:

[1]吴晓燕.一体化监控信号管理在电力系统监控中的应用[J]. 科技资讯,2014,32:70.

[2]张春晓,陆建峰,夏士兵,饶莉莉,蔡丹,冉光莹.基于专家系统的变电站监控信号智能处理系统[J].东南大学学报(自然科学版),2008(S2):140-144.

[3]张琳.提升无人值守变电站监控质量探析[J].科技视界,2015,04:328.

[4]解宇涵.基于深度学习的中文分词模型应用研究[D].重庆:重庆大学,2017.

[5]林英,陆颖铨.变电站集中监控信号优化方案探究[J].中国新技术新产品,2014,16:40-41.

[6]李英,钱建国,方响,等.基于大数据背景的集中监控辅助决策系统研究[J].浙江电力,2019,38(10):34-39.DOI:10.19585/j.zjdl.201910006.

猜你喜欢

校核
发电机进相试验失磁保护与低励限制配合关系的校核
通行费校核分析方法探究
基于卫星遥感图像的收费站位置自动识别与校核
FPSO火炬塔海运绑扎方案及强度校核
LKJ径路数据校核系统的设计与实现
基于Aerobook的复合材料机身壁板优化和校核
基于VB的设计校核软件在重载轨枕生产控制技术上的应用
继电保护定值在线校核及预警系统的研究
基于Mathematica的失磁保护与低励限制配合的校核
基于电气介数的继电保护定值在线校核