基于知识图谱的电网调度告警关联规则与决策树算法
2022-11-21钱肖马翔吕磊炎张文杰王宁支月媚
钱肖,马翔,吕磊炎,张文杰,王宁,支月媚
(国网浙江省电力有限公司金华供电公司,浙江 金华 321000)
电网调度告警原理是将现代先进的智能信息融合技术与特征提取方法结合[1],构建电网调度告警系统模型,实现对电网系统故障的实时故障检测和有效故障告警。通过构建告警模型可有效提高电网调度的告警能力,因此,电网调度告警模型的设计方法受到了相关领域专家和学者的极大关注[2]。传统的电网调度告警模型,无论是在电网系统正常运转的状态下或是故障情况下,都需要调度员对告警信息进行手动操作,某些繁杂的告警信号容易被忽略,并且通过人工处理海量的告警信息难度较大,不能及时做出有效分析,无法对故障位置进行有效控制,造成不必要的损失。因此,对电网调度告警关联规则与决策树算法进行设计,通过关联法则和决策树算法对电网系统进行故障信息采样与分析,从而提高电网系统运行稳定性和效率。文献[3]提出基于告警信号文本挖掘的电力调度故障诊断方法。该方法基于隐马尔可夫模型对告警信号文本进行分词并去除其中的停用词以构建本体词典;采用向量空间模型使文本向量化;使用滑动时间窗读取实时告警信号;采用支持向量机对滑窗内的告警信号进行分类,利用k-均值聚类法提取较高可能性的故障供调度员参考。该方法由于调度过程复杂,告警调度效率较低;文献[4]提出调度命令智能生成模型,提出5种调度命令修正策略并分别对5种易错信息进行修正,引入调度命令,将预警文本信息作为模型的输入进行训练,有效提升了调度命令生成质量,但调度命令运行较慢;文献[5]针对当前人为处理海量监控告警信息效率低的问题,提出一种融合知识库和深度学习的电网监控告警事件自主识别方法,实现电网监控告警事件的智能感知和识别,然而该方法的告警误报率较高。
根据上述研究结果的不足,为了进一步提高告警指令运行效率,降低告警误报率,本文提出基于知识图谱的电网调度告警关联规则与决策树算法。在知识图谱数据层约束下,设计基于知识图谱的电网数据关联规则生成算法,对不符合规则的数据进行筛选;计算出电网系统的额定输电标准,确定电网调度信息特征量;依据电网调度告警指令特征,提取电网调度告警事务;利用决策树算法对基于知识图谱的电网数据关联规则生成算法进行优化,建立电网调度告警模型,实现电网调度告警。实验结果表明,该方法显著提高了电网调度告警性能,保证了电网调度的安全性。
1 电网调度告警关联规则与决策树算法设计
1.1 基于知识图谱的电网数据关联规则生成算法
电网数据经过相关领域专家认证后存入到知识图谱数据层[6]。为了提高知识图谱存储的效率和正确率,利用关联规则算法对传统的知识图谱数据层进行结构优化,在构建数据层的过程中不断对不符合规则的数据进行筛选,形成补充规则并存入到知识图谱的数据层内[7]。
电网数据关联规则生成算法是通过决策树中某一条规则R中的约束条件Condi,计算得到规则集,根据数据挖掘算法,对规则集内的数据进行分析,得到分类错误率。具体步骤如下:
步骤1:将知识图谱层存储的电网数据集T经过关联规则计算,生成规则集,规则R是样本数据集T中某个数据节点到知识图谱的一条存取规则路径。
步骤2:利用规则R对知识图谱层存储的电网数据集T进行数据挖掘分析,构建知识图谱数据层关联属性矩阵Q=[qVS]n×n(n为数据挖掘的行列数值;qVS为属性值)。
步骤3:沿着规则路径筛选出所有符合规则关联的数据集,整理为T′,同时获得关联规则分类错误率。用规则集对T′数据继续进行挖掘,获得新的关联规则集作为补充规则集R′,导出关联属性,构建具有关联属性的新数据集T″一起存储在数据层[8-9]。
步骤4:按照补充规则集R′中的每一条规则r′继续对T″进行挖掘处理,直到知识图谱数据层的属性关系概率小于分类错误率,输出该规则集R″作为知识图谱层存储规则路径,由此重建知识图谱电网数据层的整体结构。
经过优化重建后的知识图谱电网数据层存取数据路径为关联规则路径,完成基于知识图谱的电网数据关联规则生成算法的设计。
1.2 确定电网调度信息特征量
在1.1节优化后的知识图谱电网数据层中提取电网调度信息,需要确定电网调度信息特征,而保证电网系统的额定输电标准是电网调度信息特征量确定的基础。对调节匝进行电阻值增减调节[10],获取电网系统周期内的电压值,最终得到一个不会让电压产生明显波动状态的接入阻值,计算出电网系统的额定输电标准:
式中:Wα为电网系统的额定输电标准;α为电网的额定电压系数;U′为波动的电压幅值;I′为波动的电流值;Rk为调节匝间电阻的接入阻值;ω为电网系统中供电设备的转速;ik为电流额定值。
可将电网调度信息特征量表示为
式中:β为电网调度信息特征量;μ为电网调度信息的运行参数;θ为额定的电压值、额定的电流值的交角;-θp为θ的补角;p为电流值与电压值的相交条件调节系数;sin(θ+-θp)为理想的电网调度交角的正弦值。
1.3 提取电网调度告警事务
电网调度告警事务提取过程中,电网系统中的部分元件无法承受高压的电流而出现异常行为[11],导致电网系统中偏导电压受阻而形成电力数据的堆积,电网调度告警指令特征表达式为
式中:ep(k)为电网调度告警信息值;yp(k)为电网调度告警特征向量;d为电网调度的告警事件的权值。
电网调度告警是指电网系统运行过程电力数据的堆积传输,根据电流数值波动变化,电网系统中的电压会引起一定的波动,造成调度信息值偏移[12],在此情况会因为指令部分不均的问题进行告警,从而引发电网调度告警行为。电网调度设备监测数据表达式为
设λ1为电网调度设备告警系数,λ2为电网调度运行告警系数,λ3为电网调度位置点告警系数,联合上述得到的电网调度告警特征和电网调度设备监测数据,可得到电网调度告警事务提取结果为
式中:为电网调度告警系数的平均值;ẏ为电网调度告警信息的权值;w,q分别为两个不同周期内的电网调度告警信息参数;δ为提取次数。
根据电网调度告警指令特征,提取出电网调度告警事务。
1.4 建立电网调度告警模型
利用决策树算法对基于知识图谱的电网数据关联规则生成算法进行优化,然后利用优化后的算法对电网调度告警信号进行分析[13],构建电网调度告警融合集。
在进行数据挖掘的过程中,决策树内各个属性之间存在关联。如果对传统关联规则算法中的规则属性采用决策树结构进行集中训练,分析出各个属性之间的关联关系并进行简化处理,就可以在保证关联规则算法分类精度的前提下,有效提高其运算效率。根据上述思想,对基于知识图谱的电网数据关联规则生成算法进行优化设计,具体操作如下:
步骤1:根据c4.5决策树结构,构建关联规则R的决策树模型为S;
步骤2:在决策树S中规则R是决策树中某个根节点到叶节点的一条规则路径,即
式中:“∧”为“按位异或”运算符。
步骤3:对决策树S中规则R,结合决策规则参数τ对每条关联规则ri进行简化处理[14]。i和j个指令对应的不同约束条件Condi和Condj对应的属性分别为Av,As。当Av,As之间没有关联规则属性,则不保留Condi和Condj;若Av,As之间存在关联规则数据,则分别计算出属性关系概率;
步骤4:根据得到的概率大小,判断Condi和Condj是否保留。得到决策树关联规则阈值P(Condi+1∧Condi),通过新设计的关联规则阈值对规则集进行重构,获得具有关联属性的新数据集T″。
通过上述基于知识图谱的电网数据关联规则优化算法,对电网调度告警信号进行分析,构建电网调度告警信号关联规则融合集,其表达式如下:
式中:x(t)为电网调度告警信息的关联参数;h(t)为电网调度的故障信息特征值;v为指令辅助决策系数。
则知识图谱电网数据层决策树数据集为
式中:Q为故障点被监测权重。
根据构建的知识图谱数据层,对告警信息中的故障信息特征关联规则进行挖掘分析,得到电网调度智能告警的特征偏移系数为
式中:s′(t)为电网调度告警信息的偏移系数;S(t)为电网调度智能告警的监测量化指数;t为告警时间。
在保证电网稳定运行的条件下,得到谐振频率Sr(t)为
式中:ns(t)为电网调度虚拟告警值。
在存在告警故障的区域,通过上述得到的正常电网调度信息值αk,获得电网调度故障点存在的区域范围计算函数为
式中:p(fI)为电网调度的故障区域匹配函数;fI为故障区域的电流频率;K为故障分布系数。
通过上述确定的电网调度信息故障特征量,作为智能告警的关联规则,在知识图谱的电网数据层构建电网调度智能告警模型:
式中:z(k)为电网调度智能告警的密度分布函数。
通过计算所得的电网调度智能告警模型,结合式(8),得到电网调度智能告警故障检测输出函数:
其中
式中:G(U∣μk,k)为电网调度智能告警故障特征集[15];τi(t)为监测量化指数间的属性关系函数。
对电网调度智能告警故障输出函数进行检测,完成对电网调度告警故障点位置的准确判断,最终实现电网调度告警。
2 实验对比分析
2.1 设置实验参数
为了验证基于知识图谱的电网调度告警关联规则与决策树算法在电网调度告警中的实用价值,利用对比实验的方法,测试文中算法的性能。实验参数设置情况如表1所示。
表1 实验参数设置Tab.1 Experimental parameter setting
在保持表1实验参数一致的情况下,为了确保实验测试的公平性,需要根据本文设计的知识图谱电网告警数据层选择测试指标。
目前,知识图谱电网告警数据层包括告警指令的提取、调度融合和调度告警三部分,知识图谱构建的框架如图1所示。
在知识图谱数据层构建的过程中,通过不断完善关联规则来完善数据层相应数据。根据图1选择告警指令运行效率、告警误报率、调度故障的动作次数作为性能测试指标。
2.2 电网调度告警性能
引入基于信息散布指数的算法和基于分类型属性数据的算法作对比,在指令告警标量为0.79、测试时间为50 min的条件下,测试了三种算法的告警指令运行效率,结果如图2所示。
从图2的结果可以看出,随着实验时间的延长,基于信息散布指数的算法和基于分类型属性数据的算法得到的告警指令运行效率分别在1×109~ 4.5×109条/min之间和3×109~ 6×109条/min之间。当实验进行35 min时,两种算法的告警指令运行效率变化趋势大致相同,直到实验进行到50 min时,告警指令运行效率出现最大值,分别为4.8×109条/min和6×109条/min。而采用文中算法进行电网调度告警时,告警指令运行效率的初始值就已经达到了7×109条/min,且随着实验的进行,告警指令运行效率越来越高,最大值达到了9.55×109条/min,说明基于知识图谱的电网调度告警关联规则与决策树算法有效地去除了不符合规则的数据,针对电网调度告警事务,保证告警故障点位置判断效果,可以提高告警指令运行效率,具有更好的告警性能。
在电网运维指标为0.86、告警指令运行效率为7.48×109条/min的条件下,以电网调度告警次数为自变量,实验过程中,将电网调度告警次数设置为50次,测试了三种算法的告警误报率,结果如图3所示。
从图3的结果可以看出,随着实验次数逐渐增加,三种算法测试得到的电网调度告警误报率也随之增加。采用基于信息散布指数的算法时,电网调度告警的误报率初始值就超过了25%,当告警次数达到50次时,误报率达到最大值,为42%;采用基于分类型属性数据的算法时,前25次告警的误报率低于15%,当告警次数在25~30次之间时,误报率出现了突增的情况,原因是该算法的属性数据分类精度较低,提高了电网调度告警的误报率;采用基于知识图谱的电网调度告警关联规则与决策树算法时,在整个实验过程中,误报率始终低于15%,最大误报率也只有13.5%,说明文中算法在误报率方面具有更好的性能,这是因为文中算法首先划分了电网调度故障点存在的区域范围,有针对性地判断存在异常行为的故障元件,进而为准确判定电网调度异常行为、降低告警误报率提供帮助。
为了进一步验证基于知识图谱的电网调度告警关联规则与决策树算法性能,模拟电网调度的开关合闸故障,测试了三种算法发送电网调度故障的动作次数,结果如表2所示。
表2 发送电网调度故障的动作次数测试结果Tab.2 Test results of action times of sending grid dispatching fault
从表2的测试结果可以看出,根据发送电网调度故障的动作次数测试结果,发现该算法的电网调度故障爆出率可以达到98.06%,能够将电网调度故障排除,这是因为其在知识图谱的数据层,挖掘出了存在关联关系的电网调度信息属性条件,限制了发送电网调度故障的动作次数,保证所发送的告警指令都是正确的告警指令。
3 结论
本文提出了基于知识图谱的电网调度告警关联规则与决策树算法设计,经过实验测试发现,该算法在告警指令运行效率、告警误报率和发送电网调度故障的动作次数等方面具有更好的性能。
但是本文缺乏电网调度告警的全面性,在今后的研究中,需要针对电网调度的不同故障进行改进,拓宽该算法的应用范围。