APP下载

基于Relief-FT的时间自适应TSA方法研究

2022-05-14唐文权

计算机仿真 2022年4期
关键词:特征选择准确率样本

徐 武,唐文权,文 聪,郭 兴

(云南民族大学电气信息工程学院,云南 昆明 650500)

1 引言

电力系统暂态稳定是指系统受到大扰动后能保持同步运行的能力,快速、准确评估暂态稳定状态是电力系统安全运行的迫切需求[1]。传统评估方法有时域仿真法和暂态能量函数法,时域仿真法通过求解模拟电力系统动态特性的高阶微分代数方程来实现,但由于计算量大,难以达到在线实时稳定评估;暂态能量函数法通过分析系统的能量函数来计算稳定指标,根据分析系统存储的能量得到工作点的稳定裕度,但针对大规模电力系统难以计算其不稳定平衡点[2]。

为实现快速准确暂态稳定评估,众多研究者提出了基于数据驱动的方法,如支持向量机,神经网络和决策树等方法[3]。在基于数据驱动方法的评估过程中,权衡评估过程的准确性和实时性是研究重点,通过考虑更多的参量数据能够提升评估的准确率,但评估时间也会增加,这对实现快速评估暂态稳定过程是不利的。暂态稳定评估(Transient Stability Assessment, TSA)方法的响应时间是固定的,由于定义了具有固定观测窗口的时间特征,需要在观测窗口内的所有测量值达到要求后进行TSA,观察窗口越长,TSA的准确率就会越高,但评估速度就会越慢,从而导致没有足够的时间让TSA进行补救行动。

本文提出了一种时间自适应暂态稳定评估方法,该方法通过考虑时间变化因素,对原始Relief-F算法进行了改进,减少了原始特征数据量,并改进了传统算法中由于时间变化导致算法性能较差的缺陷,再利用长短期记忆网络进行分析,通过对网络进行训练以满足检测要求,优化模型性能,最后通过PowerFactory软件对改进算法进行性能分析,实验结果表明,该方法在不影响评估精度的前提下,能够降低模型复杂度,提升评估的实时性。

2 时间自适应暂态稳定性评估

2.1 传统Relief-F的时间特征选择

原始特征集的构建是基于数据挖掘方法进行TSA的基础,特征集性能的优异直接决定系统的评估精度[4]。通过分析影响暂态稳定的主要因素,选取能反映系统动态的初始特征来构建TSA输入特征,包括发电机有功和无功功率、母线电压幅值和相位角、支路有功和无功功率以及负荷的有功和无功功率,构建的数据集在时间上最初的特征表现为

(1)

其中n为初始特征总数,T为观测窗口长度,xiT为T时刻的第i个特征。

根据基尔霍夫定律,上述特征之间存在一定的相关性,因此需要选择关键特征来降低特征维数、训练时间和特征冗余度[5]。Relief-F是一种高效特征排序算法,通过计算所有初始特征的重要性,然后按重要性降序对特征进行排序[6]。Relief-F的核心步骤是计算两个特征之间的差异,处理过程如下所示

(2)

其中R1和R2是原始数据集中的不同样本,a是样本中的一个特征。

2.2 基于Relief-FT的时间特征选择

Relief-F可以有效处理目标属性为连续值的回归问题,但不能分析时间序列等时间形式的特征,因此对Relief-F进行了改进,计算多变量时间特征的重要性,考虑了时间变化因素,改进算法称作为Relief-FT。改进后的样本之间在时间特征a上的差异公式可以改写为

(3)

Relief-FT的分析过程见表1,其中m为用户自定义参数,确定整个过程的重复次数,P(C)为类C在所有样本中的比例。

Relief-FT时间特征选择算法如下所示:

输入:对于每个训练样本r∈R,一个向量的特征值a∈Α和长度的观察窗口T

输出:一个向量W∈R|Α|是重要性的评估特征a∈Α

1)将所有W设为0;

2)fori=1:m

3) 随机选取样本xi;

4)for每个类别C=class(xi)

5) 从类别C中选择k个最接近H的点;

6) 结束

7)for每个类别C≠class(xi)

8) 从类C中选择k个最接近M的点;

9) 结束

10)for每一个在Α中的a

(4)

12) 结束

13)结束

通过计算所有初始特征的重要性,得出并将最重要的特征作为训练TSA模型的关键特征,其重要性特征的总和占所有重要特征总和95%的比例,在几乎保留全部原始特征信息的情况下有效降低了特征数量。

2.3 长短期记忆网络

长短期记忆网络(Long Short-Term Memory,LSTM)是基于递归神经网络得到的改进网络,可以学习和记忆多元时间序列中的长期依赖信息[7]。LSTM网络由遗忘门、输入门和输出门三个部分构成,并分别处理历史信息、输入信息和输出信息。将LSTM的存储单元合并历史信息和当前数据,实现特征提取[8]。通过这种方式获取特定时间戳ct的记忆状态并传递给下一个时隙,其数学表达式为

gt=Sigmoid(Wgxt+Ught-1+bg)

(5)

it=Sigmoid(Wixt+Uiht-1+bi)

(6)

(7)

(8)

利用ct来计算输出信息ht,计算过程如下

ot=Sigmoid(Woxt+Uoht-1+bo)

(9)

ht=ot⊙Tanh(ct)

(10)

其中,Sigmodi(x)=1/(1+exp(-x)),Tanh=(1-exp(-x))/(1+exp(-x)),W*,U*和b*是相应门的对应参数[9]。LSTM可以按时间步骤展开,如图1。

图1 按时间步骤展开的LSTM结构图

2.4 时间自适应暂态稳定性评估

大部分TSA方法通过固定响应时间来进行评估,即观测窗口长度恒定。由于暂态过程非常迅速,需要以更快的响应速度来得到不同运行条件下的评估结果[10]。基于固定响应时间的模型在评估过程中所需时间与响应时间相等,即需要消耗与响应时间同等时长的时间才能评估得到暂态稳定状态,这不利于在响应速度要求较高的场景下评估。基于改进时间自适应TSA过程,能在适当时刻提前给出评估结果,实现在TSA中实时性和准确率之间的权衡。

2.4.1 离线训练

通过生成包含训练数据和测试数据的原始数据集,这些数据集具有多种不同状态的偶然性,数据集中的每个样本标记为:

(11)

其中η=(360-δmax)/(360+δmax),δmax是故障发生后系统任意两个发电机的最大相角差,T为观测窗口长度。

根据上文分析,为获得最优W*,U*和b*,引入Adamoptimizer优化器来训练LSTM,LSTM的损失函数可以定义为:

(12)

其中y(i)是训练数据的真实标签,y-(i)是LSTM上一个时刻的评估结果,N是训练数据的数量。

2.4.2 在线评估

为了获得可信的TSA结果,稳定指标S可以定义为

(13)

图2 时间自适应TSA流程

3 实验分析

3.1 数据集的构建

新英格兰39总线电力系统如图3,该方法包含39个总线,34个分支,19个负载。在PowerFactory软件上进行了暂态仿真[12]。

图3 新英格兰39总线电力系统

在构建数据集的同时需要考虑不同情况下的运行状态,才能有效地训练LSTM网络,以提升自适应TSA的性能。在仿真过程中,将发电机有功功率设为基本潮流的75%-125%,步长为5%,负荷水平分别按发电机有功功率的相同比例缩放。考虑所有母线和所有支路发生三相接地故障,故障位于分支长度的20%、40%、60%和80%处。仿真时间为10s,故障持续时间为0.1s、0.2s和0.3s。共生成5775个样本,按照4:1的比例随机划分4620个训练样本和1155个测试样本。

3.2 时间自适应TSA的时间特征选择

根据提出的改进Relief-FT方法,得到各时间特征的重要性值,最大决策时间Tmax设为20,其重要性按降序排列如图4。可以看出,特征具有不同的重要性,通过每个时间特征分配权重来区别分类,权值越大,对应特征对分类模式的泛化能力越强。

图4 时序特征的重要性排序

3.3 性能分析

为了量化模型的评估性能,表征TSA的评估准确率和实时性,定义平均响应时间(Average Response Time,ART)和准确率Accuracy两个指标,指标量化公式如下所示

(14)

(15)

其中m为决策周期总数,Ti表示第i个决策周期,C(Ti)表示被分类的样本总数,C(T)表示当前决策周期及之前所有决策周期被分类的样本总数,M(T)是当前决策周期中错误分类的总数。根据分析,ART指标能够表征所有样本在线评估的平均响应时间,ART越小,评估速度越快;Accuracy指标体现所有样本的评估精度,用于表征自适应评估框架的准确性。

在时间自适应TSA中,稳定阈值δ和观测窗口长度T对模型性能有较大的影响。对这两个参数进行灵敏度模拟,寻找最优性能情况下的δ和T,进行了准确性和平均响应时间实验,结果如图5和图6。

根据图5(a)结果可知,在总体趋势上,随着观测窗口T长度的增加,评估精度逐渐增高然后降低,当T为5和6时,准确率达到最高;根据图6可知,ART随观测窗口T的增加而增大,此时稳定阈值δ也逐渐增大;在5(b)结果中,稳定阈值δ在0.57时,评估准确率达到最大;再比较分析图6(a),在保证准确率最大的情况下,提升评估速度即ART最小,此时窗口长度T为5。因此,在保证系统最优评估性能情况下,分析得到的稳定阈值δ在0.57,观测窗口T为5。

利用主成分分析法从数据可视化的角度对该方法的有效性进行验证分析,主成分分析法能够以无监督的方式进行特征提取,信息损失最小,在较低维度空间中提供对TSA的直观理解。图7和图8分别为时间自适应TSA过程中时间特征选择前后测试数据的动态变化,其中V1和V2为二维空间中的变量。

图7 基于Relief-F的TSA过程动态变化

图8 基于Relief-FT的TSA过程动态变化

在图7仿真结果中,基于Relief-F的TSA过程起初稳定与不稳定的重叠区域较大,随着时间的变化重叠区域逐渐变小;在图8仿真结果中,基于Relief-FT的时间自适应TSA中,不同类别之间的空间重叠基本相同,每个类别都只有较小的重叠区域,稳定与不稳定区域划分明显。时间自适应评估可以更早、更可靠地评估电力系统的稳定性,而在不进行时间特征选择的情况下,时间自适应评估需要更长时间才能得到评估结果。

比较Relief-F方法和文献[13]中基于集成的极限学习机(Extreme Learning Machine, ELM)模型评估整体性能,通过评价特征数量、模型训练时间以及ART和Accuracy四个指标,对比结果见表2。

表2 性能分析结果

根据结果对比可知,对比Relief-F方法,提出的Relief-FT方法能够更快地获得可靠稳定结果,不降低评估精度的情况下减少了平均响应时间和模型训练时间。同时对比基于集成ELM模型的自适应评估方法,该方法尽管在较Relief-F准确率性能更优,但该方法对比本文改进方法准确率无法得到保障,同时ART更长。通过Relief-FT方法处理后的原始特征数量显著降低,有效去除了部分冗余特征信息,使得网络训练时间明显缩短。综合对比可知,对比传统Relief-F以及集成ELM模型方法,基于Relief-FT的暂态稳定评估方法能有效保证系统评估精度,同时提升了评估的实时性。

4 结论

本文提出了一种基于Relief-FT的时间自适应暂态稳定评估方法,在传统特征选择方法上考虑了时间变化的因素,改善了原有算法检测时间较长不能满足实时性检测的要求。仿真结果表明,改进方法保证了暂态稳定评估精度,有效减少时间特征的维度,从而减少算法的响应时间,提升了算法的评估效率。该方法在提高暂态稳定评估速率方面具有卓越的性能,能够减少系统评估时间,提升电网调度人员清除故障的快速性,从而有效保证电力系统的安全运行。

猜你喜欢

特征选择准确率样本
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
随机微分方程的样本Lyapunov二次型估计
基于智能优化算法选择特征的网络入侵检测
故障诊断中的数据建模与特征选择
reliefF算法在数据发布隐私保护中的应用研究
一种多特征融合的中文微博评价对象提取方法
基于支持向量机的测厚仪CS值电压漂移故障判定及处理