APP下载

基于决策树的电力系统实时动态安全评估方法研究

2021-06-03蔡忠林

能源与环保 2021年5期
关键词:特征选择决策树分类器

蔡忠林

(国家电网宝鸡供电公司,陕西 宝鸡 721004)

传统DSA是基于系统运行情况和负荷需求预测的启发式假设来进行离线开发的[3]。然而,随着网络运行状况不确定性增加,需要在线DSA对系统的安全状态进行连续监控。同时,随着广域测量系统的出现,在线DSA的发展得到了极大的推动[4],在线DSA提供了各种时间同步的测量,同时能够在线评估系统的安全状态。然而,在线DSA的应用受到限制,不适用于系统发生干扰后的实时保护和补救控制措施。为了给保护控制应用提供充足的时间进行分析、决策,准确地提供补救控制措施,实时提供系统安全指标至关重要。本文提出了一种基于决策树分类器的动态安全评估新算法,将对称不确定性(SU)算法和逻辑模型树(LMT)算法分别作为特征选择的高级分类器和决策树分类器。将这2种方法耦合,可以在不影响评估精度的前提下,最大限度地减少用于电力系统保护和控制应用的DSA工具的计算时间。

1 方法论

DSA方法是一种分析工具,它对系统运行状况进行快照,然后执行全面的安全评估,以警告系统操作员任何异常操作情况,DSA还提供了相应情况下的补救控制建议。近年来,由于对DSA技术的迫切需求以及计算机功率成本比的不断提高,使得在线DSA技术在实践中得到了大量的实现。DSA系统在全球电力系统中正处于使用或实施阶段[5]。

DSA技术在文献中已有报道,这些方法的目的或者是提高计算时间,或者是提高DSA结果的准确性。高本锋等[6]建立了H桥级联型SSSC的动态模型及小干扰稳定性分析,采用特征值分析法分析了该系统的振荡模态,并研究了控制器参数对系统小干扰稳定性的影响。Luo等[7]采用了基于模式发现的先进模糊分类方法,该方法使DSA的准确性提高到98.1%。在现代电力系统的新环境下,电网的规模不断扩大,因此,突发事件的数量和类型有所增加。由于PMU单元每秒可以为当前操作系统拍摄60~120个快照,利用这个优势,需要分析的数据量增加了。因此,需要寻求一种准确、快速的DSA工具,尤其是实时的DSA工具,以保证电力系统处于安全状态。改进DSA工具的基本思路可以分为2个阶段:第1阶段,在不影响数据集中相关和非冗余特征的情况下,减小DSA数据集大小;第2阶段,选择一个更好的分类器模型,该模型能够解释数据集中的模式,从而获得高精度的结果,并节省时间。

本文考虑使用SU算法来减少分类标签与数据集中非相关和非冗余特征之间的误差。SU是一种相关测量检验,用于评估特征的价值或分类价值[8]。这种技术能够研究一个数据集来嵌入或映射从高维到低维变量的数据点,同时保持所有相关结构的完整性。该思想源于熵的概念,即测量随机变量的不确定性[9]。变量X的熵定义为式(1):

(1)

式中,P(xi)为所有值的先验概率。

在观察其他变量Y的值之后的X熵可描述为式(2):

灵隐寺主要以天王殿、大雄宝殿、药师殿、直指堂(法堂)、华严殿为中轴线,两边附以五百罗汉堂、济公殿、联灯阁、华严阁、大悲楼、方丈楼等建筑所构成,共占地130亩,殿宇恢宏,建构有序。灵隐寺自创建以来,高僧云集,文人荟萃,儒释交融,谈禅论道,一吟一咏早已蔚为大观。此外,寺内还存有不少年代久远的佛像、法器、经幢、石塔、御碑、字画等历史文物,为灵隐寺珍贵的佛教文化遗产。

(2)

式中,P(xi|yi)为给定Y值后X的后验概率。X熵的减少表示由Y提供的关于X的附加信息,该值称为信息增益(IG),其表达式如式(3)所示:

IG(X,Y)=H(X)-H(XY)

(3)

若IG(Z,Y)

引入SU(X,Y),表示归一化信息增益[10],其定义如式(4)所示:

(4)

SU的范围从0到1,SU=0表示特征和特征是独立的;SU=1表明特征X和特征Y高度相关。在本文设计方法中,基于熵的度量方法通过选择相关、冗余和非冗余的特征来降低数据集的维数,以提高决策树算法在电力系统DSA应用中的性能。

2 模型设计

将SU技术与决策树分类器相结合,以获得更好的DSA应用性能。SU降低了数据集的维数,而决策树为DSA分类难题提供了一个有效的解决方案。SU用于显著改善决策树分类器的性能,这些分类器在高维数据存在时,承受着高计算负担和准确性不足的问题。为了达到研究目标,本文分为3个主要阶段,如图1所示。第1阶段包括构造表示测试系统模型动态行为的数据集;第2阶段,使用高级特征选择(FS)来减少数据集中的冗余[11],从而进行数据降维;第3阶段,将降维数据集应用于决策树分类器的DSA应用。

图1 模型构建路径Fig.1 Model construction path

提出方法第一阶段的详细过程如图2所示。本文研究了电力系统元件在各种运行工况下的动态建模行为,构建数据集时考虑的突发情况如下:①在正常负荷和每条输电线路上,施加平衡三相故障,并在0.1 s后清除。②在正常负荷和110%负荷下,每次有1条输电线断开。③在正常负荷、110%负荷、120%负荷下,发电总线附近2条传输线同时开路。

图2 数据集构造Fig.2 Data set construction

在所有情况下,记录转子角、电压幅值和各总线的频率。

在第2阶段,DSA数据集每个实例有n个特征和c个目标类,SU算法通过度量特征与目标类之间的相关性来评估特征的权重,以确定该特征是否与目标类相关。然后将所有计算得到的SUn,c存储在矩阵中。其根据信息增益值按降序排序,特征选择可以帮助消除不相关的属性,但是不能删除冗余属性。为了识别冗余特征,本文采用了SU法和排序搜索法。

SUlist矩阵的第一个特征Fa被设置为与目标类具有最高的相关性,因此,将SUa,b与SUb,c进行比较。若SUa,b≥SUb,c,则从中去除特征Fb。然而,若SUa,b

在特征选择过程之后,该过程继续使用决策树技术对数据集进行分类,过程如图3所示。排序搜索法的特征选择结果可以根据评价结果对特征进行排序[12],之后用户可以根据SUnew排名最高的特征和预先定义的阈值,使用决策树技术指定SUnew中要保留的特征数量。由于很难为每个电力系统中保留特征的数量指定一个合适的阈值,因此,用户需要进行实验以获得最佳结果。在这个过程之后,将简化的数据集应用到决策树技术进行分类。本文将逻辑模型树(LMT)算法应用于电力系统DSA数据集的分类。与传统的决策树相比,LMT用逻辑回归函数代替了决策树的终端节点[13]。由于这种改进,它能够对二进制和多类目标变量、数值和标称属性以及缺失值进行分类。当在一个节点上拟合逻辑回归函数时,LMT使用交叉验证来确定迭代次数,并且在整个树中使用相同的迭代次数,而不是在每个节点上进行交叉验证。这种启发式方法极大地提高了运行时间,但对精度影响很小。

图3 LMT分类器Fig.3 LMT classifier

3 结果和讨论

3.1 IEEE30总线测试

在IEEE30节点测试系统模型中,有功功率和无功功率总需求分别为283.4 MW和126.2 MVAr,IEEE 30总线测试系统模型由36个总线组成。使用PowerWorld模拟器程序来模拟测试系统模型在所有突发情况下的响应。本文方法要求得所有总线的电压幅值和频率,因此,在每种情况和突发情况下,对所有总线进行72次电压幅值和频率测量。此外,该方法还需要对所有6台发电机的转子角进行测量。每个度量都是数据集中的一个特征或属性[14]。因此,这意味着在每个突发情况下都有78个特征。根据上文所述突发情况,47个突发事件来自正常负载下的平衡三相故障,94个突发事件分别来自正常和110%负载下的一条开放传输线,45个突发事件分别来自正常情况、110%负载以及120%负载下发电总线附近的2条开放输电线。因此,研究中考虑的突发情况总数为186。在这里,每个突发情况都是一个实例。因此,IEEE30总线测试系统模型的数据集由78个特征和186个实例组成。

IEEE 30总线测试系统模型在N-1突发情况下的响应如图4—图6所示。在t=1 s时,在2号总线上安装螺栓连接的三相故障,通过打开2—6号线路消除故障。图4、图5、图6分别表示了运行场景下测试系统模型中发电机的转子角、连接到总线2的所有总线电压幅值以及连接到总线2的所有总线频率。

图4 发电机转子角响应Fig.4 Angular response of generator rotor

图5 总线电压幅值Fig.5 Bus voltage amplitude

图6 总线频率Fig.6 Bus frequency

根据图4所示的发电机转子角响应,系统能够在受到扰动后找到一个新的平衡点。因此,系统是瞬态稳定的。图5显示了连接到总线2的所有总线的电压幅度在0.9~1.1 V振荡,而图6显示在N-1突发情况下,连接到总线2的所有总线的频率在49.5~50.5 Hz振荡。由于满足了系统动态安全的3个标准,因此系统可认定为安全。

3.2 性能比较

对数据集中的所有实例重复这些过程。对于研究所考虑的测试系统模型,123个实例被分配为安全实例,63个实例被分配为不安全实例。因此,采用SU算法来减少数据集中的信息冗余,然后利用LMT算法将简化后的数据集应用于DSA。研究记录了该方法的精度和计算时间。最后,将本文方法与LMT算法的DSA性能进行了比较。有SU和没有SU情况下,使用LMT算法的结果见表1。

表1 基于SU的LMT决策树技术的性能Tab.1 Performance of Su based LMT decision tree technology

从表1中可以看出,DSA应用于IEEE 30总线测试系统模型的数据集中的特征数为78个。然而,使用所提出的方法,特征的数量已经显著减少到7个,这意味着71个特征与这7个特征高度相关。换句话说,只有这7个特征在数据集中是重要的。因此,71个特征可以被忽略,因为它们代表着与显著特征相似的特征,这些显著特征足以表示系统在受到扰动后的动态响应。要考虑的实例保持在186个,这意味着该方法不会忽略决策树训练过程中的任何突发情况,减少数据集中特征的数量可以提高LMT算法的性能。结果还表明,带SU的LMT算法优于不带SU的LMT算法。使用SU减少的数据集,LMT只需要0.09 s就可以达到100%的准确率,而使用初始数据集来评估IEEE 30总线测试系统模型的动态安全性,LMT只需要0.09 s就可以达到98.387 1%的准确率。这表明该算法通过减少数据集中的实例,通过用于DSA的LMT算法提高了DT的性能。

为了比较SU特征选择算法与其他机器学习应用中的特征选择算法的有效性,在同一数据集中使用了4种特征选择算法(基于相关、增益比、信息增益和RELIEFF算法)。算法SU、相关、增益比、信息增益与RELIEFF准确率为100%、94.086 0%、99.462 2%、99.462 4%、96.774 2%。

可以看出,SU在精确度方面明显优于其他所有算法。这种优越性是由于SU算法只选择最重要的特征而排除了冗余特征,因此具有较高的性能。由此可以将错误和噪声降低到最低限度,并改善了LMT分类器的结果。

与传统技术相比,机器学习技术在DSA的各种应用中都显示出了更高的效率[15-17]。然而,现代电力系统必须处理来自测量设备(如pmu)每毫秒数据量的巨大变化。因此,减小数据的规模和从数据集中去除不相关或冗余的特征是至关重要的,这样可以缩短分析时间,提高机器学习算法的精度[18]。与传统的DT分类方法在DSA中的应用不同,研究结合了SU特征选择算法的优点和LMT分类器算法的优点,这种组合有效地实现了在线DSA应用的目标(高精度和短时间),因为SU将LMT学习过程转化为高效、快速的操作。就成本效益而言,这种方法的优点是可以消除DSA数据集的不相关和冗余特征,这可以减少DSA工具需要分析的数据量,从而提高分类算法的性能,降低额外的计算成本。此外,对操作人员进行高度准确的评估,可以降低保护过程的成本。

安全性和稳定性是时变的特性,可以通过监测电力系统在突发情况下的性能来衡量[19-21]。在突发事件中,电力系统的存续取决于故障的性质和位置以及保护装置对故障的快速清除。保护装置的任何延迟或该装置的运行不理想,都可能导致电力系统稳定性的变化,从而导致在短时间内处于不稳定状态。该方法具有精度高、时间短的特点,有助于电力系统安全稳定状态的有效评估。

4 结语

本文提出了一种基于决策树分类器的改进特征选择算法,用于电力系统动态安全评估。该方法将动态安全评估与决策树分类器相结合,使用SU算法来降低数据集的维数。将简化后的数据集应用到LMT算法中,用于对电力系统的动态安全性进行评估。以IEEE 30总线测试系统模型为例,验证了该方法在提高决策树分类器性能方面的有效性。对于IEEE 30总线测试系统模型的DSA,SU算法可以减少30.76%的计算时间,而LMT算法的精度可以提高到100%,该方法对实时保护和控制应用具有一定的参考价值。

猜你喜欢

特征选择决策树分类器
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
BP-GA光照分类器在车道线识别中的应用
Kmeans 应用与特征选择
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于决策树的出租车乘客出行目的识别
联合互信息水下目标特征选择算法
基于肺癌CT的决策树模型在肺癌诊断中的应用
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别