电力系统不良数据检测与识别方法研究
2019-06-11刘喆刘策
刘喆 刘策
本文首先介绍了电力系统中数据识别不良的重要性,然后阐述了电力系统中不良数据的概念。最后,给出了电力系统故障测量数据检测与识别实际应用中的状态估计方法。几种识别方法,如残差搜索识别法等。
1 研究电力系统中的不良数据识别算法的必要性
随着中国智能电网的逐步完善,智能电网发展迅速。在当今阶段,我国的智能电网有着复杂度高,范围广的特点,所以会在电力系统中产生海量的量测数据。针对不良数据带来的干扰这一研究问题,这就需要使采集到的量测数据进行检测辨识,确保电力系统中所需数据的准确度意义在于保障智能电网内每个系统的可靠性。然而,这么庞大的数据的正确性对电力系统能否高效稳定的运行有着重要的影响,从而更加确定了电力系统中对不良数据的辨识修复的必要性,为此课题进一步的研究提供支持。
2 判断电力系统中不良数据的方法
从一个正常的电力系统上讲,其中对数据的量测是有一定的误差的,然而误差的大小呈正态分布。从大体上其分布的表现上看,对于所有的量测值来说,误差为标准差δ。当电力系统中的量测系统运行良好时,误差大于3δ的概率很小,相当于基本无法发生的情况。所以这种数据我们就把它看成不良数据,接下来对你识别出来以防止烦扰电力系统调度人员对各种情况下的决策。
在电力系统故障测量数据的检测和识别中,实际应用中使用的主要方法是基本状态估计方法。残差搜索识别方法,基于聚类分析的GSA模型算法,基于关联规则分析的错误数据识别方法,接下来逐一进行讨论。
3 电力系统中的状态估计法
在这个阶段,识别是电力系统状态估计的主要任务。在测量系统中查找测量数据并将其删除是最终目标,使电力系统更加稳定。电力系统中的一个关键组成部分为状态估计,其对所有量测数据进行第一次检测以及辨识。但是,在客观存在的不利因素下,数据的可信度不能得到保证。不良数据的不匹配将影响后续调度程序的某些决策,因此状态估计的重要任务是检测和识别不良数据。
智能电网中的状态估计是一个完整的过程,除了状态估计之外,还具有不良数据的识别。估计的计算是基于计算的原始数据的最佳标准,并接近最佳估计。最大接近于电力系统的实际状态,相当于让数据的可信度提升。数据检测是指根据相应的测试标准的数据是不是有缺陷的。辨识是发现不良数据的测量点存在的位置,经过检测判断数据的正确性,再对分析这些数据,通过辨识来提高数据的可靠性。
4 残差搜索识别方法和非二次准则方法
残差搜索识别方法首先通过加权残差或标准残差对不良数据进行排序,然后逐一消除,然后计算状态估计以达到最佳效果。然而它也具有一些缺点,由于该方法需要重新状态估计,因此需要大量计算。在此基础上修改了非二次准则方法,为的是取消第二状态估计以减少计算量,该方法通常对于检测和识别不良数据是有效的,但存在“殘留污染”和“残余洪水”现象的干扰会影响检测效果,从而导致错误检测或漏检的后果。
5 基于聚类分析的 GSA模型算法
基于聚类分析的 GSA模型算法的不良数据辨识:智能电网系统的不良数据识别是数据修复的基础与前提,本文对智能电网异常数据的识别方法的研究是针对不良数据。针对受物理环境、恶劣天气的一些不可改变的偶然因素影响以及监控设备老化或故障等多种原因导致的智能电网不良数据,获得了一种利用 GSA模型算法检测不良数据的方法, BP神经网络用于训练和测试待测数据。K均值聚类方法用于数据分类,然后使用间隙统计方法。提取出 k值以及不良数据,并利用数据进行实例验证。
不良数据的个数的确定:k-means算法可以准确,准确地执行数据分类操作,但前提需要知道簇的确切数量。在智能电网中不良数据的辨识中,我们往往不知道不良数据的个数及分布范围,因此,不可能在识别中预先指定簇的数量,并且需要间隙统计算法来分析每个簇的信息。判断簇的数量,如何确定簇的数量是问题的关键。
6 关联规则分析法
基于关联规则分析的不良数据辨识:通过分析数据库中以往每个采样时间对应下数据,将其进行离散化处理使其成为关联规则所需的数据类型,关联规则算法挖掘后,获取采样时间下的关联规则,每个采样时间对应的测量预测量为,最后,根据时间属性与测量数据的对应关系,验证当前时间测量数据的正确性。从而对不良数据进行的识别。
每个时刻在关联规则的提取:关联规则分析方法用于分析历史数据,然后在每个采样时刻提取关联规则,即随时测量预测量。然后,通过比较数据和数据之间的关系,比较测量数据以达到检测和识别不良数据的目的。
(作者单位:东北大学秦皇岛分校)