数据挖掘技术的智能变电站故障诊断技术

2020-11-06陈林

商品与质量 2020年32期

陈林

国网湖南省电力有限公司邵阳供电分公司湖南邵阳 422000

近些年随着大数据技术、云计算的快速发展，智能电网数据管理模式发生了本质的改变，通过大数据技术可以有效解决电力故障信息系统中的不利因素。从现阶段的智能变电站来看，为了有效监控变电站中的设备设置了不同类型信息采集系统，形成的大量数据对变电站的检修造成了不便，并且数据量较大，非常容易发生疏漏，大大降低了信息资源利用率。虽然经过各方面研究，发展了多种快速处理智能变电站相应数据的方法（例如专家系统、神经网络等），但是都存在一定限制。本文以粗糙集遗传算法为基础提出了智能变电站数据信息约简算法，利用粗糙集所具有的约简能力提升结果的准确性以及故障诊断速度[1]。

1 基于数据挖掘技术的遗传算法

1.1 粗糙集技术概述

第一，粗糙集属于数据挖掘技术的一种，应用到了很多领域，不但能够实现冗余降低、无关数据决策，同时也能够有效分析变电站历史数据库中的数据。同时，变电站实时数据分析时要避免较长的计算时间，所以数据挖据实施时一定要考虑到管理信息系统的离线以及在线算法的处理速度等。而粗糙集技术可以满足数据处理速度的要求，并且处理方式较为便捷。

第二，粗糙集数据更多来自于信息系统以及决策系统，粗糙集行以及列代表着对象标识符以及属性，属性值会随着时间有所变动。智能变电站会从上述两系统中得到非常多的信息，尤其是智能变电站采用不同类型IED的情况下数据量更是呈几何级数上升。但是很多数据都是冗余的，对于分析造成干扰。而粗糙集技术可以从原始数据中找到最小的有价值信息理论，能够通过缩减的属性来对系统进行体现，称此种属性集为“简约”。因此通过IED数据得到关键数据的过程也称之为简约过程，但是其速度相对较慢并且偶尔无法得到优化结果，因此要通过遗传算法提升简约速度，并且能够得到最优解。

1.2 基于粗糙集的遗传算法

遗传算法是获取最小相对约简最为常用的方法之一，获取最小相对约简是非常重要的，对于处理决策问题具有重要意义。

第一，编码方法。在利用遗传算法来处理约简问题时，首要处理的就是数据编码方面的问题。在分析知识约简问题的具体特征之后，可以通过基于{0，1}符号集的二进制一维形式进行编码。具体的编码方式设置为：

设定条件属性集合：C={c1，c2，…，cn}，条件属性集能够很便利的映射到遗传算法的染色体，其中染色体为长度是n的二进制位集，不同的位元素都会对应相应的属性。例如元素取值为1，就表示选择与之对应的条件属性，取值为0就表示不选择与之对应的条件属性。因此每一个染色体和条件属性中的一个属性子集相对应。

第二，选择适应值函数。在进行个体元素适应性评定过程中，最主要的指标就是适应值函数，因此所选定的适应值函数直接影响着群体的进化方向。按照具体问题的需要，可以设定适应值函数具体为：

表中，f（x）表示目标函数，n表示条件属性集C的长度，card（x）表示个体x中1的个数，就是指个体x中存在条件属性集C的数量。f（x）表示不包含在个体x中属性占比情况，能够得知个体x和f（x）具有反比关系。P（x）表示惩罚函数，α表示惩罚因子。

通过上述公式能够得到惩罚函数的特性曲线，如图1所示。图中k（x）表示：

x中所含条件属性C对于决策属性D的支持度情况，k0表示预先设定的阈值，通过合适α值的设定能够确保惩罚函数在k（x）＞ k0的情况下无限接近1，并且在k（x）＜ k0的情况下会逐渐衰减到0，从另一个角度讲，降低精度无法满足k0的个体适应值，不会对k0的个体适应值造成影响。

适应值函数F（x）为了能够得到知识约简问题的最好搜索效果，要确保个体x中所具有的条件属性集C的数量尽量小，个体x中所具有的条件属性集C的决策属性D的支持度尽量大。

第三，选择运算情况。在进行运算时可以设定群体量为m，被选概率可以表示为：

其中F（xj）表示个体适应值。利用选择运算就能够形成交叉运算集合，父代种群中个体生存期望数目表示为：

通过选择运算能够确保良好基因传递到后代。

第四，交叉运算。为了能够确保核中所含属性相应基因位的稳定性，可以通过一致交叉运算的方式来进行，就是指染色体位串上每一位根据同样概率实施随机均匀交叉。操作描述具体情况设定为：

其中x设定值为[0，1]中满足均匀分布的随机变量，Pc表示交叉概率。

第五，最优个体保护法。从根本上来看遗传算法属于近似的运算方法，所以通过遗传算法所得到的结果并非是完全准确的。在具体计算过程中，此种近似算法所得结果虽然能够接受，但是更为关注的则是算法的收敛性。最优个体保护法就是保证每一代中适应值最大的个体能够进入到下一次迭代当中，此种方法能够确保在算法执行时每一代最优个体特性表现出单调递增的方式，能够最大程度确保算法的收敛性。此种算法若是连续几代最优个体适应值保持稳定，就能够获取最优解[2]。

2 相应的仿真分析

2.1 仿真案例

本文主要以某110kV智能变电站为例对其实施仿真，此智能变电站通过同个电源供电的110/35kV智能变电站主要包括2台变压器，每一台变压器一般都运行在50%-60%额定功率情况下。

2.2 仿真情况

第一，在启动仿真模拟之后的t=1s情况下，变压器T2就发生了故障（在A-B之间），此时IED5以及IED7发生动作而造成断路器5以及断路器7跳闸。在变压器T2退出的情况下，T1的功率会有明显上升（达到100%—110%）。因为保护动作具有速断的特性，所进行的仿真很快（t=3s）完结。

第二，IED可以直接从模型信号中实施采样，但是所得数据存在大量不相关数据。对于IED所处状况进行定义，具体如表1所示。对IED没有处理的数据

表1 状态说明

通过遗传约简算法进行仿真，相应参数设置如下：群体规模m=11，交叉概率Pc=0.8，惩罚因子α=15，预先设定的阈值k0=0.9。能够在很短时间内将冗余信息清除掉，能够获得最小相对约简IED5以及IED7。

第三，在进行仿真时IED5以及IED7属于故障分析的关键内容，因为IED5存在着定向继电器功能，所以更便于故障位置的判定。因为IED5以及IED7属于最小简约，具有断路器以及继电器等方面的操作数据。将两者中相应的冗余信息去除掉，能够得到上表的结果，其中0表示无动作，1表示动作。通过上表可知数据的规模有了明显降低，更便于工作人员快速准确的对故障进行分析，可以提升对故障的处理速度，能够大大降低故障对系统的影响，从而确保系统的安全性[3]。

3 结语

本文在分析传统数据算法的基础上，提出了基于数据挖掘技术的遗传算法，将其用在智能变电站故障诊断方面，可以准确、快速获取最佳简约组合，对于约简结果进行有效融合。通过在故障诊断中应用分析决策表（能够体现故障真实状态），工作人员可以快速准确的对故障进行分析，对于故障位置进行判定，从而及时采取措施进行故障处理，确保系统的安全性。