数据挖掘技术在电力设备故障诊断中的实践
2019-06-11张倩
摘 要:现阶段我国电力设备的运行已与各行业顺利发展具有较为密切的关系。就实际展开分析,电力设备一旦出现故障,对现实中的各项生产、生活相关项目皆会造成较大影响。为保障电力设备顺利运行,需切实掌握一套较为完善的故障诊断、修整方式。本文即从故障诊断工作着手,将电力设备故障诊断结合当前较为发达的数据挖掘技术展开,以技术分析角度展开研究,确定电力设备故障诊断流程,并切实将其实践于实际过程中的故障诊断工作,确保其准确且能够稳定使用。
关键词:数据挖掘;电力设备;故障诊断;应用实践
故障诊断工作为根据设备运行状态、运行信息分析其是否符合正常标准,随后判定故障具体位置的设备维护、修理工作。故障源的准确诊断能够保障其具有较为完善的决策制定,对于实际过程中的相关工作具有一定价值。针对其工作原理展开分析,过程中确定故障源、实现信息分析的具体工作步骤可切实应用数据挖掘技术,现阶段电力设备数据的复杂性、信息多样性亦使数据挖掘技术能够较其他方式更快、更为精确地确定故障源。因此,下文将数据挖掘工作应用至电力设备故障诊断中,并通过实际情况确认其准确性、稳定性。
1 数据挖掘技术的原理
1.1 粗糙集属性约简原理
粗糙集理论由波兰学者Z.Pawlak于1982年提出,其主要作为数学工具使用,目的为处理模糊问题、不确定型问题。[1]实际应用过程中,粗糙集理论能够基于运算进行分析与处理,将各类不精确、不一致数据通过发掘数据间联系的方式进行提取,最终实现有用信息提取、简化信息处理。技术层面中,粗糙集将客观世界的信息系统抽象对待,将客观世界作为一类“系统”。以S=(U,A,V,f)为运算公式。其中U为对应项目的非空有限集,被称为论域。A为属性的非空有限集,V为属性A的值域。f为U*A→。V为信息函数,即代表a∈A,x∈U,f(x,a)∈Va。其中,若A的表示方式为条件属性C与决策属性D,那么可以将A视为C∩D,C∩D=,即将其视为决策表。[2]
除此以外,根据信息论中关于知识定义的P(属性集合)的熵、条件熵概念,可将P的熵H(p)确认为H(P)=-(Xi)log(P(Xi))。知识属性结合过程中,Q(U\\IND(Q))={Y1,Y2,…,Ym}。
针对原始决策表展开分析,其中所具备的各项条件并非必要属性,实际过程中部分属性较为多余,去除此类属性不会影响原有表达效果,此即为粗糙集算法的优势所在。根据粗糙集描述知识,不仅能够将原有冗余条件去除,使计算更为明朗、直观,且冗余条件去除后,利用粗糙集描述知识的属性,求取约简过程结束后能够有效实现知识简化,将对应复杂决策予以分析,切实解决原有模式中较为复杂的问题。[3]
1.2 朴素贝叶斯分类算法及原理
朴素贝叶斯算法为贝叶斯网络中的一种。贝叶斯网络亦可称为因果网络与信度网络,其主要原理为利用有向图形式较为直观地展现随机变量向的因果关系,并将概率信息应用至实际,体现随机变量间的因果关系同时利用条件概率将此类关系有效量化,随后展开计算。皮素贝叶斯分类为贝叶斯方法中较具有实用型的方式,适用于多种场合,能够切实以概率密度函数作为计算、阐述基础,将分析类统中的条件属性与分类属性进行明确,切实确认而这会之间的映射关系。较其他算法而言,此算法具有出错率小、容错率高的优点。
针对朴素贝叶斯分类的原理展开分析,其主要假定属性变量间相互条件较为独立。且其中所存在的每个属性节点X仅存在单一关联性,即其与类节点C之间的联系。在分析合集的过程中,令U={X1,X2,X3,Xn,C}。其为离散随机变量的有限集。其中X1,X2,X3,…Xn为属性变量,而属性变量的取值范围与实际关联较为密切。可以实际过程展开假设,若故障样本为X={X1,X2,X3…Xn},可准确确定样本的故障范围。根据贝叶斯定理,其可表示如下:
P(Ck|x1,x2,x3…xn)=P(x1,x2,x3…xn|Ck)P(Ck)P(x1,x2,x3…xn)
其中,P(Ck)为Ck的先验概率,主要意义在于根据数据分析获得其发生概率,随后将后验概率加以分析,得到信息后进行修正,保障其概率较为标准,且反应样本数据对类Ck的影响。除此以外,若将公式中的相关参数进行分析,可确认训练样本中的故障条件与属性值x,且Ck的概率若属于某类故障参数区间,则可确定其概率值,根据概率值大小确定算法结果,即判断故障样本属于何种故障,确认故障归属并展开实际过程中的维修工作。
2 基于数据挖掘技术开展的电力设备故障诊断步骤
粗糙集理论的主要优势在于其无需于计算过程开展前预设数据准备,或进行额外调查获取更多数据以便于计算。粗糙集计算过程中完全依靠数据驱动,即根据对应工作获取相关数据,以此类获取数据推动计算模式及相关工作,保障其能够切实有效地获取相关信息,实现较为有效的发展。但针对实际情况展开分析,此类理论所衍生的计算手段中亦存在局限性,即错误率方面问题,当计算工作开始时,计算过程对故障信息的诊断耗时要求较高,且对故障信息的针对性。准确性具有较高要求,若其存在无法,即易导致问题出现。因此,实际过程中以朴素贝叶斯理论与粗糙集理论为数据挖掘技术的开展基础,根据对应情况使用对应方式,保障计算、搜索、分析等一系列数据挖掘工作中的重点得到解析,切实实现发展。根据实际工作展开分析,一般情况下的算法流程多为图1所示的具体流程。
以变压器故障诊断工作为例,数据挖掘工作的主要目的即在于保障变压器稳定,实现变压器发展的同时切实解决实际过程中的问题,有效应对各类情况下所出现的故障检查。以实际工作中的问题出现因素代入到计算过程中,可发现此类问题的发生领域。首先将对应参数带入到征兆合集C、故障合集D中,以编号形式将各类问题进行顺序排布,随后根据相关公式计算出故障先验概率。如将C1、C2作为三比值编码呈过热性、放电性故障特征,按照变压器故障发生过程中的各项问题进行编号与分类,通过具体计算确定故障发生具体位置。实际过程中导致变压器故障的因素较为多样性,但無论其发生概率如何,应将其计算于编号内。如本次模拟分析过程中将铁心接地电流、绕组直流电阻的三项不平衡系数、变压器本体油中含水量、局部放电、绕组变比偏差等因素均计算在内,保障具体数据挖掘过程中的精确性。
由粗糙集观点展开分析,若想切实根据实际情况展开分析,首先需将对应决策予以明确,并切实根据相关信息,如决策表征兆集合、故障类型分析与判断等确定故障源及故障具体原因。但就实际过程展开分析,决策表中的相关数据较为连续,取值方面亦为连续值,若想切实实现连续值分布与分析,还需将此类数据予以分析,实现有效提升的同时按粗糙集理论将其离散化,对信息进行处理。如互信息>0.5,应将其量化为2,互信息若小于0.5,则应将其量化为1。就实际规则展开分析,可较为直观地将其征兆视为引起故障的概率较大、较小或视为无。经此类处理后,相关数据即可较为有效地实现发展,保障单位数据发展满足实际需求。就朴素贝叶法进行分析,其约束属性中确定的最小属性集为{c1,c2,c3,c5,c7,}其余三类属性集亦与其较为接近,具体过程中存在的相同参数可视为一致,三组合计间的差异性在于C6。因此,应结合实际展开分析,将变压器中对应部件进行调整,并观察实际情况确认是否正确。除此以外,还应考虑到征兆获取过程中的对应条件属性为0,应切实将其删除,选择较为适合的实际参数,进一步确定变压器故障源所在。
3 实际过程中应用数据挖掘技术的电力设备故障诊断有效性实践
为保障上文所述的相关数据挖掘手段切实有效,特根据实际情况展开电力设备故障诊断机制,展开有效性实践,以对应相关信息确定故障诊断有效性。实践中存在的电力设备为型号为SFSZ8-50000/110。当电力设备故障诊断工作开展前,针对其具体参数进行油色谱分析气体组分试验,相关数据如表1所示。
获取对应数值,将各类气体的存在与浓度作为分析过程中的重要参数,应切实根据实际展开分析,将其代入到公式中。当三比值编码为022时,判断出问题属高温过热性故障特征,与温度方面关联较为密切;当铁心接地电流为1.378A时,属性值存在异常。除此以外,具体测算公式可以如下形式表现:
除此以外,实践确认过程中发现变压器油中水含量为17mg/L,局部放电量完全处于正常范围内。针对此类信息进行计算,可确认各项事故的发生几率。具体几率可参照表2。
获取数据后可发现,对应过程中所存在的数据多与实际关联较为密切,且数据计算过程中所存在的相关数据能够切实对实际进行分析。由上表可得知,实际过程中的故障发生几率最大者即编号为d1的问题,即铁芯接地造成的变压器故障原因的几率较大。确认问题发生源后,针对实际展开分析可发现实际过程中的相關问题多以对应工作中的研究信息为主,结合实际呈现较为有效分析的同时将问题缩小于具体范围内,有效解决问题的同时切实与实际情况吻合。获得数据后验证正确性的过程中发现,此变压器的故障问题为铁芯多点接地,实际过程中变压器内部亦存在铁屑及残渣,此杂质于变压器运行过程中受磁场影响吸附于铁芯上,造成环流过热后使铁芯多点接地,造成变压器的运行故障。此类结果可判定数据挖掘技术的准确性,实践过程中出现的对应技术亦表明过程中存在的相关数据,有效解决问题。
4 结语
针对实际进行分析,本文所使用的数据挖掘技术为诊断电力设备故障的必要因素之一,实际过程中所出现的各项单位数据亦使实际过程中的单位数据有所提升,切实解决问题,保障电力设备的运行稳定。但就现阶段情况展开分析,数据挖掘技术的难度仍较大,因此,应切实使相关人员明确操作技术,了解相关知识,提升技术发展。
参考文献:
[1]王喜,赵宵凯,熊斌宇.一种基于数据挖掘技术的智能变电站故障诊断方法[J].陕西电力,2018,v.46;No.294(4):45-49.
[2]宿忠娥,祁建宏,效迎春.数据挖掘技术在风力发电机组故障诊断中的应用与研究[J].自动化与仪器仪表,2018(2).
[3]张斌,滕俊杰,满毅.改进的并行fp-growth算法在工业设备故障诊断中的应用研究[J].计算机科学,2018,v.45(S1):521-525.
作者简介:张倩(1984-),女,汉族,陕西潼关人,本科,讲师,研究领域:电力系统及其自动化等。