APP下载

基于“多表合一”系统的智能表异常诊断及处理方法研究*

2018-07-30王新刚祝恩国朱彬若曹祎

电测与仪表 2018年2期
关键词:诊断系统置信度排查

王新刚,祝恩国,朱彬若,曹祎

(1. 国网上海市电力公司电力科学研究院,上海 200437; 2.中国电力科学研究院,北京 100092)

0 引 言

多表合一”系统是以“助力智慧城市建设”为出发点,基于远程信息采集构建的城市智能计量系统,为电、水、气、热行业实现能源计量数据远程采集、实时监测、综合应用等提供智能化手段,降低损耗和运营成本,服务国家能源阶梯价格及节能减排政策执行。智能表作为该系统中与用户联系最紧密的组成单元[1],是供能企业和用户进行贸易结算的计量器具,其运行可靠性对双方都存在重要意义。运行统计情况表明,智能表在现场可靠运行的风险主要来源于自身元器件失效导致的智能表故障和运行环境异常导致的异常运行状态[2]。传统的质量管控只能通过智能表安装前的试验和安装后的运行抽检、周期检验、到期轮换来保证智能表的可靠运行,其缺点是对运行智能表质量管控实时性差,且用于管控分析的数据维度较少,难以及时、全面的掌握智能表运行状态。

近年来,高级量测体系(Advanced Metering Infrastructure, AMI)一直被用于提升电力企业的运营管理水平[3-6]。美、法、日等国通过AMI实现电能表远程抄表、实时监控和故障诊断等功能,用于提升计量管理和故障消缺水平。我国在电能计量领域也开展了计量装置在线监测[7-8]的研究,但较多的是针对高压大用户智能表误差的监测和营销大数据分析。一方面,电、水、气、热智能表在用户侧具有显著的关联关系,而现有的系统没有把此类智能表计纳入分析范围;另一方面,采集系统在长期的运行过程中积累了海量的历史数据和监测数据,但由于缺乏信息的综合分析和关联关系而很难满足高层次分析决策的要求,无法从时间和空间意义上深层次理解并有效利用这些数据。

为提升“多表合一”的运行稳定性,充分发挥成熟系统的优势,带动电、水、气、热行业协同发展,不仅需要构建一个适用于多种计量表计数据采集的系统,还要具备异常监测、故障诊断、消缺管理等应用功能。本文结合智能表已有的运行数据监测条件和消缺工作流程,提出了一种基于关联挖掘的智能表异常诊断和处理方法,通过对智能表数据的采集与处理,利用数据比对、统计分析和数据挖掘[9-12]等技术手段诊断智能表异常工况,从关联规则提取、监测结果匹配、现场分析及反馈、数据库更新等方面阐述了该技术是合理、有效的。

1 “多表合一”系统原理结构

“多表合一”系统是在用电信息采集系统的基础上升级改造而成,其系统结构主要分为主站层、采集传输层和数据测量层,如图1所示。

主站层是系统的运行管理中心,负责整个系统的数据采集、数据存储、分析应用和系统接口等,是实现智能表异常诊断的关键逻辑层,通过系统接口将诊断结果传输至闭环消缺系统,以实现故障的智能诊断和闭环处理。

采集传输层负责智能表数据的采集和传输,由采集设备和上下行通信信道组成。电表的数据采集采用已有的设备和信道,水、气、热表数据的采集通过转换器进行信道和协议的转换后在传输至集中器。

数据测量层是实现智能诊断的基础数据层,由智能电、水、气、热表计组成,负责产生运行和诊断所需的各类数据。

图1 系统结构框图

2 基于关联挖掘的异常诊断

2.1 关联挖掘基本原理

关联规则反映了大量数据中项目集之间的相关联系,可定义如下。设I={I1,I2,…,Im}是项的集合,其中:元素称为项,项的集合称为项集。事务数据库D={T1,T2,…,Tn}是数据库事务T的集合,每个事务T是一个非空项集,且T⊆I。设X、Y都是T中的项或项集,关联规则是形如X⟹Y的蕴涵式,其中:X⊂I、Y⊂I,且X∩Y=φ,规则X⟹Y在事务集D中成立,具有支持度S和置信度C,可表示为:

X⟹Y(S%,C%)

(1)

式中S%为包含X∪Y的事务T在事务集D中所占的比例,C%为事务集D中包含X的事务中又包含Y的比例,即:

S%=S(X⟹Y)=P(X∪Y)

(2)

C%=C(X⟹Y)=P(Y|X)

(3)

同时满足最小支持度(minimum support)和最小置信度(minimum confidence)的规则称为强规则,最小支持度和置信度的阈值由运行经验给出,并可在后续进行调整。关联规则挖掘方法中最有影响的算法是Apriori算法,由Agrawal和R.Srikant于1994年提出,是一种基于布尔关联规则挖掘频繁项集的算法,后续很多关联规则算法都是在此基础上的改进和优化。Apriori算法将关联规则的发现分为两步:第1步是识别所有的频繁项集(frequent itemset),即其支持不低于用户最小支持度的项目集,第2步是从频繁集中构造其信任不低于用户最小置信度的规则。

2.2 关联挖掘模式

通过对智能表的事件元信息进行统计后发现,诊断结果与事件元信息之间存在一定的导向关系,即某个诊断结果仅与若干个事件元信息存在关联关系,而与其他事件元信息之间不存在关联关系。因此,可以通过制定元规则对挖掘过程进行约束,提高挖掘性能,本文对元规则定义如下:

设集合P={P1,P2,…,Pm},Q={Q1,Q2,…,Qn}分别表示事件元和诊断结果的集合,∀Qi∈Q,(i=1,2,…,n),∃Pj,Pk,…,Pl∈P,(j,k,l∈[1,m]),满足PjΛPkΛ…ΛPl⟹Qi,则称PjΛPkΛ…ΛPl⟹Qi为智能诊断的一个元规则。

元规则可以根据分析者的经验、期望或对数据的直觉、根据数据库模式自动产生,挖掘系统可以寻找与规定元规则相匹配的规则。文章通过对历史数据的总结和分析,将事件元和诊断结果进行关联配对,对每个诊断结果挖掘的事件元进行约束,只取具有关联关系的事件元进行挖掘。

2.3 异常诊断流程

异常诊断流程可分为关联规则提取、事件元生成和结果诊断三个部分组成,如图2所示。

图2 智能表异常诊断流程

关联规则提取采用离线方式,即异常诊断系统按设定的时间间隔(默认为1日)从知识数据库中提取满足要求的关联规则,作为下一时间段智能诊断的诊断规则。初始的规则由历史数据、专家经验等信息挖掘生成,随着系统运行的逐步完善,异常诊断系统积累的诊断知识越来越多,通过知识数据库挖掘的规则准确性越来越高。

异常诊断的主流程从事件元生成开始,采集系统对采集的数据和事件进行分析处理,经过相应的数据清洗后形成事件元,并通过关联信息实现事件元和设备信息及计量点信息的关联,为结果诊断提供诊断信息。

结果诊断将一定时间窗口内的事件元与关联规则进行匹配,并提供每个诊断结果的支持度和置信度。

3 诊断结果的排查及处理

3.1 诊断结果处理流程

诊断结果处理作为异常诊断的闭环处理环节,其目的主要有两个:一是确认诊断结果;二是完成故障消缺。在实际运行过程中,由于受到采集数据不完整或异常、知识数据库不完善、突发异常等因素影响,异常诊断系统不能保证诊断结果完全正确。因此,对于系统的诊断信息,需要人工进行排查和确认。虽然智能诊断结果的有效性仍待确认,但其为运维人员提供了一个排查的方向,缩小了排查的范围,有利于指导确认工作的开展。

诊断结果处理流程主要分为三大部分:诊断信息收发管理、异常排查管理和消缺管理,具体流程如图3所示。

图3 异常诊断闭环管理流程图

(1)系统从中间库接收诊断信息,包括诊断结果、支持度和置信度指标、事件元信息等,并将获取的信息按要求进行排序和展示;

(2)派工人员根据管理要求对诊断信息发起排查流程,安排消缺人员进行排查,消缺人员参考分析指南进行故障排查。排查分为远程和现场两种方式,可并行开展,远程排查可快速获取计量装置故障的更多信息,现场排查可获取采集系统无法获取的信息。如果通过多次排查仍无法确认故障结果时,可发起协作排查的申请,邀请相关领域的专家共同分析处理。当排查结果确认后,系统需录入排查结果,并将结果通过中间库方式反馈故障诊断系统,同时检查排查工作是否超出分析指南的范围,如果涉及分析指南中为明确的方法和要求,则更新分析指南;

(3)根据排查结果判断计量装置是否需要消缺而选择发起相应的消缺流程,并对整个消缺流程进行管控,直至完成全部的消缺工作和信息归档。

从系统流程中可以看出,闭环消缺管理包括信息流和工作流两个方面:信息流管理是指对诊断信息的闭环管理,包括信息的获取、验证和反馈,分析指南更新,信息的准确性等;工作流管理是指对排查工作和消缺工作的闭环管理,包括工单管理、工作进度和完成质量等。通过信息流和工作流的闭环管理,既保证了诊断结果的准确性和可靠性,也保证了工作的质量,使智能表异常能够及时准确的得以处理。

3.2 主要模块功能介绍

3.2.1 诊断信息收发管理

诊断信息收发管理主要负责智能表异常诊断结果的接收、展示,以及将确认的诊断结果发送回去,通过中间库的形式进行数据交互。系统定时从中间库获取诊断信息,并根据操作人员制定的规则进行结果展示,当诊断结果经排查确认后,系统再将结果返回中间库。

系统按照预先定义的库、表结构定义和权限配置,实现各种数据的双向交换,交互的数据格式如表1所示。

表1 系统数据交互列表

唯一性标识用作诊断信息的身份标识,保证数据交互对象的一致性,当系统返回数据时,需连同唯一性标识一起返回。

计量点编号是计量点的唯一性编号,通过该编号消缺管理系统可以从营销系统获取相应的计量点基本信息和设备基本信息,便于消缺工作的开展。

监测信息为得出该计量点诊断结果的全部信息,包括诊断结果对应的事件元和故障生成日期,但考虑到可以通过采集系统获取事件元的详细信息,为提高接口效率,监测信息不包含事件元的详细信息。

诊断结果根据信息来源不同分为两个方面:一个是智能诊断系统分析得出的诊断结果,另一个是人工排查后得出的确认结果。智能诊断系统将其诊断结果和对应的支持度、置信度指标传给消缺管理系统,消缺管理系统经排查确认后将最终结果返回智能诊断系统,返回最终结果时不含支持度和置信度指标。返回的结果由智能诊断系统判断原诊断结果是否正确,并根据不同的情况更新知识数据库。

3.2.2 异常排查管理

异常排查管理主要负责管理智能表异常诊断结果的人工排查过程,包括排查的流程、数据和结果的处理、工作质量的管理等,同时还能以固定的流程指导排查工作的开展。当消缺管理系统获取诊断信息并生成排查工单后,运维人员根据已有的信息并参照分析指南,开展远程抄表分析和现场人工排查,通过综合分析形成最终的排查结果。

由于诊断结果最终由排查分析后得出,排查结果的准确性关系到后续诊断结果的准确性,因此,排查的质量管控尤为重要,本文提出以下三个管控指标:

(1)排查结果支撑数据的有效性。排查时会产生大量的过程数据,如果这些数据能够有效支撑排查结果,则认为这些数据有效。在进行排查时,首先应确认智能诊断系统提供的信息;其次,通过远程的方式采集故障点其他支撑数据;如果仍不足以判断结果,则再经人工现场排查,收集远程无法采集的数据进行综合分析;

(2)排查工作的时效性。为保证智能诊断系统高效运行,进行排查工单派发时,会对每个排查任务制定工作时效,通过对时间节点的考核和管控确保运维人员按时完成排查任务;

(3)排查结果的验证。通过消缺工作的开展和系统对同一计量点相同故障的重复诊断来验证和考核排查结果的准确性。

3.2.3 异常消缺管理

系统根据排查结果判断是否启动消缺流程,对于由电网异常、现场维护导致的异常诊断,经排查阶段确认后可直接结束流程,无需进行消缺;而对于设备故障、疑似窃电、回路异常、错接线、违约用电这类诊断结果,需开展消缺工作并对应发起换表、故障消缺等流程,涉及电量退补、反窃电等情况时还应发起电量退补和反窃电流程。按照闭环管理流程,故障消缺系统的主要功能可分为消缺管理、消缺派工、现场消缺和消缺归档。

4 诊断知识库的维护

4.1 诊断知识库的定义

异常诊断系统将历史故障或异常信息和对应的消缺结果以统一的数据结构保存下来,形成诊断知识库,作为后续异常诊断的挖掘知识,诊断知识库是关联挖掘的基础,通过反馈的排查结果形成新的知识,并用于下一次挖掘。在关联规则的挖掘中,诊断知识库也叫事务数据库,是挖掘频繁项集的基础,随着现场异常、故障的不断确认和处理,诊断知识库也不断的扩大,种类也不断丰富,一些知识如经常发生的异常及对应的诊断结果得到不断强化,使得其在挖掘过程中的支持度和置信度不断提高,成为更容易被挖掘到的规则。

4.2 诊断知识库初始化

故障特征可以通过挖掘故障样本获得,也可以根据已有的运行经验生成。在挖掘系统的运行初期,可以归纳一些故障特征,并在运行过程中不断检验和调整,以适应计量在线监测的实际。本文依据对历年智能表故障分类及特征的统计分析,结合智能表运维消缺的经验,生成初始的诊断知识库。

4.3 诊断知识库的维护

在系统运行初期,诊断知识库中的知识基本靠手动方式进行维护,根据特征数据的统计情况、现场运行工况及专家经验等数据,建立一个初始的知识数据库。随着系统的不断运行,知识数据库通过学习机制不断进化、完善,总体而言,诊断知识库的维护可分为知识积累、学习限制及知识淘汰三个步骤。

4.3.1 知识积累

诊断知识库的知识积累实际上是一个学习的过程,将智能表运行过程中普遍发生、重复出现的问题记录下来作为后续诊断的依据。除了初始的知识外,异常诊断系统接收经现场确认的结果,与诊断信息一起以统一的形式存储在知识数据库中,形成诊断知识,共同参与下一次关联规则的挖掘。

4.3.2 学习限制

当具有相近诊断信息的同一类型故障在一段时间内大量发生,则很有可能是一种批量性问题的集中爆发,将极大提高此类故障诊断的支持度和置信度,同时其他诊断结果的支持度和置信度下降。这种情况下,一方面应正确引导诊断系统的结果导向,精确定位诊断结果;另一方面又不能明显牺牲关联规则的多样性,影响其他故障的诊断。因此,必须对此类学习过程进行限制。如果发现一段时间内积累了大量相似的诊断信息,则只记录N条(N默认取10)诊断信息支持度最高的诊断知识,同时对后续挖掘到的相应关联规则进行支持度和置信度增强,即挖掘完成后,增强支持度S′%=k·S%,增强置信度C′%=k·C%,k≥1。

(1)相近诊断信息是指具有相同智能表属性的事件元信息,涉及判断的智能表属性主要有制造单位和批次号,且制造单位包含批次号,则相近诊断信息可以理解为具有相同制造单位或批次号存在一个或多个重叠事件元的多条诊断信息。

(2)一段时间是指统计相似诊断信息的时间区间,考虑到故障确认及消缺周期,文中以D天(D默认取30)为窗口长度进行滚动统计,如果在这段时间内相近诊断知识超过M条(M默认取10),则定义为大量。

4.3.3 知识淘汰

随着诊断知识库的不断扩大,一些历史上特定的、不常发生或不具备普遍适用性的知识应逐步被淘汰,使诊断结果更加能反映当前的运行情况,这个过程称为知识淘汰。知识淘汰主要有自动和手动两种方式,自动淘汰由诊断系统自动完成,通过对诊断结果设置诊断知识的生存周期,根据诊断知识的时标属性进行判断,如果生存周期内知识库未获取相同的诊断知识,则淘汰该知识,否则重置该知识的生存周期;手动淘汰由诊断系统运维人员根据实际需求进行知识的手动删除。

5 结束语

文中提出的基于关联挖掘的智能表异常诊断及处理方法遵循实际的故障分析和处理流程,适应智能表异常诊断和消缺工作的开展,是一种提高智能表质量管理水平和消缺效率的有效手段,具有以下特点:

(1)有利于及时、全面的掌握智能表的运行状态,结合海量数据分析异常运行智能表的故障原因;

(2)有利于指导消缺工作的开展,为现场消缺提供技术支撑;

(3)随着异常处理的开展,诊断知识库越来越完善,能够进一步提高异常诊断的准确率。

猜你喜欢

诊断系统置信度排查
硼铝复合材料硼含量置信度临界安全分析研究
高层建筑消防安全排查情况及处理对策
配网二次回路故障的排查分析
给家中来个危险排查吧
区间轨道电路智能诊断系统的探讨
设备在线诊断系统在唐钢的建设与应用
正负关联规则两级置信度阈值设置方法
如何排查并改错
连铸板坯质量在线诊断系统的应用
置信度条件下轴承寿命的可靠度分析