基于台账数据图谱的设备家族缺陷预控检修技术
2021-03-12姚明亮
巩 宇,姚明亮,张 豪
(南方电网调峰调频发电有限公司,广东省广州市 510630)
0 引言
电力系统台账数据以功能位置类型、品类、型号、厂家、设备参数、缺陷信息、运维信息为关键字段,以台账数据ID为主关键字[1]。电力系统设备品类多,数量也多,致使台账数据成为海量数据,依靠人工维护已成为不可能的工作。过去由于缺乏有效手段挖掘,海量台账数据价值没有被挖掘,台账的数据质量维护工作也成为生产技术人员的维护负担[2-3]。
图论中邻接矩阵可用一个稀疏的二维数组存放图中所有顶点数据和顶点间关系(边或弧)的数据[4]。不难想象如果能用一种标准的方法将台账数据连接为二维表并转化为邻接矩阵,再将邻接矩阵转化为图谱,无疑可使图谱成为台账数据的研究工具[5-6]。生产技术人员可根据图谱“按图索骥”快速找到台账各字段的联系,通过横向比较发现数据质量问题,通过纵向分析发现设备的家族缺陷[7-8]。
本文结合工程经验,全面考虑台账数据的特性,对图谱形成的方法进行标准化,并交给计算机完成,使得提升台账数据质量并发现设备家族性缺陷,为预控设备家族缺陷发展的检修方法实现自动检测和控制,为提前暴露台账数据所属的设备的家族缺陷以及消缺工作提供技术支持。可有效规避风险,为工业的安全稳定生产提供可靠的技术保障。
1 台账数据图谱的形成方法
1.1 应用图谱的数据治理方法流程[9]
步骤1:形成包含所有台账数据字段的二维表B0。
步骤2:根据指定范围形成由功能位置类型、设备型号、生产厂家、技术参数字段组成的二维表B1,根据二维表B1形成台账数据图谱T1。
步骤3:根据台账数据图谱T1中同一功能位置类型下所关联的设备型号、生产厂家、技术参数获知潜在互为备品的信息和台账数据质量情况,对于有数据质量问题的台账数据进行纠正。
步骤4:根据指定范围形成由设备品类、设备型号、功能位置、缺陷表象、缺陷原因、处理措施字段组成的二维表B2,根据二维表B2形成台账数据图谱T2。
步骤5:根据台账数据图谱T2中,同一品类、型号所关联的功能位置类型、缺陷表象、缺陷原因、处理措施字段获知设备家族缺陷,根据处理措施字段形成有针对性的预控设备家族缺陷发展的检修方法。
1.2 二维表形成台账数据图谱步骤[10]
步骤1:获取二维表B的行数M和列数N,M∈[1,+∞),N∈[1,+∞)。
步骤2:按列取唯一值,即同一列中相同的数据合并为一个数据。
步骤3:按列取唯一值后,获取1~N列唯一值的个数O。
步骤4:按1至O对各唯一值进行编号,并将编号回写到二维表B中形成新二维表BB,BB为M×N的矩阵。
步骤5:设邻接矩阵TT是O×O的全零的稀疏矩阵。
步骤6:设i=1。
步骤7:设j=1。
步骤 8 :TT(BB(i,j),BB(i,j+1))赋值为 1。
步骤9:j的值加1,若j的值不大于N-1则转至执行步骤8,否则转至执行步骤10。
步骤10:i的值加1,若i的值不大于M则转至执行步骤7,否则转至执行步骤11。
步骤11:获得二维表B的邻接矩阵TT。
步骤12:设i=1。
步骤13:设j=1。
步骤14:若TT(i,j)不等于1,则第i点向第j点画一条线,并按二维表BB将节点编号转为原台账数据,否则转至执行步骤15。
步骤15:j的值加1,若j的值不大于N则转至执行步骤13,否则转至执行步骤16。
步骤16:i的值加1,若i的值不大于N则转至执行步骤13,否则转至执行步骤17。
步骤17:获得二维表B的台账数据图谱。
2 应用台账数据图谱的治理方法
电力系统台账数据是以台账数据ID为主关键字并包含设备品类、设备型号、生产厂家、技术参数、功能位置类型、缺陷表象、缺陷原因、处理措施、设备运维部门等字段。长期以来,由于台账数据、缺陷数据是两个孤立的数据孤岛,台账数据的设备品类、设备型号等字段信息无法与缺陷数据进行一一映射,致使数据质量普遍存在于台账数据与其他业务数据的对接中。应用台账数据图谱的治理方法可以解决两个数据孤岛引起的海量对象映射困难的数据质量问题。
同一功能位置类型下所关联的设备型号、生产厂家、技术参数获知潜在互为备品的信息和台账数据质量情况,是指同一功能位置类型下台账数据代表的设备应能发挥相同的作用,如果出现多条不同的台账数据,通过相同字段的不同台账数据进行比较,若无数据质量问题,则多条不同的台账数据代表的设备可互为备品;若有数据质量问题,则可快速定位错误字段。同一品类、型号所关联的功能位置类型对应台账数据的缺陷表象和缺陷原因字段均为设备家族缺陷[6],对应的处理措施为预控设备家族缺陷发展的检修方法。
3 实例分析
以下对某电力公司的台账数据进行实例分析。结合图1流程,本文技术方法由以下步骤实现:
图1 图谱分析程序流程Figure 1 Map analysis program flow
(1)如表1所示形成包含所有台账数据字段的二维表B0。
表1 包含所有台账数据字段的二维表B0Table 1 A two-dimensional table B0 containing all the account data fields
续表
(2)在台账数据字段中通过搜索条件(“功能位置类型=厂用变”&&“电压等级=10kV”&&“额定容量=50MVA”&&“型式=干式”)索引获得由功能位置类型、设备型号、生产厂家、技术参数字段组成表2所示的二维表B1。
表2 二维表B1Table 2 Two-dimensional table B1
根据二维表B1形成台账数据图谱T1由以下步骤获得:
1)获取二维表B1的行数M和列数N,M=4,N=5。
2)按列取唯一值,即同一列中相同的数据合并为一个数据。
3)按列取唯一值后,获取1~N列唯一值的个数O=11。
4)按1至11对各唯一值进行编号,并将编号回写到二维表B中形成新二维表BB,BB为4×5的矩阵,
5)设邻接矩阵TT是11×11的全零的稀疏矩阵。
6)设i=1。
7)设j=1。
8)TT(BB(i,j),BB(i,j+1))赋值为 1。
9)j的值加1,若j的值不大于N-1则转至执行第8)步,否则转至执行第10)步。
10)i的值加1,若i的值不大于M则转至执行第7)步,否则转至执行第11)步。
11)获得二维表B1的邻接矩阵TT,矩阵TT为稀疏矩阵,以下各元素为数值为1的元素:TT(1,5)、TT(2,5)、TT(3,5)、TT(4,5)、TT(5,6)、TT(5,7)、TT(7,8)、TT(7,9)、TT(6,10)、TT(7,10)、TT(8,11)、TT(9,11)、TT(10,11)。
12)设i=1。
13)设j=1。
14)若TT(i,j)不等于1,则第i点向第j点画一条线,并按二维表BB将节点编号转为原台账数据,否则转至执行第15)步。
15)j的值加1,若j的值不大于N则转至执行第13)步,否则转至执行第16)步。
16)i的值加1,若i的值不大于N则转至执行第13)步,否则转至执行第17)步。
17)获得二维表B1的台账数据图谱T1。
图2 台账数据图谱T1Figure 2 Account data map T1
(3)根据台账数据图谱T1中同一功能位置类型下所关联的设备型号、厂家信息、技术参数获知潜在互为备品的信息和台账数据质量情况,对于有数据质量问题的台账数据进行纠正。
通过台账数据图谱T1不难发现同一功能位置类型厂用变,针对所关联的设备型号,可以推测SCB 10-400/10型号名称其正确写法应该是SCB10-400/10,针对厂家信息,可以推断海南金盘、海南金盘电气有限公司应该为同一生产厂家,其准确名称为海南金盘电气有限公司,同样,还可以根据分析情况,空缺的信息为海南金盘电气有限公司,进而对数据质量问题的台账数据进行纠正。同时,可以看到是同一功能位置类型下4条台账数据代表的设备具有相同的技术参数,应能发挥相同的作用,则4条不同的台账数据代表的设备可互为备品。
(4)根据指定范围形成由设备品类、设备型号、功能位置、缺陷表象、缺陷原因、处理措施字段组成表3所示的二维表B2。
表3 二维表B2Table 3 Two-dimensional table B2
根据二维表B2形成台账数据图谱T2由以下步骤获得:
1)获取二维表B2的行数M和列数N,M=4,N=6。
2)按列取唯一值,即同一列中相同的数据合并为一个数据。
3)按列取唯一值后,获取1~N列唯一值的个数O=12。
4)按1至12对各唯一值进行编号,并将编号回写到二维表B中形成新二维表BB,BB为4×6的矩阵,
5)设邻接矩阵TT是12×12的全零的稀疏矩阵。
6)设i=1。
7)设j=1。
8)TT(BB(i,j),BB(i,j+1))赋值为 1。
9)j的值加1,若j的值不大于N-1则转至执行第8)步,否则转至执行第10)步。
10)i的值加1,若i的值不大于M则转至执行第7)步,否则转至执行第11)步。
11)获得二维表B2的邻接矩阵TT,矩阵TT为稀疏矩阵,以下各元素为数值为 1的元素:TT(1,2)、TT(2,3)、TT(2,4)、TT(2,5)、TT(2,6)、TT(5,7)、TT(3,8)、TT(6,9)、TT(4,10)、TT(7,11)、TT(8,11)、TT(9,11)、TT(10,11)、TT(11,12)。
12)设i=1。
13)设j=1。
14)若TT(i,j)不等于1,则第i点向第j点画一条线,否则转至执行第15)步。
15)j的值加1,若j的值不大于N则转至执行第13)步,否则转至执行第17)步。
16)i的值加1,若i的值不大于N则转至执行第13)步,否则转至执行第17)步。
17)获得二维表B2的台账数据图谱T2。
图3 台账数据图谱T2Figure 3 Account data map T2
(5)根据台账数据图谱T2中,同一品类、型号所关联的功能位置类型、缺陷表象、缺陷原因、处理措施字段获知该设备家族缺陷是接头绝缘不合格,根据处理措施字段形成有针对性的预控措施,为加强红外巡检观察的频次,下次检修时更换接头。
4 结束语
本文提供了根据台账数据字段的关联关系形成二维表,再把二维表转化为邻接矩阵,接着通过邻接矩阵生成台账数据图谱的标准化实现方法,使得快速生成台账数据图谱实现自动生成。本文结合工程经验,全面考虑台账数据的特性,提供了通过相同字段的不同台账数据进行横向比较,为获知数据质量信息和可互为备品信息提供了有效技术手段。通过图谱中同一品类、型号所关联的功能位置类型、缺陷表象、缺陷原因、处理措施字段,获知设备家族缺陷,并根据处理措施字段形成有针对性的预控设备家族缺陷发展的检修方法。