APP下载

基于多元大数据融合的智能电能表可靠性评估模型

2023-01-18张家琦郭帅李国昌陈颖宋玮琼关慧哲

电测与仪表 2023年1期
关键词:失效率电能表元器件

张家琦,郭帅,李国昌,陈颖,宋玮琼,关慧哲

(1.清华大学 电机工程与应用电子技术系,北京 100084; 2.国网北京市电力公司,北京 100031)

0 引 言

智能电能表是重要的法制计量器具,是实现电力贸易结算的必要设备,其运行可靠性对保证用户合法权益、电网公司经济利润等方面有重大影响[1-3]。传统上,电网公司通常采用现场巡检、远程异常筛查、异常主动上报等方式开展智能电能表运行状态评价,并依据评价结果开展相应的更换、修校等工作。但是,这种传统运维模式对于人力物力要求较高,且工作周期较长,在保证智能电能表高可靠性的前提下需投入占用较多资源,且存在潜在的资产浪费风险[4-5]。近年来,随着配电网中海量智能电能表的接入,形成了智能电能表大数据,其中包含着丰富的设备结构、检修和运行状态等信息。因此,基于大数据技术建立智能电能表可靠性评估模型,对运行中智能电能表的可靠性进行合理评估,对于增加智能电能表运维效率,保障现场运行水平,提升公司精益化管理水平有重要意义[6-7]。

目前,建立面向合理评估智能电能表可靠性的数学模型主要采用以下三种方法。首先,通过元器件应力法建立失效率模型,可以有效地对智能电能表基于硬件结构和功能设计的故障或异常情况进行模拟,并基于元器件手册计算得到MTTF(Mean Time To Failure: 平均失效前时间),用以表征智能电能表的寿命估计值,可作为智能电能表可靠性评估的重要参数[8-11];其次,基于事先假定的一种智能电能表失效率分布如威尔逊分布等,根据智能电能表的故障数据对参数进行最小二乘法拟合,从而得到智能电能表的可靠性评估模型[12];此外,结合事先假定的智能电能表失效率分布和多应力Peck模型,对智能电能表进行加速寿命试验,从而对智能电能表的可靠性进行评估[13-15]。但是,目前的研究大都存在智能电能表功能拓扑高度简化、所形成的寿命模型参数较为静态的问题,无法反映或适应智能电能表物理模型和运行环境条件变化的影响[16-17]。而加速寿命试验较为复杂,且随着智能电能表可靠性水平逐渐提高,试验中所需要的失效样本数据获得成本较大。

智能电能表多源大数据中包含着运行状态的相关信息,通过对其进行融合大数据分析和建模,可以有效地鉴定智能电能表的健康状态,从而为电网公司实现相关资产管理工作的精益、高效提供合理建议。目前智能电能表多源数据由两类构成。一是故障智能电能表的检修数据,以下简称检修数据,该类数据记录了已经发生故障并拆回检修的智能电能表的物理信息、故障类型和运行寿命;二是智能电能表的异常报警历史记录,以下简称异常数据,该类数据由用电信息采集系统进行采集和记录,可以反映该电能表的运行健康水平[18-19]。因此,通过对检修数据和异常数据的融合分析,可以有效建立智能电能表可靠性评估模型。

为解决现有可靠性评估方法的缺点,针对智能电能表可靠性进行合理评估,提出了基于多源数据融合的智能电能表可靠性评估建模方法。对智能电能表多源大数据融合整理后,采用生存分析理论对其进行建模,将其作为影响智能电能表可靠性的协变量刻画智能电能表的生存函数。同时,采用深度神经网络学习生存函数参数,得到了智能电能表在协变量影响下的生存函数模型,并通过算例分析与经典的元器件应力法等传统方法的评估结果进行了对比,验证了模型的合理性和可行性。

1 智能电能表可靠性评估

1.1 智能电能表可靠性定义

将规定时间和安装条件下智能电能表成功执行标准中规定功能的能力称为其可靠性。文中将一般的智能电能表失效的情况等同于智能电能表发生了故障。

对于智能电能表的可靠性进行定量评估,一般采用的指标有可靠度R(t)、失效率λ(t)和平均故障前时间MTTF等。假设某个产品服从某种概率分布F(t),在一个不可预测的随机时间点失效,如式(1)所示:

F(t)=P(T≤t),t∈R+

(1)

该分布具有概率密度函数f(t)。则可定义以下概念:

(1)可靠度R(t):规定时间和安装条件下智能电能表成功执行标准中规定功能的概率,如式(2)所示:

R(t)=Pr(T>t)=1-F(t)

(2)

式中T为智能电能表失效前的工作时间;t为所给定的时间。

(2)失效率λ(t):表示运行到某时刻未发生故障的智能电能表之后单位时间内发生故障的概率,如式(3)所示:

λ(t)=f(t)/R(t)

(3)

由于目前电网公司一般采用对达到使用期或发生故障的智能电能表进行整机更换的策略,因此将智能电能表视为不修产品,采用MTTF对其可靠性进行描述。

1.2 智能电能表可靠性评估方法

预先假设智能电能表失效率分布进行直接拟合或是加速寿命试验,可得到智能电能表的失效率λ(t),进而得到可靠度R(t)。但是,直接利用故障数据拟合假设分布,得到的是静态模型,无法反映随着环境应力作用带来的设备性能退化、可靠性下降等问题。采用加速寿命试验得到的可靠性指标考虑了环境应力因子的影响,但是该方法依赖于在不同应力条件下智能电能表运行试验得到的失效数据,过程复杂,执行难度较大。

智能电能表多源大数据中包含检修数据和异常数据。前者记录了智能电能表失效后,即发生故障后的寿命时间和故障信息;后者则包含了运行中智能电能表健康水平与异常状态的相关性信息。由两者融合分析即可建立智能电能表运行状态与多种数据之间的关联关系,从而打破传统工作模式对智能电能表运行状态进行评估的天然限制。

将智能电能表的检修数据和异常数据进行整理融合,即得到具有如下格式的智能电能表失效数据,如式(4)所示:

(4)

由于实际中智能电能表故障率较低,导致失效数据中包含较多的删失数据,即数据中部分智能电能表并未发生故障。由于删失数据中包含设备可靠性信息,无法剔除。包含此类删失数据的数据形式无法采用传统可靠性理论进行分析。生存分析理论作为一种研究事件发生前时间(Time-to-event)分布规律的理论,可以有效处理删失数据,从中提取有效信息。因此,采用生存分析理论对智能电能表失效数据进行建模分析,对智能电能表可靠性进行评估。

1.3 智能电能表失效数据整理与清洗

考虑对智能电能表失效数据进行整理,得到如下形式的数据向量,如式(5)所示:

(5)

为避免数据中无效样本对预测模型的影响,需要对样本进行清洗,删去异常数目较少的样本。其次,考虑到每个智能电能表不同异常发生的次数可能存在较大差异,为避免神经参数训练发散,对其每列进行归一化处理。归一化所采用的公式如下:

(6)

(7)

式中X(i)=[x1(i),x2(i),…,xN(i)]。

2 基于生存理论的智能电能表可靠性评估模型

2.1 生存分析理论基本介绍

生存分析是研究生存时间的分布规律以及生存时间和相关因素之间关系的一种统计分析方法,广泛应用于病患寿命分析和机器设备的故障-时间分析等领域。生存分析中很多基本概念如生存函数、风险函数等与可靠性理论中的可靠度、失效率等基本概念相对应,下面结合智能电能表应用场景对所应用的基本术语进行介绍:

(1)事件:指智能电能表发生故障后/达到规定最长使用时间后,被更换;

(2)生存时间:指智能电能表从被安装时刻到被确定发生故障/因达到规定使用最长时间后被拆换的持续时间;

(3)删失:指智能电能表生存时间一直持续到最后观察时间节点事件仍未发生的情况,即在观察周期内智能电能表保持正产运行的情况;

(4)协变量:影响事件发生时间的变量因素,如智能电能表的异常报警次数;

(5)生存函数S(t):指个体的生存时间超过的概率,定义为S(t)=Pr(T>t);

(6)生存曲线:表征随时间变化的生存率曲线。X轴和Y轴分别表示生存时间和生存概率;

(7)风险函数λ(t):表征瞬时死亡概率,定义如下:

(8)

2.2 CoxPH模型

CoxPH模型又被称为Cox比例风险模型,该模型对风险函数所具有的形式做了如下假设,如下:

(9)

(10)

2.3 CoxPH模型的求解

模型的求解过程包含两部分:对hθ(X)和λ0(t)的求解。其中,对hθ(X)的求解较为复杂,hθ(X)求解后,即可基于Breslow估计器得到λ0(t)。因此,此处着重说明对hθ(X)的求解。

由于λ0(t)事先未定义,因此无法直接使用标准似然函数对预测模型进行拟合。CoxPH模型中定义了偏似然函数来对θ进行计算。假设精确生存时间有k个,数据集容量为n。将数据按照其生存时间排序t1

(11)

对所有死亡个体的条件概率相乘即有:

(12)

式中R(ti)为ti时刻内仍然处于观察研究的个体集合;Xi为观察协变量。通过将偏似然函数最大化,即得到θ。一般求解时可以对其求取负对数,即:

(13)

通过求取令其最小的θ,即可得到hθ(X)。随后通过Breslow估计器,可求解λ0(t),从而得到完整的CoxPH模型。

2.4 CoxPH模型的评估

生存分析理论中对CoxPH模型的评估主要依据Concordance-index,又称C-index或一致性指数。该指标衡量的是预测结果和实际观察结果相一致的概率。以智能电能表应用场景为例,将所有的研究对象(智能电能表)随机地两两组对;对于某一对智能电能表,如果生存时间较长的一位,其预测生存时间长于生存时间较短的一位,或者预测生存概率高的一位的生存时间长于生存概率较低的另一位,则称之为预测结果与实际结果相一致。C-index的取值范围是[0, 1]。

3 结合深度学习的模型求解

3.1 非线性CoxPH模型

传统的线性CoxPH模型将协变量对于研究对象的生存函数的影响建模为线性关系。即假设部分风险函数如下:

hθ(X)=θ·X

(14)

但在现实应用场景中,该线性假设过于简化数据关系的复杂程度。为了更好地拟合生存数据含有的非线性关系,现有研究工作中存在大量使用非线性对数风险函数的模型。神经网络本身具有对非线性函数较好的拟合能力,1995年,文献[3]提出了运用前馈神经网络模型(NNS)对生存数据进行拟合。但随后的研究中,NNs的测试表现并不能超过经典的线性CoxPH模型。

近些年来,随着深度学习理论的迅速发展,深度神经网络的强大表征能力为非线性关系的拟合提供了新思路。文献[1]运用结合深度神经网络的CoxPH模型对生存数据进行拟合,在多个现实数据集上测试得到优于经典线性CoxPH模型的性能。考虑到所处理应用场景数据的复杂性,为有效刻画其蕴含的协变量非线性组合关系,采用结合深度神经网络的CoxPH模型建立智能电能表的可靠性评估模型。

3.2 模型的训练算法步骤

对含有深度神经网络的模型进行训练。参数设置如下:神经网络输入层节点数I=21,隐含层共两层,节点数分别为H=10和H=5,输出层节点数为O=1,神经网络迭代次数T=4500。此处采用C-index作为所建立的智能电能表可靠性评估模型准确性的指示值。具体的训练算法流程如图1所示。

4 智能电能表可靠性评估实例

基于某城市实际智能电能表运维数据,对以上所提出的智能电能表可靠性评估模型进行了有效性验证。实验中的训练样本共包含49 640块智能电能表的检修数据和异常数据,将数据集按照4:1的比例划分为训练集Dtrain和测试集Dtest,其中异常种类数目N=21。

实验的硬件平台:操作系统为Windows 8.1,CPU为酷睿单核i5-5200U,2.20 GHz,代码实现基于Python的Lifelines库包以及TFDeepSurv库包。输入图1所示训练模型进行训练。

图1 模型训练流程图

4.1 训练结果

训练过程中损失函数的变化趋势如图2所示。在Dtrain上测试得到的一致性指数约为0.682,在Dtest上得到的一致性指数约为0.683。

图2 训练过程中损失函数的变化

为表示所得到的可靠性评估模型在不同协变量取值下得到的生存曲线,取协变量向量X(1),X(2),X(3),考察任意一种异常对应的协变量的影响,如异常5,满足式(15)所示的约束:

(15)

图3 不同协变量取值的生存曲线示例

4.2 训练结果对比与分析

为了比较不同预测方法的优劣,基于同一批智能电能表的相关数据,分别采用元器件应力法计算其故障前平均寿命(MTTF)、先验假定可靠性曲线分布函数进行参数拟合两种方法对智能电能表可靠性进行评估,并与建立的评估模型进行比较。

采用元器件应力法对智能电能表可靠性进行评估,需要得到智能电能表元器件清单。一般将智能电能表考虑为简单的串联失效模型,即:

(16)

式中λs为系统失效率(1/h),λi为第1~N个元器件的失效率(1/h)。针对某型号的智能电能表,通过分析智能电能表主板的元器件清单,选用 GJB/Z 299C-2006 电子设备预计手册,推算出智能电能表的系统失效为λs=7.881 672(10-6/h),则智能电能表的平均故障前时间MTTF=1/λs=14.48年。

假设智能电能表时间-故障率关系服从威布尔分布,基于已有智能电能表数据,采用最大似然估计法得到智能电能表的可靠性曲线如图4所示。

图4 基于威布尔分布拟合得到的生存函数

以上三种办法,从三种不同角度出发对智能电能表可靠性进行了有效评估,各自具有不同的优劣判断标准,无法统一用准确率、C-index等概念进行衡量。因此,分别从模型泛化能力和结果可解释性两方面进行比较。

从泛化能力上比较,元器件应力法需要查找每一种类的智能电能表的元器件清单和元器件手册中对应的失效率,所得到模型随着智能电能表部件或部件组成的更换即发生变化,泛化能力较差;基于假设分布的参数拟合方法和文中所提预测方法均依赖于训练所选取的智能电能表故障数据样本,模型的泛化能力较依赖于样本质量。

从预测结果可解释性上比较,元器件应力法可以针对智能电能表内部的关键部件进行失效分析,可建立微观元器件失效和功能失效上的串联关系;但智能电能表发生故障时,常表现为某一功能模块的失效,较难定位到某个具体元器件,且得到的MTTF为一定值,对智能电能表运维工作的指导意义较为有限。而预先假设智能电能表可靠性分布,利用数据对模型参数进行拟合的办法采用经验式的假设,无法对应到智能电能表内源性或外源性的可靠性影响因子,得到的评估曲线可解释性较差;而文中所建立的考虑多个协变量影响的可靠性评估模型,可以通过分析单个协变量对生存概率曲线的影响,从而针对性地进行加强维护。

5 结束语

基于智能电能表多源大数据,通过融合分析智能电能表的检修数据和异常数据,建立了智能电能表的可靠性评估模型;采用结合了深度学习的CoxPH模型,对融合分析的多源数据进行拟合,得到了智能电能表寿命-生存概率模型。基于实际智能电能表运维数据的测试结果表明该模型能给出在不同协变量影响下的生存概率曲线,该结果能够反映智能电能表的状态信息,相比元器件应力法和预先假设电能表可靠性分布的拟合结果更具有参考价值,对智能电能表运维工作具有重要意义。

猜你喜欢

失效率电能表元器件
元器件国产化推进工作实践探索
Archimedean copula刻画的尺度比例失效率模型的极小次序统计量的随机序
巧数电能表
认识电能表
深入理解失效率和返修率∗
基于改进龙格-库塔法反舰导弹贮存寿命研究
装备元器件采购质量管理与控制探讨
基于DSP+FPGA的元器件焊接垂直度识别方法
电子式电能表技术综述
分析电子元器件的检测方法