配网设备局部放电边缘侧精简特征提取与短报文传输技术研究
2024-02-26刘弘景刘宏亮刘可文
何 楠, 刘弘景, 刘宏亮, 刘可文, 任 明
(1.国网北京市电力公司电力科学研究院, 北京 100075; 2.电工材料电气绝缘全国重点实验室, 西安交通大学, 陕西 西安 710049)
1 引言
电力设备是构成电网组成的重要部分,针对电力设备绝缘状态监测是保障电网安全运行的有力方法[1]。局部放电(Partial Discharge, PD)是指发生在电力设备绝缘介质局部区域中的放电现象,体现了绝缘老化程度,因此电力设备内部潜伏性缺陷和故障可通过对局部放电的监测来发现[2-4]。
近年来,随着电力市场和电力系统的飞速发展,电力设备的数量也随之快速增加[5,6],新的问题也随之出现。设备数量的大量增加带来相应的监测节点的大量增加,从而带来海量的监测数据。监测系统的传输与存储所面对的压力日益增长,系统运行的稳定性和时效性无法保障;同时系统服务器面对的计算量也快速增加,计算中心难以承受高负荷计算压力,很容易导致监测系统崩溃。在这些问题面前,中心化集中化的传统监测系统已无法满足智能化监测的需求,市场亟需一种更加智能化的监测系统,以满足多节点、低延时、高效率的要求。
随着微机电系统(Micro Electro Mechanical System, MEMS)、边缘计算(Edge Computing, EC)以及物联网(Internet of Thing, IoT)等技术的成熟,分布式感知网络(Wireless Sensor Network, WSN)凭借其良好的可扩展性、可访问性以及灵活性,已逐渐取代传统的监测模式[7-9]。BURUNKAYA等人[10]设计了一种用于配网边缘电能分配监测的智能传感网络,通过紫峰协议网络组网并与管理中心实现了动态联机;BAIDYA等人[11]提出了一种智能电网生态系统,通过融合区块链和IoT等技术以实现分布式监测;LI等人[12]将窄带物联网(Narrow-Band IoT, NB-IoT)应用于WSN,并通过蒙特卡洛模拟评估了该网络在典型场景下的性能。国内方面,任明等人[13]提出了一种基于IoT技术的WSN,并成功应用于配电开关柜、电缆等配网设备;苑佳楠等人[14]分析了WSN的应用场景和应用模式,并基于其大规模组网和拓扑灵活的特点设计了一套路由系统。但与此同时,现有研究仅仅是实现了通信层面的互联,未能明确信息应用层面的协同交互。此外,虽然已有电力物联网和边缘计算等相关标准,但关于局部放电等复杂监测量的特征提取、优选等问题,目前相关研究内容仍较少。为了实现面向未来的分布式感知和群智感知,还需要突破边缘侧和传输侧的关键问题,即在边缘侧实现精简化特征提取,在传输侧实现轻量化传输。
综上,本文基于无线传感网络架构提出了一种边缘侧特征提取和短报文传输方案。以配网中接入量大、分布广的开关柜设备为例,基于典型局部放电数据和变异数分析方法选取了8维度的精简特征集,最后在识别准确率、传输密度、节点功耗以及运算量共四个方面评估了该分布式感知网络的监测效能,对于泛在电力物联网的建设及应用提供了一定的技术参考。
2 基于WSN的状态物联监测系统设计方案
2.1 通用架构
无线传感网络是一种分布式传感网络,它的边缘侧布置有大量的传感节点,可以及时准确地获取电力设备的运行工况[15,16]。WSN中的传感器多是采用无线通信的方式,因此具有良好的可扩展性、可访问性以及灵活性。图1为WSN的通用架构,包括感知层、网络层、数据层以及应用层。
图1 无线传感网络系统架构Fig.1 Framework of wireless sensor network system
(1)感知层是由大量的分布式传感节点连接而成,是实现配网设备状态监测的基础。随着泛在电力物联网的快速发展,传感节点的采集功能已不能满足物联状态感知的需求。得益于MEMS、EC等技术的成熟,智能传感已成为现实。智能传感的内部主要由传感单元、信号处理单元、ADC(模数转换单元)和MCU(微处理器单元)等组成,可以实现信号采集、特征提取、阈值诊断等多种功能。
(2)网络层是由低功耗广域网网关单元所组成,其主要功能是连接感知层与数据层,提供上/下行数据链路。在上行链路中,感知层获取的信号数据、特征量和诊断结果会被层层上传,交由应用层做最终决策;在下行链路中,应用层在获取底层数据后,将相关决策指令层层下放,以此优化感知层的工作模式。
(3)数据层是由汇控终端或智能网关所组成,用于边缘数据存储、管理和访问。终端多布局在网络边缘侧,主要负责汇总智能传感数据、开展轻量化分类工作以及加工处理部分非智能传感数据,多个终端之间还可以进行数据交互以实现横向信息链路传播。另外,为了响应标准协议启动的数据访问,数据层还提供有大量的映射接口。
(4)应用层是由操作环境、集成框架、组件库以及应用程序等部分组成,运维人员可通过该层实现高级数据访问和命令下达,以此实现对整个监测系统的控制。
2.2 通信方案及报文机制设定
针对WSN的现场应用,需综合考虑数据速率、时延、移动性以及覆盖范围等指标,以实现分布式监测的精准控制。鉴于配网设备数量众多、分布区域广,系统的通信方案多采用低功耗广域网技术(Low-Power Wide-Area Network, LPWAN),包括有增强机器类通信技术(enhanced Machine-Type Communication, eMTC)、NB-IoT通信技术、远距离无线电技术(Long range Radio, LoRa)、Sigfox[17,18]等,各类通信技术的性能对比见表1。对比之下,LoRa通信技术通信距离远、硬件成本低,符合配网设备分布式状态监测的大部分要求,因此本文采用LoRa作为主要通信技术。
表1 LPWAN通信技术对比Tab.1 Comparison of LPWAN communication technology
在此基础上,本文采用了短报文机制以弥补LoRa传输速率较低的问题。所谓短报文机制,即通过限制单次报文长度的方式以提升传输效率,其本身具有抗干扰能力强、时延性小以及可靠性高等优点[19,20]。在处理大规模数据时,短报文机制还会匹配拆包、组包的方式,对应的流程图如图2所示。简单来说,拆包是发送端将数据拆解并增加包头说明以降低报文长度;组包是接收端拆除包头恢复数据内容。另外,若接收端在设定的有限时间内未能接收到全部子包,不能完成组包的操作,则被称为丢包。为了规避丢包风险,本文设定了补包机制,如果接收端没有在指定时间内检索到所有子包,则向发送端请求重发丢失的子包。如果依然获取失败,则重复发送请求k次(经验值k=3)。如果仍然不成功,接收端将放弃当前的任务,开始执行下一个收集任务。上述操作和超时放弃机制确保了数据传输的可靠性和及时性。
图2 拆包和组包流程图Fig.2 Flow chart of message split and combination
在参考了Q/GDW 376.1-2009标准和北斗短报文机制后,本文设定的单个子包长度不超过74字节。同时为了避免通信传输中不确定性导致的丢包、乱序等问题,本文在每个数据包前增加了4字节包头信息,用于对子包内容进行标识。其中,Task(任务号)占1字节,接收端通过识别Task确认报文所属任务以判断是否执行组包操作;Num(子包总数)占1字节,接收端基于Num确定组包次数;No(子包序列)占1字节,接收端通过该序列确认子包排序并定位出丢失的子包;Length(数据包长度)占1字节,表示报文中数据包长度,帮助接收端对数据进行重组。最终的短报文格式见表2,其中#TXZL表示通信指令,通过匹配发送端地址和接收端地址以完成数据的点对点通信。
表2 封装后的短报文格式Tab.2 Format of short message after encapsulation
3 局部放电精简特征集提取
3.1 局部放电模拟实验
为了模拟局部放电以获取不同缺陷下放电信号特征,本文搭建了一套开关柜局部放电模拟实验平台。实验平台由高压回路、模拟开关柜、局部放电缺陷模拟以及信号测量系统组成,如图3(a)所示。
图3 局部放电模拟实验Fig.3 Partial discharge simulation experiment
高压回路使用380 V/100 kV试验变压器作为高压电压,使用分压比为1∶2 000的阻容式分压器测量输出电压,回路选用电容值9.96 nF、耐压100 kV的标准高压脉冲电容器。模拟缺陷包含尖端放电、沿面放电、气隙放电和悬浮放电,如图3(b)所示。电极材料均为黄铜,除平面外的转折边缘均经过倒圆处理以减小电极结构对电场分布的影响。
信号测量系统包括地电波(Transient Earth Voltage, TEV)传感器、数字采集卡以及示波器。TEV传感器主要由模拟电路和数字电路两部分组成,其结构框图如图3(c)所示,可以实现降频检波、特征提取以及无线通信等功能。TEV传感器的工作带宽为27 MHz,中心频率在13 MHz,带宽内信号增益为40 dB。采集卡的采集频率为80 Ms/s,检测带宽为16 kHz~20 MHz。示波器的检测带宽为0~600 MHz,最大采集率为10 Gs/s。鉴于TEV信号是通过柜体屏蔽不连续处传递到外表面,测量时TEV传感器布置在柜门缝隙处附近并与缺陷电极保持在同一高度水平。
3.2 局部放电数据分析
在开关柜局部放电模拟实验平台基础上,本文以四种典型放电缺陷模型为试品,进行了电压梯度升高的局部放电实验。由于实验中四种典型缺陷的局部放电起始放电电压(Partial Discharge Inception Voltage, PDIV)各不相同,为确定实验电压梯度,本文在加压前通过预试验确定了每种缺陷的PDIV。同时,由于四种缺陷电极的击穿电压均高于柜体起晕电压(18 kV),因此在加压过程中外施电压需介于PDIV和柜体起晕电压之间,最后得到四类放电缺陷的局部放电相位分布(Phase Resolved Partial Discharge, PRPD)谱图。
以尖端放电为例,实测模型PDIV为9.6 kV,故本文从11.6 kV开始加压,按照11.6 kV、12 kV、12.8 kV、13.4 kV、14 kV、14.8 kV、15 kV、15.4 kV、15.6 kV、16 kV、16.4 kV、17 kV、17.2 kV的梯度施加电压,共测量了13组数据。放电脉冲的PRPD谱图直观地展示了脉冲点分布和放电剧烈程度。为展示升压过程中PRPD谱图变化的规律性,本文选择了其中6组电压下的谱图进行展示,如图4所示。
图4 尖端放电TEV测量信号的PRPD谱图Fig.4 PRPD patterns of TEV signal in point discharge
不难发现,在施加电压刚超过PDIV时,放电脉冲幅值在0.1 V以下。可以看出,尽管电压大小不同,但是脉冲都集中发生在正半周的90°附近且对称分布,幅值随电压增加而增加;而负半周只有少量脉冲分布在240°附近,随电压增加幅值没有明显变化。比较不同电压下的图谱可以看出,随着电压升高,脉冲分布的区域渐渐变宽,在30°~150°范围内形似“正态分布”,且电压越高,分布的相位角度越宽;而在240°~270°范围内随电压升高变化不大,呈现较平坦的分布状态。
同理对其他三类典型缺陷的PRPD谱图做分析,如图5所示,可以发现PRPD谱图能够较好地区分局部放电类型,但是这种传统的放电模式识别方法需要利用大量的原始数据做支撑,无疑增加了系统的数据传输压力和中心负荷压力。局部放电的模式构造和特征提取是进行放电模式识别的前提,因此需要在现有研究的基础上对大量的放电数据进行关联性分析并找出其中的统计特性。
图5 16 kV下四种缺陷的PRPD谱图Fig.5 PRPD patterns of four defects at 16 kV
3.3 局部放电特征提取及精简
为了尽可能地从局部放电的PRPD谱图和脉冲时序中提取出表征其放电类型特点的信息,本文通过整合现有研究中的典型特征参量,构建了局部放电原始特征集合见表3[21-24]。该特征集中前15个特征为相基特征,后6个特征为时序特征,通过对单组数据的PRPD谱图和时序数据进行计算后,可以获得一个21维的原始特征集。
表3 开关柜局部放电原始特征集Tab.3 Original feature set of partial discharge in switchgear
本文设定的短报文机制中数据包的长度为70字节,考虑到特征数据类型为单精度浮点型(float型),每类特征都需要占用4字节,即21类特征无法一次性通过短报文形式传输,所以需要在原始特征集合上做进一步的数据精简。在实际的分类应用中,原始特征集中可能存在对放电类型辨识度较低的特征,或者对噪声信号较敏感的特征以及相互之间相关性较高的冗余特征。为了提升特征对放电类型的辨识度、降低噪声干扰以及提高数据传输效率,本文采用了变异数分析方法(ANalysis Of VAriance, ANOVA)以优选特征。在分类问题中,ANOVA可以量化每类特征与局部放电类型之间的相关性,若某类特征的方差明显大于其他特征,表明该特征能够较好地区分不同类别数据,即更适合实现对放电类型的分类[25]。
为了排除不同特征的量纲和数量级差异,本文预先对原始特征数据进行了归一化处理。在此基础上,通过ANOVA方法计算出的21类特征方差结果见表4。可以看出,对应方差值最大的特征是互相关系数,其次是脉冲幅值方差,此外相位中值、脉冲时延方差和局部峰个数等也是离散度较大的特征量。鉴于21类特征的方差值均值为0.072 1,本文选取了方差大于均值的8类特征量以构建精简特征集,依次是Aavr+、μ+、μ-、P+、P-、cor、Sa以及St。在此情况下,精简特征集共占用32个字节,远远小于数据包中70个字节限制,符合短报文机制的要求。
表4 原始特征集方差表Tab.4 Variance table of the original feature set
4 基于精简数据集的效能分析
4.1 识别准确率
在泛在电力物联网背景下,系统对于数据传输速度和处理效率要求愈发严格,这就使得边缘侧局部放电特征提取和网关侧模式识别需要更加轻量化以完成实时放电类型识别和故障诊断。在此前提下,在尽可能精简特征量的同时,分类器的选取也不能过于复杂。因此,本文选取了有监督学习分类器中结构较为简单的决策树、支持向量机(Support Vector Machine, SVM)、K近邻算法(K-Nearest Neighbor, KNN)、贝叶斯网络以及集成分类器共五组分类器[26-28]。同时,为了对比原始特征集和精简特征集的识别准确率,本文中训练对象主要为四种放电模型下两类特征集合,每种放电模型下两个集合均为130组,模型评估方法采用交叉验证法,验证折数为5折,得到的训练结果如图6所示。
图6 原始特征集与精简特征集放电类型识别准确率Fig.6 Discharge type recognition accuracy of original feature set and simplified feature set
为了直观展示模型训练结果,在每组分类器中选取了准确度最高的两种进行展示。决策树分类器中精细树与粗略树表现最优,准确率分别为85%和87%,且精简特征集的表现优于原始特征集。SVM分类器中选用了线性核、二次核、三次核以及高斯核四种模型,其中三次SVM与高斯SVM表现最优,对应准确率分别为75%和69%,精简特征集识别率虽优于原始特征集,但未达到实际应用标准。在KNN分类器中,本文根据距离度量方式和邻点数量选取了五种分类器,分别是精细KNN、中等KNN、余弦KNN、三次KNN以及加权KNN,其中精细KNN与余弦KNN的表现最好,精简特征集识别率均高达95%,满足实际应用需求。贝叶斯分类器受限于特征之间的相关性,对放电类型的识别准确率较低,分别为79%和70%,没有实际应用可靠性。集成分类器中提升树和袋装树的识别准确率不足70%,对放电类型分类问题的分类效果很差,作为实际应用的轻量化识别方法可信度较低。
总体来看,精简特征集的放电类型识别准确率优于原始特征集,在五组分类器中KNN识别准确率最高,最适合作为轻量化模式识别方法应用于电力监测系统的边缘计算中。
4.2 传输密度
边缘节点的传输密度受到传感器的采样率、模数转换过程的转换精度以及采样时长三个因素影响,对应边缘侧不同数据处理模式下的数据传输密度见表5。
表5 不同数据处理模式下的数据传输密度Tab.5 Data transmission density under different data processing modes
以实验室内TEV信号采集为例,常用的采样率为20 MHz,在ARM芯片提供的12位模数转换精度条件下,采集1 s的TEV数据对应的数据量大小约为40 MB。同时,参考现有电力系统动作保护标准,数据传输时间不应超过5 ms,对应的传输速率不应低于8 000 Mbps,这远远超出了LoRa的最高传输速率(50 Kbps)。
当采用降频检波方式后,TEV传感器可以在1 MHz的采样率下进行数据采样,在相同的12位模数转换精度条件下,采集1 s的TEV数据对应的数据量大小约为2 MB,5 ms传输时间限制内对应的传输速率应大于40 Mbps,虽极大地降低了数据传输速率限制,但仍超出了LoRa的最高传输速率。
在应用边缘侧特征提取方式后,相同条件下原始特征集的传输速率为16.4 Kbps,而精简特征集的传输速率仅为6.25 Kbps,现有LoRa传输速率均能满足两类特征集传输,即采用精简特征集后系统的传输密度远远优于传统的数据传输模式。同时,在精简特征集的处理方式下,放电类型信息的数据量大小几乎等同于状态信息的大小,因而可以同时间地将传感节点编号等状态信息一同上传,且不会造成过高的传输延迟。
4.3 节点功耗
WSN架构中传感节点基本采用无线传输模式,在此模式下节点组网和拓扑转换更加自由,但带来的短板是传感节点运行的能源完全依赖电池供电,而频繁地更换电池会增加运维成本,所以传感节点的功耗控制也是物联网监测架构中的关键环节。以本文的TEV传感器为例,其运行功耗较大的单元包括有信号处理单元、中央控制单元以及通信单元,对应的功耗占比如图7所示。
图7 传感节点不同单元的功耗占比Fig.7 Power consumption ratio of different units of a sensor node
可以发现,由于传感器需要时刻收发信号,所以通信单元的功耗占比最高,这肯定是不利于传感节点的长期运行。鉴于TEV类信号幅值是会随着放电发展呈趋势变化,不会在短时间内发生突变,针对该类信号并不需要实时监测,所以本文采用定期监测的方式以降低传感功耗。在此基础上,设定传感节点工作周期为1 min启动一次监测,以上传1 s波形数据为例,完整波形数据大小在2 MB左右,精简数据集的大小在32 Byte。经过实测发现,传输完整波形的方式下TEV传感器每日功耗为18.6 mA·h,而传输精简特征集的方式下传感器每日功耗仅为1.31 mA·h。以常规型号18650锂电池为例,其容量为2 000 mA·h,理想条件下两种传输方式的理论工作时间分别是107天和1 526天。从节点功耗和续航时间结果可以看出采用精简特征集的数据处理方法对采集的放电数据进行上传,续航时间为采用波形数据上传的十倍以上,即采用该方法进行边缘侧数据处理能够获得较好的优化效果。
4.4 运算量
边缘侧进行精简特征集提取会消耗芯片算力,这部分运算量的复杂程度将会影响传感节点对放电数据的响应时间,进而影响整个物联网监测系统的响应速度。本文通过时间复杂度对精简特征集的运算量进行了量化分析。以ARM架构的STM32F103芯片为例,1 MHz采样率下采集1 s数据对应的精简特征集运算量见表6。
表6 精简特征集运算量Tab.6 Computation burden of simplified characteristic set
可以发现,除互相关系数提取算法的时间复杂度为二次外,其余特征提取算法的时间复杂度均为线性。按照上述数据进行估算,单次放电数据采集中精简特征集的总耗时为64.7 ms,在可预支的信号采集和处理时间为5 s的范围内,精简特征集提取的耗时非常小,可以认为该部分运算基本不会影响边缘节点的响应时间。
除了衡量精简特征集在边缘侧运算时间外,其对网关侧的模型训练识别时间也应当考虑。本文选取了4.1节中16种分类器模型,对应的训练时间结果如图8所示。其中,分类器序号从1~16分别对应精细树、中等树、粗略树、高斯贝叶斯、核贝叶斯、线性SVM、二次SVM、三次SVM、高斯SVM、精细KNN、中等KNN、余弦KNN、三次KNN、加权KNN、提升树以及袋装树。可以发现,精简特征集对比原始特征集的模型训练时间普遍更短,且分类器中决策树和K近邻的训练时间最短,训练时间均不超过0.5 s,符合实际应用要求。
图8 对应不同特征集的所有分类器训练时间Fig.8 Training times of all classifiers corresponding to different feature sets
5 结论
针对配网设备局部放电在线监测,本文基于WSN架构提出了一种边缘侧特征提取和短报文传输方案,基于典型局部放电数据和ANOVA算法选取了8维度的精简特征集,最后依次从识别准确率、传输密度、节点功耗以及运算量共四个方面评估了基于精简数据集的局部放电监测效能,主要结论如下:
(1)本文选取了LoRa作为WSN主要传输手段,并构建了一种子包长度不超过74字节的短报文机制,通过拆包、组包的方式极大地提升了数据传输效率。
(2)本文挖掘了PRPD类谱图与放电类型关联性,通过ANOVA算法量化了21类特征的相关性和正交性,并在此基础上构建了一个8维精简特征集以取代原始数据上传模式,在保证准确率的同时提升了边缘侧算力利用率和传输效率。
(3)基于精简数据集的传输方式在模型准确性、传输密度、运行功耗、运算量、模型训练时长等多个方面都优于原始数据集,为推动泛在电力物联网的建设及应用提供了一种经济可行的方案。