基于SF6分解产物分类规划的GIS放电故障分析
2024-03-25肖明伟何凯琳杨沛豪
肖明伟,何凯琳,杨沛豪
(1.国网安徽省电力有限公司芜湖供电公司,安徽 芜湖 241000;2.中国能源建设集团西北电力试验研究院有限公司,西安710054;3.西安交通大学电气工程学院,西安 710049;4.西安热工研究院有限公司,西安 710054)
0 引言
六氟化硫(SF6)有优良的绝缘、散热和灭弧性能,被广泛应用于气体绝缘开关(Gas Insulated Switchgear,GIS)中。因制造过程中存在细微绝缘缺陷,GIS 运行过程中会发生放电故障,导致SF6分解为硫氟化合物,引起GIS绝缘性能降低,造成设备损坏,甚至威胁到整个电力系统的安全稳定运行[1-3]。SF6本身无毒,但SF6的部分分解产物有毒,会对环境造成危害[4]。由于GIS 的结构复杂性和放电故障类型多样等因素,设备内部缺陷一般难以识别,因此需要一种有效的放电故障预诊断方法来识别绝缘缺陷[5-7]。SF6分解产物(CF4、CO2、SOF2、SO2F2)能有效反映放电故障的严重程度和绝缘缺陷的类型,许多气体检测技术如气相色谱法、气体检测法、电化学方法和光谱方法等已应用到实际中[8-10]。由于SF6分解产物与放电故障之间关系复杂,基于SF6单个分解产物分类规划的放电故障分析方法(Decomposition Components Analysis,DCA)难以精确识别引起放电故障的绝缘缺陷类别[11-13]。
机器学习算法是以放电故障的严重程度和绝缘缺陷类别为目标,在数据场中明确不同故障类型的数值边界,对GIS 的绝缘缺陷判定及设备维护具有重要意义[14-16]。文献[17]使用自适应模糊神经推理系统,将SF6分解产物按照局部放电(Partial Discharge,PD)范围的不同进行分类,可以准确识别放电故障类型,也可表征不同的绝缘缺陷类别。文献[18]总结了CF4和CO2体积分数比、SOF2和SO2F2体积分数比、SOF2+SO2F2体积分数和三组特征参数的物理意义,适用于PD的绝缘故障类型检测。文献[19]通过测试SOF2+SO2和SO2F2体积分数比来区分电晕放电和火花放电,得到电晕放电的体积分数比一般在0~1,火花放电的体积分数比一般在1~5。机器学习算法虽然在GIS放电故障识别中可以得到故障数据边界范围,但大多数机器学习数据仅限单一故障实验结果,还缺乏基于各种环境数据的识别模型和优化算法[20]。实际放电故障中由于多种绝缘缺陷共存,缺乏识别模型,很难得出一个普遍适用于GIS的放电故障综合识别的方法。
本文以GIS 四种主要绝缘缺陷(颗粒、污染、间隙、突出)所导致的三种故障放电(电晕、火花、电弧)为对象,提出一种基于SF6分解产物分类规划的放电故障综合识别方法,可以快速诊断故障放电的原因和状态,实现GIS 放电故障的快速处理。对不同实验采集的大量放电故障数据进行分析,用两种函数对数据进行预处理,根据阿伦尼乌斯(Arrhenius)化学反应模型和数据分布特征拟合经验概率函数,使用不同机器学习算法进行比较,得到一个鲁棒、可靠的模型来描述SF6分解产物与放电故障之间的关系。通过k最近邻模型中SO2F2和SO2体积分数比来确定放电故障的严重程度。提出基于两种模型的经验概率函数,识别GIS 多种绝缘缺陷共存状态、偏置电晕放电状态和表面污染缺陷状态。
1 SF6分解过程和产物分析
SF6在PD 时的二次电离率非常小,分解产物主要是通过第一次电离得到,分解过程随着S-F 化学键的断裂而发生,断裂键数与放电能量成正比。破坏S-F键需要大量的能量,SF6的分解产物包括SF2、SF3、SF4和SF5。SF3、SF5易与游离F 原子结合,极不稳定;SF2、SF4的结构相对稳定,所以SF6的主要分解产物是SF2、SF4。由于GIS中H2O和O2的存在,SF6分解产物进一步与H2O和O2发生反应,使得分解过程更加复杂,可产生SOF2、SO2F2和SO2。在GIS气室中出现的C 原子会与元素F 和O 反应生成CF4和CO2。GIS中气体分解过程如图1和式(1)所示。
图1 SF6的分解产物Fig.1 Decomposition product of SF6
与SF2、SF3的简单反应相比,SF4、SF5反应生成特征气体SOF2、SOF4和SO2的过程更复杂,中间体较多。因特征气体的来源不同,不同方式的复杂性也不同,导致SF6的分解过程很难从分解机理上进行识别。
2 机器学习数据集
GIS的绝缘缺陷主要包括突出、颗粒、污染和间隙,这些绝缘缺陷造成的放电故障可以分为电晕放电、火花放电和电弧放电。本文以某设备厂家的GIS 故障设备为分析样本,采用红外吸收光谱法和气相色谱法对GIS设备中的SF6分解数据进行分析,选取故障发生后24~72 h内每12 h记录的数据作为样本集,共222 个样本用于训练,24 个样本用于测试。测试得出的数据采用六种机器学习算法(神经网络、支持向量机、线性回归、k最近邻、随机森林和高斯分布)进行放电故障识别。识别出的故障类型以及相应的训练数据个数和测试数据个数如表1所示。
表1 故障类型、训练数据和测试数据关系Tab.1 Relationship among fault types,training data and test data
GIS放电故障严重程度可以根据设备内部放电故障的能量等级来表示,电晕放电的能量等级较低、火花放电的能量等级中等、电弧放电的能量等级最高。根据能量等级,将电弧放电标记为3,火花放电标记为2,电晕放电标记为1。在传统DCA方法的基础上,本文将SO2F2和SO2体积分数比作为表征放电故障严重程度的有效特征。
3 建立模型
由于没有考虑多种绝缘缺陷共存的情况,传统故障识别方法无法提供准确识别模型,导致两种放电故障之间始终缺乏一个清晰的边界,容易造成结果误判。为了提高模型的预测能力,本文采用经验概率函数为故障数据赋予不同权重,根据阿伦尼乌斯(Arrhenius)化学反应和数据分布特征拟合模型,经验概率函数可表示为:
式中:φ为SO2F2和SO2体积分数比;f1(φ)、f2(φ)、f3(φ)为不同φ对应的权重。
利用经验概率函数对三次放电数据中的原始标记3、2、1进行调整,电弧放电数据对应2+f1(φ),火花放电数据对应2-f2(φ),电晕放电数据对应1+f3(φ)(φ≥0.5)或3-f3(φ)(0≤φ<0.5)。放电类型与标记值之间的对应关系如图2所示。
图2 三种放电类型和标记值之间的变化曲线Fig.2 The variation curves between three discharge types and marked values
将样本数据分为两组,利用一组数据建立放电故障的识别模型,将数据分离,形成测试数据集。另一组数据进行预处理后,通过机器学习算法得到具有较好识别能力的模型,选择k 最近邻算法建立放电故障模型,使用测试数据集进行测试。对四个绝缘缺陷进行标记,将颗粒缺陷标记为Ⅰ,污染缺陷标记为Ⅱ,间隙缺陷标记为Ⅲ,突出缺陷标记为Ⅳ。三个特征参数CF4和CO2体积分数比(记为φ1),SOF2和SO2F2体积分数比(记为φ2),SOF2+SO2F2和CF4+CO2体积分数比(记为φ3)作为典型特征参数,用于区分四种绝缘缺陷。由于GIS内部吸附剂对不同SF6分解产物的吸附率不同,使得φ2特征参数值较为分散,无法区分过热故障或绝缘缺陷引起设备放电,因此本文选取φ1和φ3作为特征参数来表征绝缘缺陷。为了使GIS绝缘缺陷数据在特征参数φ1和φ3的坐标轴上具有可比性,本文采用拉伸函数扩展不同绝缘缺陷数据点之间的陡峭边界,x和y坐标分别用式(5)和式(6)的拉伸函数表示,将特征参数数据点分布在二维平面上。
式中:VSO2、VSO2F2、VCF4、VCO2为SO2、SO2F2、CF4、CO2的体积。
当GIS 发生过热故障时,CF4和CO2释放量低于正常放电故障的释放量,导致φ3过大,不能准确表征GIS绝缘缺陷,采用特征参数lgφ3来代替φ3。为了进一步量化GIS 绝缘缺陷与特征参数之间的关系,有效识别绝缘缺陷类型,采用六种机器学习算法对数据进行样本训练,用等高线表示训练结果,用高斯分布描述绝缘缺陷类型。
结合马尔科夫链与元胞自动机建立CA-Markov模型(见图2)多情景模拟,开展城市开发模型推演研究;依据“两线合一”规划,以1:10 000为统一比例尺,建立矢量化、电子化信息共享平台,明确城市开发边界的地理坐标,整合形成“一张图”管理,提出城市、土地和环境规划数据校核技术标准,研究“两线合一”划定标准和技术指引。
4 实验验证
为了分析SF6分解产物及其浓度对GIS 放电故障和绝缘缺陷的识别性能,构建模型进行实验验证。模型主要基于Python软件(3.8.7版)进行构建,以Anaconda 软件作为发行平台,以Keras 软件为基础框架完成构建。本文用于训练的SF6分解数据来自故障的GIS和IEC TC10数据库。
图3为SO2和SO2F2的体积分数与放电故障分布关系。SF6分解数据作为训练GIS 放电故障模型的样本点,每种放电故障的采样点集中分布在特定区域内。由图3 中放电故障趋势线可知,不同放电故障趋势线斜率不同,电弧放电趋势线斜率最大,火花放电趋势线斜率较小,电晕放电趋势线斜率最小。SO2体积分数在不同放电故障趋势线附近呈现中心聚集分布,这表明分解产物SO2F2和SO2体积分数比与放电故障类型有很强的关联性,可以利用SO2F2和SO2体积分数比区分GIS放电故障类型。
图3 SO2和SO2F2体积分数与放电故障分布关系Fig.3 Distribution relationship between volume fraction of SO2 and SO2F2 and discharge faults
图4 给出了预处理调整前后采用六种机器学习算法模拟得到的GIS放电故障类型与SO2F2和SO2体积分数比关系,其中,纵坐标3.0 代表电弧放电故障,2.0 代表火花放电故障,1.0 代表电晕放电故障。由图4可知,预处理调整前,机器学习算法不能很好地模拟放电故障类型,在SO2F2和SO2体积分数比为12~14 时尤为突出,两种放电故障模拟曲线之间存在明显边界,忽略了两种放电故障共存的情况。随着放电能量的增加,放电故障将经历五种状态,即电晕放电、电晕-火花放电、火花放电、火花-电弧放电和电弧放电,此过程连续渐进,而分解产物数据对应的放电故障是离散的,两者之间的不对应导致机器学习算法结果不够理想。图4(b)中,对原始数据进行不同权重预处理后,可以很好地描述放电故障时能量变化,减少边缘区域出现样本点的概率,使图4(a)中两种放电类型重叠区域中不稳定的样本数据趋于统一。
图4 不同机器学习算法模拟放电故障类型与SO2和SO2F2体积分数比关系Fig.4 Relationship between discharge fault types simulated by different machine learning algorithms and volume fraction ratio of SO2F2 and SO2
由图4可知,k最近邻算法主要依靠周围有限的样本来确定放电故障类型,而不是通过判别样本的总体类域来确定放电故障类型,具有精度高、对不同距离加权平均异常值不敏感的特点,对于划分重叠域较多的样本集具有较强的转移性,能够与经验概率模型相吻合。
通过建立合适的曲线模型来匹配数据分布和化学反应过程将有助于机器学习,同时调整经验概率函数可以得到机器再学习结果,有助于GIS 放电故障分类。由于化学反应速率通常满足Arrhenius模型,可以用式(7)表示温度T时的化学反应速率。
式中:M 为反应物的量;KB为玻尔兹曼常数;T 为绝对温度;A0为常数;t 为反应时间;ΔE 为化学反应的活化能。
由式(8)可知,反应物消耗或生成物积累与反应活化能ΔE呈指数关系。
在图4(a)中,根据Arrhenius 模型和数据特征,选择SO2F2和SO2体积分数比在4~5 急剧上升时的S形高斯过程作为电晕放电的经验概率函数f2(φ)。对于火花放电,由归一化原理推导出经验概率函数,通过k 最近邻算法训练,得到放电故障模拟测试结果。图5为电晕和火花放电故障模拟测试结果。
图5 电晕和火花放电故障模拟测试结果Fig.5 Simulation test results of corona and spark discharge faults
由图5 可知,三种类型的放电故障均呈阶梯状能级分布。在火花放电区,SO2F2和SO2体积分数比为0.4~4.2;在电晕放电区,SO2F2和SO2体积分数比为>10;在火花放电和电晕放电之间的偏置电晕放电区,SO2F2和SO2体积分数比为4.2~10。这表明GIS设备放电故障是以电晕放电为主,同时存在偏置电晕放电状态,SO2F2和SO2体积分数比为>4.2。
通过测试结果还可以预测SF6在不同放电故障下的分解过程。在偏置电晕放电初期,少量的S-F键断裂,与反应区微量氧反应生成低氟化物(主要是SO2F2),当SO2F2和SO2体积分数比大于4.2临界点时,放电故障进入高能放电状态,大量S-F 键断裂。由于反应区氧的存在,使SO2的体积分数迅速增加,而SO2F2和SO2体积分数比随着放电能量的增加而降低,这表明SF6在高能放电状态下具有非常大的S-F 键断裂能量,在偏置电晕放电状态后断裂速度加快。基于此,可以将4.2 作为高能量放电与低能量放电状态之间的临界点,对于高能量放电故障的预警具有重要意义。
图6 为不同特征参数的GIS 绝缘缺陷类型图。由图6可知,GIS绝缘缺陷类型分布具有一定聚集性和连续性。图7给出了采用随机森林分布模型和高斯分布模型,得到的GIS 绝缘缺陷样本分布图。由图7 可知,随机森林分布模型的平行线边界在GIS绝缘缺陷判断中简单有效,而高斯分布模型具有较好的平滑斜率,且与实际数据分布相适应。由于高斯分布的高度一致性,当数据呈现非线性趋势时,可将高斯分布与贝叶斯(Bayesian)概率算法相结合,以多维高斯分布的形式给出预测值的概率和置信区间。图8为基于高斯分布的GIS绝缘缺陷测试结果。四种绝缘缺陷都有聚集区域,分别标记N 为突出缺陷、G为间隙缺陷、M为污染缺陷、P为颗粒缺陷。由图8 可知,四种绝缘缺陷除了N 和G 区有一些污染缺陷外,M和P区的分类是一致的。N和G区域边界附近的污染缺陷(y≈0.15)是由其他区域缺陷的二次效应引起的绝缘子表面污染缺陷。在此区域,φ1值较低,说明S-F键断裂产生的F原子与金属原子的反应较多,从而减少了CF4的含量,导致金属严重劣化。y值从突出缺陷到间隙缺陷变化幅度较大,考虑到SF6的分解程度相同,y 主要取决于降解的有机绝缘材料中碳原子数量,因此,表面污染缺陷是由退化程度较低的间隙缺陷或退化程度较高的突出缺陷引起的,说明GIS 存在多个绝缘缺陷。M 区域的污染缺陷代表绝缘子内部的污染缺陷,即使加入φ2特征参数,绝缘子内部污染缺陷的采样点仍然与其他缺陷重叠,说明了GIS 绝缘缺陷会造成多次放电故障,验证了使用φ1和φ3两个参数,可以有效识别GIS绝缘缺陷类型[21-23]。
图6 不同特征参数的GIS绝缘缺陷类型图Fig.6 GIS insulation defect types with different characteristic parameter
图7 不同分布模型的绝缘缺陷样本分布图Fig.7 Distribution of insulation defect samples with different distribution models
5 结束语
本文通过机器学习算法得到电力系统GIS放电故障和绝缘缺陷识别模型,经过预处理后,可以描述放电故障的严重程度和绝缘缺陷的类型。在k最近邻算法得到的GIS 放电故障模型中,偏置电晕放电状态是电晕放电到火花放电的过渡状态,其SO2F2和SO2体积分数比范围为4.2~10。在体积分数比为4.2时,由于S-F键快速断裂,之后能量快速增加,对高能放电故障预警具有重要意义。在高斯分布得到的GIS绝缘缺陷模型中,y≈0.15的区域是多种类放电故障共存区,需重点关注。