变压器油中溶解气体色谱峰识别方法的研究及应用
2020-07-06李永征宗起振包素丽
李永征 宗起振 包素丽
摘 要:针对目前变压器油中溶解气体分离后得到的色谱曲线基线存在抖动、漂移、有异常点,特别是在低浓度曲线干扰大、波形不规则,易出现对气体色谱峰的误判和漏判,导致气体浓度值检测偏差大,严重影响了故障诊断的准确性等一系列问题。采用了差分阈值滤波法、粗糙惩罚法以及粒子群优化支持向量机等算法,对油气分离后的色谱曲线序列数据中的一系列色谱峰进行干扰峰识别、分类,并采用优化半峰宽法计算出气体浓度值。有效降低了色谱峰的漏判和误判率,极大提高检测气体浓度值的稳定性、准确性和精确性。
关键词:油中溶解气体色谱峰; 支持向量机; 粗糙惩罚法; 阈值滤波
中图分类号:TP274 文献标识码:A
文章编号:1003—6199(2020)02—0078—04
Abstract:In view of the separation of dissolved gas in transformer oil chromatographic curve of jitter,baseline drift,have abnormal points,especially in low concentration curve interference,waveform is irregular,the misjudgement of gas chromatographic peak occurring and false negative,leads to the gas density detection deviation is big,seriously affected the accuracy of fault diagnosis and so on a series of problems. Differential threshold filtering method,rough penalty method,particle swarm optimization support vector machine and other algorithms are used to identify and classify a series of chromatographic peaks in the chromatographic curve sequence data after oil and gas separation,and the optimized half-peak width method is used to calculate the gas concentration value. It can effectively reduce the misjudgment and misjudgment rate of chromatographic peak,and greatly improve the stability,accuracy and accuracy of detection gas concentration value.
Key words:oil dissolved gas chromatographic peak;SVM;Roughness penalty method;threshold filtering
变压器是电力系统中的核心设备,在变压器本体中的绝缘油除了起到绝缘和冷却作用外,油中的溶解气体的浓度和组合比例还能实时反映出变压器内部是否存在缺陷、故障以及绝缘状态等。因此,油中的溶解气体的浓度和组合比例成为了变压器实时监测的最有效、最灵敏的手段,油中的溶解气体在线监测系统在变电站、发电厂、煤炭、钢厂、石油化工等领域得到了日益广泛的应用[1-2]。但目前变压器在线监测系统中对油中溶解气体分离后气体的识别、分类和计算过程中普遍存在偏差大、精度低和重复性比较差等一系列问题,严重阻碍了油色谱在线监测的推广。同時用户对变压器在线监测系统的性能、稳定性和实用性提出了更高的要求,比如C2H2的精度由0.5 PPm提高到0.1 PPm,同一油样数据的误差由30%降低到10%,究其原因,除了装置自身传感器的原因外,更多的是在色谱峰识别过程中受色谱基线漂移大、杂波多以及所采用的色谱峰识别技术等因素有关,目前对色谱峰的识别和分类技术一般采用单一参数、模糊隶属度以及灰色关联度等方法[3-5],但在强干扰、高低温、湿度大等环节恶劣的情况下容易出现对色谱峰的误判和漏判,而采用多参数权重分析[6]虽在一定程度上提高了对色谱峰的误判和漏判准确性,但对色谱峰识别和分类缺乏自适应和自我学习能力,从而影响气体浓度测量值的准确性,因此如何降低色谱峰的漏判和误判率以及提高色谱峰计算精度是至关重要的。
1 色谱曲线预处理
色谱曲线在强干扰、高温、湿度大等环节恶劣的情况下易出现异常点,所以先去掉异常点,为后面数据处理打下基础。
1.1 阈值滤波法
由于可以把色谱峰近似看成正态分布,基于数理统计中的3σ原则[7],数值分布在(μ-2σ,μ+2σ)中的置信度为0.9545,其中μ为均值,σ为标准差,由于标准差sd能反映一个数据集的离散程度,当一个数据集中某个点的数值不在(μ-3σ,μ+3σ)中的概率为:1-0.9973=0.003,因此我们可以认为此点为异常点,在本文中对色谱曲线序列数据采用每5个数据为一个数据集,即n=5,如式(1)式所示,对每个数据集计算标准差?坠,如果数据集中数据点的标准差sd大于三倍标准差?坠的点即认为是异常点ci,把ci替换为(ci - 1 + ci + 1)/2,依循查找出所有异常点,得到无异常点新的色谱曲线序列.
1.2 粗糙惩罚平滑算法[8-9]
油中溶解气体浓度越低时,基线漂移大、干扰越大,杂波越多,越容易出现对色谱峰漏判和误判,因此在数据处理前,需要采取相关措施对色谱数据进行平滑滤波,提高色谱数据质量,以便能更好的对干扰峰识别和分类。所采用粗糙惩罚平滑算法,可以克服最小二乘法平滑时具有不稳健性,具体就是在最小二乘目标函数函数后面加上一个惩罚项如式(2)所示:
经过变化可以得到,当:y* = (8)时,S可以求得最小值,从而得到了平滑函数表达式。
上述(8)式中,y*为平滑后的数据,λ通过去一法交互检验可得到,这样就可求得平滑后的色谱曲线。
1.3 色谱峰提取
油色谱的气体峰型近似看成正态分布,因此一个完整峰特征点具有:局部最大值、局部左最小值、局部右最小值、左半峰为上升沿和右半峰为下降沿,根据这一特征,采用一阶导数[10]特征的峰识别算法,具体步骤如下:
a、对平滑后的曲线数据设为y = f(x)其一阶导数为,定义三种一阶导数特征点:局部最大值点、局部最小值和零点。
b、设x=x0,ε>0,在x0的邻域d=(x0-ε,x0+ε)中有:f |(x0)≥f |(x),且x|d,则记为x0|dTMax,dTMax记为所有一阶导数局部最大值点的集合,依次求出所有属于dTMax集合的最大值点。
c、设x=x0,ε>0,在x0的邻域d=(x0-ε,x0+ε)中有:f |(x0)≤f |(x0),且x|d,则记为x0|dTMin,dTMin记为所有一阶导数局部最小值点的集合,依次求出所有属于dTMin集合的最小值点。
d、设x=x0,有f |(x0)=0,则记为x0|dTZero,dTMin记为所有一阶导数局部零点的集合,依次求出所有属于dTZero集合的零点。
e、在所有一阶导数特征点中搜索具有峰特征的峰:设ci为一阶导数特征点,i|(i,n),n为特征点个数。若ci-1|dTMax,ci|dTZero,ci+1|dTMin,则ci点为峰的最高点,当cj=max(m),cj|(dTmin | dTZero),且m < i-1,则cj为峰的起始点.当ck=min(m),cm|(dTmin | dTZero),且m>i+1,则ck为峰的结束点,依次检索出具有峰特征数据点的集合,记为Peaks集合。
2 色谱峰识别
在强干扰、高温、湿度大等环节恶劣环境中,色谱容易出现基线抖动、漂移、干扰大,在识别色谱峰过程中,容易造成色谱峰的误判和漏判,同时对色谱峰的识别也缺乏自适应和自我学习能力,从而造成气体组分数据测量失真,进一步影响了故障诊断的准确性,因此采取粒子群优化支持向量机算法(PSO-SVM)[11-14]对色谱峰进行识别,首先获得油中溶解气体分离后的气体组分在不同温度下主要是对低、中、高浓度的色谱峰特征量如幅度值、峰位(包括峰起点和峰终点)、峰面积、峰宽等参数组成五维特征向量样本组合,对每种气体组分在不同温度的低、中、高浓度分别选取250、130、76共456个样本。把色谱峰分为H2、CH4、C2H2、C2H4、C2H6共五类气体组分,将样本集设置为五种标签,如下表1所示:
将样本集分成两组:训练集和验证集,为提高SVM分类器分类性能和优化計算,先对样本进行归一化处理。其次,将样本组合分成训练集和验证集,训练集有334个样本,验证集有105个样本。训练集和验证集中样本分类见表2。
采用带惯性权重ω的粒子群优化算法对支持向量机的核函数参数g和惩罚参数c进行优化,其中,选择粒子群算法的主要参数:群体规模m=20,惯性权重ω=0.95,加速常数c1=1.23,c2=1.41,Vmax= Gmax=0.1。通过训练,核函数参数g的最佳数据为0.62745,惩罚因子C的最佳数据为2.4962,然后对训练集样本中的每个样本进行训练,得到训练模型,经PSO-SVM分类器的分类准确率高达98.6749%,最后采用训练良好的SVM 分类器对122个验证集进行预测,预测结果如表3所示。
在125个测试样本中,有120个样本的SVM分类结果与其实际的色谱峰气体组分情况相符合,即验证集分类准确率达到96.32%。因此采用训练良好的SVM 分类器对上文所述色谱峰Peaks集合依次进行预测,就可以较高准确的判断出色谱峰属于哪种气体组分,同时计算出本次预测的置信度,如果本次置信度高,就把本次分类结果存入训练集数据库中。使训练集不断得到矫正,使SVM 分类器的分类性能得到进一步提高,从而也进一步提高了色谱峰分类和识别的准确性。
3 色谱峰面积的计算[15]
由于色谱曲线在工程现场环境相对恶劣,而导致色谱基线存在漂移较大,峰宽较大以及重峰等现象,如下图1所示,对峰面积的计算采用积分法,但嵌入式系统存在计算速度慢的问题,特别是B点每次上下位置波动很大时,采用半高峰宽法误差较大,计算误差较大。因此为提高计算色谱峰气体组分浓度的精度,采用优化半峰宽法如图1所示,计算相对简单且有效,由峰顶点C作时间坐标(t)的垂直线,交于AB与D,则CD为峰高(h),取CB中位点,作AB的平行线,与色谱峰两边相交于F和E,由F和E两点作时间坐标(t)的垂直线,交时间坐标(t)于G、H两点,此时GH为半高峰宽(b),色谱峰的峰面积为 w=h*b= CD*GH;通过建立气体组分的峰面积-气体浓度的校准关系,即可求得气体浓度值。
4 算法验证
本算法是在嵌入式Vxworks操作系统下实现的,Vxworks操作系统具有高实时性、可剪裁性、高可靠性,不仅可实现对多种监测特征量的接入和转出,而且易于软件更新和功能扩展。同时为验证本算法的性能和效果,为排除传感器的干扰,测试数据采用在中国电力科学研究院测试用的原数据和测试结果,采用本色谱峰识别算法和优化半峰宽面积算法,计算出气体组分浓度范围对比如表4所示,结果表明本算法在色谱峰识别率有不同程度上的提高,同时气体浓度测量值在真实值上下波动,测量数据离散程度低,明显减小了偏差范围,从而使测量值更接近于真实值。对C2H2的检测下限由0.5 PPm提高为0.2 PPm,提高了对C2H2检测的灵敏度。
5 结 论
采用差分阈值滤波法、粗糙惩罚法以及粒子群优化支持向量机、优化半峰宽等算法对色谱曲线序列数据通过去噪、平滑、色谱峰识别、计算气体浓度值等一系列流程,有效降低了对色谱峰的漏判和误判率,极大提高了油中溶解气体在线监测装置的实用性、稳定性、准确性和精确度,为变压器内部故障诊断奠定了基础,具有广阔的推广和使用价值。
参考文献
[1] 仲元昌,万能飞,夏艳,等. 基于油气参数分析的电力变压器故障分步式诊断算法[J]. 高电压技术,2014,40(8):2279-2284.
[2] 操敦奎. 变压器油色谱分析与缺陷诊断[M]. 北京:中国电力出版社,2010.
[3] 罗荣模,王泳涛. 色谱工作站中谱峰识别的设计与实现[J]. 中国计量学院学报 2003,14(1):24-28.
[4] 胡劲松,周方洁,鲍吉龙,等. 基于模糊隶属函数的变压器色谱峰定性算法[J]. 电力系统自动化 2005,29(18):70-72.
[5] 曹建,范竞敏,安晨光. 灰色关联度在变压器油色谱峰辨识中的应用[J]. 电网技术 2010,34(7):206-210.
[6] 张炜,林,吴秋莉,等. 基于多参数权重分析的油中溶解气体色谱峰识别[J]. 电力建设 2014,35(10):43-46.
[7] 盛骤、谢式千、潘承毅. 概率论与数理统计[M].3版 北京:高等教育出版社,2001.
[8] 徐海坤,曹创华,柳建新,等. 粗糙惩罚法在CSAMT数据处理中的应用[J]. 工程地球物理学报 201512(3):304-310.
[9] Oliveira Dinis、Larsson Ann I、Granhag Lena.Effect of ship hull form on the resistance penalty from biofouling [J]. Biofouling,2018,1-11.
[10] 张万国. 高等数学[M]. 北京:高等教育出版社,2011.
[11] 郑蕊蕊,赵继印,赵婷婷,等. 基于遗传支持向量机和灰色人工免疫算法的电力变压器故障诊断[J]. 中国电机工程学报,201l,31(7):56-63
[12] 毛耀宗,陈珂,江弋,等. 基于粒子群算法与图形处理器加速的支持向量机参数优化方法[J]. 厦门大学学报,2013,52(5):609-612.
[13] 陈晋音,熊晖,郑海斌. 基于粒子群算法的支持向量机的参数优化 [J]. 计算机科学,2018,45(6):609-612.
[14] 袁海滿,雷帆,陈宇,等. 基于DGA的粒子群相关向量机变压器故障诊断 [J]. 高压电器,2017,53(2):108-113.
[15] 陈晋音,熊晖,郑海斌. 基于粒子群算法的支持向量机的参数优化 [J]. 计算机科学,2018,45(6):609-612.