基于SAM-ED光谱匹配的绝缘子污秽类型检测方法研究
2023-10-27刘益岑刘曦杨琳林柯心郭裕钧张血琴
刘益岑,刘曦,杨琳,林柯心,郭裕钧,张血琴
(1. 国网四川省电力公司电力科学研究院,四川 成都 600072;2.西南交通大学 电气工程学院,四川 成都 611756)
0 引言
绝缘子对保证输电线路安全具有重要的作用,由于长期在大气环境中运行,污秽易在其外部积累,并在空气湿度大的天气下与水分相互融合,在绝缘子表面形成导电水膜,使得绝缘子的绝缘性能逐渐减弱,情况更严重时会发生污闪,其导致的后果要比雷电等其他事故造成的后果严重的多[1-2]。污闪的发生受多种因素的综合影响,其中污秽成分与污秽量是主要影响因素。有研究表明,即使是在相同污秽程度下,污秽成分的差异将造成污闪电压的不同[3-5]。而现如今随着气候环境的变化,生产工业的进步,外绝缘污秽成分日益趋于多样化,若能及时掌握绝缘子污秽成分信息,便可根据不同污秽成分的特点,在电网运行的外绝缘设计中加以考虑,对预防污闪有重要作用。
目前,常用的污秽成分测量方法主要有:X-射线能谱仪、原子吸收分光光度法[6]、等离子体发射光谱法[7]、离子色谱法(IC)[8]等,具有操作难度大、繁琐程度高等缺点,并且无法适用于现场检测。因此,迫切需要一种高效、准确、非接触式的检测方法对绝缘子污秽进行在线检测。
高光谱技术是通过对成像技术与光谱技术融合后,对目标物体进行多维数据获取的技术,能获取从紫外-可见光-近红外,再到短波近红外范围内连续、波段很窄的光谱数据[9-10],具有实现对地表物质类型及物质含量的有效识别,在农业、医学等领域具有广泛应用[11-12]。高光谱曲线主要是根据电磁波反射差异决定的,因此高光谱曲线具有“同物同谱”的特点。光谱匹配法正是基于该特点,通过对不同光谱曲线进行相似度度量来实现分类。
文献[13]通过采集植被光谱数据,去噪,并采用最小距离法(ED)和光谱相似角度(SAM)等光谱特征匹配算法,在760 nm~900 nm的近红外波段,可以准确的对沙丘植被进行分类识别;文献[14]利用高光谱对生活垃圾进行了信息提取,并采用光谱相似角度的算法对采集到的数据分类处理,对生活垃圾的分类准确度均达99.0%以上,徐隆鑫用机载高光谱设备采集建筑垃圾,并利用二值编码、光谱信息散度和光谱角的算法对高光谱数据进行分类处理,最终可以实现88%的识别准确率[15]。然而,单一的光谱匹配法通常只根据曲线某方面的单一特征进行计算,相似性测度往往存在缺陷,容易导致物质类别的错误判断。文献[16]考虑了具有多种特征的光谱信息,提出了一种具有多光谱特征的相似性测度,通过综合考虑光谱特征信息,对矿物光谱库的物种等数据进行试验,结果表明利用多特征融合的相似性测度方法可以产生更好的识别效果。
因此,文中将光谱匹配法引入绝缘子污秽类型检测中,并根据光谱角匹配法和最小距离匹配二者检测具有相同识别原则即“值越小,曲线相似度越高,物质类别相似度越高”的特点,提出SAM-ED光谱匹配法,综合考虑光谱曲线的相似性和谱线空间距离,实现绝缘子污秽类型的准确检测。
1 样本制备及高光谱数据采集
1.1 实验样本制备
标准IEC60815根据环境特性和污秽种类将输电线路绝缘子污秽类型分为沿海型、沙漠型、工业型、农业型、内陆型[17]。其中,典型污秽成分对绝缘子闪络起关键作用,故选择各污秽类型中典型污秽成分制备人工样本,以获取不同污秽成分样本的高光谱数据集,各污秽类型的典型污秽成分如表1所示。
表1 不同污秽类型的典型污秽成分
根据标准[18]将污秽程度定义为四个等级:Ⅰ级(0.03 mg/cm2-0.06 mg/cm2)、Ⅱ级(0.06 mg/cm2-0.1 mg/cm2)、Ⅲ级(0.1 mg/cm2-0.25 mg/cm2)、Ⅳ级(>0.25 mg/cm2),灰密恒定为0.1 mg/cm2。根据污秽类型将样本分为五组,每组包括四片绝缘片,用来制备不同污秽类型下四种污秽程度的样本。制备每种污秽类型的不同污秽程度电导率溶液,采用浸污法使混合物均匀附着于绝缘片上。待样本自然阴干后采集高光谱图像。不同污秽类型人工样品如图1所示。
图1 不同污秽类型人工样品
1.2 高光谱数据采集
高光谱采集平台如图2所示,其中,高光谱成像仪具体参数见表2;校正白板的数据用来对样本的高光谱数据做黑白校正处理;拍摄时为防止环境光干扰需保证室内环境黑暗封闭,补光灯用于在室内模拟自然光。高光谱仪镜头与样品成45°夹角,与样品距离设置为60 cm,在对样品进行高光谱信息采集后传输到计算机内处理。
图2 高光谱采集平台示意图
图3 原始高光谱数据
表2 高光谱成像仪各项参数
2 高光谱数据处理及分析
在进行图像采集时,光源的光线分布不均匀、光强分布弱是常见的问题,这会造成采集的高光谱数据中某些波段存在噪声等干扰信息。针对这一问题,需要对高光谱数据进行预处理。
2.1 黑白图像校正
原始高光谱数据是样品对光的绝对反射DN值,如图所示3,通过黑白校正将其转换为能反映物质特征的反射率值。在采集每个样本的高光谱图像时,将校正白板与样本放在一起同时采集以此得到全白标定图像;等待采集完所有样本的高光谱图像之后,将高光谱仪器的镜头盖上后重复采集图像的操作以此得到全黑标定图像。黑白校正公式如下:
(1)
式中,T为完成校正后的图像数据,TR为原始图像数据,Tw为全白标定图像数据,Td为全黑标定图像数据。
2.2 多元散射校正(MSC)
为尽可能减少散射的影响,增大光谱有效数据的获取,还要对进行黑白校正后的高光谱图像数据再次进行多元散射校正。具体操作如下:
计算平均光谱:
(2)
一元线性回归:
(3)
多元散射校正:
(4)
3 基于SAM-ED光谱匹配的绝缘子污秽类型检测
3.1 SAM- ED光谱匹配原理
光谱角匹配(SAM)是一种用于分析评估光谱曲线间相似度的技术,基本思想将每一条n维光谱曲线记为一个n维空间矢量,以空间矢量间广义夹角来评估曲线间相似程度[19],来确定检测光谱类别,计算公式如下:
(5)
其中,Ti和Ri分别代表测试光谱和参考光谱中第i波段对应的反射值,n为光谱曲线波段数,θ为光谱向量之间的广义夹角即光谱角,θ
最小距离法(ED)通过计算曲线间空间距离来评估曲线间相似程度[20],D值越小代表曲线相似程度越高计算公式如下:
(6)
其中,D为待测光谱和参考光谱间的最小距离;R1i为待测光谱在i波长下的反射率值;R2i为参考光谱在R2i波长下的反射率值。
单一的光谱匹配法通常只根据曲线某方面的单一特征进行计算,相似性测度往往存在缺陷,容易导致物质类别的错误判断。因此,文中提出SAM-ED光谱匹配法,根据SAM和ED二者检测具有相同识别原则即“值越小,曲线相似度越高,物质类别相似度越高”的特点,分别对二者赋予相同的权重,通过算术平均法将二者结合起来进行综合识别,提高相似性度量可靠性,光谱角和最小距离的融合值记为Q,得到的矩阵记为标准矩阵。SAM-ED光谱匹配法具体流程如图4,将标签组和测试组中光谱数据两两匹配得到一个n×m维的光谱角矩阵和一个n×m维的最小距离矩阵,进而通过SAM-ED光谱匹配法得到标准矩阵,将融合值Q最小时所对应的标准光谱类别记为该待测曲线类别,并将测试组匹配结果放入匹配集中。SAM-ED光谱匹配法计算公式如下:
图4 SAM-ED光谱匹配流程图
(7)
3.2 基于全波段SAM-ED光谱匹配的污秽类型检测
将沿海型、沙漠型、工业型、农业型、内陆型污秽分别记为A型、B型、C型、D型、E型。采用整块样本作为感兴趣区域,提取感兴趣区域内所有光谱曲线平均值作为该类型污秽的参考谱线,如图5所示。从每组污秽类型样本的感兴趣区域中各提取10组光谱数据,同时提取10组基材数据,共60条光谱作为测试组,将不同污秽类型参考谱线及基材光谱作为标准组。
图5 不同污秽类型及基材参考谱线
从图5可看出,不同污秽类型的谱线之间差异较大,农业型、沙漠型、沿海型三种谱线较为平缓;内陆型、工业型和基材的高光谱响应较为相似,但是在波峰和波谷处的响应差异较大。不同污秽类型间差异在反射峰谷反射率以及波形上均有不同程度的体现,污秽成分光响应特性可以作为污秽成分识别本征特性依据。
根据不同污秽类型谱线的差异性,通过SAM-ED光谱匹配法将待测谱线与标准谱线进行匹配从而识别出谱线类型,具体流程如图6所示:
图6 污秽类型检测流程图
分别计算测试集谱线与标准组谱线的光谱角θ、最小距离D及融合值Q,并根据计算结果对污秽类别进行分类。基于全波段数据SAM光谱匹配的准确率为80%,从表3中可以看出,A型、B型和D型光谱容易被误分,而C型、E型和基材光谱更容易误分,这是因为SAM法利用了光谱曲线之间的形状度量,而ED法主要是利用了光谱曲线之间的距离度量,从表4中可以看出,ED法对形状相似的光谱可分性更好,而对于反射率相近的光谱更易误分,检测准确率为85%。而基于全波段数据的SAM-ED光谱匹配法由于对光谱间的形状和距离进行了综合度量,使不同角度光谱特征的信息优势互补,不仅降低了信息的不确定性,同时检测准确度有所增加,准确率达到95%。
表3 基于全波段SAM光谱匹配结果
表4 基于全波段ED光谱匹配结果
表5 基于全波段SAM-ED光谱匹配结果
3.3 基于特征波段SAM-ED光谱匹配的污秽类型检测
3.3.1竞争自适应重加权采样法 (CARS)
利用竞争自适应重加权采样法(CARS)对光谱数据进行特征选取,以降低信息冗余问题带来的影响,剔除干扰信息,降低计算的复杂程度。CARS算法通过结合蒙特卡洛采样与PLS模型回归系数对变量进行逐步保留和剔除,经过多次计算后选择使交叉验证均方根误差(RMSECV)达到最小值时子集中的变量作为特征波长。
特征选取具体过程如图7所示,本实验设置采样次数为50次,变量数在前10次采样过程中迅速下降,后逐渐趋于平缓。随着采样次数的增加,无关变量逐渐被剔除,RMSECV值最终在第36次采样时达到最小值,而在此后RMSECV值逐渐上升,说明在第36次采样之后一些关键的特征变量被剔除,导致PLS模型精度下降。因此选择第36次采样时获得的变量子集中的10个波长作为本研究的特征波长。提取出的特征波长值如表6所示。
图7 CARS特征波长选择过程图
表6 特征波长表
3.3.2主成分分析法 (PCA)
对不同污秽类型在特征波长下的光谱数据做主成分分析,将主成分得分转化为空间分布图,如图8所示,可以看出不同污秽类型间的特征光谱数据表现出良好的可分性和聚类性。
图8 不同污秽类型主成分得分空间分布
将特征波长下待测组光谱与标准组参考光谱进行SAM-ED光谱匹配结果如表7所示,只有一处发生了误分。准确率高达98.33%,特征提取能有效消除冗余信息的干扰提高检测准确性,同时降低处理数据量,提高检测效率。
表7 基于特征波段SAM-ED光谱匹配结果
4 结论
(1)不同污秽类型间的差异在高光谱谱线波形和空间位置上均有不同程度的体现,这些差异能够作为污秽类型识别的特征依据;
(2)SAM-ED光谱匹配法通过光谱相似性分析后,对光谱距离量等光谱特征信息进行综合考虑,使不同角度光谱特征的信息优势互补,减少了信息的不确定性,相对于单一的光谱特征信息可以提高识别效果,准确率高达98.33%;
(3)特征提取能有效消除冗余信息的干扰,增强不同污秽类型数据间的可分性,有效提高检测的准确性和效率。