APP下载

基于拉曼光谱和改进KNN算法的油纸绝缘设备老化阶段判别

2020-09-18赵金勇周永阔陈钰韩丙光杨定坤

光散射学报 2020年2期
关键词:皮尔森油纸曼光谱

赵金勇,周永阔,陈钰,韩丙光,杨定坤

(1 国网山东省电力公司德州供电公司,山东 253000;2 重庆大学,重庆市 400044)

1 引言

目前为止,油纸绝缘设备聚合度的测量是国际上认可度最高的确定老化程度的指标。但是在设备的实际运行过程中,由于绝缘纸无法直接取出,因此聚合度的测量只能作为在实验过程中的评判标准,而不能作为评判指标。因此,在大部分研究工作中,是利用对绝缘油的分析来实现老化阶段的诊断的。

准确诊断油纸绝缘材料的老化程度是保证油纸绝缘设备安全运行的重要技术手段。目前检测油的老化状态的方法主要有高效液相色谱法(HPLC)、气相色谱法(GC)等,但是这些方法都只能针对有限物质进行测量,且需要较多预处理工作,耗时较长。拉曼光谱在物质成分分析及状态诊断领域已经普遍应用。与传统技术相比, 拉曼光谱技术应用于变压器油中糠醛含量分析具有以下优势:拉曼光谱检测为非接触测量, 可实现连续测量;变压器老化微量特征物均有拉曼活性, 均可进行拉曼检测;受环境因素影响不大, 易于实现在线监测。因此, 本文主要研究不同老化阶段油纸绝缘样本的拉曼光谱, 探究拉曼光谱技术对油纸绝缘老化的有效可靠诊断。

目前有很多机器学习算法被用于分类的研究,常见的有支持向量机、K 最近邻(KNN)、随机森林等算法。由于在实验室中的油纸绝缘老化试验持续时间较长,因此不同老化阶段样本较少,而KNN算法对样本数量要求较低,并且不需要训练模型,因此本文利用皮尔森相关系数和欧几里得距离作为两个表征样本间距离的参量,对样本进行双重筛选,以此来提高正确率。

本文的研究中, 运用加速热老化实验制备对应不同老化时间的油纸绝缘样本,根据取样时的老化天数,将样本分为12类;结合实验室搭建的拉曼光谱老化特征物检测平台采集样本的原始拉曼信号;采取五点三次平滑降低原始谱图噪声,通过K 最近邻分类算法,建立基于皮尔森相关系数和欧几里得距离的老化诊断模型。

2 实验及数据

2.1 样品预处理及加速老化试验

本文依据IEEE导则进行油纸绝缘加速热老化样本的制备,在密封系统中模拟实际变压器的老化运行状态。油纸绝缘样本包含纤维绝缘纸、矿物绝缘油,实验中使用的矿物油为克拉玛依25#环烷基矿物油。克拉玛依25号矿物油,绝缘纸使用0.2 mm厚的牛皮纸。

首先,将油和纸在真空箱中90℃干燥48小时,油和纸的水分含量分别控制在10mg/kg和0.5%以下。然后将真空箱的温度调节到60℃,并将纸样在绝缘油中浸渍24小时。油纸质量比为10∶1。之后,将油纸样品移入加热罐,加热罐抽真空,注入氮气。

图1 加热罐结构示意图

为模拟真实变压器内部的铜绕组,在瓶中放入适量铜条。油纸样品的加热罐放置在在一个稳定在130℃的恒温油浴锅中,进行25天的加速热老化。由于加速热老化前期绝缘纸聚合度速度较快,因此在老化进行8d之前需要密集取样,8d之后每两天取样一次,按设定好的取样时间定期取出加热罐,放入温箱冷却,打开分析老化样品。最终共获得1d、2d、3d、4d、5d、6d、7d、8d、10d、12d、14d、16d、18d、20d、22d、24d共16组老化样本,按照绝缘纸聚合度,将老化样品划分为绝缘良好(1~4d),老化初期(5~8d),老化中期(10~16d),老化末期(18~24d)共形成4种不同的老化程度。

摘 要:随着科技的发展和新课程改革的进行,小学数学课堂发生了巨大的变化,多媒体的应用使得小学数学课堂变得越来越多姿多彩,激发了学生学习的热情和积极性,活跃了课堂的气氛,提高了学生的学习质量和小学数学教学效果。通过描述小学数学教学效果的现状,从而提出利用多媒体提升小学数学教学效果的意见和措施,保证教学质量的提高,扩展学生的见识和眼界,保障学生想象能力和思维能力的提升,为“新时期”学生今后的发展奠定坚实的基础。

2.2 拉曼光谱获取

用于绝缘油拉曼光谱的检测平台原理如图1所示。波长为532 nm的激发光源通过共聚焦显微镜聚焦在检测点,使该处发生拉曼散射。散射光同样通过显微镜进行收集,并通过电荷耦合元件(CCD)及光谱仪进行光谱的实时采集,保存油样的光谱信息用以之后的数据分析。

2.3 实验数据

为减小在光谱测量中的误差带来的影响,本研究中将每个样本 5 次重复测量结果的均值作为样本光谱数据。原始光谱数据中包含了荧光信号、拉曼散射信号及噪声信号。光谱信号中一般都存在基线干扰,这是由油纸绝缘老化过程中产生的荧光物质、油中杂质、绝缘油的荧光性及设备所产生的,它将会对光谱特征量的提取产生极大的影响。因此,数据预处理的第一步是采用三次样条函数去除基线,再采用五点三次平滑算法降低光谱噪声,最后再对数据进行归一化处理。最终得到的原始光谱数据如下图所示。

图2 实验原理示意图

图3 实验装置图

本实验共获取了230组数据,将其分为十份,用于十折交互验证。应保证每一份数据中不同老化天数样本的数量尽量相同,以减少样本带来的误差。

可以看到,随着变压器油的老化,拉曼光谱基线变化很大,在扣除基线时误差很大,会对老化时间的判断带来很大影响。在不考虑基线的情况下不同老化时间变压器油老化光谱的变化主要体现在整体形状的变化,虽然可以直观看出老化油样拉曼光谱的变化,但是其变化规律非常复杂,变压器油中物质成分多样,在不同阶段的老化机理尚无研究,因此,对变压器油老化的分析较为困难。

图4 部分老化油样原始拉曼光谱

3 KNN模型建立

KNN算法是一个经典的机器学习分类算法,通过度量”待分类数据”和”类别已知的样本”的距离对样本进行分类。KNN算法精度高,对异常值不敏感、无数据输入假定,对样本数量无太高要求。

如果一个样本在特征空间中的K个最邻近的样本中的大多数属于某一个类别,则该样本也划分为这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在分类问题上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

3.1 相似性度量选择

关于距离的度量方法,常用的有:欧几里得距离、余弦值(cos), 相关度 (correlation), 曼哈顿距离 (Manhattan distance)或其他。

在这里,本文采用了皮尔森相关系数作为不同样本间距离的度量。皮尔森相关系数皮尔森相关系数是用来反映两个变量线性相关程度的统计量。相关系数的绝对值越大,相关性越强。

3.2 KNN模型的建立

在KNN算法中K值的选取非常重要,如果当K的取值过小,一旦有噪声成分存在,将会对预测产生比较大影响,容易发生过拟合;

如果K的值取的过大,就相当于用较大邻域中的训练实例进行预测,学习的近似误差会增大。

在选取K值时常用的方法是从K=1开始,使用部分数据测试算法正确率,选取预测正确率最高的K值。

为减少随机误差,采用十折交互验证的方式计算模型预测正确率。将原始样本分为10份,轮流选择9份作为训练样本1 份作为测试样本,重复10 次后的正确率均值即为交叉验证结果。预测正确率随K的取值的变化情况如下图所示。

图5 不同K值下预测正确率

从上图可以看到,模型的正确率在K的取值为7时达到最大值,但是预测正确率仅有56%,正确率较低。并且,KNN算法预测的老化天数与实际老化天数偏差较大。该模型无法到达实际使用要求。

图6 KNN算法预测的老化天数和实际老化天数

3.3 KNN模型改进

考虑到皮尔森相关系数主要是两光谱形状相似程度上的度量,而两个形状相似但是绝对数值相差较大的谱图使用上述方法无法区分。因此,可以利用欧几里得距离来表征两光谱绝对数值上的差异,以此提高预测正确率。

欧几里得度量是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离。

本文实验过程中为改进KNN算法以提高正确率,将KNN算法中K个最邻近的样本的选取过程分为了两部分。首先,以皮尔森相关系数为第一个衡量标准,通过计算待测样本和样本库中样本间皮尔森相关系数选取m个与待测样本最接近的样本作为新的数据库,称之为一次筛选。然后,将欧几里得度量作为第二个衡量标准,通过计算待测样本与一次筛选获得的m个样本间的欧几里得度量,选取n个与待测样本最接近的样本,将这n个样本中作为待测样本的预测类别。

图7 改进的KNN算法流程

与KNN算法类似,需要确定最佳的m和n的值,在选取m和n值时从m=1, n=1开始,使用部分数据测试算法正确率,选取预测正确率最高的m和n值。m和n的取值上限设为10。

为减少随机误差,在计算预测正确率时同样采用十折交互验证。最终预测正确率和m与n值的关系如图8所示,KNN算法预测的老化天数与实际老化天数如图9所示。可以看到,预测正确率在m值为9,n值为5时预测正确率达到最大值87.92%。而预测的老化天数与实际老化天数相差最大值为4天(两个相邻类别)。

图8 不同m和n值下的预测正确率

图9 改进的KNN算法流程

4 结论

通过加速热老化实验, 获取不同老化阶段的油纸老化样本, 通过拉曼光谱仪获取了大量不同老化阶段老化样本的拉曼光谱,通过改进的KNN算法对老化天数进行了预测。

从实验结果可以看到,改进的KNN算法极大提高了老化天数分类的正确率,在12种分类类别的情况下,预测正确率达到了87.92%。并且预测类别与实际类别的偏差大大降低。KNN算法在油纸绝缘老化阶段判别中有一定应用前景。

猜你喜欢

皮尔森油纸曼光谱
特高压变压器油纸绝缘典型缺陷局部放电特征
一把纸扇记忆成河
绝缘纸板老化对油纸绝缘沿面放电发展规律的影响
数字翘楚皮尔森:忍过100多次整形的女军人
有梦的青春不易“残”
油纸电容式套管故障统计分析及模拟测试研究
BMSCs分化为NCs的拉曼光谱研究
便携式薄层色谱-拉曼光谱联用仪重大专项获批
苯的激光拉曼光谱研究
新型4H-3,1-苯并噁嗪类化合物的合成及拉曼光谱研究