基于谱聚类的输电线覆冰过程微气象特征提取模型
2019-09-19刘宣廷1鹏1苗爱敏2勇1
刘宣廷1, 李 鹏1, 苗爱敏2, 陈 勇1, 沈 鑫, 曹 敏
(1.云南大学 信息学院,云南 昆明 650500; 2.仲恺农业工程学院,广东 广州 510225;3.云南电网有限责任公司 电力科学研究院,云南 昆明 650217)
近年来由于全球气候变暖,对我国自然灾害风险分布和发生规律产生了全方位、多层次的影响。而由恶劣气候诱导的冰冻、风灾、雷害、大雾、洪涝、泥石流等自然灾害已成为威胁电网安全的主要因素[1]。特别是在我国的云、贵、川、渝、湘等低纬度高海拔地区,由于地形地貌复杂,气候环境多变,每年冬季在微地形和微气候的共同影响下经常发生严重覆冰事故,对当地的经济及人民的生活造成巨大的危害[2]。覆冰导线在气温升高、自然风力作用等情况下会产生脱冰现象,脱冰会引起输电线路瞬时的张力变化,引起输电线路闪络,使脱冰档绝缘子挂点处承受很大的纵向不平衡张力,对铁塔产生很强的冲击效应,危害线路的安全、稳定运行[3-5]。因此,如何根据气象部门提供的气象信息预测有可能对输电线系统造成的覆冰灾害影响已成为亟需解决的问题。
然而输电线路覆冰过程是一个高维的非线性时间序列过程,具有动态性、不确定性、非线性、高维及突变等特性。不论是基于机理模型[6-7]还是统计学模型[8-9],其本质都是基于解析模型的覆冰预测方法。该类模型虽然可以利用微观气象信息对覆冰状况进行监测和预报,但要求解析模型的精确化。而输电线路覆冰过程解析模型不易建立,且模型中含有较多的待定参数和经验参数,因此在实际的应用过程中无法满足不同监测点的地理和气候特性,其模型的鲁棒性显然存在问题。
另一方面,现有的输电线路覆冰监测系统在运行过程中积累了大量的现场数据,例如温度、湿度、风速、风向、雨量、气压、绝缘子拉力、绝缘子倾斜角及风偏角、实时覆冰负荷等数据信息,而这些数据信息即为现场监测点气象因子与输电线路覆冰过程模型I/O映射关系最真实的反映。因此不少学者基于数据驱动建模的思想,提出了以机器学习为主要方法的覆冰负荷定量预测的智能计算方法[10-14],此类方法均基于数据驱动对输电线路覆冰进行了定量预测研究,很少关注微气象因素内在联系对输电线路覆冰过程的影响。
由此提出了基于谱聚类算法的输电线路覆冰过程微气象特征提取模型,该模型通过提取输电线路覆冰的各阶段微观气象特征,对覆冰过程进行定性分析,对严重覆冰、覆冰脱落等过程进行较好的聚类。分析总结了轻微覆冰、严重覆冰及覆冰脱落过程的微气象条件,为电网部门对由输电线路覆冰引起的电网灾害预警提供气象条件参考。
1 谱聚类算法原理
谱聚类算法是近年来出现的一类性能优越的聚类算法,相较于其他聚类算法,谱聚类算法实现简单,不易陷入局部最优解,且具有对非凸数据集聚类的能力[15],因其具有较强的数据适应能力、较小的计算量以及优秀的聚类效果而得到广泛运用[16]。
谱聚类是基于图论而发展起来的聚类算法,主要思想是将数据集(x1,x2,…,xi)中的每个点视为空间中的点,并建立任意两点间的边连接,边权重wij表示xi与xj的连接关系,距离较近的两点之间边权重较大,距离较远的两点之间边权重较小,且有wij=wji,进而使用无向图G(X,W)的表示方法描述整个数集,X表示原始数据集,W表示邻接矩阵[15]。然后设定切分标准并对无向图进行多路划分,使得同一簇的数据点间具有强连接关系,不同簇的数据点间的连接关系较弱[15]。
设数据集为X(x1,x2,…,xi),使用高斯核函数定义边权重wij,此时邻接矩阵W与相似矩阵S相等[16]:
(1)
再由下式求出拉普拉斯矩阵L:
(2)
之后求出拉普拉斯矩阵L最小的k个特征值λ(λ1,λ2,…,λk) 以及对应的特征向量V(v1,v2,…,vk),最后对特征向量V进行K-means聚类[16-18],得到簇分类C1,C2,...,Ck。
2 基于谱聚类的特征提取模型
图1为基于谱聚类的电网灾变气象条件特征提取过程,数据为云南电网提供的监测数据,每15 min采样一次。将历史的监测数据,包括气象因子(温度、湿度、风速等)、时效因子以及由气象因子所决定的成灾因子(导线覆冰负荷),作为谱聚类算法的输入,使用谱聚类算法对输入数据进行特征提取,输出为一维数组,表示每组数据对应的聚类类别。
图1 基于谱聚类的电网灾变气象条件特征提取过程
图2为基于谱聚类算法的输电线路覆冰过程特征提取流程图。
具体实现步骤如下。
① 设置参数,根据工程需求设置聚类簇数k以及σ值。
② 输入数据并进行预处理,将时效因子、覆冰质量以及与输电线路覆冰增长相关的微气象因子(包括温度、湿度、风向的历史监测数据)作为模型输入,并进行滤波及归一化等预处理。
图2 输电线路覆冰过程提取流程图
③ 求拉普拉斯矩阵L的k个最小特征值以及对应的特征向量,根据式(1)求出邻接矩阵W,有相似矩阵S=W,由式(2)可获得拉普拉斯矩阵L,最后求出其k个最小的特征值以及对应的特征向量V(v1,v2,…,vk)。
④ 对V(v1,v2,…,vk)进行K-means聚类,模型输出为一维数组,对应每组数据所在的类别序号。
⑤ 最后将聚类结果进行统计分析,获得微气象因子的均值、范围、倾向率等统计量,并进行综合分析。
3 实验仿真及结果分析
所使用的数据为云南电网提供的相关数据,微气象因素及覆冰质量数据如图3所示。
在进行仿真实验时,参数聚类簇数k设置为9,即将覆冰过程分为9类,σ=0.1,仿真结果如图4所示。
图3 微气象因素及覆冰质量数据
图4 聚类结果图
由仿真结果可知,谱聚类算法将输电线路覆冰过程聚为9簇, 较准确地分离了无覆冰、轻微覆冰、覆冰增长、严重覆冰、覆冰脱落等过程,对无覆冰(第1类)、轻微覆冰(第6类)、严重覆冰(第3类)以及覆冰脱落过程(第5类)进行统计分析,统计数据如表1和表2所示。
表1为类别1,3,5,6对应的气象特征,包含温度、湿度以及风向的范围和均值,表2 为温度、湿度、风向的倾向率,气候倾向率是指气候变化趋势率,通过建立气象数据(x1,x2,…,xi)与时间(t)的一元线性回归方程(3)来确定倾向率[19]:
x=pt+q
(3)
式中,p为回归系数;q为回归常数;p和q通过最小二乘法进行估计。p的10倍即为气象因素倾向率[17],单位为:/10a。
为较准确地描述覆冰过程的气象特征,根据气象数据的长度进行分段处理,约10个数据点为一个单位,计算其气象倾向率,表2 即为连续的各段数据气象倾向率。倾向率为正表示此段数据总趋势为上升,倾向率为负表示此段数据呈下降趋势,其大小表示数据的变化程度。
由于输电线路是一个时序过程,仅通过表1统计的各气象因素的范围及均值不能客观地反映输电线路覆冰每个阶段的气象特征,需要结合表2 给出的倾向率统计量,根据表1与表2进行综合分析可提取出类别1,3,5,6的气象条件特征。
第1类:无覆冰,对应的数据序号为1~19,其最高温达到4.8 ℃,湿度最低为57%,由温度、湿度、风向的倾向率可知其变化程度较大,微气象因子极不稳定,即在温度较高、湿度偏低且气象因子波动较大的微环境不易形成覆冰,具体统计量如表1、表2所示。
表1 气象条件特征
第3类:严重覆冰,对应的数据序号为178~209,覆冰质量在601~952 kg之间,此类情况温度范围在-10.4~7.9 ℃之间,平均湿度达到95%,且由表2可知温度、湿度、风向的变化较为平缓,即在低温持续时间长、湿度大且各气象因素变化平缓的气候条件下,易形成严重的覆冰。
第5类:覆冰脱落,对应的数据序号为210~241,气温范围在-8~-5.2 ℃,平均湿度为95.2%,但由表2可知,前两段数据的温度持续升高,湿度持续下降,且第一段数据的风向发生突变,即当输电线路覆冰较严重时,在温度持续上升、湿度持续下降以及风向发生较大程度突变的情况下,输电线路覆冰易脱落。若前期出现严重覆冰,则在此类气候条件下,需要特别注意输电线路覆冰脱落的状况发生,提前做好防御措施,保障电网安全运行。
第6类:轻微覆冰,对应的数据序号为242~260,温度范围为-8.4~-6.9 ℃,温度较低,平均湿度为96.2%,温度倾向率以及湿度倾向率为负,且数值较小,即温度及湿度均持续缓慢下降,但风向变化较剧烈,此类气象条件易形成轻微覆冰,具体的统计量如表1所示。
4 结束语
针对覆冰过程具有非线性,且受微气候以及微地形的影响较大,很难建立精确的数学模型对该过程进行直接预测,提出了基于谱聚类算法的输电线路覆冰过程微气象提取模型,此模型可以对输电线路脱冰过程微气象特征进行较好的分类提取,并统计了共4类覆冰状况的各气象条件的范围、均值以及倾向率,通过对这些统计量的分析整理,获得不同覆冰状况对应的微气象条件,并利用云南电网提供的相关数据验证了此模型的有效性。