基于关联规则的能源互联网输电线路安全分析
2021-09-09张志友陈德富
张志友,陈德富
(1.南京信息职业技术学院电子信息学院,江苏 南京 210023;2.浙江工业大学信息工程学院,浙江 杭州 310014)
随着能源互联网战略的不断推进,电力系统在其中发挥着主干作用。输电线路作为连接发电侧与用户侧的重要纽带,是提升能源互联网供电质量和用户体验的关键环节[1-2]。当前,能源互联网的建设对信息感知的深度、广度、密度、频度和精度都提出了更高要求。能源互联网利用智能感知技术对系统内各个环节的电气量、状态量、物理量、环境量、空间量、行为量进行全面监控,形成能源互联网底层感知基础设施[3]。伴随着我国能源互联网的发展,如何利用智能感知技术提高输电线路的安全性成为亟待解决的问题。在天气因素影响下输电线路缺陷属性中又有许多规律性的规则隐藏在其中,如果将温度、湿度、风力等天气因素,结合能源互联网的状态智能感知、微气象在线监测、自动气象站等监测数据进行科学分析,从中挖掘出其潜在的联系,那么相关部门在改进电力系统安全、防范恶劣天气灾害现状时做出的决策就有科学依据[4]。
目前,针对这一问题国内学者进行了研究。文献[5]根据输电线路易受恶劣天气影响的特点,提出将防御框架覆盖的时间段向两端扩展,将防御功能在广域信息、仿真分析、决策支持等方面进一步深化的具体任务。文献[6-7]主要论述了停电防御系统应充分考虑外部天气因素影响,更有效地处理天气因素造成的突发事故。文献[8]建立电力系统气象监测及预警系统,提高电力系统应对极端天气的能力。文献[9-10]提出了预警系统多维度表征,将天气因素作为影响因子,建立了天气因素的电力事故影响模型,并证明了模型的有效性。传统方法是根据电力系统长期的运行经验进行判断,在灾害性天气下,输电线路可能发生某些缺陷,在日常巡检时需要重点防范[11]。这种方法虽然能起到一定的预防作用,但是无法发现潜在的缺陷。
综上所述,能源互联网的发展已然成为一种必然的趋势,但是能源互联网智能感知技术的数据利用效率低,使得智能感知技术的巨大潜力无法发挥。因此,文中尝试利用智能感知技术获得的外部气象检测数据,并结合关联规则方法应用在电网输电线路安全分析中。首先,对历史缺陷数据和气象数据进行分析和处理,再进行数据指标的筛选和整合;然后,利用Apriori算法建立两者之间的关联规则挖掘,挖掘气象因素和输电线路的关联关系,并在此基础上做好输电线路恶劣天气预防措施,保障输电线路的稳定运行。基于关联规则的电网输电线路安全分析研究,可有效提高输电线路在极端恶劣天气下的应对能力和电网的稳定性,保障能源互联网的安全运行,具有重要的研究价值和意义。
1 输电线路天气信息和缺陷信息处理
能源互联网属于“新基建”融合基础设施范畴,智能化、网络化、信息化是其主要特点。能源互联网中应用的智能感知技术,针对性地部署于互联网的各个环节,对相关设备进行实时监测,为系统的安全稳定运行提供了可靠保障,为日常巡检、检修等工作提供了数据支撑。能源互联网范畴如图1所示。
图1 能源互联网范畴图Fig.1 Energy Internet category
天气预警应用针对温度、湿度、风力等天气因素,结合输电线路的场景状态智能感知、局部气象在线监测等监测数据,实现多系统数据融合,可实现对重要输电通道的全天候、全方位状态监测与风险预警。如图2所示。
图2 多系统融合图Fig.2 Multi-system integration
1.1 天气数据分析与处理
本文整理了智能感知系统采集的某省2019年~2020年历史天气数据,包含了各个探测位置的天气数据,如图3所示。
图3 天气数据图Fig.3 Weather data
结合输电线路的实际生产运行状况,并考虑到了可能会受到灾害性天气的不良因素,进而给出了电网气象灾害的定义。本文为得出各气象因素是否对输电线路停运有很大影响,以及进一步确定其影响程度,进而引入了变异系数。
变异系数法是通过变异程度的大小,进而判断赋值权重的范围。其中,变异程度是由评价指标确定的。如果指标的变异程度大,说明它的重要程度高,则被赋予的权值应较大;反之,则应赋予较小的权值。此外,输电线路的停运率表明,离散程度高、波动性大等特征是一些影响程度较高的气象因素往往所具有的,又因在进行数理统计时,常常需要用到随机变量的相对期望值,而它的偏离程度恰恰可以被用来表示方差的大小。因此,基于方差和变异系数的特殊性,本文结合两者特点,进而确定各气象因素的赋值权重。
从收集的气象序列数据中表明最高温度、最低温度、最高湿度、最低湿度、降水量、风力、气压、云、降水和能见度。这10种气象因素包含在每组气象序列数据中。Aij表示第i组气象序列的第j个气象因素,i=1,2,···,m ;m=20;j=1,2,···,n;n=10。计算各气象因素权值的步骤如下:
1)计算气象因素的均值和均方差,即
2)由上一步计算所得的均方差进而计算第j个气象因素的变异系数σj,即
3)归一化处理各变异系数,进而得出第j个气象因素的权重dj,即
选择最高温度、最低温度、最高湿度、最低湿度、降水量、风力、气压作为主要因素。具体数据如表1所示。
表1 气象因素取值Tab.1 Meteorological factors
天气记录中经常出现少雨、多雨、干燥等用来描述降雨量的词汇。由于在天气预报中,满足该地区在24 h之内降水量不超过0.1 mm的被定义为少雨,因此采用替换法处理对此类型小于0.1 mm的数据进行替换。对于天气记录中的缺失值采用牛顿插值法,根据相似点的已知值进行缺失补全。另外,由于在输电线路工作过程中会出现缺陷数据采集延迟的情况,所以分析时应考虑天气引起的延后效果和累计效应。具体描述如表2所示。
表2 天气指标描述Tab.2 Description of weather indicators
1.2 隐患数据分析与处理
由于电力系统缺陷记录中含有重复和无关的缺陷数据,因此结合实验需要对数据进行清洗。下图是某电网公司输电线路缺陷记录表如图4所示。
图4 输电线路缺陷记录图Fig.4 Transmission line defect record sheet
从图4的统计中可以看出,玻璃绝缘子自爆、鸟害、锈蚀、损伤和保护区安全隐患所占的比例排名靠前,在进行人工巡视时,需要重点关注这几类缺陷的发生。输电线路情况分布如图5所示。
图5 输电线路情况分布图Fig.5 Distribution of transmission lines
接地装置损坏与气象的分布情况对比。如图6所示。它与强降水量的关系相似。主要可能原因为大量的强降水,造成水土流失,从而接地装置损坏。
图6 接地装置损坏原因对比图Fig.6 Comparison of grounding device damage causes
鸟害与气象的分布情况对比如图7所示。它与湿度、降水量的关系较为紧密。主要可能原因是湿度增强导致鸟类活动频繁。
图7 鸟害原因对比图Fig.7 Comparison of causes of bird damage
最后,对隐患数据进行归纳操作,包括以下两个步骤:1)信息提取,针对缺陷数据中存在的大量的、潜在的信息,需要进一步的分析和提取。2)信息合并,通过整合提取出的缺陷数据,将那些功能相似的属性信息进行合并。归纳结果如表3所示。
表3 缺陷表格Tab.3 Defect form
1.3 数据指标筛选与整合
首先对所要挖掘的所有数据都做了形式化的定义之后,就可以进行关联规则挖掘。一个缺陷情况表含有n个维,每个维代表一个缺陷属性,不同的属性下都有一个或多个值与之对应。n个维中所属的单元是用来记录每条事故属性值的。一般情况下,n维数据也可以被看做为n个独立的数据表,每个表存储的是n维属性的值。由恶劣天气引起的电力系统事故属性有:线路属性、时间属性、电压属性、故障设施属性、灾害属性。各属性下的值如下:
1)线路属性:CS线、GCJ线、JSJY线、BH线、NL线、TZ线、HYP线、PQ线、DDJ线、HC线、HC线、WD线、HX线、XHY线、WT线、SQ线、WZ线、XX线、ZD线、CJ线、BCY线。
2)时间属性:Jan,Feb,Mar,Apr,May,Jun,Jul,Aug,Sep,Oct,Nov,Dec。
3)电压属性:110 kV,220 kV,500 kV。
4)故障设施属性:导线及地线、绝缘子、金具、杆塔及基础。
5)灾害属性:鸟害、部件发热异常、接地装置受损、保护区安全隐患及锈蚀部位损伤。
通过挖掘气象条件与各缺陷部位之间的关系,进而能够找出各数据间的数据关联,以其为条件进行数据整合,如表4所示。
表4 数据整合Tab.4 Data integration
2 基于Apriori算法的能源互联网输电线路安全分析
Apriori算法是用于挖掘出数据关联规则的常用算法,它用于找出数据值中频繁出现的数据集合,将这些数据集合称为频繁项集,找出各项集合间的关联关系,有助于决策的制定。因此,Apriori算法分为两步:第1步产生频集,第2步产生关联规则。算法的原理概括如图8所示。
图8 Apriori算法原理图Fig.8 Algorithm principle
首先将缺陷记录和气象信息整理成关联规则模型所需的数据结构,从中抽取相关信息作为事务数据集,为方便起见将天气因素A{最高温度、最低温度、最高湿度、最低湿度、降水量、风力、气压}分别简记为{a1,a2,a3,a4,a5,a6,a7},将缺陷B{鸟害、部件发热异常、接地装置受损、保护区安全隐患、锈蚀部位损伤}分别简记为{b1,b2,b3,b4,b5}。
每个项的集合被称之为项集,一个项集中所对应的支持度,定义为数据集中包含该项集的记录所占的比例。频繁项集就是支持度大于等于最小支持度阈值的项集,设定最小支持度为20%。首先产生候选集Ck,然后计算所有k项集的支持度,若支持度满足大于最小支持度阈值要求,则成为频繁k项集Lk,接着在Lk基础上产生候选集Ck+1,然后通过判断最小支持度来确定频繁(k+1)项集Lk+1。在这个过程中连接步和剪枝步互相融合,最终得到最大频繁项集。数据集中所包含的某项集的事务个数,被定义为该项集的支持度计数。关联规则强度可以通过它的“支持度”和“置信度”来表示。支持度如下式:
在已知项集A发生的条件下,同时发生B的概率,这个事件也可以描述为发生A的同时发生B的置信度,它可由同时发生A,B事件的支持度计数与A的支持度计数相除得来:
在利用得到的最大频繁项集与预先设定的最小置信度阈值生成关联规则。
鉴于上述分析,输电设备在传输过程中的某些缺陷与某些天气因素在统计上有较强相关性,并且可以通过Apriori算法在长期的大规模缺陷数据中找到这些关联性。因此,建立基于Apriori算法的传输线路安全分析模型对输电线路的长期安全可靠运行具有非常积极的作用。
分析流程描述如下:
1)建立数据库。分析、收集并处理该期间内所有先前的传输线缺陷记录信息和天气数据。
2)分析数据库中的Apriori算法。挖掘隐患与天气之间的关联规则。
3)制定预案。针对挖掘出的所有关联规则进行规划。
4)实时接收信息。在输电网的运行检修中,及时的接收天气预报信息。
5)比对信息。把预报中的信息与已知的关联规则相比对,再按照之前制定的预案进行相应部署,具体流程如图9所示。
图9 输电线路安全分析流程Fig.9 Transmission line safety analysis process
3 实验分析
本文采用Matlab平台设计与实现了基于关联规则的能源互联网输电线路安全分析。主要是挖掘输电线路故障与天气因素之间的关联,并且给出相应预防措施。
本文整理了某省2019年~2020年的输电线路缺陷数据以及当时的气象数据。如表5所示。
表5 输电线路缺陷数据Tab.5 Transmission line defect data
对气象因素和输电线路缺陷进行分析,对数据进行筛选、合并。然后对整合后的数据,进行离散化处理,离散化结果如表6所示。
表6 数据离散化Tab.6 Data discretization diagram
在实验中,针对离散后的气象数据和缺陷数据,选用需要同时满足置信度和支持度都最高的关联规则去挖掘气象条件和缺陷类别之间的关系,并使Apriori算法对其进行关联分析。部分程序运行如图10所示。
图10 程序运行结果图Fig.10 Program run result diagram
关联分析结果如表7所示。
表7 关联分析结果Tab.7 Association analysis results
从关联分析结果中可得出以下几点:1)即使在降水量很低的情况下,发生锈蚀部位损伤的概率最大(53.28%);2)由各因素的关联度因素可知,鸟害、部件发热异常、保护区安全隐患、锈蚀部位损伤的支持度相同,都为4%,接地装置受损略低,为2%;3)在湿度较高的情况下,接地装置受损的发生概率也最低(16.67%)。可以根据各地区不同的天气情况,采取相应的预防措施。如表8所示。
4 结论
文中提出了一种基于关联规则的能源互联网输电线路安全分析方法,该方法的提出能在一定程度上提高输电线路应对恶劣天气的能力,同时提高了能源互联网的智能化和安全水平。通过深入分析输电线路易受天气因素影响的问题,收集天气数据和缺陷数据进行分析和处理,然后采用的Apriori算法对天气因素下的输电线路故障进行了关联规则挖掘,最后针对关联分析结果采取应对措施,保证输电线路的稳定运行,满足了电网在恶劣天气下的高可靠性需求。