基于随机矩阵理论与Spiked模型的电力系统态势感知方法研究
2022-10-24叶新青刘梦爽吕笃良徐一晨
叶新青 刘梦爽 吕笃良 徐一晨
(1.浙江华云信息科技有限公司,杭州 310008;2.国家电网新疆电力有限公司,乌鲁木齐 830000)
近年来,国家大力推行一系列电力电网、新型能源的调整优化政策,智能电网(smart grid,SG)的发展便是其中最重要的方向[1-2].国家电网公司早在2009年便对SG 未来20 年内的发展方向进行了明确,旨在于2020年全面实现SG.中国电机工程学会在2013年对电力系统的数据发展提出了明确方向,随后国家电网公司在2019年也提出了“三型两网、世界一流”的战略部署,牵头开展了多项电力系统及大数据运营的研究项目.国家电网公司对电力系统的多个方向进行了技术上的定位,其中包括物联网、智能交互、先进通信等多方面的战略要求,目的是在2024年形成“共建、共治、共享”的泛在电力物联网[3-6].
新生代SG 具有复杂多变的网络结构,在用户侧全面放开的背景下接入了新能源汽车、电动交通及柔性电子等多方面的新科技、新手段,不仅在一定程度上增加了自动化控制的难度,也淘汰了传统的人工经验控制的电网行业技术手段.因此,在电力系统中加入智能态势感知技术对于提高电力系统的经济性和安全性具有重要意义[7].同时,由于电网公司建设中加入了大量智能化硬件设计,在输出海量控制数据的同时,也为大数据的处理提出了严峻考验.智能态势感知融合了数据挖掘、人机交互等关键技术,能够在繁琐复杂的电力系统中准确高效地提炼、筛选和分析电网数据,精准把握住电力系统的运作态势,提高态势感知的成效[8-9].
电力系统态势感知技术是目前大数据挖掘和分析的关键,对从智能电网获得的大量历史数据进行数据挖掘,保证了时间成本、资源成本和智能部件的约束发展.而作为直接有效的大数据挖掘理论手段,随机矩阵理论(random matrix theory,RMT)为数据驱动的电力系统提供了理论基础,在海量数据中形成了相关性联系,从全新的电力系统分析角度对智能电网的发展提供了新思路和新技术.
1 基于MESCM 的电力系统异常状态感知方法
1.1 基于MESCM 的电力系统异常状态感知路径
(1)考虑噪声的PMU 数据源矩阵
此处假设PMU 的数量为N(N≥1),定义t i为随机选取的采样时刻,采集到的信号数据在时间序列下构成了列向量xs(t i)=(X1,X2,…,X N)T,在此基础上形成了数据源矩阵Xs,见式(1):
由于引入了噪声,因此定义噪声矩阵和噪声幅值为式(1)中的η和m,并且引入了高斯噪声对噪声源进行处理.数据源矩阵的样本质量受噪声的影响程度较大,对电力系统在态势感知异常状态过程中造成较大的影响.因此,此处定义数据源矩阵的信噪比[10](signal-to-noise ratio,SNR)为:
其中:Tr(·)为矩阵的迹.
(2)异常状态检测方法
由RMT 的M-P律可知,如果电力系统中出现异常状态,会破坏电力系统网络中的随机性和特征规律性,而MESCM 的优势在于能够维护统计性边界的特征值和规律性,并对系统异常状态进行检验.此处定义样本协方差矩阵S的最大特征值为λmax,定义其阈值函数为:
如果电力系统满足条件λmax≥γ,就意味着系统出现异常状态.MESCM 的最大特征数值会随着窗口数据矩阵的维度和噪声强度的增大而增大,过大地提高了阈值的检测精度,造成检测过灵敏.所以,考虑到电力系统的预警级别,将阈值定义为1.2γ,以保证20%的裕度.
MESCM 的理论基础是M-P 律,在不需要固有数学模型的前提下,运用数据挖掘和数据驱动的方法就能完成数据分析.同时,MESCM 具有较高的灵敏度,能够保证在较大的噪声干扰下,依然能保持较高的灵敏度,这是矩阵谱半径法(MSR)不具备的优势[10-11].
(3)方法步骤
Step1:采集引入噪声的PMU 数据构建数据源矩阵Xs;
Step2:分别定义数据的采样时刻和窗口宽度为t1和T,计算阈值函数γ;
Step3:对数据源矩阵Xs进行运算,最终得到动窗口矩阵X,维度为N×T维;
Step4:利用数据标准化手段处理Step3的X,得到非Hermitian矩阵X;
Step5:对矩阵X样本协方差矩阵S和特征值进行计算;
Step6:从Step5计算得到的特征值中筛选得到最大特征值λmax,并将其定义为异常状态指标;
Step7:如果电力系统异常状态判断正确,则重复Step3至Step7;如果不正确,将采样时刻t i定义为t i+1,对数据进行迭代计算,整个流程如图1所示.
图1 基于MESCM 的电力系统异常状态检测流程图
1.2 基于MESCM 的电力系统异常状态感知测试
1.2.1 完整信息下异常负荷跃变测试
测试前设置2 500个数据采样点,并对信噪比场景进行设置:低信噪比ρ=260,高信噪比ρ=4.2×103,将采样时刻t0至t500设置为无异常事件,并且从时刻t501开始直至t1500结束,将节点15 的功率从320 MW 跃迁至360 MW,此段设置为异常事件.除了节点39之外,将其余38个节点中的发动机节点数据和负荷节点数据构成38维数据源矩阵.选取120组采样数据,由当前时刻的1 组数据和119 组历史数据,将滑动窗口的T设置为120,阈值γ为2.9.对高信噪比和低信噪比场景进行数MESCM 指标的变化曲线分析,如图2(a)所示;同时,对文献[12]方法的实验结果进行分析,得到了如图2(b)所示的MSR 指标变化曲线.然后从谱分布角度来分析,得到了高低信噪比环境下的特征值分布,如图3所示.
图2 完整信息下指标变化对比(基于MESCM)
图3 完整信息下谱分布示意图(基于MESCM)
由图2可知,在异常事件开始时和结束时,也就是采样时刻t501及t1500,电力系统分别出现了节点跃升和跃降的现象.进行对比分析可知,高信噪比的环境会破坏电力系统的随机性,MSR 特征值和MESCM 特征值均出现异常,这就意味着电力系统的异常状态能够被有效检测.同时,由于MSR 在强噪声的干扰下受到了强烈的影响,所以特征值并未突破内径值,这也表明MSR 无法准确检测电力系统异常状态;而MESCM 的最大特征值能够在t526及t1527时刻突破阈值,并且低于高信噪比的数值,这也表明电力系统异常状态能够被MESCM 成功检测到.
分析图2可以得知,当信噪比较高时,MSR 值在采样时刻t1476降低至0.769,这代表当电力系统异常状态出现时会导致MSR 值与内径的限定值出现较大偏差.换句话说,特征值的分布出现了“坍缩”.然而,如果是在信噪比较低时,MSR 值在采样时刻t1472降低至0.879,特征值并未超出内径限定值,这代表低信噪比时的异常状态无法准确感知.
1.2.2 非完整信息下三相短路故障测试
上一节对完整信息的适应性进行准确分析,接下来将对剔除节点后的信息进行非完整信息适应性检测.在39个节点中随即剔除2个节点(15/16)及与2个节点相关联的5个节点(14/17/18/21/24).随后,除了节点39之外,将其余31个节点中的发动机节点数据和负荷节点数据构成62 维数据源矩阵.选取120组采样数据,由当前时刻的1组数据和119组历史数据,将滑动窗口的T设置为200,阈值为γ=3.01.对高信噪比和低信噪比场景进行数MESCM指标和MSR 指标的变化曲线分析,如图4所示.
图4 非完整信息下指标变化对比(基于MESCM)
由图4分析可知,当信息处于非完整状态下时,两种方法在高信噪比场景下的最大特征值均能突破阈值,这表明可准确有效地识别三相短路故障异常状态;在低信噪比的场景下,MSR 的最小特征值为0.874 6,并未突破内径,因此无法准确有效地识别异常状态.MESCM 的最小特征值为0.752 8,突破了阈值,这表明能准确有效地识别三相短路故障异常状态.
1.2.3 大规模电力系统的适用性分析
为了验证MESCM 在实际应用过程中的适用性,本文选取了乌鲁木齐市某个220 k V 输电线路进行三相短路故障检测.低信噪比场景设置为ρ=4.4×10-3,并将数据采样点设置为2 000.同时,选取200个新疆维吾尔自治区和浙江省不同区域内的500 k V节点的电压相角[13-14],并构造出200 维的数据源矩阵,将滑动窗口的T设置为300,阈值γ为3.96.对高信噪比和低信噪比场景进行数MESCM 指标和MSR 指标的变化曲线分析,如图5所示.图6为谱半径示意图.
图5 实际电力系统下指标变化对比(基于MESCM)
图6 实际电力系统下谱分布示意图(基于MESCM)
由图5(a)中的数据分析结果可知,低信噪比的MESCM 从时刻t1078开始迅速上升,最大特征值达到了12.236 9,并突破了阈值,发送了电力系统异常状态警告,准确有效地识别了三相短路故障异常状态.而从图5(b)中可以看出,MSR 在强噪声的干扰下,虽然出现了最小特征值,但是仍远大于内径值,不能有效识别故障异常状态.
分析图6可以得知,所有特征值数据点均超出内径限定值,只能收敛在双环范围内.这表明由于噪声的存在,MSR 方法无法感知电力系统异常状态,导致方法失效.
完成对方法的有效性和适用性分析后,在装有Matlab R2014a软件的计算机上对两种方法的计算效率进行对比分析.对上述3种算例的计算耗时进行对比可知,随着矩阵维度的增加,两种方法的计算耗时均在上升,但MESCM 的计算耗时和上升幅度均为最低,见表1.矩阵维度为38×120时,MESCM 的计算耗时为MSR 的1/4,矩阵维度为62×200 时,MESCM 的计算耗时为MSR 的1/3,矩阵维度为200×300时,MESCM 的计算耗时为MSR 的1/5.
表1 两种方法的计算耗时比较
2 基于Spiked模型的电力系统异常状态动态感知方法
2.1 基于Spiked模型的电力系统异常动态感知路径
(1)全局信噪比估计
此处假设PMU 的数量为N(N≥1),定义x i为某个PMU 的交流电信号,定义T为信号长度.对原始交流电信号x i进行过滤处理,提取到直流分量xfi,见式(4).
利用Kaiser窗来描述信噪比,并将其定义为可调窗口函数,并对其时域进行描述:
定义上式中的I0(β)为第一类变形零阶贝塞尔函数.噪声的整体水平和β数值呈现出正相关趋势,越小的β值越容易降低SNR 估计值,而过大的β值也会导致计算误差偏大.所以,为了能够保证SNR 估计值处于合理水平,将选取准确度较高的β值(β=38),并且对窗值w i(n)的均方根wRMSi和平均值μ(w i)进行计算.
运用离散时间傅立叶变换(discrete time fourier transform,DTFT)变换时域信号xf为频域信号x i(ejω),并得到功率谱密度P i(ejω):
由式(7)计算带宽:
计算功率密度平均幅值:
真实信号功率Pri为:
噪声信号功率Pni为[15]:
信噪比:
如果噪声的变化没有明显波动,则将全局信噪比定义为ρG[16],见式(12):
(2)动态阈值模型
由于计算维度不断增加,过去传统的统计方法可信度越来越低,因此基于M-P 律,Spiked 模型被提出,也取得了一些初步的研究成果[17-18].并且,很多研究团队在频谱感知中加入了Spiked 模型来设定阈值.本文在电力系统中进行了应用,以此对电力系统异常状态进行感知检测,将核心定义为0<c<1,如果c开平方之后的数值小于ρG,则矩阵S的最大特征值应收敛于:
在此定义全局信噪比为ρG,其中σ2=1.结合文献[18]中设定阈值的内容,在此设定Spiked模型的动态阈值函数为:
将上式中的α定义为比例系数(0≤α≤1),数值的大小可以通过T进行调整.增大α数值能够显著增强去噪能力,获得更多的信号数据,但是过高的α数值缺点也很明显,即弱信号的数据很容易被掩盖;降低α数值能够有效捕捉弱信号,但是过小的α数值会突出多余的冗杂信号.因此,本文设置合理的α数值(α=0.5).
(3)方法步骤
Step1:采集引入噪声的PMU 数据构建数据源矩阵Xs;
Step2:定义采样时刻和窗口宽度为t1和T,计算阈值函数γ;
Step3:对数据源矩阵Xs进行运算,最终得到动窗口矩阵X,维度为N×T维;
Step4:利用数据标准化手段处理Step3的X,得到非Hermitian矩阵X n;
Step5:对矩阵X n样本协方差矩阵S和特征值进行计算;
Step6:从Step5计算得到的特征值中筛选得到最大特征值λmax,并将其定义为异常状态指标;
Step7:如果电力系统异常状态判断正确,则重复Step3至Step7,如果不正确,将采样时刻t i定义为t i+1,对数据进行迭代计算,整个流程如图7所示.
图7 基于Spiked模型的电力系统异常状态检测流程图
2.2 基于Spiked模型的电力系统异常动态感知测试
2.2.1 完整信息下异常负荷损失测试
测试前设置2 500个数据采样点,并对信噪比场景进行设置:低信噪比ρG=(18±0.3)d B,高信噪比ρG=(30±0.3)d B,将采样时刻t0至t510设置为无异常事件,并且从时刻t511开始直至t1500结束,将节点15的功率从320 MW 跃迁至360 MW,此段设置为异常事件.除了节点145之外,将其余144个节点中的发动机节点数据和负荷节点数据构成288维数据源矩阵.选取120组采样数据,由当前时刻的1组数据和119组历史数据,将滑动窗口的T设置为500.对高信噪比和低信噪比场景进行数MESCM 指标的变化曲线进行分析,如图8所示;同时,对文献[12]方法的实验结果分析,得到了如图9所示的MSR 指标变化曲线.图10为该状态下的谱半径示意图.
图8 完整信息下MESCM 变化对比(基于Spiked)
图9 完整信息下MSR 变化对比(基于Spiked)
图10 完整信息下谱分布示意图(基于Spiked)
从图8~10的数据分析结果可以看出,时刻t511时的信号出现了波动,节点负荷出现了明显的跃降行为.虽然测试过程中加入了强烈的干扰噪声和随机噪声,但是电力系统网络的随机性仍然被打破.
MESCM 和MSR 两种方法的实验效果均能表明电力系统的异常状态能够被准确有效地检测出,并且在鲁棒性方面基于Laplace噪声的MESCM 的效果更好.同时,MSR 在低信噪比情况下的最小特征值未突破内径值,所以这也表明MSR 无法准确检测出电力系统异常状态.
分析上图可以得知,当信噪比较高时,MSR 值降低至0.631,这代表当电力系统异常状态出现时会导致MSR 值与内径的限定值出现较大偏差,换句话说,特征值的分布出现了“坍缩”.然而,如果是在信噪比较低时,MSR 值降低至0.770,特征值并未超出内径限定值,这代表低信噪比时的异常状态无法准确感知.
2.2.2 非完整信息下三相短路故障测试
对剔除节点后的信息进行非完整信息适应性检测.在145个节点中随即剔除2个节点(67/120)及与2个节点相关联的5 个节点(66/69/119/121/125).随后,除了节点145之外,将其余137个节点中的发动机节点数据和负荷节点数据构成274维数据源矩阵.选取120组采样数据,由当前时刻的1组数据和119组历史数据,将滑动窗口的T设置为500.对高信噪比和低信噪比场景进行数MESCM 指标和MSR指标的变化曲线分析,如图11~12所示.
图11 非完整信息下MESCM 变化对比(基于Spiked)
图12 非完整信息下MSR 变化对比(基于Spiked)
由图11~12分析可知,当信息处于非完整状态下时,两种方法在高信噪比场景下的最大特征值均能突破阈值,这表明可以准确有效地识别三相短路故障异常状态;而在低信噪比场景下,MSR 的最小特征值为0.738 6,并未突破内径,因此无法准确有效地识别异常状态.MESCM 的最小特征值为12.468 3,突破了阈值,表明能有效识别三相短路故障异常状态.
3 电力系统关键节点辨识方法
基于模型驱动的分析思路就是电力系统的内在运行机理和影响因素联系,对电力系统的运行态势进行特征关联.而数据驱动的分析方法则不局限于固定的系统模型,可以忽略电力系统的复杂结构和电网规模,能够简化电力系统模型结构,对海量电网数据进行特征提取和数据挖掘,找到数据与电力系统态势的关联性[19].此处对RMT 的相关性进行分析,并提取电力系统的多状态数据,积分了平均谱半径,对电力系统的数据高维矩阵进行相关性分析.
3.1 增广矩阵法
此处假设PMU 的数量为N(N≥1),定义t i为随机选取的采样时刻,采集到的信号数据在时间序列下构成了列向量Xs(t i)=(X1,X2,…,X N)T,在此基础上形成了数据源矩阵Xs,在一些需要特定关注的环节可以增加此环节的次数,即为复制k次,所以随机矩阵Xs的增广矩阵De见式(15):
在上式中引入De,n的噪声矩阵,定义为η,对数据相关性的描述可以体现在De,n与GA的MSR 之差,见式(17):
任意的采样时刻t中存在节点na,与电力系统的运行状态呈现出的相关性可通过上式sMSR表示[20].
3.2 熵理论
T.Clausius早在一百多年前就针对热力系统中的物质状态进行描述,提出了描述状态程度的量化指标——熵理论.而在复杂的电力系统中也得到了广泛应用,运用熵理论对电力系统内部的物理特征进行多方面描述,阐述了物理系统内部状态量的变化.
熵理论的定义为描述物理系统内部的混乱状态的物理量.熵的数值越大,代表系统内部越混乱,数值越小代表系统的有序性越强.对于系统所处的不同状态所对应的概率p(w i)(i=1,2,…,l),均有不同的系统熵值,定义式[21]为:
定义上式的状态数为l,而C1为普通常数定值.
3.3 关键节点辨识方法
在此定义,电力系统内部的不同节点如果发生扰动,则可以通过对所有节点进行增广矩阵的构造,对不同节点进行MSR 的计算,准确分析不同节点的变化特征.对1号节点和2号节点分别设置了1.5 s左右的电压短路故障,图13为M-P律得到的MSR,图14为扰动电压的变化取消.
图13 电压扰动在不同节点的示意图
图14 节点扰动电压示意图
由于电力系统中的不同元部件或者网络节点存在较强的耦合关系,单一节点的扰动同样会造成与节点相互关联的其他节点出现较大的波动,通过M-P率能够将变化率转化为MSR 计算数值的波动.从图13~14可以看出,节点2在出现电压扰动的时候会出现更为复杂和明显的压力波动信号,这就意味着节点2对于电力系统的影响更大,如果故障节点的压力扰动越大,则代表MSR 计算的波动也就越大.但是文献[22]却由于运用错误的方法[23]误判得出了相反的结论.究其原因,MSR 的评价指标过于简单,不能对复杂的电力系统进行准确分析.而sMSR却能够对MSR 计算数值进行衍化,能够在扰动电压下对复杂电力系统内部的数据相关性进行定量定性的分析[22].
为了能够对上述电力系统关键节点进行准确辨识,此处改进了文献[22-23]的辨识方法和分析手段.定义系统的谱分布集合为F∈C n×m,对某个关键节点sMSR进行数据相关性分析,便得到概率化公式:
对节点总数为n的第i个节点进行概率化计算得到的数值定义为sMSR,对应熵值p:
越为关键的节点其p值越小.
3.4 验证分析
为了对电力系统的数据相关性进行分析,并且验证改进的关键节点辨识方法,本文取C1=1,并且对除了平衡节点39 之外的其余节点设置三相短路故障,将系统仿真得到的相关性数据计算熵值,对关键节点的熵值进行排序,见表2.
表2 关键节点辨识结果对比
从表2的辨识结果对比分析可知,文献[22]在节点2、3、4、5、8和9出现了误判现象,文献[23]在节点1、5、6、7和9出现了误判现象,所以本文对文献[22](基于RMT 联合指标)和文献[23](基于MSR 结合熵理论)的辨识结果进行了改进,不仅保证了原有的辨识结果的准确性,也降低了文献中出现的误判现象.并且,与这两种方法相比,本文方法对关键节点的辨识数量更大,准确度更高.文献[24](基于层次分析法)在节点5、6、7、8和10出现了误判现象,这是因为该方法融合了系统操作人员的主观意见和部分关键节点的客观系统数据,结合了层次分析法和信息熵分析方法,对不同指标设置了占比不同的权重,综合来辨识关键节点,所以具有一部分的人工经验误判现象.文献[25](基于潮流熵)在节点1、3、4、5、7和8出现了误判现象,是通过计算断开电力系统支路的潮流分布熵,当电力负荷出现过大的扰动,则会导致电力系统越限的概率越大,所对应节点的潮流分布熵越小,也就能判断哪个节点越关键.但是由于电力系统的潮流分布熵受电力负荷的扰动影响较为敏感,所以出现较大程度的误判现象.文献[26](基于复杂网络理论)在节点3、6、7、8和9出现了误判现象,判断关键节点的方法是基于一种新的综合介数,将复杂电力系统发生改变后的脆弱性变化通过短线冲击进行分析.以上几种方法都是从某一种电力系统的物理特征着手,对物理参量进行抽象化分析,最终辨识到电力系统关键节点.
而本文使用了随机矩阵理论(RMT),运用数据驱动技术关联了海量电力数据之间的数据特征,综合不同方法的优势并且加入了相关性分析,提出了一种新型关键节点辨识技术.与文献[22-26]抽象分析物理参量的方法不同,本文使用了特征值关联、数据挖掘和优势方法相结合的方法,提高了辨识技术的有效性和准确性.
4 结语
为了提高复杂电力系统的抗噪能力,提高异常状态的检测精度,改善关键节点的辨识结果,本文基于随机矩阵理论(RMT),研究了电力系统态势感知中的电力系统异常状态感知方法和关键节点辨识方法.提出了基于样本协方差矩阵最大特征值(MESCM)的电力系统异常状态感知方法,验证了方法具有抗噪性能高、计算耗时少的优点,提高了异常状态感知的抗噪能力和计算效率.利用Spiked 模型改进了MESCM 感知方法,对电力系统的异常状态实现了动态感知,提出了基于Spiked模型的电力系统异常状态动态感知方法.对RMT 进行相关性分析,结合熵理论提取了电力系统原始数据的有效信息,对电力系统网络的关键节点进行辨识,提高了谱半径分析法(MSR)的准确度和鲁棒性.本文方法能够有效反映电力系统异常状态的演化方向及其分布,可用于支持电力系统预防、检修和运维,辅助电力系统决策.