电力大系统振荡数据的可靠性挖掘算法
2015-03-15刘鑫
刘 鑫
(湖南铁道职业技术学院,湖南 株洲 412001)
电力大系统振荡数据的可靠性挖掘算法
刘 鑫
(湖南铁道职业技术学院,湖南 株洲 412001)
提出一种基于频谱包络特征提取和时频分析的电力大系统振荡数据的可靠性挖掘算法。构建了电力大系统数据传输和存储模型,对电力大系统中的数据进行频谱包络特征提取,以此为数据基础,对电力大系统数据信息库振荡数据的包络矢量实行高斯离散采样,采用决策树分类方法对时频分析后的振荡数据进行初步的数据筛选,采用时频分析和决策树分类方法实现对振荡的可靠性分类挖掘。仿真结果表明,采用该算法进行电力大系统中的振荡数据频谱包络特征提取,能有效挖掘出电力大系统中的振荡数据的分层结构特征和细节,数据挖掘精度较高,抗干扰性能较强。
电力大系统;振荡数据;数据挖掘
电力大系统作为国民经济的基础设施,为经济社会发展和人民生产生活提供可靠的电力能源支持,电力大系统是实现电力发电、输电、配电和电力信息管理的综合系统,电力大系统是由大量的敏感电子元件组成。电力大系统设备包含变电设备、输电设备、配电设备三个单元的电子器件设备。在电力大系统运行中,电力大系统设备规模复杂,工作环境恶劣,存在来自于发电系统、输电系统和配电系统的干扰和电磁干扰会产生大量的振荡数据,影响了电力系统在信息传输和配电过程中的稳定性和可靠性。电力大系统中的振荡数据将对电力大系统的电机和稳压设备的电压输出造成影响,导致电力大系统的供电输出功率不稳定,配电系统紊乱,需要对电力大系统的振荡数据进行有效挖掘,提高系统的稳定性和可靠性[1]。
电力大系统的振荡数据具有非线性、自耦合性等特点,传统方法中重要采用的是功率谱特征提取、时频特征提取和小波包分解等方法实现对电力大系统的振荡数据挖掘,随着电力大系统的振荡数据出现非线性逆变和自耦合[2],传统方法难以实现对振荡数据的有效挖掘,对此,相关文献进行了算法的改进设计,其中,文献[3]提出一种基于非线性时间序列分析和自相关特征提取的电力大系统的振荡数据特征检测和数据挖掘算法,提取电力大系统数据信息流的自相关特征,通过神经网络分类器实现数据挖掘,挖掘的准确度较高,但是算法的计算量大,计算开销对系统的实时性造成了限制。文献[4]提出一中基于PID控制和模糊神经网络分类的电力大系统的振荡数据挖掘算法,通过对振荡数据的自适应控制调节,实现数据挖掘,但是该算法的时效性差、控制精度不好;文献[5]采用决策树特征分类方法进行电力大系统振荡数据的可靠性挖掘算法,在振荡数据序列的广域子空间中产生大量干扰噪声,数据挖掘的精确度不高。针对上述问题,本文提出一种基于频谱包络特征提取和时频分析的电力大系统振荡数据的可靠性挖掘算法。首先构建了电力大系统数据传输和存储模型,实现数据的信号模型构建,在此基础上对电力大系统中的数据进行频谱包络特征提取,以此为数据基础,进行振荡数据挖掘,采用时频分析和决策树分类方法实现对振荡的可靠性分类挖掘,最后通过仿真实验进行了性能验证,展示了本文方法在提高数据挖掘精度,降低数据挖掘的误差方面的优越性能,得出有效性结论。
1 电力大系统结构及数据信息流分析
1.1 电力大系统的数据信息存储结构分析
为了实现对电力大系统的振荡数据挖掘,首先需要分析电力大系统的数据信息存储结构,并分析电力大系统振荡数据的产生机理,首先构建电力大系统结构模型,电力大系统是一个由发电、输电、配电和电力信息管理系统构成的数据信息存储和通信的综合系统,电力大系统数据库主要由数据通讯系统、人机接口单元和程序控制单元以及电力数据调度单元组成[6-8]。电力大系统数据存储和信息通信结构模型示意图如图1所示。
图1 电力大系统数据存储和信息通信结构模型
(1)
其中,amn为单位区域内的电力大系统信息相对偏差,gmn(t)为振荡数据的振幅,电力大系统的信息节点和数据负载之间有如下映射关系:
(2)
(3)
式中 CSC,CSS——-电力大系统的节点信息分布的可靠度和安全承载强度。
电力大系统的振荡数据分析和检测机制主要是面向电力大系统的数据特征完整性保护、电力大系统的用户节点信息保护和访问控制保护(AccessControl,简称AC)展开,采用数据向量集分析电力大系统的振荡数据模型,定义为:
CSS={Co,In,Nr,Ac,Aa}
(4)
采用决策树分析方法,对电力大系统中的数据信息存储结构进行相空间重构,采用以下的相空间重构矩阵表示,电力大系统的数据信息存储结构矩阵为:
(5)
其中,m为电力大系统振荡数据的特征嵌入维数,为数据时间序列的长度,矩阵表示N条记录的电力大系统振荡数据信息的特征数据集,通过上述分析,实现了对电力大系统的数据信息存储结构分析和振荡数据产生机理分析,为进行振荡数据挖掘提供准确的数据基础。
1.2 电力大系统振荡数据的信息模型构建
在上述进行电力大系统的数据信息存储结构分析的基础上,进行数据信息流的信号模型构建。设电力大系统振荡数据的自特征序列P={p1,p2,…,pn}和分解序列Q={q1,q2,…,qm},在电磁干扰下,振荡数据的特征状态子空间模态函数为:
(6)
式中P——数据时间序列的时间标量序列主频特征;x(t)——系统振荡数据的标量长度;τ——时间尺度。
数据的统计信息特征表示为:
U={U1,U2,…,UN}
(7)
式中Ui——维数为d维的状态矢量。
假设一个电力大系统振荡数据时间序列由一非线性差分方程表示,振荡数据的多元特征线性方程为:
xn=x(t0+nΔt)=h[z(t0+nΔt)]+ωn
(8)
式中h(.)——电力大系振荡数据的多元数量值函数;ωn——观测或测量误差。
采用相空间重构方法对振荡数据进行预测,在m维相空间中,M是d维的紧流形,通过特征参量重构,电力大系统振荡数据在m维相空间中形成一种规则的、有形的维矢量场为:
X(n)={x(n),x(n+τ),…,x(n+(m-1)τ)}
n=1,2,…,N
(9)
其中,电力大系统振荡数据时间序列的时间标量序列为{x(t0+iΔt)},i=0,1,N-1计算电力大系统振荡数据时间序列的几何不变量,得到其相空间重构的矢量场轨迹为:
X=[s1,s2,…sK]n=(xn,xn-τ,…,xn-(m-1)τ)
(10)
其中,K=N-(m-1)τ表示振荡数据信息模型在相空间中的嵌入维数,τ为时间延迟,sK为单个监测节点的振荡数据振幅,综上描述,实现对电力系统振荡数据的信号模型构建,在此基础上进行特征提取和数据分类,进行振荡数据可靠性挖掘。
2 电力大系统振荡数据挖掘算法改进实现
在上述进行了电力大系统振荡数据的信息模型构建的基础上,进行电力大系统振荡数据挖掘算法设计,传统方法采用的是决策树特征分类方法进行电力大系统振荡数据的可靠性挖掘算,在振荡数据序列的广域子空间中产生大量干扰噪声,数据挖掘的精确度不高。为了克服传统方法的弊端,本文提出一种基于频谱包络特征提取和时频分析的电力大系统振荡数据的可靠性挖掘算法。算法改进设计的关键技术描述如下:
电力大系统的分布模型中,节点的位置为y=[y1,y2,…,yN]T,ηn∈Ωη,n=1,2,…,N每一个节点需要进行电力数据传输和同行的频谱为:
(11)
(12)
其中ρ∈(0,1),假设电力大系统振荡数据信息流是一组LMF信号,振荡数据的时频特征函数为:
(13)
其中,t为电力大系统振荡数据采样时间点,x(t)为相位差异信息,τ为时延参数,P为振荡数据的能量密度谱。对振荡数据的数据信息流x(t)的进行时频变换,定义为:
(14)
其中,h*(τ-t)表示时频变换的传递函数,它的实质是加了窗的傅立叶变换。计算电力大系统数据库信号模型的能量密度谱:
(15)
(16)
其中,x(t)是振荡数据进行信息传输的最短路径上的平方可积函数,ψ(t)是包络特征基函数,同参数a和τ有关。对振荡数据的包络特征计算瞬时频率时间平均即
(17)
r1=x(t)-c1
(18)
wij=β×w(epkq) (β>1)
(19)
在振荡数据挖掘过程中,来自多分量电力大系统振荡数据挖掘信息特征中出现不同时频强度的交叉作用,产生干扰,其中干扰项为:
n(t)=Fα·x(t)
(20)
X=[Xα(0),Xα(1),…,Xα(N-1)]T
(21)
其中,Fα是N×N维的频谱包络特征矩阵,设计一个原始实值时间函数h(t),对电力大系统数据信息库振荡数据的包络矢量z(t)实行高斯离散采样,经过筛分过程,数据结果满足:
(22)
通过上述分析,采用决策树分类方法对时频分析后的振荡数据x(t)进行初步的数据筛选,得到数据筛选后的第个电力大系统数据信息库振荡数据的挖掘的判别函数为:
(23)
其中,α为决策树类别调节系数,W为电力大系统的频谱包络特征,取值范围为0≤α≤1。通过上述算法设计,由此实现数据挖掘算法改进。
3 仿真实验与结果分析
为了测试本文算法在实现对电力大系统振荡数据可靠性挖掘中的性能,进行仿真实验。真实验的软件环境建立在Matlab仿真软件基础上,硬件环境为:Inter Pentium 4 3000MHz内存,操作系统为Windows 7。构建电力大系统模型,电力大系统振荡数据的信号模型表型为一组频带为3~17 KHz、时宽为10 ms的窄带调频信号,电力大系统振荡数据序列采集中,采集的频率测试为f0=1 000 Hz,数据的随机采样率为fs=10×f0Hz=10 KHz,电力大系统振荡数据的初始校验频率B=1 000 Hz,采样点N=201,适应度值为v=1 000,调控因子λ=0.25,电磁环境交叉项干扰强度n=5 dB,在上述参数设计和仿真环境描述的基础上,采用本文算法进行算法编程设计与实现。进行电力大系统振荡数据挖掘仿真和性能分析,在电力大系统数据信息流中选择一个小样本,对样本进行分析采集,得到原始采样的电力大系统中的数据信息分布仿真结果如图2所示。
图2 原始采样的电力大系统中的数据信息分布
以上述的数据采样为样本测试集,假设电力大系统数据信息库信息流矢量长度为N,N=2 048,对电力大系统信息流序列进行相空间重构和随机相位离散化处理,采用本文方法进行频谱包络特征提取和时频分析,得到电力大系统中的振荡数据频谱包络特征提取结果如图3所示。
图3 电力大系统中的振荡数据频谱包络特征提取结果
从图3可见,采用本文算法进行电力大系统中的振荡数据频谱包络特征提取,能有效反应出电力大系统中的振荡数据的分层结构特征和细节,能有效实现对电力大系统数据信息库振荡数据挖掘,为了定量分析本文算法的挖掘性能,采用本文算法和传统算法,采用10 000次蒙特卡洛实时,在SNR=-10 dB~0 dB范围内,以数据挖掘精度为测试指标,得到仿真对比结果如图4所示。从图4可见,采用本文算法,对振荡数据的挖掘精度较高。
图4 振荡数据挖掘精度对比
4 结语
在电力大系统运行中,电力大系统设备规模复杂,工作环境恶劣,存在来自于发电系统、输电系统和配电系统的干扰和电磁干扰会产生大量的振荡数据,影响了电力系统在信息传输和配电过程中的稳定性和可靠性。
需要对电力大系统的振荡数据进行挖掘,提高系统的稳定性和可靠性,本文提出一种基于频谱包络特征提取和时频分析的电力大系统振荡数据的可靠性挖掘算法。首先构建了电力大系统数据传输和存储模型,实现数据的信号模型构建,在此基础上对电力大系统中的数据进行频谱包络特征提取,以此为数据基础,进行振荡数据挖掘,采用时频分析和决策树分类方法实现对振荡的可靠性分类挖掘,实验结果表明,采用本文算法进行振荡数据挖掘的精度较高,性能优越。
[1]孔英会,车辚辚,苑津莎,等. 基于小波分解和数据挖掘中决策树算法的电能质量扰动识别方法[J]. 电网技术, 2007, 31(23): 78-82.
KONG Ying-hui, CHE Lin-lin, YUAN Jin-sha, et al. A power quality disturbance identification method based on wavelet decomposition and decision tree algorithm in data mining[J]. Power System Technology, 2007,31(23):78-82.
[2]李红升. 基于粒子群算法改进电力信息系统的安全研究[J]. 科技通报, 2013, 29(4): 158-161.
LI Hong-sheng. Study on safety evaluation and application of electrical enterprise information system safe model based on improved particle swarm algorithm[J].Bulletin of Science and Technology,2013,29(4):158-161.
[3]郭 丽. 面向PID电力系统信息安全自动控制研究[J]. 科技通报, 2013, 29(2): 39-41.
Guo Li. PID oriented information security in power system automatic control research[J]. Bulletin of Science and Technology,2013,29(2):39-41.
[4]杨 来,史忠植,梁 帆,等. 基于 Hadoop 云平台的并行数据挖掘方法[J]. 系统仿真学报, 2013, 25(5): 936-944.
YANG Lai, SHI Zhong-zhi, LIANG Fan, et al. Parallel approach in data mining based on Hadoop cloud platform[J].Journal of System Simulation,2013,25(5):936-1111.
[5]张国良,姚二亮,汤文俊,等. 一种自适应的GraphSLAM鲁棒闭环算法[J]. 信息与控制, 2015,44(3): 316-320,327.
ZHANG Guo-liang, YAO Er-liang, TANG Wen-jun, et al. An adaptive robust loop closure algorithm for graph SLAM[J].Information and Control,2015,44(3):316-320,327.
[6]王 进,阳小龙,隆克平. 基于大偏差统计模型的 Http-Flood DDoS检测机制及性能分析[J]. 软件学报, 2013, 23(5):1272-1280.
WANG Jin, YANG Xiao-Long, LONG Ke-Ping. Http-Flood DDoS detection scheme based on large deviation and performance analysis[J]. Journal of Software,2013,23(5):1272-1280.
[7]郑海雁,王远方,等. 标签集约束近似频繁模式的并行挖掘[J]. 计算机工程与应用, 2015, 51(9): 135-141.
ZHENG Hai-yan, WANG Yuan-fang, XIONG Zheng, et al. Parallel mining on label-constraint proximity pattern[J]. Computer Engineering and Applications, 2015,51(9): 135-141.
[8]邢长征,刘 剑. 基于近邻传播与密度相融合的进化数据流聚类算法[J]. 计算机应用, 2015, 35(7): 1927-1932.
XING Chang-zheng, LIU Jian. Evolutionary data stream clustering algorithm based on integration of affinity propagation and density[J].Journal of Computer Applications,2015,35(7):1927-1932.
(本文编辑:杨林青)
Reliability Mining Algorithm for Power System Oscillation Data
LIU Xin
(Hunan Railway Professional Technology College, Zhuzhou 412001, China)
This paper presents a reliability mining algorithm for power system oscillation data based on spectral envelope feature extraction and time frequency analysis. Construct the power system data transmission and storage model, conduct the spectral envelope features extraction for power system data, based on this basic data, implement discrete Gaussian sampling on power system data repository oscillation data envelope vector, do the preliminary vibration data screening after time-frequency analysis by using decision tree classification method, then achieve the reliability classification mining of oscillation data by using frequency analysis and decision tree classification method. Simulation results show that the algorithm can effectively extract the hierarchical structural features and details of the vibration data in power system with a strong anti-interference performance.
power system; oscillation data; data mining
10.11973/dlyny201506020
刘 鑫(1982),男,硕士,讲师,主要研究信息系统项目管理、软件工程和大数据分析等。
TP391.9
A
2095-1256(2015)06-0831-05
2015-10-28