智能电网下变电运行的数据需求及数据结构分析
2020-06-29刘成华
摘要:对智能电网模式下变电站运行所需的数据进行了分析,发现变电站数据虽然复杂,但其可以归结为三类——离散数据、矢量数据、流媒体数据。通过对这三类数据分别进行管理和针对性治理、挖掘,可以实现对变电站数据更高效的管理,使其充分服务于智能电网。
关键词:智能电网;变电运行;数据需求;数据结构;数据分析
0 引言
从最初的五防系统开始,变电站的运行已经进入大数据时代。智能电网的CBA模式,即云计算(Cloud Computing)、大数据(Big Data)、人工智能(Artificial Intelligence),均需對变电站数据进行更高效率的管理。本文重点讨论智能电网下变电站运行的数据采集需求和数据结构分析方法。
1 变电运行的原始数据来源
变电运行数据中,以各级母线及相关设备中安装的互感器获得的电流和电压数据为核心数据,其中包括三相母线各自的互感器数据,中性线、接地线的互感器数据等。另外,还需采集部分设备的温度(一般以红外探头实现)、振动(一般以激光陀螺仪实现)、声音、油量等数据。虽然变电运行的数据来源较为复杂,但从数据来源的原始数据结构分析,主要原始数据只有三种:
1.1 双精度浮点离散数据
来自电压互感器和电流互感器、油量计、流量计、计数器等的数据,均属于双精度浮点离散数据。离散型数据更容易进行信度分析、效度分析、回归分析、状态空间分析等数据治理和初步分析。
1.2 流媒体数据
来自红外摄像探头、音频探头等设备的数据属于流媒体数据,其中红外探头数据属于三维流媒体数据(含一维时间轴),声音探头数据属于一维流媒体数据。这些流媒体数据较难进行离散数据分析(信度分析、效度分析、回归分析、状态空间分析等),但可以直接在神经网络或模糊判断等计算模块中进行深入挖掘。
1.3 矢量数据
来自激光陀螺仪、加速度计等仪器的数据多属于矢量数据,这些数据的特征是相对离散、带有矢量信息,将这些数据求导,可以得到连续的路径信息。经过热力图分析、矢量叠加分析等,可以得到系统的振动特性和移动特性数据。同时可以将这些数据进行离散化,得到类似双精度浮点离散数据的相关数据,也可以将这些数据进行位图化,得到流媒体数据。
2 变电运行的数据治理及挖掘方案
首先,来自互感器的电流、电压等波形数据,可以使用基于逆向傅里叶回归的非线性正弦函数回归的模式进行计算。
波形数据正弦非线性回归的训练数据来源为1 s间隔采集的二次电压(U)和电流(I)数据,自变量为时间序列(t),单位为ms。
式中,A为振幅数据,表示波形在纵轴上的幅度;ω为振幅调整参数,表示波形在纵轴上的压缩程度;φ为初相参数,表示波形在横轴上的位移截距;b为截距参数,表示波形在纵轴上的位移截距;i为迭代次数,表示回归方程最终叠加的固定杂波的层数。
假定i为固定值,即仅考虑振幅最大的5层波形,最终得到两个回归参数阵列:
其次,其他回归及衍生的回归过程更适合进行线性回归。
在时间序列t上进行线性回归,回归方程式为:
在实际运行过程中,线性回归过程是动态过程,沿着时间轴线,其回归因子会发生变化。
最后,在数据治理中还有可能用到MIN-MAX投影、LN投影等数据治理方法,其中MIN-MAX主要用作数据的去量纲计算,即解决电压数据和电流数据相比较的问题;而LN投影一般与MIN-MAX投影结合使用,将MIN-MAX进行加1计算,使其区间从[0,1]区间移动到[1,2]区间,或者将MIN-MAX区间乘以某值,比如进行乘10计算,使其区间从[0,1]区间扩展到[0,10]区间,再进行加1计算后,进一步移动到[1,11]区间。
3 变电运行的数据结构分析
当前变电站的核心数据库一般采用分布式管理,即独立系统的数据存储在相关数据系统的管理系统中。一般变电站的独立系统的管理系统数据库采用微软的SQL Server数据库或者谷歌的MySQL数据库,少部分数据量较大的系统采用dBASE数据库或者Haddop数据库。
核心数据库分为4层:
第一层为数据硬件层:数据硬件层指互感器线圈、红外探头、音频探头、陀螺仪等数据采集使用的硬件设施,及相关硬件用于数据存储和分布式数据处理的CPU、RAM、SSD等硬件资源。
第二层为独立数据层:独立数据层指存储在分布式系统及分布式系统的服务器中的相关数据集合。这些数据一般只服务于独立系统,并不能形成跨系统的数据交互。
第三层为整合数据层:通过对变电站中所有独立数据系统进行实时查询并在中央大数据仓库中进行备份,形成整合数据。同时对这些数据进行初步治理,如各种回归及在回归基础上构建的多维度状态空间模型,将这些空间模型也在整合数据层中进行存储。
第四层为服务数据层:整合数据因为体量庞大,查询和更新时间都较长,所以无法进行直接利用,必须构建服务数据层。服务数据层一般使用源数据库结构实现。
4 结语
综上所述,变电站数据虽然来源和结构均较为复杂,但其可以归结为双精度浮点数据集、矢量数据集、流媒体数据集三种,在实际大数据管理中,可以针对这三种数据分别进行管理,同时可以根据数据的实际意义,开发数据治理、数据挖掘、数据可视化的相关工作,以实现对相关数据最大限度的利用。
[参考文献]
[1] 李永兴,刘连义.变电站数据采集器专线MODEM的设计[J].计算机与数字工程,2019,47(9):2315-2320.
[2] 国家电网首个联网运营多站融合变电站投运[J].农村电气化,2019(8):8.
[3] 韩军,马佳豪,李晓军,等.基于数据挖掘的变电站告警数据分析和巡检策略研究[J].电力大数据,2019,22(7):20-26.
[4] 郭怀东,侯新伟,胡玉平.基于电力物联网多源异构数据分析的变电站智能健康系统的研究[J].电气技术与经济,2019(3):1-2.
收稿日期:2019-12-12
作者简介:刘成华(1994—),女,青海西宁人,助理工程师,研究方向:变电运行。