电网分析模型数据的图表组织结构对比与适用性研究
2024-02-22李俊业张俊勃李凯航李淳袁伟健
李俊业, 张俊勃, 李凯航, 李淳, 袁伟健
(1.华南理工大学 电力学院,广东 广州 510640;2.华南理工大学 未来技术学院,广东 广州 511442)
0 引 言
在电网数字底座[1]中,电网分析模型需支撑大量调控业务的开展,其数据组织方式会影响业务执行效率。
目前,电网模型的组织方式主要有三类:①元件表组织,指以关系表结构组织电网模型数据,如文献[2-3]采用Access和MySQL数据库管理模型数据;②元件拓扑图组织,指以图数据表征元件拓扑关系,如文献[4-5]采用Neo4j、RedisGraph构建基于CIM电网模型,满足特定应用的拓扑检索需求;③层次化拓扑图组织,指在元件拓扑图基础上关联其他图层,例如文献[6]构建厂站-线路拓扑、站内拓扑图,文献[7]采用图整合电网发输变配用环节的要素。
上述研究初步分析了电网模型的图表组织优劣,但缺乏更为深入的定量探讨,其适用性并不清晰,致使在设计面向多业务的电网模型数据组织方式时缺乏准确的数学模型指导。
为此,首先构建电网分析模型的元件表、元件图和层次化电网图三种组织方式的数据模型,然后以PSD-BPA模型为例搭建数据库,在多种典型应用场景测试三者性能,分析其适用性。
1 电网分析模型的数据组织
基于本体论,元件数据建模考虑本体和关系两方面。
(1)元件本体及其属性。按元件类型分,静态元件包括母线和线路等,动态元件包括同步发电机等。分类可继续细化,例如同步发电机可分为三阶、五阶发电机等。
(2) 关系。可作为元件的连接属性,以隐式方式表达;也可作为独立对象,显式描述关系的两端元件。
1.1 关系表组织
关系型数据库是二维表的集合。表的行表示不同的个体,列表示个体的不同属性。二维表也可表达个体的映射关系,如<个体1-个体2-关系类型>表显式表达关系。
各类元件是不同的本体,可分别由单独的表组织各类元件及其参数。考虑到动态元件的控制复杂,模型子类数量大,故直接构建各种模型子类的数据表并不合理,可采用JSON按需组织同类元件下所有模型子类的参数,以提高存储效率。
1.2 元件图组织
图数据将本体和关系建模为有向图G(V,E),其中:V为节点集;E为边集。节点和边均包含标签和属性,其中标签用于指代节点和边的类型,属性用于扩展节点和边的信息。
电力元件拓扑天然是一张图。图的节点表征各类元件,其标签表征元件的模型类型,属性记录元件的ID、名称等信息。边表征元件之间的连接关系。静态元件间关系为电气连接,而动态元件通过关联关系挂接在静态元件上。
基于上述定义,元件图组织形态如图1所示。
图1 元件图组织
1.3 层次化电网图组织
根据实际需要,在元件图上增加与之关联的新图层,形成层次化电网图。图中节点和边的组织形式与第1.2节相同,不同的是可利用上下层图关系进行搜索剪枝,加快搜索速度。以增加厂站拓扑图为例,构建<厂站层-元件层>图,如图2所示。
图2 层次化电网图组织
2 案例与适用性分析
采用三个不同规模电网(见表1)的BPA模型作为测试数据,分别构建三种组织方式的数据库,以开展三者在典型检索场景下的适用性测试,测试电网如表1所示。
表1 测试电网
测试所用虚拟机配置4核CPU,内存20 GB。关系型数据库为MySQL(T),图数据库为Neo4j(N)、RedisGraph(R)。其中,前两者为硬盘型,后者为内存型,以进一步评估数据库载体对检索性能的影响。
2.1 元件参数检索
本案例中,表和图数据均存储元件的所有参数。开展100次检索某一元件下某一参数的随机试验,统计元件表和元件图耗时,其均值如表2所示。
表2 元件参数检索性能对比
可见,元件表的耗时均值几乎不随电网规模发生变化。这是由于关系表采用B+树优化检索,其检索复杂度降为O(logN)(N为元件规模)。
图的属性检索耗时结果与元件规模明显正相关。元件图(R)查询耗时在电网A和B上略优于硬盘型元件表,主要原因是内存的数据检索性能远高于硬盘,弥补了组织方式的不足。然而,元件图(R)在电网C上耗时约是元件表的2倍,说明在数据量大的场景,组织方式与检索需求不匹配逐渐凸显,并不能通过数据载体完全解决该问题。
可见,元件表在参数检索方面具有较大优势。由于硬盘型更为经济,后文的图将不再存储元件所有参数,而仅保留ID、名称等基本信息。
2.2 限定范围内的元件拓扑检索
元件拓扑检索常用于事故后分析和供电路径分析等场景,其检索工作为给定元件起点和深度的范围搜索。
针对元件表和元件图,在每级深度均开展50次随机起点的拓扑检索试验,测试结果如图3~图5所示。由于电网A规模限制,其后半段试验已经接近电网边界,故耗时趋于平稳。在电网B和C,元件表检索耗时呈快速增长趋势,且达到10 s以上,其在电网紧急业务中不可接受。
图3 电网A下元件拓扑检索耗时
图4 电网B下元件拓扑检索耗时
图5 电网C下元件拓扑检索耗时
拟合检索耗时与搜索深度的关系,结果如表3所示。在元件图中,R耗时起点低,但斜率稍高,故R和N耗时随深度的曲线存在交点,交点前R性能更优。元件表的检索耗时与检索深度呈三次关系,说明其不适合进行深度大的拓扑检索。
表3 元件拓扑检索耗时T(ms)与检索深度d关系
图6给出三者拓扑检索性能随电网规模变化的趋势。随着电网规模增大,元件表耗时曲线呈增长趋势,拟合曲线为T=0.5n-760(n为元件数)。元件图耗时拟合直线斜率小于0.01,说明元件图能够更好应对电网规模增长带来的拓扑检索复杂度问题。
图6 不同组织方式的拓扑检索性能随电网规模变化趋势
2.3 查询一定范围内厂站的元件
以某一厂站为起点,检索给定深度内的厂站范围,并查找范围内厂站所含元件,该检索常用于区域子网分析、事故影响范围分析等业务。测试①层次化图、②厂站拓扑图+元件表、③元件图、④元件表四种组织方案在电网C下所需耗时,如图7所示,拟合关系如表4所示。
由图7可见,层次化图的耗时约为元件图的1/10和元件表的1/40。对比表4拟合斜率大小,有方案①拟合斜率<方案②拟合斜率≈方案③拟合斜率<方案④拟合斜率。可见层次化图有效裁剪了元件的搜索空间,在多层关联检索方面具有绝对优势。
3 结束语
本文分析了电网模型的元件表、元件图、层次化图组织方式,并以BPA模型为例,对比分析三者在典型数据检索场景中的适用性。结果表明所构建的层次图结构明显优于元件图和元件表,其检索性能在多层拓扑检索场景中分别约为二者的10倍和40倍,图和表分别适用于关联检索和属性检索,具体总结如表5所示。适用性研究成果可为后续支撑多业务的电网数据组织设计与优化提供数据经验。
表5 3种组织方式的适用性(n为节点规模,d为检索深度)