APP下载

基于SDN的智能电网降维数据传输研究

2021-12-09李小焱

微型电脑应用 2021年11期
关键词:降维交换机数据包

李小焱

(国网山东省电力公司 济宁供电公司, 山东 济宁 272000)

0 引言

智能电网(SG)系统中智能设备生成具有多个异构属性的高维数据,并且其值随时间而变化[1]。数据的高维会影响大多数设计方案的性能,在对大数据进行有效存储之后,主要任务是通过底层SG网络高效地传输降维后的数据[2]。文献[3]重点介绍了智能电表生成数据类型和处理数据所需的技术。由于从各种智能设备定期生成的数据导致网络通信流量拥堵,因此,网络级的数据处理已成为SG系统面临的主要挑战[4]。文献[5]提出了在智能电表和电网之间,利用高级电表架构(AMI)蜂窝网络进行实时数据传输。因此,软件定义网络(SDN)作为高效的数据流量平台在SG系统中,可以在现有的网络基础设施上进行高效的数据流处理。文献[6]提出了一种基于SDN的微电网通信体系结构,以便为终端用户提供灵活可靠的服务。文献[7]利用SDN为SG系统设计了自主管理的变电站网络。SDN可减少延迟和提高吞吐量的形式提高传输性能,从而有利于大数据应用[8]。

针对SG系统中不同智能设备获取数据后的降维数据,本文设计了一种基于SDN的智能电网降维数据传输方案,设计了一种基于经验概率的控制算法(EPCS),用于计算在SG网络上转发降维数据的最佳路径。

1 SDN模型

为了更好地说明本文所利用的SDN模型优势,将SDN模型与蜂窝网络模型进行对比示例,如图1所示。

如果通过传统网络信道传输20 Mbits的数据帧,则以20 Mbps的数据速率到达目标节点需要1秒,如图1(a)所示。如果数据量被降维到16 Mbits,可以省略所有无用和不需要的值,则以相同的数据速率到达目标节点仅需0.8秒,如图1(b)所示。因此,数据量对传输时间有很大的影响。由于在SG系统中有大量的数据是无缝传输,因此,如果这些数据被减少,则有利于网络传输的整体性能。

(b) 路由方案得到的吞吐量图4 方案的评价结果

(a) 降维率与误差率之间的统计权衡

(b) 通过蜂窝网络传输的降维数据用时

(a) 通过蜂窝网络传输的原始数据用时

当网络遵循动态网络管理方案时,可以帮助实现更好的网络资源利用率,从而实现更高的吞吐量。例如,如果在蜂窝网络上传输降维的数据帧,则可以使用传统网络协议选择最短路径。在这种情况下,实现50 Mbps的数据速率以及25%的链路利用率和12.5 Mbps的吞吐量,如图1(c)所示。如果部署了诸如SDN之类的动态网络,则实现55 Mbps的数据速率以及25.2%的较好链路利用率和13.7 Mbps的增强吞吐量,如图1(d)所示。因此,通过在SG系统中部署SDN的网络基础设施用于数据管理,可以实现更好的吞吐量、数据速率和链路利用率。链路的更好利用还有助于减少网络基础架构的能耗。

(c) 通过传统网络传输的降维数据

(d) 通过SDN网络传输的降维数据

2 基于SDN的控制方案

本文提出一种以SDN作为SG降维数据传输的智能方案,以此对SG系统进行动态网络管理。SDN作为开放且可编程的平台,通过其良好的解耦平面可以实现智能且动态的网络控制。SDN从网络应用程序中抽象出底层基础设施,使得网络配置中的动态变化管理和重新配置变得容易[9]。利用SDN的可扩展性和高效性,可以有效地处理SG系统中不断生成的大数据流量。因此,将大数据降维技术与SDN相结合,可以为终端用户提供可扩展、高效的服务。本文使用3个平面设计了SDN网络模型:(1)数据平面;(2)控制平面;(3)应用平面,如图2所示。

图2 SDN网络模型三个平面设计

在该模型中,数据平面主要由交换机、转发设备和路由器等网络设备组成,数据从SG系统中的各种设备获取,如工业用电、家庭用电和商业用电。该平面使用OpenFlow协议(OFP)作为通信标准,将收集到的数据转发到上层平面[10]。在位于控制平面的服务器上,将采集到的数据降维处理,并结合控制算法对核心数据进行高效传输。因此,本文设计了一种基于经验概率的控制算法(EPCS)来估计SG网络上数据传输的最优路径。最后,应用平面为不同的用户和SG提供各种服务。

2.1 流量管理

数据平面由转发节点(FN)组成,如OpenFlow交换机、路由器和网关。在控制平面上,SDN控制器负责为FN做出转发决策。通过南向接口将这些决策配置为FN,结合位于FN的通道相互连接流量表和分组表。

由控制器提供的指令集遵循的流量表由不同的字段组成,例如,接口ID、指令、优先级、操作、端口号等。SDN模型的流量匹配过程如图3所示。

图3 SDN模型中的流量匹配过程

控制器交换通信的主要步骤如下。

步骤1:解析系统分析输入的数据包,以此确定如何对其进行处理,主要分为3个步骤:(1)标头识别,(2)字段提取,(3)字段缓冲。在分析数据包之后,输出数据将传输到查找标头。

步骤2:接收到输出数据后,查找功能从入口端口启动,并在出口端口结束。通常,使用两种查找方法:(1)精确匹配,(2)通配符匹配。精确匹配使用hash函数设置特定项的精确位置。通配符匹配是用于多表查找的复杂部分字符串匹配,旨在匹配条目的标头字段。

步骤3:当OpenFlow交换机接收到数据包后,匹配系统就会启动路由决策任务。如果在表中找到合适的匹配项,则执行相应的操作。在这种情况下,数据包将转发到相关端口,并且OpenFlow交换机更新其第一计数器,即匹配计数器。相反,如果匹配失败,则将数据包发送回控制器。在这种情况下,OpenFlow交换机更新其第二计数器,即不匹配计数器,控制器重构一个新的流量规则并将其插入到OpenFlow交换机。流量驱动规则缓存算法(FDRCA)[11]用于替换流量表中的条目,FDRCA是基于策略的算法,可通过特殊的替换策略来处理有限的缓存限制和不可预测的流量。

步骤4:使用流量表通道连接所有表(表1到表n),还可以使用分组表。

步骤5:使用计数器记录发送到控制器的数据包数量。

步骤6:成功匹配数据包标头字段后,在操作集将输出数据包定向到出口交换机端口。

每个OpenFlow交换机上维护的流量表条目,如表1所示。

表1 OpenFlow交换机的流量表条目

流量表条目(例如源ip、目标ip、优先级、端口号入口端口和操作)对于在不同实体之间进行数据传输的决策非常重要。但是,这可能会根据输入流的情况和要求动态变化。表1中各种流量表条目的具体说明如下。

(1) 表号:流量表的编号,即它在流量表管道中的相对位置。

(2) 条目ID:为OpenFlow交换机的流量表中的每个条目分配一个唯一的ID(主key)。

(3) 优先级:流量表中每个条目的重要性。

(4) 入口端口:传入数据包到达的物理端口及虚拟端口。

(5) VLAN id:包含13位虚拟LAN id和3位VLAN类型。

(6) IPv4地址(IPv4 dst):由32位IPv4地址组成。

(7) TCP地址(TCP dst):包含16位TCP源端口和目标端口地址。

(8) 操作:数据包与相关规则匹配后要遵循的说明。

(9) 计数器:分配给各种属性,如字节计数器、数据包计数器、标志、流量持续时间和丢弃的数据包数量。

2.2 基于经验概率的控制算法(EPCS)

在该算法中,所有的FN都可以表示为SDN-FN和非SDN-FN。通过至少一个SDN-FN的数据属于可控流,而不通过任何SDN-FN的数据视为不可控流[14]。对于网络Z(N,L),有N个节点和L个链路,c(l)表示信道容量;f(l)表示链路L上的流量。本文将流量表条目更新为新的流量表条目(Nr),将旧的流量表条目作为观测集,并将其反馈给SDN控制器的估计器,以此进一步预测或估计最优路径(Np)。

(1)

其中,np表示转发给控制器的新数据包;op表示流量表中的旧观测值。

(2)

(3)

基于经验概率的控制算法(EPCS),如下所示。

THRcrlb的值是使用CramrRao下限(CRLB)方法计算得出[15]。文献[15]指出,任何无偏估计量的方差至少与Fisher信息的逆(I(θ))一样。如果估计器达到CRLB,则其有效。使用CRLB进行MSE的条件如式(4)。

(4)

其中,I(θ)表示如式(5)。

(5)

3 结果讨论

本文利用单个家庭用电量的数据集,对所提出的基于EPCS的SG设备降维数据传输SDN模型进行评估。该数据集以每分钟的采样率收集了大约4年(2015年12月至2019年11月),共2 075 259个测量值,数据集包含一些缺失值以及各种次级计量值和电量值。利用R编程和MATLAB将仿真结果进行比较,为了评估SDN在传输SG降维数据方面的性能,在Mininet网络仿真器中设计了一个网络拓扑。

3.1 评价参数

本文利用以下评价参数对所提出的方案进行了评估。

(6)

(2) 统计权衡:降维前后数据误差率(ρ)和降维率(λ)之间的权衡,并且彼此成反比,如式(7)。

(7)

(3) 传输延迟(d):特定路由器上的延迟,包括处理延迟(dpr)、排队延迟(dq)、传输延迟(dt)和传播延迟(dpg),如式(8)。

d=dpr+dq+dt+dpg

(8)

(4) 吞吐量:指通过通信信道成功传递消息的速率,也可以称为数据处理的最大速率。

3.2 评估结果

将采集到的SG数据进行降维处理,利用本文所提出的SDN模型对降维后的数据进行传输,实验结果如图4所示。

图4(a)表明,降维后的数据误差率较低,保留较高的核心数据信息,因此,可以达到最小化误差率的总体目标,并且满足后期SDN传输的要求。当从各种SG设备获取的数据保留为核心数据时,则使用SDN基础设施在SG网络上进行处理和传输。为此,本文设计EPSC算法来估计简化数据的最优路径。在对所提出的方案进行评估后,所有性能指标都显示出适当的增长。图4(b)表明,采用EPCS算法可以得到更高的吞吐量。基于EPCS路由估计器的评价结果如图5所示。

图5(a)给出了使用所提出基于EPCS路由估计器和SDN在SG网络上传输简化数据时所产生的延迟,与标准的SDN路由方案(不利用EPCS的OpenFlow算法)相比,将数据传输到目标节点所引起的延迟更小。图5(b)给出了得到的估计精度,结果表明,最优路径估计精度明显优于标准的OpenFlow算法。在增加丢包率的情况下,其准确度下降较小。图5(c)给出了使用所提出基于EPCS路由估计器的带宽使用情况。控制方案在SG网络上传输降维数据时,可用带宽得到了最佳利用。利用EPSC估计路线的RMSE值,如表2所示。

(a) 传输延迟

(b) 估计精度

(c) 带宽使用情况图5 基于EPCS路由估计器的评价结果

表2 EPCS的RMSE值

上述讨论的评估结果描述了该方案在各种性能指标下的有效性和效率。

4 总结

针对SG设备产生的海量数据,本文利用SDN模型为基础,提出了基于EPCS的SDN控制方案用于计算数据降维后的转发路径。结果表明,所估计的路径具有较低的传输延迟和较高吞吐量的特点,并且保持了较高的路由估计精度。最后,带宽利用率保持稳定,避免了任何拥塞或带宽利用率不足。

猜你喜欢

降维交换机数据包
混动成为降维打击的实力 东风风神皓极
二维隐蔽时间信道构建的研究*
民用飞机飞行模拟机数据包试飞任务优化结合方法研究
降维打击
基于地铁交换机电源设计思考
SmartSniff
修复损坏的交换机NOS
缔造工业级的强悍——评测三旺通信IPS7110-2GC-8PoE工业交换机
一种改进的稀疏保持投影算法在高光谱数据降维中的应用
基于特征联合和偏最小二乘降维的手势识别