APP下载

SDN中控制器的故障切换需求分析

2016-01-01朱兴浩

无线互联科技 2016年24期
关键词:多域可用性交换机

朱兴浩,李 书,陶 君

(重庆邮电大学通信与信息工程学院,重庆 400065)

SDN中控制器的故障切换需求分析

朱兴浩,李 书,陶 君

(重庆邮电大学通信与信息工程学院,重庆 400065)

由多域SDNs提出解决了单控制器的可扩展问题,在可靠及可用性方面得到了一定的提升。然而在多域SDNs中,控制器的故障问题仍然存在,网络的可用、可靠性仍然无法保证。因此文章在对相关故障切换机制进行充分研究后,对故障切换进行了需求分析。

多域SDN;故障检测;故障切换;可用性

软件定义网络(Software Defined-Networking,SDN)[1]作为一种新型的网络架构,其主要思想是将控制平面与数据平面相分离,能够灵活的满足多种应用需求;控制平面通过下发相关决策使得数据平面能够按照规定进行转发操作。随着网络规模的增大、OpenFlow设备增多,单一控制器不仅容易达到性能瓶颈,而且控制器的单点故障问题也没有很好地解决方案,于是多域SDNs控制器架构[2]应运而生。

SDN多控制器架构的提出使得单一控制器SDN的单点故障、容量瓶颈、可扩展性等问题得到一定的解决。然而,SDN多控制器域是由单控制器通过如集群等方式来实现,各控制节点所隐含的故障是仍然是威胁多域SDNs可靠、可用性的主要原因。然而网络的可用性是指系统正常运行的时间与总运行时间的比值来量化衡量,其中总运行时间是正常运行时间与故障时间之和,因此失效检测与故障恢复是提高SDN网络可用性的关键手段之一。

1 SDN技术特征

SDN的主导思想是将传统设备中的控制层与转发层相分离,主要是由控制器,OpenFlow交换机两部分所组成。控制器是控制平面最重要的元素,也是SDN的核心组件,它负责管理数据平面,针对数据平面出现的如:转发失败,链路拥塞等问题时,制定出相应的决策,并且对数据平面的节点及链路进行实时监控,以保证数据平面能高效工作。交换机作为数据平面的代表,主要是根据控制器制定的决策来转发数据包,将不能识别的数据报文按控制器的决策采取上报,丢弃等动作。

OpenFlow技术和起源于斯坦福大学中CleanSlate研究组中关于网络安全与管理的Ethane研究项目。目前,对于学术研究团体,OpenFlow已在印第安纳、斯坦福大学、欧洲OFLEIA、日本JGN2plus、韩国NetOpen网络服务平台及其他诸多科研机构中成功部署,不仅如此国内中一些诸如清华大学,北京大学也较早的参与、跟进SDN相关技术研究。除学术界之外,各大设备商,芯片制造商,网络服务提供商,运营商也对SDN技术产生了浓厚的兴趣,并对产品及网络部署进行了积极实践。SDN将分散在各个网络设备的网络状态集中编程,推动网络应用创新等带来了许多新思路,在新一代网络的架构方面SDM成为当前最为热门的网络研究方向。

2 SDN的故障切换机制研究现状

SDN中控制器的故障切换可分为单控制域SDN与多控制域SDNs。在单控制域SDN中,网络通过单个控制器进行控制,但存在可伸缩性和单点失效(SPOF)问题。Fonseca等[2]为单控制器提前备份了一个控制器。在发生崩溃时,备份控制器将替代之前控制器继续接管数据平面的管理工作。然而,这会使得投入成本太高,主要体现在:(1)设备利用率太低;(2)无法保证系统运行的连续性及可持续性。(3)设备维修、更换对管理的人员的操作要求高;因此该方法无法得以推广。

在多域SDNs中,网络被分为各个不同的域,因每个域受由各自的控制器管理,使得SDN的可扩展性问题得到解决。多域控制器的故障切换可分为单一故障探测器和多个的故障探测器。然而,单一故障探测器也会遇到单点失效的问题。例如:Tam等人提出DC[3]的传统失效检测方式,工作方式如控制器a按一定的时间间隔T给控制器b发送心跳信息,在控制器b中通过设定一个较大的固定超时值作为门限值,如果控制器b在收到超过门限值得心跳到达时间时,将怀疑控制器a发生失效;该技术算法简单、实现容易、检测时间可控;然而,错误率高,不够灵活。Chen等人改进了传统失效检测方法,根据心跳消息延迟值得历史记录来预测下一心跳消息的历史纪录来预测下一心跳消息的到达时刻(EA),并通过增加一固定修正值来检测时间进行调整,并提出可通过完整性、准确性、及时性来评价失效检测算法。

在Hyperflow[3]中,每个控制器记录了一个时间点,并且有一个服务器/控制器会定期地检查这些时间点;Kuroki等人提出了角色管理服务器(RMS)[4]这个概念,它独立于控制平面并能请求每个控制器发送CPU利用率到其中,否则它将使其他控制器发送keep-alive心跳信息给那些疑似失效的控制器,如果超过一半的控制器接收到的keep-alive消息回复,RMS就认为这是一个健康的控制器。然而,HyperFlow和RMS都没有解决单点失效问题,此外,DC,HyperFlow和RMS都使用了一个不适应网络环境的固定门限值,然而网络环境是多变的,固定的超时时间延迟不仅难以确定而且会影响故障检测的时间。

当控制器发生失效之后,交换机与控制器的连接通道将会断开;此时需要重新分配交换机到别的控制器之下。DC提前随机定义每个控制器的优先级,在失效发生时,优先级最高的控制器会提前接管失效控制器下的交换机。HyperFlow也选择了任意一个控制器去替换故障控制器。然而,由于DC和HyperFlow没有考虑到备选控制器的负载问题,将导致切换之后的控制器处于过载的情况。RMS从控制器的负载和CPU的利用率这两个方面来选择能替代本域的控制器。然而,RMS没有考虑到控制器与交换机之间的交互时延,这有可能导致长时间的延迟。

3 SDN故障切换需求分析

研究高可用多域SDNs的原因是:(1)多域SDNs是由单个SDN控制器通过集群技术来实现的且是分布式的,在此环境下高可用性多域SDN的解决方案有很大的需求;(2)多域SDNs的分布式应用,如:数据面跨域传输,拥塞调度等,都是基于局域或者广域网,因此急需在各个不同网络环境下解决容错的方案;(3)为缩短控制器的故障切换时间,而尽快的确定多域控制器的失效。

多域SDN的架构解决了单域SDN的可扩展性、可用、可靠性问题,然而提出多域SDN中网络的可用性,但是可靠性仍然没有得到很好的解决。

及时检测和故障恢复是评价网络可用性的两个关键因素,网络服务的突然中断会造成用户的巨大损失,因此网络的可用,可靠性是网络应用的迫切需求。网络的可用性可通过网络正常运行时间与总运行时间的比值来进行量化,网络的总运行时间是正常运行时间与故障时间之和,因此降低检测故障与恢复时间是提高网络可用性的关键。

4 结语

软件定义网络(Software Defined-Networking,SDN)作为一种新型的网络架构,其主要思想是将控制平面与数据平面相分离,能够灵活的满足多种应用需求;控制平面通过下发相关决策使得数据平面能够按照规定进行转发操作。在单控制域SDN中,网络通过单个控制器进行控制,但存在可伸缩性和单点失效(SPOF)问题。在多域SDNs中,网络被分为各个不同的域,因每个域受由各自的控制器管理,使得SDN的可扩展性问题得到解决,然而网络中控制域的可用及可靠性问题仍然存在,提升网络可用性的关键在于如何缩短故障检测及故障切换时间,以达到提高网络可用性的目的。

[1]MASOUDI R, GHAFFARI A. Software defined networks: A survey[J].Network and Computer Applications, 2016(67):1-25.

[2]SEYHAN C, ERHAN L, BÜLENT K, et al.Distributed Management of Service-Enabled Flow-Paths Across Multiple SDN Domains. [C].2015 European Conference on Networks and Communications,2015:360-364.

[3]BARTOSZ B. Increasting Scientific Workflow Programming Productivity with HyperFlow[J].2014 9th Workshop on Workflows in Support of Large-Scale Science, 2014(10):59-69.

[4]KUROKI K, MATSUMOTO N, HAYASHI M. Scalable OpenFlow controller redundancy tackling local and global recoveries[J]. International Conference on Advances in Future Internet, 2013(8):61-66.

Controller failover requirement analysis in SDN

Zhu Xinghao, Li Shu, Tao Jun
(Communication and Information Engineering College of Chongqing University of Posts and Telecommunications, Chongqing 400065, China)

Multiple domain SDNs can solve the problem of extension of single controller, in certain improved its reliability and usability. Yet in a multiple domain SDNs, controller failure problems still exist, the availability and reliability of network still can't guarantee. So this article has carried on the demand analysis to fault switch after the fully research on relevant related fault switching mechanism.

multiple domain SDNs; failure detection; fault switching; availability

朱兴浩(1991— ),男,重庆。

猜你喜欢

多域可用性交换机
“全时多域五三三”混合式课程思政教学模式的建构
基于文献计量学的界面设计可用性中外对比研究
多域SDN网络中多控制器负载均衡算法研究
基于多维战场空间理论的联合防空反导作战效能评估
基于辐射传输模型的GOCI晨昏时段数据的可用性分析
修复损坏的交换机NOS
使用链路聚合进行交换机互联
空客A320模拟机FD1+2可用性的讨论
PoE交换机雷击浪涌防护设计
黔西南州烤烟化学成分可用性评价