APP下载

网咖云业务应用研究

2022-08-03邵湘怡张月星李建奇

数字通信世界 2022年7期
关键词:城域网交换机路由

邵湘怡,张月星,李建奇,王 浩

(1.湖南文理学院,湖南 常德 415000;2.中国联合网络通信集团有限公司湖南省分公司,湖南 长沙 410014)

0 引言

大数据时代已经到来,互联网流量迅猛增长,应用不断创新,无论企业用户还是个人用户,都需要新业务和更为出色的网络体验。云计算通过互联网将分布的计算、存储、服务、软件等资源整合起来,以虚拟化资源池的方式向用户提供更方便、快捷、可伸缩式的按需服务[1]。消费者和企业将从“购买软硬件产品”向“购买信息服务”转变,如同100年前“电”的演变,农场和公司逐渐关闭了自己的发电机,从发电厂购买电力。

云计算的基本表现形式仍然是数据中心,但技术发生了革命性的变化:从强调单机的性能向“虚拟化、分布式、智能化”方向发展,用海量低成本服务器替代传统专用大/小型机/高端服务器;用分布式软件替代传统单机操作系统;用自动管控软件替代传统的集中管理,也就是硬件资源池化、软件分布式化、管理自动化。这种新型运营模式能统筹利用城市发展的物质资源、信息资源和智力资源,推动物联网、云计算、大数据等新一代信息技术创新应用,实现与城市经济社会发展深度融合。在这种背景下,网咖云业务应运而生。

1 网咖云业务应用方案设计

云的本质是面向多租户的服务化。网咖可将现有的IT基础设备外包给运营商承建和运维管理,也就是采用全新的ICT(Information Computer Technology)业务集成外包模式,这样管理更加高效简化,可以把人力、物力聚焦于业务发展。

1.1 概述

传统网络软硬件高度耦合,网络功能扩展困难、设备更新成本高、灵活性差。网络设备既要负责流量的转发,又要负责规则的制定,一旦拓扑发生变化,需要管理人员手动配置网络设备,浪费大量的人力物力[2]。软件定义网络SDN[3](Software Defined Network)将网络的数据层面和控制层面分离,可以实行集中化的管理和灵活的策略部署,目前运营方的数据中心网络普遍采用这种新型体系结构[4]。网咖把服务器(云主机)部署在运营商的数据中心,接入点采用云桌面方式,中间的传输线路由运营商负责管理维护,提供服务。图1是基于SDN的PaaS(Platform as a Service)框图。

图1 基于SDN的PaaS框图

网咖客户端把本地的计算和应用迁移到数据中心,这些设备被虚拟成资源池,可以大大提高资源利用率,整合比常为1∶5~1∶10,服务器利用率可提升到60%以上。运营方数据中心则综合IT资源及通信业务能力,实现资源的统一管理、业务的统一发放和集中运维。由于数据中心网络分布比较集中,策略需要频繁更新,十分适合使用SDN技术。控制器和交换机两种独立设备分别负责数据流的控制与转发[4],数据层面的交换机由控制层面通过Open Flow[5]协议来实现控制[6]。这样可以进行更加灵活的网络监测、路由管理和资源分配。API(Application Program Interface)是SDN控制器与网络应用程序的交互接口,客户端用瘦终端替代主机,将用户桌面与实际终端分离,通过网络方式远程使用位于云端的个人计算机。

1.2 关键技术

当前SDN技术正处于发展阶段还不够成熟,这种网络模式在实际应用中存在一些问题。为了保证可靠性和用户体验,现针对服务和负载两方面进行分析和讨论。

1.2.1 服务可靠

1.2.1.1 网咖数据中心可靠

由于网咖采用云桌面方式接入,运营方数据中心会大量使用虚拟机。虚拟机宕机时需要将计算任务重新分配至备份虚拟机,同时需要为同一个服务配置多个备份来保证服务的稳定性。因此,一旦出现节点机失效、链路中断等导致网络异常情况,就必须对虚拟机或服务进行迁移,也就是网络重定向,把网络中的各种请求重定向到新的位置[2]。如果虚拟机和迁移的目的主机处于在同一网段,只需迁移虚拟机的CPU和内存状态,不用更改网络配置,向外发送一个对应新MAC地址的ARP应答包即可恢复通信[7]。但如果源虚拟机和目的主机不在同一网段,就需要讨论新的重定向算法,具体阐述如下。

(1)正式迁移前,网络控制端为需要迁移的虚拟机分配一个转交地址。注意这个转交地址不是目的主机地址,而是和目的主机处于同一子网的IP地址。同时,所有运行Open Flow协议的交换机在连接到控制器时,控制器需要建立一个ARP缓存表,以便集中处理ARP请求与应答,保证传输的可靠性和迁移的透明性。

(2)开始迁移虚拟机的内存和系统状态。在这个过程中,控制器不实施任何动作,但交换机会通过流表项记录迁移的动态。

(3)状态迁移完成后,控制端根据受控交换机的对应流表项,建立转交地址与虚拟机地址的映射关系,然后清除这些条目,修改转发规则,将与虚拟机之前建立的连接传到转交地址,响应新的通信需求,实现网络重定向。在Open Flow交换机内部不区分普通数据流量与重定向流量[8],都是根据流表项描述的转发逻辑完成转发的。

1.2.1.2 运营商传输可靠

目前,运营商城域网采用的组网结构通常是双平面组网,以此保证业务的稳定性。城域网使用的外部网关协议是BGP(Border Gateway Protocol)。当线路或设备发生故障时,业务由一个平面自动切换至另外一个平面,在进行业务升级、割接等日常运维操作时,运营商运维人员通常也会主动进行流量切换。由于BGP本身设计了180秒的收敛时间,以上情形导致路由需要3分钟左右才能完成切换,公众上网业务通常对网络敏感性较差,但是网咖用户特别是游戏玩家无法接受,网咖商家通常会以停止营业应对以上情形,向运营方投诉。运营方对此种情形可能采取的解决措施有如下两种。

方式一:3分钟内无法使用网络是由于路由收敛导致,因此考虑压缩BGP路由收敛时间。由于BGP本身的设计规则,路由收敛时间是秒级的,而且收敛时间太短会出现路由频繁更新问题,影响运营商集团公司网内路由的稳定性,隐患更大。而且网咖用户对于网络收敛的时间要求是500毫秒以下,显然这种方式不具备可操作性。

方式二:毫秒级的收敛时间使人联想到万能BFD(Bidirectional Forwarding Detection),在BGP中部署BFD,当链路中断时邻居即时失效,快速收敛路由。该方案交由运营商省级分公司及集团公司审核时予以否定,原因为城域网部署BFD会出现极端情况:当中间传输链路频繁瞬断时,会导致路由在两个平面频繁切换,导致集团层面的BGP路由保护机制会禁用城域网BGP路由,最终引发整个城域网路由失效,存在城域网全阻风险。

由于以上方式的局限性,经多方研究探讨,提出一种多重重定向解决方案,基于地级市的网咖云业务组网模型如图2所示。图中城域网核心路由器为华为NE5000E,业务接入网关为华为ME60E。网咖云业务通过地市ME60E接入,业务正常情况下数据从A平面连入互联网,当A平面省干线路故障或者升级割接时,在NE5000E-A上启用多重自动重定向策略将网咖云业务数据流重定向到国干B方向路由设备,城域网B方向路由设备在收到网咖云路由之后无条件往B平面出口方向发送数据。多重重定向首先在NE5000E-A上设置。具体步骤如下。

图2 基于地级市网络的网咖云业务组网模型

(1)配置ACL(Access Control List)规则:匹配网咖云业务所在IP段(源IP)的报文。

(2)配置流分类:匹配规则为上述ACL规则,使设备可以对报文进行区分。

(3)配置流行为:配置多重重定向流行为。

(4)配置流策略:将流分类和对应的流行为进行绑定。

(5)应用流策略:将流策略应用到相应接口上,实现策略路由。

在NE5000E-A上配置多重重定向流行为,设备通过监测A出口方向端口状态,如中断就触发策略从而将流量转发至城域网互联接口C,从而避免因BGP路由收敛导致的数据中断。在NE5000E-B上重复上述配置流程,与A平面配置的区别在于第3步配置流行为时不需要监测端口状态变化,同时增加一个步骤:为使回程路由能原路返回,需要及时设置BGP路由的cost值,保证路由能从B平面返回。按照这个策略完成整个业务部署,可确保在链路故障或者割接时实现毫秒级切换。

1.2.2 负载均衡

SDN数据中心网络采用分布式的控制器架构,不用改变控制器和交换机的连接状态,就能对控制器负载进行全局优化。在这种模式下,每台交换机与多个控制器连接,控制器的角色由控制层动态分配[9]。当某个交换机产生突发流量时,通过将一部分宏流从高负载交换机转发至低负载交换机的方式,实现链路负载均衡,这里把具有相同源节点和目的节点的流集合称为宏流,具体做法如下。

(1)局部控制器收集所管理的网络信息,周期性地上报给全局控制器。

(2)全局控制器汇总全网的流量信息,并根据历史统计情况,预测下一周期的流量分布。

(3)在掌握了控制链路上行负载情况和下个周期宏流预估的基础上,控制器选择一部分宏流从较高负载交换机重定向至较低负载交换机上。

1.3 网络拓扑

现针对网咖云业务,设计出网咖云数据中心网络部署图以供参考,如图3所示。该网络架构设计采用云主机模式,数据中心部署在核心机房侧,网咖侧使用云桌面,架构采用上文中提出的服务可靠与负载均衡策略。

图3 网咖云数据中心网络架构

(1)服务可靠:运营方侧部署服务器,大量使用虚拟机服务,提高服务内容的可靠性。核心交换侧部署OpenFlow协议,保证服务重定向的实施。运营商根据路由规划部署多重重定向策略,解决运营商线路与割接时服务不可用问题。

(2)负载均衡:数据中心采用分布式控制器架构,对负载进行全局优化。

2 网卡云业务性能分析

网咖如果采取图3架构,运营方能按照不同的网络架构设计相应的路由算法或转发策略,提高带宽利用率。通过Open Flow交换机执行网络重定向的转发任务,运行效率比较高[10]。虚拟机(应用)能在多台物理服务器之间透明移动,保证业务不中断,实现跨物理机的错峰削谷。同时虚拟机(应用)之间还可以动态共享资源,实现物理机内的错峰削谷。由于磁盘空间是动态伸缩的,改变了原有的应用打包/发布模式,实现了应用对硬件更彻底的解耦。SDN云数据中心的操作系统OS(Operating System)专用绿色化,避免了其他软件的干扰。当物理机或网络出现故障时,业务恢复时间可控制在百毫秒内。基于以上这些优势,网咖云业务已经引起人们的密切关注并迅速发展起来。

3 结束语

随着互联网技术的快速发展,用户应用需求也不断更新增长,对网络架构的性能和可扩展能力等提出了挑战。本文针对网咖云业务解决了服务和传输可靠以及负载均衡等问题,需要进一步探讨SDN体系结构及相关的云业务,同时继续提升控制器的计算能力,采取相应措施保证云数据中心的信息安全,促进不同领域的数据流动及融合,使其释放出更大的价值。■

猜你喜欢

城域网交换机路由
面向未来网络的白盒交换机体系综述
IP城域网/智能城域网BGP收敛震荡的分析方法
局域网交换机管理IP的规划与配置方案的探讨
数据通信网VRRP与MSTP联动引发的次优路由问题分析
路由选择技术对比
更换汇聚交换机遇到的问题
基于地铁交换机电源设计思考
路由重分发时需要考虑的问题
面向FTTH业务的IP城域网优化改造设计
基于IP城域网的优化策略及发展应用