数据中心网络云化的演进趋势
2018-05-22王少鹏中国信息通信研究院云计算与大数据研究所助理工程师
王少鹏 中国信息通信研究院云计算与大数据研究所助理工程师
郭 亮 中国信息通信研究院云计算与大数据研究所高级工程师
1 引言
近年来,依托于云计算相关理论与技术,数据中心各方面技术取得了快速的进展。数据中心三大核心资源中,随着计算云化与存储云化的应用,计算和存储已经能实现按需动态分配,这极大地提升了数据中心基础设施的利用率。而网络方面更看重稳定性,目前诸多业内科研机构、高校、企业等聚焦于网络的按需调用、动态分配、高效管理等方面进行研究和开发,数据中心网络逐渐向云化发展。
2 现有数据中心网络分析
2.1 网络拓扑
在网络拓扑方面,传统数据中心一般采用如图1所示树型拓扑方案,包括接入层、汇聚层、核心层。
图1 传统网络拓扑
接入层将计算节点接入网络,在数据中心常常使用TOR交换机。汇聚层实现接入层之间的互联,网络防火墙、负载均衡等一般部署于汇聚层。核心层用于汇聚层的互联,实现数据中心与外部网络之间的通信。传统的网络拓扑满足了传统数据中心对于网络的需求,其不足之处主要有:汇聚层、核心层交换机易形成网络传输的瓶颈;发生单点故障后,对服务器影响范围较大。随着数据中心的不断发展,数据中心的规模逐渐变大,对于数据传输的性能要求变高,传统数据中心网络拓扑已经不能很好地满足上述要求。
近年来,为了适应数据中心的新需求,诸多新的网络拓扑被提出,网络结构正由传统的树形结构向胖树形结构或非树形结构方面进行改进,比较具有代表性的网络拓扑有 Fat-tree、Portland、VL2、Cellrfi、BCube等。以Fat-tree网络拓扑为例,汇聚层和接入层形成集群,分别有1/2的交换机作为汇聚层的交换机和接入层的交换机,并且汇聚层与接入层所有交换机均采用全
连接的方式进行连接(见图2)。Fat-tree网络中采用了多路径路由技术,保证了服务器之间的通信。相比于传统的网络,Fat-tree网络拓扑结构从叶节点到根部并没有收敛,因此可以较好地支持无阻塞网络。
2.2 网络设备
目前,数据中心在网络建设中仍然高度依赖于高端交换机,从而导致建设、运维成本较高,扩展难度大等问题。同时,网络设备之间、网络设备与服务器之间连接都是固定的,设备之间物理连接完成之后进行相应的配置,只能按照相关的连接和配置进行数据的传输,不能根据网络流量的变化进行动态的调整。
图2 Fat Tree网络拓扑
白盒交换机逐渐成为一个趋势。2017年开放数据中心峰会上,百度展出了其自研的100G盒式和框式的白盒交换机,吸引了众多眼球。相关设备厂商也开始向白盒交换机进行转型,纷纷发布相关产品。网络操作系统也在进行一场革命。开放数据中心委员会倡导的“凤凰项目”作为网络操作系统的一种颠覆性解决方案,依托SONiC开源社区,将BaseOS、SAI、平台驱动等共同打包制作成可直接加载运行在白盒交换机的网络OS映像文件,实现操作系统的定制化。
网络之间的架构也在向SDN方向演进,例如中国移动自主研发的SDN-O、SDN控制器、硬件/软件交换机等,通过标准接口对接厂家成熟产品,以期构建数据中心内高性能、高可靠、开放的网络。中国电信以SDN/NFV为抓手,以网元云化部署、网络DC化改造等为切入点,推进网络的纵向解耦、横向打通。
业界希望通过白盒交换机+开源OS的方式,借助SDN网络的部署,解决部署和运维过程中的很多现实问题,解决网络传输中的吞吐和时延等问题,以期达到网络性价比的最大化。
3 数据中心网络的新场景
随着业务的发展,数据中心网络面临着许多新的场景,这些新的场景是数据中心网络创新的动力,也为数据中心网络的发展提出要求、明确目标。新场景主要包括人工智能的应用场景、虚拟化场景等。
3.1 人工智能
随着人工智能、大数据等应用的逐步落地,数据中心面对新场景,将迎来更大的挑战。人工智能和大数据所产生的巨大数据量和运算量对于数据中心的IT架构和基础设施承载能力提出了更高的要求。为满足业务快速发展的要求,为业务提供稳定的IT基础设施支撑,必须对数据中心各项技术不断进行创新和发展。
网络方面所面临的问题主要集中于两点,一方面数据中心存储数据量较大,网络性能将极大地影响数据的存取速度;另一方面,大数据下实时处理业务的需求不断增加,保证实时业务处理过程中,数据高效的传输至关重要。大量的存储与计算,使得数据中心内部流量占比逐渐超过数据中心与外界进行交互的流量占比,东西流量占比持续快速增长。在网络方面,为了保证东西流量的快速传输,要求网络高带宽、低时延、少丢包。
目前,针对上述问题,包括网络架构、传输协议等许多新技术被提出。
3.2 虚拟化
数据中心的虚拟化包括计算虚拟化、存储虚拟化和网络虚拟化3个主要方面。
网络在数据中心的虚拟化的场景中,既要关注于计算虚拟化、存储虚拟化对网络的新要求,又要关注网络本身的虚拟化需求。计算虚拟化和存储虚拟化等服务器虚拟化方面对网络影响较大,服务器虚拟化后,由于模糊了物理和虚拟、网络和服务器等边界,对网络的带宽、交换能力、安全隔离等各个方面都提出了更大的要求,在网络复杂性、交换性能与扩展性、网络安全与管理、虚拟机在物理机上的无缝迁移等方面产生了具体的挑战。因此,网络技术发展过程中,必须考虑服务器虚拟化对于网络的要求和影响,这样才能更好地发挥基础设施的性能。
在网络自身虚拟化方面,网卡虚拟化、硬件设备虚拟化等技术在网络设备虚拟化方面进行发展;链路聚合、隧道协议等技术在链路虚拟化方面取得了一定的突破;同时,近年来软件定义网络(Software Define Network,SDN)技术不断成熟和发展,成为研究的重点,其应用于网络虚拟化方面之后,极大地扩展了网络虚拟化的边界。
4 数据中心网络的新需求
4.1 网络体系架构适应大规模部署的需求
随着云计算的快速发展,目前政府、企业、科研机构不断将业务迁移部署到云端,数据中心的规模越来越大。面对超大规模的数据中心,网络体系架构在设计的时候需要考虑,包括可扩展性、网络带宽、点对点多通信链路等在内的诸多因素。这些挑战共同促进了数据中心网络体系架构的研究发展。例如,以交换机为转发中心的设计和以服务器为转发中心的设计从转发中心的不同对网络架构进行划分,这两方面都在不断地发展和创新之中,取得了很多研究成果。
4.2 东西流量激增下,高性能网络的需求
云计算、大数据等新技术的进一步发展,让数据处理量激增,而传统的网络建设大多集中于应对南北流量下,系统所产生的各种问题。面对数据中心内部东西流量的快速增长,如何保证数据在网络中更快、更高效的传输,成为解决数据中心在网络方面的瓶颈,进而提高数据中心性能的关键所在。该问题的核心是如何提高数据中心内部数据在网络上的传输效率。
相关厂商通常采用提高网络的带宽和性能的方式应对该问题。以该问题的具体解决方案——无损网络为例,其在拥塞控制、流量控制、分组转发、路由选择等方面进行了改进与创新,使得网络可以自动调节转发速度,降低时延、减少丢包。目前,百度、京东、腾讯、电信、移动、华为、迈络思等公司均针对网络云化趋势下基于以太的无损网络展开了研究,取得了一定的成果。
4.3 网络资源按需分配、高效利用的需求
对数据中心基础设施的高效利用,一直以来都是云计算的一个研究重点。利用虚拟化技术,对基础设施进行资源池化,按需调用资源是提高基础设施利用率的重要方式。目前,计算虚拟化技术、存储虚拟化技术已经取得较大的突破,实现了对计算和存储资源的池化,极大地提高了数据中心相关基础设施的利用率。
网络虚拟化技术相对发展较慢,但数据中心在发展中对网络虚拟化技术有切实的要求。网络虚拟化的对象包括服务器、路由器、交换机、链路等方面,采用虚拟化方案后,数据中心可以提高网络资源利用效率、简化引用部署、降低网络故障影响区域等。根据共享网络、计算虚拟化、存储虚拟化等方面的特点,在安全、隔离、调度等方面进行创新,才能更进一步发展网络虚拟化技术,实现网络资源的统计复用。作为近年来研究的热点之一,SDN通过转发层与控制层的分离,来实现统一的资源调度。
4.4 低成本、高扩展的需求
数据中心的规模变大之后,网络方面需要较好的扩展性、较低的成本。在扩展性方面,除了考虑网络架构设计等方面的因素,还需要考虑设备的通用性。在网络建设中,尽量使用通用性设备,减少专用性设备的使用,有利于网络未来的扩展;在成本控制方面,也应该尽量减少使用较贵的专用设备,而采取较便宜的通用性设备。因此,目前数据中心网络在研究和建设中,大多采用通用型的设备,以降低成本,同时满足未来的扩展。
4.5 支持虚拟机动态迁移的需求
虚拟机迁移后,快速实现网络资源的部署是数据中心对网络的要求。网络应该自动感知虚拟机的变化,并进行相应的配置。为了实现对虚拟机动态迁移的需求,“大二层”网络、隧道技术等被提出。这些技术可以实现虚拟机动态迁移的需求,同时仍在不断地创新和改进中。
5 数据中心网络标准化工作
在数据中心网络研究与建设方面,还需要进一步加快技术研发,促进应用落地,引导产业发展。因此,在企业对技术进行研发的同时,需要行业进行技术交流、研发立项、标准制定、应用场景说明、准入测试等方面的工作。
目前,中国信息通信研究院、中国通信标准化协会(CCSA)、开放数据中心委员会(ODCC)等相关单位和组织高度关注数据中心网络方面的发展,积极推动数据中心相关研究内容的立项,邀请相关单位共同研究、探讨技术标准、应用场景、测试规范等内容。并积极与国际标准化组织进行交流,促进数据中心网络技术研究、标准制定、测试规范等工作与国际接轨。
CCSA的TC1已经对数据中心场景的无损网络总体技术要求和测试规范做了初步立项,ODCC也在积极推动数据中心无损网络方面的规范制定等方面的相关工作,得到了包括中国电信、中国移动、百度、华为和Mellanox在内的主流用户和厂商的大力支持。
2018年3月,IEEE发布了由百度、中国移动、中国电信、中国信息通信研究院、华为等单位共同撰写的白皮书《Lossless Networks for Data Center Report》。中国信息通信研究院云计算与大数据研究所李洁博士认为,无损网络的标准制定、技术研究、应用测试非常有意义,后续中国信息通信研究院将从标准、测试、应用、行业等各个方面全力推动包括无损网络在内的数据中心新技术的发展。
6 结束语
以云计算、大数据、人工智能为代表的新技术不断发展,数据中心作为IT基础设施也越来越受到关注。网络作为数据中心的重要组成部分,面对不断发展、变化中的数据中心,需要不断地进行创新和改进,才能更好地适应数据中心的需求,提供更好的服务。
网络云化是数据中心本阶段网络发展的趋势,更好地理清数据中心网络方面的应用场景与需求,明确数据中心技术的发展方向,是推动技术标准、测试规范等内容制定的前提。数据中心是网络技术发展的重要依托与创新平台,相信更多网络方面的新技术和新产品将通过数据中心产生,并应用于数据中心。