面向业务和网络协同的未来IP网络架构演进
2021-11-11黄兵谭斌罗鉴郭勇
黄兵,谭斌,罗鉴,郭勇
(中兴通讯股份有限公司移动网络和移动多媒体技术国家重点实验室,广东 深圳 518055)
1 引言
以IP技术为基础的互联网创建50余年来,取得了巨大的成功。新应用的创新层出不穷,应用不断向深度和广度拓展。面向未来5~10年,互联网从消费互联网向产业互联网的演进最为令人期待;VR、AR、全息通信等新媒体应用也同样值得关注。6G面向万物智联,提出了感知互联网、AI服务互联网、行业服务互联网等应用场景和需求。
但在面向未来的需求,尤其是产业互联网的需求时,现有的IP网络存在着很大的技术局限性。这些局限性包括确定性传输能力、网络安全能力、算网融合能力、移动性支持能力等。此外,现有网络的智能化水平和对业务的精准支持能力也亟待提升。
对于IP网络技术在未来5~10年如何演进,业内有多条研究路线,基本上可以分为颠覆型和演进型两大类型。本文提出,传统IP网络技术尽管存在一些问题,但其基本设计原则和架构是有生命力的,没有必要做颠覆性的改变。面向未来的业务需求,除了提升网络基础能力,还需要对IP网络架构设计做一些改进,解决业务和网络的协同问题。
2 传统IP网络架构的成功与不足
在互联网诞生之初,主要是实现计算机网络的互联,整体目标围绕着建立主机间的通信连接。之后互联网逐步推进,规模逐步扩大,业界基于互联网推进过程中的问题总结,逐步形成了一些有共识的原则。在1996年IETF发布的RFC1958Architectural Principles of the Internet中,首次提出了互联网设计需要遵循的一些原则,指出互联网的首要目标是提供连通性,IP协议是工具,智能应该在网络的两端,而不是隐藏在网络中。2002年,IETF对互联网的设计原则进行了升级,发布了RFC3439Some Internet Architectural Guidelines and Philosophy,对互联网设计原则做出了更为明确的解读。
(1)端到端原则
互联网的复杂性属于边缘,互联网的IP层应保持尽可能简单。
(2)分层解耦原则
互联网层间应该尽可能避免内部交互;IP应该要做到和传输的物理介质以及对应的物理编址无关;不要多层实现重复功能设计。
(3)最优成本设计原则
IP不追求最高效率,而是追求最优成本的设计,应避免逐场景去寻求局部最优设计。
(4)避免过度设计
网络应该避免过度设计,如为了达到5个9(即99.999%)的可靠性,可以从整体网络解决方案出发,而不是对于网络中的每个组件都提出对应的要求。
(5)分组交换原则
网络不需要维护每个连接状态,这样可以确保网络的可伸缩性并有助于提高成本效益。
这些原则是互联网获得巨大成功以及互联网体系得以发扬壮大的根源,本文认为其中最为重要的两大设计原则就是端到端原则和分层解耦原则。由于端到端和分层解耦的架构设计,极大降低了互联网业务的创新门槛,增加了业务部署的便利。这种架构使得业务可以脱离网络而独立发展,新业务的开发和部署只需要在云端和终端通过软件升级的方式进行,可以快速迭代,而无须修改众多的网元,无须制定复杂的互联互通标准。这种架构使得业务创新的门槛降低,多样化、个性化的新业务层出不穷,从Web1.0、Web2.0到Web3.0.……新的业务模式快速更新换代。同时,互联网的IP层尽量简单,也有利于跨越不同类型的底层介质,实现全球互联的目标。但按照这两个原则设计出来的IP网络架构,存在的最大问题就是业务和网络处于相对割裂的状态。端到端原则隔离了两端和网络,使得终端和云端无法感知网络的状况;分层解耦原则隔离了应用层和网络层,使得上层应用无法向网络传递个性化的需求,最终绝大多数业务只能按照“尽力而为”的模式运行。
随着互联网业务向纵深推进,尤其是产业互联网的发展,业务和网络的割裂状态越来越不能满足业务的需求。如对于传输质量有要求的业务,希望网络能够提供确定性的传输能力,即带宽、丢包率、时延都是可以预期的,而不仅是“尽力而为”;对安全性有高要求的垂直行业,希望网络不仅提供传输功能,而且提供“有安全保障”的传输,即保持信息传送的完整、可靠、不被非授权的访问;还有的业务希望感知网络的状态,如链路利用率、丢包率、缓存队列等,以便调整自身的传输窗口,保持最优的传输效率。
因此,需要重新思考现有体系结构的设计原则,以解决业务和网络隔离的问题。不过这并不意味着完全抛弃最初的设计原则,打造一个全新的互联网体系结构。
3 实现网络和业务的协同是未来IP网络的关键需求
业务和网络的分离,不仅体现在IP设计中,还体现在电信网和互联网融合过程中,网络运营者和业务运营者的分离。
互联网最初是服务于教育科研的网络。20世纪80年代,美国国家科学基金会(National Science Foundation,NSF)是互联网的主要建设者和管理者。90年代以后,NSFNet恢复成为学术网络,而网络运营商成为了商用互联网的主要建设者和运营者。为用户提供互联网接入服务逐步成为运营商的一项主要业务,运营商投入巨资拓展网络覆盖范围,提升网络连接速度,极大地促进了互联网的发展。
网络运营商一直试图实现网络和业务的综合运营,不断研究“综合业务网”技术,从80年代末的综合业务数字网(integrated service digital network,ISDN)技术,到90年代的异步传输模式(asynchronous transfer mode,ATM)技术,再到90年代末开始的电信级IP承载网技术。但是IP技术架构“两端智能、中间简单、业务和网络分离”的特征,使得运营商在发展互联网业务方面没有优势。国内三大运营商曾经大力发展即时通信、音乐、游戏等新兴业务,但成功者寥寥无几。互联网服务商在商业模式灵活性、业务创新能力、迭代速度、资本运作等方面都具有明显的优势。在这个过程中,互联网业务运营与网络运营逐渐分离。新的互联网服务商,如美国的Facebook、Amazon、Google,中国的BAT,借助于网络运营商建设得越来越宽的连接带宽不断创造出新的业务形式,从2G时代的新闻浏览,到3G时代的音乐、社交,到4G时代的视频、游戏,再到5G时代的VR/AR……
网络运营商曾试图发挥自身的网络优势,引入“智能管道”的理念,用VPN、QoS等技术手段使得不同类型的业务能得到不同的网络服务质量。如QoS发展出了DiffServ、IntServ、MPLS-TE等技术标准,新的SR-TE、SR-Policy等技术也在标准制定之中,但这些技术只在运营商自营业务得到部署,没有得到更广泛的应用,尤其是没有和互联网服务商的业务结合起来。互联网的业务运营和网络运营始终处于相对分离的状态。出现这种情况有以下原因。
• 网络总体处于轻载状态,即使是“尽力而为”,也能满足大部分业务的体验需求,因此业务运营方没有很强的QoS需求。
• 应用开发者不断在应用层、传输层开发新的技术降低对网络带宽和传输质量的要求,如压缩率更高的音视频编码、前向纠错编码、多路传输(如QUIC)等技术。同时,有实力的互联网服务商还自建网络设施,大量部署MEC节点、POP节点等,尽量靠近用户提供服务,降低对运营商网络的需求。
• 现有的QoS技术没有解决可运营的问题,从QoS需求如何传递给网络、网络对QoS参数的配置、网络对QoS保障业务的收费等。
随着互联网应用的持续深入,尤其是行业应用的不断互联网化,业务对网络服务质量提出了越来越高的要求,网络和业务分离的状态难以持续,从以下5个方面加以说明。
(1)网络带宽提升逐渐遇到技术瓶颈,未来网络难以继续保持轻载状态。
对于有线网络,光纤传输性能最好的C波段已经在传输速率上逼近香农极限,L波段正在开发中,S波段也提上了日程,但后两者的传输性能弱于C波段,而实现成本高于C波段。新的少模多芯技术预计技术成熟需10年以上,且需重铺光纤,意味着部署成本大幅上升;对于无线网络来说,5G的频谱效率也已经接近香农极限,再进一步提升带宽只能从更高频段的太赫兹上想办法,但频段越高,穿透力越差,意味着要达到同样的覆盖,需要更高密度的基站。因此不论是有线还是无线,未来想继续保持轻载就意味着更高的成本、能耗,在商业上难以持续。
(2)即使保持轻载,“尽力而为”模式的服务也不能满足垂直行业对于低时延、低抖动、高可靠的传送需求。
如工业控制、智能电网等行业应用要求毫秒级时延、微秒级抖动、5~6个9(99.999%~99.999 9%)的高可靠性,仅仅依靠“‘尽力而为’的分组转发模式+传统的QoS”机制并不能达到这种服务要求。需要网络能够识别这种具有特殊需求的业务,并且用确定性的网络技术满足其需求。
(3)随着工业互联网、车联网、无人机、云XR等新兴业务的发展,未来的业务对于移动性提出了更高的要求。
未来的6G网络需支持新增的卫星通信、毫米波、微基站等新型连接技术,在连接密度、空间容量、终端移动速度等方面相比5G网络有上百倍的增加。目前应用层、传输层对于移动性的支持有所增强(如QUIC技术),一定程度上缓解了对于网络移动性的要求。但是未来的业务不仅要求跨越各种异构网络的移动性,而且要求移动切换时业务连续不中断,高可靠业务甚至要求移动切换过程中保持零丢包、低时延、低抖动、高可靠。这些需求仅靠应用、终端的改进是不能满足的,必须在网络层面提供能力支撑。
(4)在分布式计算和边缘计算的大背景下,算力资源从中心云的集中模式,逐渐向“云-边-端”的分布式模式转变。
算力的分布化,最主要的驱动力是要就近提供服务,满足低时延、高可靠的需求。因此,为用户和应用调度算力资源时、必须同时考虑网络的精准传输能力,即需要能够根据不同的业务需求,并结合网络实时状况、计算资源实时状况,将业务导入最合适的计算节点上执行计算任务,同时建立能满足带宽、时延等特性的网络连接。这是计算和网络深度融合的模式。这种融合不同于目前业内在做的云网融合,云网融合是以云为主导的模式,但各个云平台都是封闭私有的架构,因此云网融合无法做到全程全网。由于缺少统一的互联标准,云服务商和网络运营商之间只能一对一进行接口适配,互联效率低,云和网之间也难以形成有效的协同。未来在广域网上,由网络主导的方式来实现计算网络融合是较为合适的路径,网络领域具有互联互通的传统,以及成熟的标准制定流程和组织。算力网络技术是电信行业朝这个方向的一种努力,其目标是网络能够感知算力,实现全网的算力和网络统一调度,形成算网存一体化、服务化的数字基础设施。
(5)未来业务对于高可靠的需求同时伴生着高安全需求。
互联网设计初期没有考虑安全性,其端到端的设计是交给两端来解决安全问题。随着非对称密钥技术、公钥基础设施技术的发展,基于应用端和终端的安全技术确实在一定程度解决了互联网的安全问题,对于安全有较高要求的网上支付、电子商务等应用都得到了大规模的应用。但至少有3个方面的原因,使得目前的安全解决模式无法满足未来行业应用的需求。
• 目前互联网全互通的模式,使得安全问题始终处于“道高一尺,魔高一丈”的技术比拼之中。行业应用难以避免新的攻击手段的威胁,从而阻碍了行业互联网的发展。
• 应用层的安全技术即使能够防住攻击,也需要付出时间和资源的代价,如需要对通信对端做严格的身份认证,以及对于数据流做复杂的加减密算法。有时无法满足应用的低时延需求。
• 对于DDoS攻击,目前业内没有很好的解决办法。
因此,未来的互联网不能让应用和终端暴露于完全不受控的网络之中。网络要能够让相互信任的用户无障碍连接,相互不信任的用户之间高度受限,这就需要网络具备内生安全的能力。
综上所述,脱离网络层面的支持,未来的业务已无法仅通过应用层的改进,以overlay的方式满足自身对于高可靠、低时延、高安全、移动性的需求。而要满足业务的需求,一方面需要网络自身基础能力的提升,另一方面,需要在网络架构和协议方面,建立业务和网络之间的桥梁,使得网络层面的新能力、新技术等很好地被业务使用。
实现业务和网络的协同,对于业务运营商、网络运营商都具有重要的意义。对于业务运营商,这是高质量业务真正落地的必要条件;对于网络运营商,则是摆脱“哑管道”地位,发挥网络优势,创造更多价值的机会点。
4 面向业务和网络协同的未来网络架构
基于以上分析,本文提出未来IP网络演进的基本观点。
• 基于IP技术的互联网运行50年来已经取得巨大的成功,说明互联网的架构设计总体是合理的,目前没有充足的理由对其做根本性的改变。其核心设计原则需要保留,包括端到端原则、分层解耦原则等。
• 未来的业务对网络提出了更高的要求,需要网络能感知业务需求,提供精准的服务,而不仅是“尽力而为”。因此目前业务和网络相对分离的架构需要做调整,实现业务和网络的协同。
• 目前的IP网络需要持续提升自身能力,才能满足未来业务的需求。包括精准传输能力、内生安全能力、算力网络能力、移动性服务能力等。
综上,未来IP网络的目标,是基于增强的网络能力和业务网络协同的架构,以“网络内生”的方式满足未来业务的共性需求(如确定性、安全性等),使网络成为未来互联网的公共能力平台。基于这个想法,提出了如图1所示的未来网络参考架构,这个架构在横向、纵向两个维度对现有的IP网络提出了改进方向。
图1 未来IP网络参考架构
(1)横向:服务化网络赋能的端到端架构
从横向的角度看,即终端、网络、业务之间的关系看,端到端的互联网设计原则仍然保留,即业务的处理仍然主要在两端进行。同时,为了满足网络对业务进行支撑的需求,把“端到端原则”修正为“服务化网络赋能的端到端原则”。增加了两方面的含义。
• 未来网络在保持原有“尽力而为”服务的基础上,提供增强的、共性的服务能力。包括确定性承载能力、网络内生安全能力、算力网络能力和连续移动服务能力等。
• 网络将增强服务能力延伸到业务应用的两端,并提供标准化的能力开放接口,为未来多种多样的业务提供服务化的支撑。
网络能力提升面向的是基础性的、公共服务类的能力,不会“越俎代庖”去做更适合在业务层面做的事情,不会改变IP网络端到端的基本架构。网络能力提升面向未来业务对于网络的需求,如提供有服务质量保障的连接,即确定性网络能力;提供基础资源类服务,即“连接+计算+存储”服务;提供业务支撑类服务,网络提供业务需要的公共模块,如安全服务。
网络将服务能力延伸到两端,目标是打破网络和业务之间的隔离,使得增强的网络能力能够被业务调用,实现业务、网络的协同。网络能力延伸的具体实现形式有多种。一种形式是在终端和服务端部署智能插件,作为网络功能的代理。另一种形式是把智能插件部署在网络的边缘节点(PE节点)。智能插件是网络运营商触达用户需求、应用意图的重要手段,是网络功能精准投放的重要载体。未来的网络智能插件具有广泛的应用场景,如智能插件负责实现网络标识映射和管理,解决当前互联网面临的安全可信、移动连续以及寻址效率等问题;智能插件还可以通过感知应用意图,对网络、算力、AI、安全等综合资源进行最优决策和调度,最终向应用提供有精准资源保证的精准连接。
智能插件和应用之间通过松耦合的接口进行交互,一类接口是网络向应用发布不同类型的业务服务调用接口,应用结合自身的需求调用网络服务;另一类是网络向应用提供资源状态通告服务,应用根据网络资源使用状态进行应用侧优化,以向最终用户提供精准的业务 体验。
(2)纵向:智能控制面支撑的分层模型
互联网架构的“纵向”,可以从两个角度理解:一个是纵向的协议分层,即TCP/IP协议栈,分为应用层、传输层、网络层、网络接口层(网络接口层可再细分为链路层、物理层);还有一个角度是网络的纵向功能区分,分成转发面、控制面、管理面。
TCP/IP是按照“分层解耦”的原则设计的,不同层次的功能定位要明确、不重复,层间接口简单、清晰。同时,IP层作为互联网互联互通的基础,是所有节点都要支持的协议,影响面涉及全网。IP层的技术改动需要经历长期的技术研究、试验、标准化的过程,才能进入真正的商业部署。从这个意义来说,对于IP层的改动要保持慎重。
但目前的IP架构造成了业务和网络的隔离,这个问题需要在未来网络中解决。为了加强业务层与网络层的协同,对IP协议栈做适当的改进是必不可少的,只是这种改动涉及面不能太大,改动不能太频繁。
对网络功能的扩展,还可以从网络纵向架构的另一个角度,即网络自身的转发面、控制面、管理面着手。自从SDN的概念提出以来,数据网络采用相对集中的控制面,简化转发面,已经成为运营商的普遍选择。SDN控制器相当于以软件的方式扩展了网络的功能,有利于把最新的IT技术,比如AI、大数据、区块链等技术,引入到网络领域,实现网络资源的高效利用、网络能力的精准匹配。
两个角度结合起来看,未来IP网络纵向的改进方向就是“智能控制面支撑的分层模型”。具体的含义有以下两个。
• 保持互联网协议栈的“分层解耦模型”,IP层尽量稳定。但这并不是说,IP不能扩展。事实上,IPv6协议预留了扩展字段用于扩展新功能,SRv6、BIER6等功能就是利用IPv6的扩展功能实现的。对IP层的扩展要相对慎重,要考虑对现网的兼容和网络的平滑演进。
• 网络的功能扩展主要在相对集中的控制面进行,转发面尽量简洁。智能化的控制面,应作为运营商扩展网络功能,提升网络服务能力的主要抓手,使得网络能够在不对基础协议做大的改动的情况下,体现出更强的业务支撑能力和适配能力,实现灵活性和稳定性的统一。
基于以上的设计思想,未来网络新功能的部署,可以把复杂多变的处理交给控制面,网络设备转发面保留通用、简化的处理功能。如转发面负责提供基本原子元素的操作(如标识、选路、整形、调度等),控制面把网络原子功能组合,通过网络编程实现复杂的应用需求。
智能控制面本质上是实现了网络功能的IT化、软件化,有利于引进最新的IT技术,比如大数据、人工智能等,使得网络技术也像IT技术一样迅速迭代演进。如最近发展迅速的意图网络(IBN),通过分析用户意图,将意图转译为相应的网络策略,最终实现网络感知和控制策略的自动化部署。在意图网络的支撑下,非专业人员在对网络行为感知和控制时,无须了解相关的底层实现细节,大大简化应用开发的复杂度。还有镜像网络技术,基于对网络整个运行状况的仿真、建模,对于未来的网络质量、用户体验以及后续行为做出预测,以便快速调整资源配置,优化用户体验。
未来网络架构横向、纵向两个维度的改进方向是相辅相成的关系。端到端原则和分层模型是保持互联网灵活、可靠、可扩展的最基本原则。为了满足未来业务需求和网络可持续发展,引入了服务化网络的概念,作为端到端原则的补充。而智能控制面的引入,就是为了在分层模型架构中增强网络能力。
综上,本文提出的网络参考架构。核心要点有3条:网络自身的能力要提升(确定性承载、内生安全等);这种能力要能够向两端延伸,向应用开放;控制面增强、转发面简洁。
5 结束语
针对未来10年IP网络面临的业务需求,提出了面向业务和网络协同的IP网络演进方向。总体上认为,IP技术虽然已经存在了50多年,但其技术架构具有弹性,仍然可以以逐步演进的方式继续发展,在未来的产业互联网阶段继续作为重要的基础设施。
提出了“横向:服务化网络赋能的端到端架构,纵向:智能控制面支撑的分层模型”的IP网络演进思路,力图在不对现有网络架构做大的改动的前提下,解决关键的业务网络协同问题,使得未来IP网络更加适配业务需求,更加开放、智能。
在概念层面提出了未来网络架构,下一步还需要做详细的实现方案。包括协议层面的改进方案,转发面实现业务、网络交互的接口,控制面实现智能管理的方案等。网络基础能力的提升,包括确定性承载、算力网络、内生安全等能力的设计也需要不断完善。希望在业内同行的共同努力下,未来IP网络能够解决面临的技术挑战,满足整个社会数字经济发展的要求。