APP下载

IPv6+和算力网络的探索与实践

2022-05-19陈孟尝中国联通广东分公司广东广州510627

邮电设计技术 2022年4期
关键词:云网算力时延

薛 强,庄 飙,邓 玲,陈孟尝(中国联通广东分公司,广东广州 510627)

1 概述

数据经济成为十四五国家发展新征程的主要方向,数据也成为重要的生产要素,算力是数字经济时代国家的核心竞争力,算力呈现泛在化、分布化发展演进的趋势。2021 年5 月24 日,国家发改委印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,至此国家级算力调度系统“东数西算”浮出水面。2022 年1 月27 日,工业和信息化部、国家发展改革委联合印发《关于促进云网融合加快中小城市信息基础设施建设的通知》,提出千城千兆和千城千池的发展战略,无论是“东数西算”还是“千城千池”都需要新型的基础网络来支撑,这就是算力网络。

2021 年9 月18 日,中国联通在世界5G 大会发布“大计算”战略,推进架构领先、质量领先、服务领先的算力新网络布局;2021 年11 月2 日,中国移动在全球合作伙伴大会上发布算力网络战略,让算力成为像水、电一样,可“一点接入、即取即用”的社会级服务,打造“连接+算力+能力”服务;2021年11月11日,中国电信在天翼智能生态博览会上发布四级架构AI 算力网络规划。三大运营商不约而同地发布了算力网络顶层战略,可以凸显算力网络对于国家数字经济发展及运营商未来业务布局的重要性。

IPv6+是互联网话语权争夺的关键技术。网信办、发改委、工信部、国资委等分别在不同文件中要求加快部署步伐。IPv6+在算力网络中起到了关键作用,为算力提供保障,为数字经济发展保驾护航。

2 算力网络架构目标

2.1 IPv6+技术体系

经历40 多年的发展,IP 网络经过2 个时代的发展,现在正在进入第3 个时代。第1 个时代是Internet时代,以IPv4 为代表技术;第2 个时代是全IP 时代,核心技术是MPLS。这2 个时代的网络典型特征是人人互联、人机互联,促进了时代的飞速发展。但是,随着网络规模越大,连接扩展到万物互联,这2个时代的关键缺陷(IPv4 地址短缺和MPLS 叠加协议运维复杂)越发突出,网络需要一种新的技术来替代,并演进到第3个时代。

IPv6+包括SRv6(segment-routing V6)、网络切片(slicing)、随流检测(iFIT)、基于bitstring 的组播转发(BIERv6)、网络感知应用(APN6)等协议创新,以及以网络分析、自动调优等网络智能化为代表的技术创新。IPv6+可极大刺激业务创新,重新定义商业模式,增加收入,提升效率,例如IPv6+SRv6 可加速业务部署,使部署周期从月缩短到天;IPv6+iFIT 可简化网络运维,优化用户体验。

一般将IPv6+发展规划分为3 个阶段:IPv6+1.0:SRv6 基础能力;IPv6+2.0:面向5G/云的新应用;IPv6+3.0:APN6——感知应用的新网络架构体系。

2.2 算力网络

算力网络是高效连接泛在算力资源与海量用户数据的纽带,提供算力即服务的智慧形态。更进一步,网络本身就是算力、智能,算网一体将使社会进入更高一层的智慧形态。

传统算力主要是集约化的数据中心算力和智能终端的算力,但数据持续增长的机器智能时代,只有终端+数据中心两级处理无法满足要求,算力必然会从云和端向网络边缘进行扩散。数据处理会出现三级架构:终端、边缘和数据中心,边缘处理能力未来几年将高速增长,尤其是随着5G 网络的全面建设,其大带宽和低时延的特征,将加速算力需求从端、云向边缘扩散。

算力网络早期与云化网络类似,聚焦算网协同的需求,包括网络为AI 提供连接服务(Network for AI),如用于数据中心内部的算内网络IB、RDMA 和更大规模的无阻塞DCN;用于用户数据到算力连接的CFN(Compute First Network)和支撑用户数据到算力更低时延和更大带宽的Metro Fabric 和5G uRLLC 网络;用于为AI 提供算力服务的新型网络设备MEC/ECC 等;还包括将AI 技术用于运维(AI for Network)实现主动运维的IDN自动驾驶网络。

伴随着网络对AI 技术的深入研究,未来AI 的一些核心理念如“并行低精度+算法算力辅助”有可能会用于网络设备、芯片的改造,突破单通道物理极限的挑战,通过多通道+算法算力的方式实现更大接入带宽,因此一些新型超融合(CT+AI)设备可能会在网络中大量出现,算网协同也将向算网一体阶段演进。

算力网络中算网协同的场景已经逐渐出现,与云网协同类似,首先面向数据中心内的需求,然后向用户到数据中心跨广域的需求延伸。

如图1所示,高效算力网络具备联网、云网与算网3 个方面的技术元素,其中联网是基础,在5G 时代,引入了超低延时技术与端到端网络确定性技术,以适应VR/AR、工业计算等面向垂直行业的需求。同时,为了达到网络无损的目的,需要将数据中心内部的Leaf-Spine 架构向城域扩展,搭建城域的Metro Fabric。云网方面,网络人工智能技术将在算力网络的运维、管理、故障预测等方面发挥极大作用,并且网络需要进一步地云化以便提升业务交付效率。算网技术元素,主要包括算力生成、算力调度(路由)和算力交易3 个方面,使网络成为为全社会提供AI算力能力的基础设施。通过构建起下一代“算力网络”,将海量数据带给算力,并将智能带给万物,从而支撑智能社会的实现。

图1 算力网络的关键技术元素

2.3 IPv6+是实现算力网络的重要手段

算力网络将数据与算力连接,具有数据中立、高效算力、算网协同等三大属性。

算网协同是连接基础,要求网络支撑算力的弹性(数据处理需求到算力资源之间的连接的快速建立)和协同(多边缘之间以及边缘与中心之间的低时延、大带宽、算力均衡,流量调度和拥塞管理),需要网络感知业务属性(AI 感知、客户自定义),并在多层网络(计算网络、智简网络、基础网络)协同提供SLA 保障和确定性体验,端边之间双向感知业务属性,具备差异化能力,边/云之间构建无阻塞网络。为了支持算网协同,需要网络支持智能绿色超宽、体验保障和自动优化等能力(见图2)。

图2 算力网络关键特征图

IPv6+技术体系以网络基础隧道(SRv6)、网络分片(VPN+/Slicing)、确定性网络技术(Detnet)、随流检测技术(iFIT)、BIER6、应用感知网络(APN6)等协议为代表,实现网络的统一部署、灵活编程、任意扩展,并支持网络可视、应用感知、弹性分片等能力。

通过构建IPv6+的算网底座,通过一网联多云、一键网调云,网络切片、应用感知、算力感知等能力,实现云、网、边、端、业等算力的高度协同。

2.4 某省联通算力网络架构设计

某省联通遵循公司CubeNet3.0 设计理念,基于IPv6+核心技术,采取1 个物理网络+N个虚拟网络的虚实结合模式,探索算力路由、算力可信等虚拟网络,进一步提升计算和连接效率。

中国联通IP 云网的发展目标是算网一体,规划分为2 个阶段实施,第1 阶段即在云网融合1.0 的基础上,继续夯实云网融合,持续打造关键核心竞争力;第2阶段迈向算网一体,算力成为基础产品。2个阶段相辅相成,云网融合为算网一体提供必要的云网基础能力,算网一体是云网融合的升级。

如图3所示,在未来算网一体架构和组网中,需要提供六大融合能力,包括运营融合、管控融合、数据融合、资源融合、网络融合、协议融合等,具体分析如下。

图3 算网一体架构与组网示意

运营融合:提供云、算、网、安一体的融合运营平台,为客户提供一键式电商化服务,客户可以订购云、算力、网络、安全等各种服务,并可以实时了解服务提供进度、提供质量等各项内容。

管控融合:云、算、网、安协同编排,通过云、算力、网络、安全等提供服务化API接口,将所有服务快速集成、统一编排、统一运维,提供融合的、智能化的管控体系。

数据融合:将云网中各种采集数据、配置数据、安全数据、日志数据等集中在数据池中,形成数据中台,充分发挥AI能力,基于大数据学习和分析,提供安全、运维等多种智能服务,构建整个云网架构的智慧大脑。

算力融合:提供算力管理、算力计算、算力交易以及算力可视等能力,通过算力分配算法、区块链等技术实现泛在算力的灵活应用和交易,满足未来各种业务的算力诉求,将算力相关能力组件嵌入到整体框架中。

网络融合:集成云、网、边、端,形成空天地海一体化融合通信。

协议融合:端到端IPv6+协议融合,围绕SRv6、BIER6、APN6 等IPv6+协议,实现云、网、边、端的协议融合,同时端到端控制协议和转发协议均被简化,向以SRv6为代表的IPv6+协议演进。

3 某省联通算力网络实践探索

3.1 智能云网是算网一体的前提

某省联通云网创新架构以智能城域网和省内云骨干网为主体进行创新,采用IPv6+协议,实现业务端到端无缝打通,管控体系上实现云网自动化对接、快速业务开通、自助服务以及全流程云网电商化的一致体验。所有的创新均从客户的需求和体验出发(见图4)。

图4 某省联通云网架构逻辑图

整体云网能力包括以下3个方面。

a)泛在的多云接入能力。某省联通目前已经建设省内云骨干网,其汇聚医疗云、政务云、工业云等行业云能力,同时采用端到端SRv6 技术,实现一跳入多云(见图5)。

图5 一网连接多云能力

b)差异化业务、网络可视、路径可选能力。传统的IP 网络在选路转发的时候没有考虑时延因素,2 个节点之间只是简单地通过设计Cost 值来进行算路转发,在等价负载均摊的情况下,对于时延敏感型的业务可能会HASH 到传输长路径,致使体验受损,如图6所示。未来的网络是精细化运营的网络,提供差异化服务,差异化地提升客户的体验。时延敏感型业务要求网络具备时延按需选路、时延实时可视、时延地图路径可调等网络差异化服务保障能力,从而实现业务实时监控,指标劣化实时感知,告警提醒调优或自动调优,如图7所示。同时需要一键式业务SLA 部署,简化业务部署,并且具备路径重计算能力,支持业务时延重优化。某省联通省内云骨干网已经具备时延地图、时延选路、路径调优等能力。

图6 传统网络选路转发示例

图7 差异化服务选路示例

c)电商化体验能力。电商化是提升客户体验的一个重要手段,解决运营商连接客户“最后一米”问题,电商化在实践中又可分为售前、售中和售后3个环节。

(a)售前能力。售前能力主要为客户提供直观的销售方式,在线套餐推荐,用户无需到营业厅即可随时下单;网络时延可视可查,路径可选,体验可变现;只关注首尾两端,一跳入云,快速获取理想的云资源。

(b)售中能力。售中能力主要提供交付的流程可视化能力,主要包括实时网络资源可视可查,开通时长可预估,可承诺;订单流程可视化,交付过程直观化;CPE设备即插即用,连接自动打通,硬装即开通,无需专门工程师软调;网络能力开放,新型、叠加型业务可快速研发,满足客户定制化需求等。

(c)售后能力。售后能力主要提供在线网络质量可视可查、路径调优等能力。包括专线质量实时可视、可看、可追溯,降低客户误报率;网络自愈,故障快速定界定位,零投诉;AI 加持,网络隐患提前发现,防患于未然;智能推荐升级产品,方便用户订购,自助调整等。

3.2 SID As A Service,算网一体基础能力

算力网络最终的目标是在业务需求的基础上,实现以网络手段灵活调度算力、存储等基础资源,实现资源在云—网—边—端的最佳调配。运营商成为算力交易的入口,构建算力交易平台,负责实现算力的分发。

某省联通基于IPv6+技术打造SID As A Service 能力,实现网络、应用一体编排,为未来建设算力交易平台打造基础能力(见图8)。

图8 某省联通应用交易平台

某省联通基于安全服务链场景出发打造了两大算网能力,一是算网技术能力,包括网调应用和网随算动能力,网调应用实现了极致灵活网络,算力云池内应用按需调度,网随算动使网络具备了基于低时延、带宽、丢包、指定路径等选路能力,能够满足算力的不同诉求;二是算网生态服务能力,因为网络的极致灵活,实现了网调应用或算力,因此可以网为媒介,使中国联通成为交易中介,网串应用或算力。比如安全业务链,可以纳入三方的安全应用、负载均衡等应用,中国联通构筑算力交易平台,与应用合作伙伴形成生态,应用合作伙伴之间也能互为生态。

4 某省联通算力网络商业探索

某省联通打造以IPv6+为技术底座的算力网络,构筑网络新能力,在2B政企专线、2H家宽上网及IPTV等业务领域主动开展商业探索。

4.1 某银行金融安防物联专网

银行业正在向银行4.0 发展,网点智能化、无人化成为共识。某市某银行全面建设新一代智能网点,部署了智能显示屏、环境传感器、灯光控制器等物联网设备。同时,根据金融安防发展趋势和业务发展要求,启动了安防物联管理平台的建设。安防监控高带宽视频传输、海量安防设备接入等业务场景对网络提出了更高要求,因此期望建设一张安防物联专网进行新业务承载。客户要求网络支持三层组网,银行CE与运营商路由器对接;承载网络必须与其他客户严格隔离;提供链路利用率、时延和丢包率可视,每月提供链路使用报告。此外对于网络时延、丢包等指标均提出了具体要求。

某省联通围绕“IPv6+”构筑强大云网服务能力,基于智能城域网+SRv6+L3EVPN+iFIT 提供行业专网服务,完全满足某行安防物联专网的诉求(见图9)。

图9 金融安防专网架构图

a)智能城域网全网支持IPv6 和1588 V2 时钟,具备全网部署SRv6、iFIT和L3EVPN等IPv6+系列技术的基础条件。

b)SRv6 智能算路实现数百个网点业务的快速开通。

c)全网和用户侧终端部署了随流检测技术,实现租户级SLA 指标可视、可追溯,完全满足银行客户对专网可视监控需求。

d)L3 EVPN 支持多点到多点互通,实现网点到支行、网点到分行的业务流量灵活调度。

基于端到端L3 EVPN 组网,相比传统的二层专线+IP 城域网L3 VPN 组合型方案,在业务开通、流量调度、体验保障、业务运维等方面具备明显优势,可支持业务一键通、站点间流量就近转发、直观呈现端到端业务SLA指标及可视化主动式运维。

4.2 某县公安视频专网

面对日益严峻的应急处突、反恐维稳、治安形势,公安亟需用信息化和科技化的手段来提升公安治安防控及维稳处突的业务能力。某县以数据为中心,充分利用先进的云计算、大数据、物联网、人工智能等技术,通过一张快速高效可支持多维感知数据采集的公安视频专网、一朵协同弹性的视频云、一个资源高度共享的视频资源共享池和一个能够支撑全市未来视频大数据应用的视频图像综合应用系统共同实现“全局覆盖、全网共享、全时可用、全程可控”的目标。具体需求如下。

a)感知采集网建设:视频监控数据采集广度和密度不足,治安车辆卡口建设密度不足,需要建设公共场所视频监控、车辆卡口、微卡口、人脸卡口等数百套监控点,通过感知采集网实现视频数据回传到公安机房并实现云存储。

b)视频专网:建设派出所到公安局的视频专网,期望及时通过视频监控处理相关警情。

c)智能视频云:建设视频云服务,实现云计算、云存储,并具备人脸识别、车辆图片二次识别等AI能力。

d)数据互通:视频平台能与政务外网、雪亮工程视频网、公安信息网打通,实现数据共享及远程调阅。

某省联通基于智能城域网+SRv6+iFIT+L3 VPN 为公安客户提供视频专网服务(见图10)。主要包括:

图10 公安视频专网架构图

a)基于SRv6 的智能选路能力实现业务配置自动化,可做到业务天级开通。

b)通过iFIT 技术,对摄像头到公安局机房之间的专线链路、各派出所到公安局的视频专网链路进行可视化监控,实现快速故障定界定位,保障业务高SLA要求。

c)L3 EVPN 可支持多点之间的灵活互通,满足公安局和政务外网、雪亮工程视频网之间的互联互通需求,以及摄像头接入到L3 EVPN即组网的需求。

4.3 Bierv6 IPTV组播

为响应国家IPv6+化规模部署推进的整体策略和解决当前实际业务面临的困难,某省联通采用IPv6+新型组播承载技术,进行了IPTV 直播业务的IPv6+技术创新。

当前,某省联通IPTV 直播和点播业务采用多级CDN 模式发布,以达到节约带宽,快速响应业务的目标,如图11所示。

图11 某省联通IPTV业务现状

在城域网内,IPTV 的VOD 点播业务依然采用单播发放,终端用户点播某个节目或片源时,首先从省中心的播放鉴权平台获取CDN 访问地址,如果用户本地的二级CDN 有资源,就将用户的点播访问调度到二级CDN;如果用户本地二级CDN 没有资源,就将用户的点播访问调度到一级CDN。如果一级CDN 检测到某个地(市)点播某个片源的用户多,就将此片源推到二级CDN。

对于VOD 点播业务,其业务并非直播,实时性要求不高,且各终端用户观看诉求各有差异,采用CDN分级发放模式是与业务特征相匹配的选择。

对于BTV 直播业务,由于其对实时性要求高,如果采用分级CDN 发放,则由于视频文件存储和处理的时延会造成终端用户观看时延增大,体验降低。同时随着视频业务的快速发展,用户对画质观看体验和清晰度要求约来越高。4K、8K 视频已经逐渐走入千家万户,AR/VR 沉浸式体验也已来临。视频的码率也从传统的标清2M、高清8M 提升到4K 40M、8K 80M、AR/VR 100M 以上,为了给用户提供极致的视频观看体验,某省联通紧跟产业发展,持续提升IPTV 视频的清晰度,由此需要网络提供更大带宽,二级CDN 需要不断扩容来支撑大码率直播视频的单播转组播处理,CDN投资逐年增大。

某省联通计划将现有的BTV 直播业务进行IPv6+E2E组播承载改造,作为云骨干网的重点业务,通过云骨干网进行逐级组播复制到终端用户,降低二级CDN的压力。直播内容从南方传媒导入某省联通省中心CDN,省中心CDN 作为IPTV 直播业务的组播源,穿越云骨干网向各地(市)终端用户直接采用组播复制。E2E组播复制时延小,节约带宽,可以承载更高清晰度的频道,最终为用户提供更极致的观看体验。

本项目主要针对某省联通IPTV 直播业务承载IPv6+化改造,完成IPTV 直播业务E2E 通过IPv6 新型组播技术承载,将IPTV 直播业务当前的分级CDN 架构改造为IPv6+E2E组播承载架构(见图12)。

图12 某省联通IPTV直播组播流

5 算力网络展望

算力网络依托DICT等数字化基础设施,使能算力服务,响应国家产业政策,顺应技术演进趋势,保障数据安全,维护国家数字主权,非常适合国有通信运营商经营,具有良好的商业前景。

从政策导向看:国家发改委明确将算力基础设施作为新基建的核心内容之一,通过顶层设计、政策环境、统筹协调等方式促进算力基础设施的持续发展、成熟和完善。

从商业模式看:强大的算力是全社会智能应用的重要支撑,而运营商所掌握的优质网络将是算力触达用户,实现算力商业变现的最重要手段。通过搭建算力“电商”交易平台,使算力供给企业,售卖算力服务到算力需求企业或个人,充分发挥运营商平台作用。

从技术成熟度看:以微服务、无服务等为代表的资源管控和调度技术已经趋向成熟,承载网SRv6 等技术也可实现云数据中心内外部网络的统一调度和智能路由,加快了“网络内生服务”这一理念的实现。随着未来网络技术发展,网络能够感知应用、感知算力并应用算力,网络将发展为确定性的、服务质量等一切有保障的网络,网络自动化能力更能达到L3以上甚至L5的“自动驾驶”网络,彻底实现算网一体。

从电信运营商的经营发展来看:运营商具备以5G为代表的接入网络覆盖和良好的体验优势、长期运营积累的IDC以及边缘云数量和质量优势,多种公有云、行业云和企业云的资源整合优势,以及电信行业全程全网运营带来的规模优势与安全保障。运营商应充分利用算力网络发展机会,面向数字时代泛在接入、超低时延、安全可信为代表的计算服务体验需求,重点提升高品质的算力互联能力和算网联合调度能力,构建泛在算力的网络化服务新模式,实现云、网、数、智、安、链的一体化运营。

中国联通探索算力网络起步早,具有先发优势,需要持续巩固能力,拓展商业场景。中国联通1+N+X的算网架构很好地诠释了算力网络的实质,需要打造1个SRv6可编程的算力网络,N种网络能力(包括网络感知应用和网络感知算力等),X种场景应用。

算力网络是个复杂的系统工程,技术上还存在诸多需要持续探索的内容,商业也需要持续拓展,两者相辅相成。总体来说要基于商业场景去固化算网能力。近期需要做实2 件事情,一是基于安全服务链的场景,拓展企业应用,搭建算力应用交易平台;二是基于某省联通业务属性挖掘更多应用场景,包括视频、AI云边协同应用等。

猜你喜欢

云网算力时延
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
新型算力网络架构及其应用案例分析
杭州“算力小镇”
计算机网络总时延公式的探讨
计算机网络总时延公式的探讨
基于物联网的IT运维可视化管理系统设计与实现
助力新基建,赋能企业高质量发展
计算万物 算力之下要有坚实的地基
《舍不得星星》特辑:摘颗星星给你呀
中国电信:云网通