华为“云引擎”助网络自动驾驶
2019-03-27王欣
王欣
随着人工智能(AI)的迅猛发展,越来越多的企业想要利用AI实现智能化转型。
在2018年华为全联接大会上,华为将人工智能定位为新的通用技术,并发布人工智能发展战略。华为轮值董事长徐直军宣布,全面将人工智能技术引入到智能终端、云和网络等各个领域。
2019年1月9日,华为网络产品线总裁胡克文发布业界首款面向AI时代数据中心交换机CloudEngine 16800,在网络领域持续践行AI战略。华为将人工智能技术创新性地应用到数据中心交换机,引领数据中心网络迈入AI时代,匹配AI业务的快速普及,助力客户加速实现智能化转型。
AI时代 数据中心面临三大挑战
“未来将是AI的时代。”胡克文表示,工业革命、电力革命和信息技术革命,在过去120年间,实现了人类文明的三次跨越,释放出的生产力远超数千年文明积累的总和。今天,我们又迎来新的拐点,以ICT为基石,以人工智能(AI)为驱动的第四次技术革命,正在引领人类社会迈向万物互联、万物感知和万物智能的智能社会。
根据华为GIV 2025(Global Industry Vision)的预测,企业对AI的采用率将从2015年的16%到2025年86%,越来越多的企业将利用AI助力决策、重塑商业模式与生态系统、重建客户体验。因此,数据中心从云时代向AI时代演进成为必然。
在他看来,AI时代,从网络视角而言,数据中心将面临三大挑战。首先, AI算力受到数据中心网络性能的影响,正在成为AI商用进程的关键瓶颈。传统以太网存在天然的冲突,其丢包率一般为0.1%,而意味着AI算力只能发挥50%的作用。因此要想充分发挥AI的算力,未来网络必须做到零丢包。其次,有数据预测,未来5年,全球年新增数据量将从2018年的 10ZB 猛增到2025年180ZB(即1800亿TB),将增长约20倍,而现有100GE为主的数据中心网络已无法支撑数据洪水的挑战。最后,随着数据中心服务器规模的增加,以及计算网络、存储网络和数据网络三网融合,传统人工运维手段已难以为继,亟需引入创新的技术提升智能化运维的能力。
面向未来,数据中心需要一个自动驾驶的高性能網络来提升AI算力,助力客户加速AI业务的运行。对此,胡克文提出,AI时代数据中心交换机的三大特征,即内嵌AI芯片、单槽48 ×400GE高密端口、能够向自动驾驶网络演进。
具体来说,内置AI芯片能够实现自适应、自优化、零丢包、低时延等性能,100%发挥AI时代数据算力;核心节点单槽位支持48×400GE,能够满足未来5倍以上流量增长;而面向自动驾驶网络,能够以开放的意图驱动网络,支持秒级故障识别、分钟级故障自动定位。
把握了AI时代数据中心交换机发展的“脉搏”,华为发布业界首款面向AI时代的数据中心交换机CloudEngine 16800,加速网络迈向自动驾驶。
三大特性,加速网络迈向自动驾驶
华为数据中心交换机CloudEngine 16800是业界首款面向AI时代的数据中心交换机,能直面AI时代数据中心三大挑战,将重新定义数据中心网络的代际切换,助力客户使能和加速AI商用进程,引领数据中心进入AI时代。
首先,业界首款内嵌AI芯片的数据中心交换机,100%发挥AI算力。
为了最大化AI算力,打破制约AI发展的瓶颈,做到零丢包。华为CloudEngine 16800搭载高能效AI芯片,承载独创的iLossless智能无损交换算法,能够对全网流量进行实时的学习训练,并根据不同业务流量模型的特点动态设置最优的网络参数,更精准地控制流量,实现百万流和面向不同场景的基于应用的队列自适应,从而具备全局网络自优化能力,保证数据中心网络在传输无丢包基础上达到最高的吞吐量。这样的智能无损数据中心网络克服传统以太网丢包导致的算力损失,将AI算力从50%提升到100%,数据存储IOPS(Input/Output Operations Per Second)性能提升30%。
其次,业界最高密度单槽位48 × 400GE,满足AI时代5倍流量增长需求。
数据中心是互联网业务流量汇聚点,企业AI等新型业务驱动了数据中服务器从10G到25G甚至100G的切换,这就必然要求交换机支持400G接口。
华为此次突破超高速信号传输、高效供电、超强散热等多个高密400GE技术难题打造的CloudEngine 16800,单槽位可提供业界最高密度48x400GE线卡,整机提供业界最大的768端口400GE交换容量,交换能力高于业界5倍,满足AI时代流量倍增需求,同时单比特功耗可下降50%,更绿色节能。
最后,使能自动驾驶网络,秒级故障识别、分钟级故障自动定位。
当数据中心为人工智能提供了充分的技术支撑去创新时,人工智能也给数据中心带来巨大的收益。近几年,数据中心架构已经发生了巨大的变化,服务器规模由几十台扩大至上万台,同时计算网络、存储网络和数据网络逐渐融合,业务一旦发生故障,靠传统人工排查的运维手段定位故障需要数个小时,已难以为继。
华为此次将数据中心交换机CloudEngine 16800赋予了AI能力,提升“网络边缘”的设备级智能化水平,让交换机具备本地推理和实时快速决策能力。再结合集中的网络分析器,构建分布式AI运维架构,可实现秒级故障识别和分钟级故障自动定位,使能自动驾驶网络加速到来。同时,该架构还可以大幅提升运维系统的灵活性和可部署性。
七年磨一剑 实现普惠AI
实际上,此次华为CloudEngine 16800的发布,可以说是华为在数据中心网络领域的"七年磨一剑"。
2012年,华为发布CloudEngine 12800数据中心核心交换机,正式进入数据中心网络市场。七年来,在全球数据中心交换机厂商中,华为连续六年复合增长率第一,发展势头强劲。在2017年,华为公司进入Gartner数据中心网络挑战者象限,2018年进入Forrester数据中心SDN网络硬件平台领导者。
目前,华为数据中心已服务于全球6400+个用户,广泛部署在中国、欧洲、亚太、中东非洲、拉美等全球各地,帮助互联网、金融、政府、制造、能源、大企业等多个行业的客户实现了数字化转型。
面向未来,在AI时代,华为希望凭借CloudEngine 16800数据中心交换机这把“利刃”,助力客户加速智能化转型,实现普惠AI,共同构建万物互联的智能世界。