光电混合数据中心研究的行路者
——记上海交通大学长聘教轨副教授、博士生导师赵世振
2022-02-25王辉
王 辉
赵世振
近些年,“人工智能”“大数据”等词语早已被人们所熟知。可随着人工智能、大数据处理、高性能计算等应用对算力的需求不断增长,数据中心的网络带宽已逐渐成为其算力增长的瓶颈。为了消除网络瓶颈,科学家想了不少办法。
第一种方法是通过堆叠交换机设备的方式来提升数据中心的网络带宽;第二种方法是采用更高容量和带宽的交换芯片。但这两种方法均会大幅增加网络功耗,并且高端芯片还受到美国限购政策的制约。除此之外,还有第三种方法,就是设计光电混合数据中心,用高带宽、低功耗的光交换机替换高功耗的电交换机,在不增加网络功耗的前提下提升网络性能。“前面的两种方法成本太高了,只有第三种方法的成本可以接受,但要做成也十分不容易。”上海交通大学长聘教轨副教授、博士生导师赵世振解释说,因为前人设计的光电混合网络对光交换硬件的切换时延和网络控制器的收敛速度要求极高,难以真正落地。
面对这样的状况,赵世振和他的团队一直在为如何设计和控制光电混合数据中心而努力着,他一直以推动光电混合数据中心的落地应用为自己的研究目标。在国内,这还是一条独特的、颇具挑战的新道路。
路,道也
本科时期的赵世振其实和很多人一样,并不知道自己应该做什么领域。2010年,赵世振从上海交通大学电子信息与电气工程学院毕业。之后,他于2015年从美国普渡大学电子与计算机工程专业毕业,获博士学位。在这段充实而又漫长的求学日子里,赵世振做得更多的是关于理论分析的内容,他把这段经历比喻为“内功修炼”,“我对数学是十分喜欢的,所以选择了做网络理论方面的研究。从我的导师那里我也学到了很多东西”。面对理论学习,赵世振丝毫不觉得枯燥,反而觉得收获巨大。“如果没有扎实的‘内功修炼’,后续遇到的现实问题我可能也解决不了。”
但在这段理论学习的过程中,赵世振也遇到了一些困惑。“我意识到理论想应用需要别人配合,但别人可能因为不懂你的理论而不会去配合。如果自己能在理论和应用两方面都做好,就不存在这个问题了。”因为这个想法,赵世振在博士毕业后,选择先去工业界——他进入美国谷歌网络组工作。
对于刚刚走出象牙塔的学生来说,这是一条未知且全新的道路。在谷歌工作的几年时间里,赵世振真正从理论中走出来,正式开始在数据中心这个方向上深耕细作。工作中一点点积累起来的宝贵经验让他意识到在实践中发现问题的重要性,而赵世振此前打下的扎实基础,也为他后来解决更多的问题提供了助力。他意识到理论分析和做系统之间是可以相互结合起来的。就这样,一条新的道路开启了。
在谷歌工作时,赵世振逐渐意识到光交换对数据中心的重要性——能有效降低运维难度,因此他提出利用光交换机加速数据中心的扩容。通过在胖树架构数据中心的汇聚层与核心层之间引入光交换机,赵世振巧妙地将扩容过程中的人工拓扑重连转化为光交换机的自动重配。此外,他还提出一个全新的变量合并技术,使拓扑重构的计算复杂度大幅降低。这一成果使数据中心的自动化扩容成为可能,不仅能大幅缩短扩容所需时间,还能降低出错概率。这项成果于2019年发表在网络系统的国际顶级会议——网络系统设计与实现专题讨论会(NSDI)中。
2019年,赵世振回国,加入了上海交通大学约翰·霍普克罗夫特计算机科学中心,开始从事光电混合数据中心网络架构的研究。光电混合数据中心网络架构的研究属于网络系统,与“人工智能”等热门方向相比,网络系统的研究虽然在业界也有较强的需求,但由于研究周期长、出成果慢,愿意从事这个方向的人并不多。“AI领域可以几个月出一篇论文,而网络领域的一篇论文要1~2年。”那如何让更多优秀的学生加入呢?赵世振采取了一种类似“姜太公钓鱼”的方式,他在上课的时候会有针对性地做一些课程的设计,通过这些独特的课程设计来吸引有想法的、优秀的学生加入。
多年来,赵世振在求学与工作中积累了丰富的经验,再加上精挑细选的团队,所有的一切都为接下来的科学探索打下了良好的基础。接下来,便是朝着理想中的目标,投身研究。
撼大摧坚,徐徐图之
尽管光电混合数据中心在技术层面存在诸多难题,但赵世振依然充满了信心。“在硬件方面,光交换器件切换时延高、灵活性差。而在软件方面,光电混合数据中心的控制方案,包括拓扑、路由算法目前比较缺少,旧的电交换Clos数据中心网络已经很成熟,而光电混合数据中心网络还比较新。”面对这些难点,赵世振及其研究团队专注于利用软件来弥补硬件的缺陷,开展相关研究工作。
除了研究上遇到的困难以外,赵世振及其研究团队在推动光电混合数据中心的落地应用方面也并不轻松。正如赵世振所说,想让光电混合数据中心应用落地不仅需要漫长的时间和足够的耐心,还要根据实际的需求不停找出解决办法。不过,相较于一味地追求速度、与他人进行无效的竞争,赵世振和研究团队选择稳扎稳打,一步步实现自己的目标。
本着这样的初心和努力,在2021—2022年,赵世振和研究团队在光电混合数据中心网络架构的设计与优化研究方向取得了多项创新进展。针对光电混合数据中心的运行过程,他们首次提出“慢切换”的控制方式,大幅降低了光电混合数据中心的控制难度以及对快速光交换硬件的依赖。针对光电混合数据中心搭建初期的容量规划,他们首次提出“竞争比”概念,能够在不知道数据中心流量模式的前提下严格分析光电混合数据中心物理拓扑的性能。其中第二个成果论文被发表在美国计算机协会计算机系统测量和建模学会举办的年度会议(ACM SIGMETRICS)中,这是上海交通大学作为第一作者单位在这一会议的首篇论文。对于赵世振和其研究团队来说,这篇论文不仅是重要的成绩,更是继续前进的鼓励。多年的研究,在赵世振和其团队的一步步推动下,终有所成。
不啻微芒,造炬成阳
即便是微弱的光芒,若能积少成多,也会成为闪耀的太阳。时间来到了2022年8月,一个好消息为赵世振和研究团队带来了一份意料之外的喜悦。谷歌首次公布了他们的光电混合数据中心架构,里面的控制算法深度参考了赵世振提出“慢切换”控制方法的论文。自己的论文被借鉴和参考,这是对他多年研究的认可,更是一剂强心剂。相较于个人的喜悦心情,赵世振感触更深的是,这会对研究光电混合数据中心这个领域起到促进作用,相信一定会有更多优秀的学生愿意加入这项研究。
在这之后,赵世振和他的团队并没有停滞不前。光电混合网络若想得到工业界更广泛的认可,必须能够支持数据中心不同业务的不同需求。例如分布式存储、高性能计算、A I人工智能等场景,需要无损网络的支持。而现有光电混合数据中心一旦开启链路层的流量控制避免丢包,就可能触发网络死锁,造成网络瘫痪。针对这个问题,他们基于“图映射”理论设计出全新的路由方案,使光电混合数据中心能够完全避免死锁。正是靠着坚持不懈的研究,克服困难的勇气和一点点不断累积起来的进步,这个原本前景不明朗的领域未来的发展也变得逐渐清晰起来。赵世振坦言:“在我之前,很多人认为这个方向只适合在实验室里发论文,因为传统设计对光交换硬件切换速度和网络控制器的收敛速度要求极高,实际的软硬件很难做到。”但他另辟蹊径,探索出一套更易于落地的方案。
除了科学研究,赵世振还是一位特别年轻的老师。与很多老师不同的是,赵世振比较看重学生对整个计算机领域,以及领域中各个方向之间的关系的认识。“我的研究工作的一个特点是:着重针对业界碰到的难题提供解决方案。这和‘从论文中找问题’‘拿着锤子找钉子’的研究模式很不一样。我在培养学生的时候也是贯彻这个思路。”因此,比起让学生一上来就去盲目地读论文,他更愿意带领学生感受业界的真实情况,找出其中尚待解决的问题,深入其中,最终提供方法解决问题。赵世振相信这样的教学方式一定能帮助和鼓励更多人,并在不久的将来吸引更多优秀学生加入研究,推动整个领域更进一步。
眼下,赵世振及其团队的研究还在继续,未来还会出现许多难题需要逐一攻克,但他坚信只要保持初心和热爱,在研究中一步一个脚印,定能驱散迷雾,拨云见日。科