APP下载

永远不要投资DPU?

2021-01-02谭婧

数字商业时代 2021年12期
关键词:安东尼开源虚拟化

谭婧

DPU是人工智能芯片之后的又一大热点。

业内人士笑谈,那些投资人钻研DPU的热情,比造DPU的人还高。

有人在问DPU芯片是啥的时候,创业公司里,飘来一个熟悉的女声:“支付宝到账,人民币一亿元。”没错,就是融资额经常上亿。

别说互联网大厂,国字头大基金也刀背藏身,眼睛直勾勾盯着DPU,伺机而动。

云厂商对DPU芯片的渴望,是歇斯底里的。逼得造DPU的人,鼻孔喷血,双眼冒火。

而坊间有个说法,DPU只有两个品牌——亚马逊云和阿里云,以及其他。

DPU的故事,要从好久之前讲起了。

1998年,美国斯坦福大学的球场上,尖尖绿草被阳光温柔抚摸,孩子们尖叫雀跃,球衣鲜艳,带风奔跑。

球场外,一些家长等着接孩子回家。他们中有的是斯坦福大学的同事及其家属。

左右无事,家长群里的两位闲聊了起来。

“最近在忙啥?”

“创业了。”

“创业方向是啥?”

“在一台计算机上可以跑多个操作系统。”

提问的这位男士,文质彬彬,听到回答,突然眼睛一亮,脱口而出:“这个想法挺好,很新鲜。”

最怕一流行家,遇见了一流行家,一聊就迸射火花。

两位家长,在球场边,就地达成投资意向。

这位家长,不,这位看准就出手的早期投资人,气质儒雅,风度翩翩。

他就是张首晟,著名华裔物理学家,杨振宁的爱徒,主要从事凝聚态物理领域的研究,斯坦福大学终身教授。

创业的那名家长也不简单,叫黛安·格林(Diane Green),一位天赋型女性管理者,从创业之日起,就担任高管,掌管公司长达十年之久。

后话是,她还管了一阵子谷歌云。

此番操作,把孩子们都看懵了。

另一个孩子的爸爸,黛安·格林的老公,是斯坦福大学教授,孟德尔·罗森布拉姆(Mendel Rosenblum,简称罗教授),是公司的首席科学家,他也是操作系统领域的世界级专家。

彼时创业路上,夫妇俩刚刚动身,公司名叫VMware。

二十多年后,这家公司成为虚拟化技术领域的巨头。

计算机技术的术语,常常闪烁理性光芒,而“虚拟化”这个词,一看就是镜花水月,太虚幻境,把一种仙风道骨的玄幻气质,拿捏得死死的。

不意外,虚拟化技术的一开始:学术研究站C位。

为数不多的高校在研究,美国斯坦福大学、英国剑桥大学。

屈指可数的公司在探索, IBM公司、英特尔公司、微软公司。

上世纪70年代是虚拟化学术研究的黄金年代,有多篇学术论文为这个方向奠定了理论基础。

科学技术这行,光凭论文不行,得拿出东西来,还得用起来。

等有代表性的公司诞生,年年等断肠,从七十年代,到九十年代,一等二十年。

据VMware公司CEO黛安·格林回忆,一天晚上,罗教授回到家,谈起工作,他说:“我想重新审视虚拟化,将隔离引入操作系统,能同时运行新旧代码,又不必构建一个新的操作系统。”

想法像洪水一样从脑中涌出,罗教授非常激动,睡醒的第二天,就开始做原型。

不久之后,澎湃的行动力,让罗教授和他的学生们实现了X86 服务器的虚拟化。

科学家的朋友圈往往光芒四射,创始人集齐五位专家,摆开了阵型,对虚拟化发起冲锋,这一次载入史册。

“攻下”X86,打开虚拟化由守转攻的新局面。

相传,虚拟化技术公司的文化和互联网企业文化不同。

美国斯坦福大学的学生闭眼挑offer的时候说,谷歌的文化吸引年轻人,撸狗上班,睡衣轰趴,而VMware 公司的员工则能在公司安穩地结婚生子。

随后,学术派传球至边路,PC的虚拟化接球。

虽然在小型PC机时代,虚拟化不是刚需,但是开创了硬件新玩法,沸腾了极客的热血。

小心翼翼问一句,虚拟化是不是在骗CPU?理直气壮回答:CPU有一种被骗的“能力”。

虚拟化技术很厉害,还是要戒骄戒躁,后面的路,还长。

无疑,VMware公司是成功的,当开源世界崛起,软件甩开商业软件的统治,开源极客走上舞台。

请大家记住这两个虚拟化技术的精神小(领)伙(袖),因为他们对DPU的发展,至关重要。

按姓氏笔画排序:安东尼·李国瑞(Anthony Liguori),美国人。张献涛,中国人。

2001年,英国剑桥大学计算机实验室,Ian Pratt教授带着几个博士生做了一个非常知名的虚拟化项目,叫Xen project。

Xen的读音和“than”有点像,但不完全一样,发音不吐舌头。

Xen有一个庞大的、活力十足的开发社区,深远地影响了云计算、虚拟化和安全。

两年后,Xen X86虚拟机监视器的第一个稳定版本就问世了。

2004年,张献涛在武汉大学,念博士。多年寒窗,没有少下功夫,他技术水平强,动手能力更强。技术大神何愁去处,可张献涛还是有些担心,因为虚拟化技术的择业面,太小了。

读博士,勤奋很重要,有一位好的博士导师也重要。

张献涛的博士导师,是全球知名的密码学家卿斯汉。张献涛一定是花掉了很多运气,才遇到了这么一个好导师。

他一脸慈祥地对张献涛说:“虚拟化这个研究方向,我和英特尔有合作,你先去那里实习,别担心,我帮你安排,剩下的,要看你自己了。”

而今看来,卿斯汉教授将张献涛送去企业实习,是完完全全从学生的利益考虑。(有些博士导师那是死活都不愿意放博士生出去干活,此处省略三千字吐槽)。

于是,张献涛从一名英特尔的实习生做起,一做就是3年。时光飞逝,技术水平飞涨,他于2008年正式入職英特尔。

他可能也没有想到,这份工作一干就是9年。

把镜头摇到2002年的美国IBM 公司,虚拟化的另一个前沿阵地。

一位名叫安东尼·李国瑞的大学生,在学校读书期间一直在IBM实习,每周20小时,连续四年,风霜雪雨,从不间断。

2006年,安东尼入职IBM Linux 技术中心,成为一名软件工程师,这份工作一干就是7年。

人这一生,找到一个真心喜爱的技术作为爱好,然后不计成本地付出时间和耐心,用心打磨,收获的将不只是一个拿得出手的技能。

更重要的,还有一个脱胎换骨的自己。

也许某日傍晚,红霞染尽天边,张献涛在看云,安东尼也在看云,可能会有那么一瞬间,他们都意识到自己要和这个名字极富诗意的技术,打一辈子交道了。

世间因缘,因缘世间。

芯片江湖,有人,有酒,有故事,就有批评英特尔的声音。

PC为王的时代,因为虚拟化不是主流,所以英特尔X86指令集对虚拟化的服务态度很不友好。

这锅,得英特尔背,还背到了2005年

英特尔在那一年才笑脸相迎,态度友好,在CPU里面做了一些扩展指令集。

这次重拳,扭转了虚拟化的乾坤。

那一年的年11月,英特尔宣布产品支持硬件虚拟化(VT-x,VT-d),AMD也屁颠跟上,宣布产品支持硬件虚拟化(SVM)。

别看姗姗来迟,但是这套技术也足够硬核党,能做出来也很了不起。

但是英特尔“罪名”也很昭彰——低效。

VMware公司眼疾嘴快,把英特尔一顿猛批。

模仿骆宾王讨伐武则天,出了一篇著名的“檄文”,讨伐英特尔。

指责支持虚拟化的扩展指令集低效,还没有自己家做的性能好(这里指VMware公司的“二进制翻译”,binary translation)。

指责别人,趁机夸赞自己,没毛病。

经此一事,也能一窥VMware公司的江湖地位,批评别人,得自己腰杆子倍儿直。

经此一变,虚拟化便有了CPU芯片厂商的全火力支持,仿佛被按下二倍速播放键。

这是虚拟化的短板,第一次被拯救。

那时候,英特尔没有白忙活,蘸着唾沫点钞票,心里乐开了花。支持Xen,跟支持Linux的道理一模一样,虚拟化带动了生态,大家都爱用户黏性。

窗外阳光正好,又是吃饭时间,天上白云飘过,人间没有巨变,云计算悄然巨变。

云计算的第一张门票,亚马逊云抢到了。云计算的号角一吹响,开源迅速占领C位。

Xen底气十足,首席科学官兼剑桥大学计算机实验室教授Ian Pratt说:“微软正处于追赶我们的道路上。”

此言不虚,微软公司的产品确也深受 Xen的启发。

一时间,红帽,Sun Microsystems,Suse Linux,到处都有Xen的身影。一时间,似乎任何新事物都会在Xen萌发

Xen被掌声包围,连云巨头都伸出橄榄枝。2006年,亚马逊云(EC2)推出第一个采用Xen的实例类型(m1.small)。

Xen登上了第一朵云,自此,成为云计算的生力军。

虚拟化技术烈火烹油,微软公司好不服气。悄悄收购位于美国波士顿的虚拟化厂商Softricity公司,赶紧公布了,为Windows Server引进新的虚拟机管理产品的时间表。

“别催了,在买了。”

后续是微软公司再露土豪本色,为了虚拟化连续多次出手多家创业公司。

这也从侧面反映了虚拟化这个技术,又小众,又难,又关键,连微软公司也哑巴吃黄连,有苦说不出。

2007年英特尔出了VT-x,增强了很多功能,又反超了VMware公司的二进制翻译技术。

VMware公司内心独白:批评英特尔,草率了。

在2009 年的时候,研究公司Gartner预测,三种技术将主导虚拟化:VMware公司的 ESX Server、Xen 和微软公司的 Viridian hypervisor。

有些技术预(占)测(卜),听一听,别当真。

正面评论大声说,Xen是当时的业界标准之一,非常成熟。负面评价小声说,Xen的架构非常复杂,代码链非常长,对内核的改动也比较大。

Xen是一个非常好的项目,但是确实太复杂。全球真正搞懂Xen架构的人不超过50人。大部分人,停留在仅仅能用这个层次。

再者,Xen还是传统虚拟化技术。

Xen的传统结构,决定了它身上的担子特别重,要忙于许多事情,保护物理硬件,保护BIOS,虚拟化 CPU,虚拟化存储,虚拟化网络,还有诸多管理功能。

Xen过于笨重,注定退场,但Xen的出现,为虚拟化打开了开源世界的大门。

梦里几十年,长风几万里,才把虚拟化吹进开源世界。

2014年,同样是开源的KVM来了。

作为Linux的家族成员(以组件的形式出现),这个轻巧的超级管理程序,身姿轻盈,席卷世界。

这时候,VMware公司的日子也不红火了,闭源商业软件,花钱不说,云厂商改动也不方便。

不要忘记的是,亚马逊云和阿里云的DPU早期架构,都能看到Xen与KVM的身影。

问世间,是否此山最高,或者,另有高处比天高。开源社区背后的惨绿少年,藏身于开源江湖,苦练绝技。

十多年前的虚拟化技术,并不成熟。放眼全世界,做虚拟化技术研究的人,真心不多。

开源社区里最有权力、最受人尊敬的人,有一个统一的称谓,Maintainer(软件维护者),也是高级别的代码贡献者,掌管开源项目的设计规划,对全局,有深入了解,对未来,也有独到见解。

安东尼,是QEMU的Maintainer。张献涛,是KVM跨平台支持以及KVM/IA64的作者和Maintainer 。

QEMU曾是世界上首屈一指的系统仿真器和虚拟器。QEMU支持Xen和KVM,并广泛部署在大多数云环境中。

从Xen到KVM,安东尼和张献涛的技术突飞猛进,天天打破天花板。只要解决性能方面的难题,什么姿势都会。

要知道,那些系统底层,要去解决性能方面的故障或者错误(Bug),都是非常难的,伸出手就能扼住整个项目的喉咙,让人动弹不得。

安东尼和张献涛,身上不断出现“巧合”。

张献涛和安东尼在Xen 和KVM 开源社区都有交集,是享誉社区的极客,令无数开源玩家高山仰止。

经历诸多采访报道,他们在做自我介绍时,都曾说到一句话:“我一直做虚拟化方向的工作。”

同样的话,一个用中文讲出来,一个用英文表达。

只要一有虚拟化安全的新闻热点出现,国外技术媒体都以采访到安东尼为荣。张献涛则是国内第一批参与做KVM的。

巧合的背后,往往是必然。

2013年,安东尼,加入亚马逊云。

2014年,张献涛,加入阿里云昔日,在虚拟化开源社区,两位最有“势力”的人。

如今,在头部云计算厂商,主导DPU技术变革。

更巧的是,一个负责Nitro系统,一个负责神龙系统。

亚马逊云和阿里云的DPU,均汲取了开源虚拟化软件Xen和KVM的精华。云计算带来了虚拟化技术的繁荣,实现了技术的跃迁。

此时,虚拟化的专家,从硬件厂商的宝贝,变成了云计算厂商、大型互联网公司的宝贝。

35岁就淘汰之类的话,在这些人面前,纯当放了一个臭屁。

所有人都意识到,虚拟化技术“值钱”了,蜂拥而至,可惜,门槛很高。

虚拟化是一门非常难的技术,虚拟机是对真实计算环境的抽象,很多人被“抽象”二字难住。

操作系统内核已是扫地僧级别的技能了,虚拟化则是独孤求败。

张献涛说:“以前,我们认为操作系统内核是最难理解的,也是最复杂的系统软件。业界有不少非常资深的内核(kernel)工程师转去做虚拟化,都理解不了,也做不好。”

为什么呢?

因为虚拟化又抽象了一层,其难度大大增加,要用软件去实现硬件(的功能)。

在云厂商没有虚拟化专家的时代,亚马逊云也找英特尔的人去解决问题。

十几年前,英特尔工程师火线救援云厂商的故事,都快被人遗忘了。

2010年,阿里云准备在5月10日发布产品(ECS1.0)。

那时,有三家企业的工程师挤在阿里云攻坚,攻了一个多月,有人都要把头急秃了,眼看到日子了,还有一个坎,过不去。

大概1000台服务器,运行一晚之后,总会发生一件奇妙的事情,硬盘找不到了。

硬盘也很委屈:“我掉线了。”

攻坚小组被死死逼到了墙角,他们拿出了一个负责任的推断:问题要么出在芯片组身上,要么出在芯片身上。攻坚小组在嘶吼,得让英特尔派人来,快点。

命悬一线之际,无论英特尔派谁来,都会被人死盯着,恨不得用秒表计时。

意外的是,英特尔的专家到现场后,看了一下(所有的配置),想了一会,之后说:“改个参数就可以了”。

计时那个人,看了下表,从拿到阿里云的服务器日志到搞定,大约用时3000秒(50分钟)。

这一刻的如释重负,让在场的阿里云工程师一辈子也忘不了。

这事,让一个外援在阿里云内部,小火了一把。

谁知不久之后,阿里云的章文嵩问了团队一个问题:如果要挖一个虚拟化做得最好的人,应该挖谁?

章文嵩是何人呢?Linux虚拟服务器创始人,开源大神,曾任阿里云CTO,首席科学家。

阿里云的工程师们,双手不离开键盘,头也不用抬,张嘴就有了:张献涛。

无独有偶。有人告诉我:“二零零几年的时候,亚马逊云还没把安东尼搞过去,虚拟化的问题也解决不了,也得靠英特尔。因为虚拟化的大牛工程师,亚马逊云也缺。”

亚马逊云,有了安东尼。

阿里云,有了张献涛。

寻隐者不遇,那虚拟化的高手到底在哪?云深不知处,他们就聚集在IBM、英特尔、红帽。

消息灵通人士透露,2008年左右,英特尔公司上海办公室里,虚拟化团队大概十几号人。云计算带动虚拟化技术热门之后,全世界都来挖人。

自此,很多虛拟化的人才就留在了美国,直到现在。

人争一口气,佛受一炷香。为什么云厂商会憋着口气一顿猛搞芯片?

答案是:谁痛苦,谁难受,谁逼疯,谁知道。

张献涛恳切的语气令人印象深刻:“就算不是神龙团队,阿里云也会有另一支团队把DPU做出来。”

众所周知,现在云计算厂商的服务器规模有多大。当规模扩大,用户量增长,对DPU的渴求就变得心切。

几十万台服务器,一天天,嗷嗷待哺。

在安东尼心里,应该也反反复复问过很多遍DPU的本质问题:

“为了得到更好的产品,我们要设计硬件,要设计一个专门用于虚拟化的硬件平台。不是通用软件,不是通用硬件。”

回望来路,已无退路,在技术最佳的更迭期,DPU出现了。用DPU定制化硬件加速,成为最正确的方向。

猜你喜欢

安东尼开源虚拟化
校园武术“学、练、赛”一体化实践探索
嘲弄的笑声
我妈妈
五毛钱能买多少头牛
2019(第十四届)开源中国开源世界
2019开源杰出贡献奖
巴西 圣安东尼日
Part 3 问题解决心情好
浅谈虚拟化工作原理
用户怎样选择虚拟化解决方案