解码达摩院:一个中国科创新样本
2021-03-08胡克非
胡克非
“天下武功出少林,少林武功出达摩。”
在武侠小说中,达摩院的任务不是帮少林看家护院,更不是称霸武林,而是研究天下武学,为少林功夫奠定基础。
三年多前,阿里巴巴宣布成立达摩院,剑指科技创新。这不是一个轻率的决定,在阿里巴巴创立初期,马云坚决反对成立研究机构,他认为自己和企业都没有准备好。2017年,阿里已创办18年后,马云才觉得准备好了。
彼时的世界有个热词——人工智能:AlphaGo打败围棋世界第一柯洁,再掀高潮;国务院印发新一代人工智能发展规划,AI成为国家战略。它是个象征,也像个预言——2017年成为分水岭,中国科技创新图景,正加速重构。
此后,被诺基亚收购的老牌研究院贝尔实验室,退出最引以为傲的半导体领域,再无水花;被誉为中国AI“黄埔军校” 微软亚洲研究院着手研究麻将,可研究成果却始终不如“业界明星”亮眼;而研发出沃森(Watson)的IBM中国研究院,更于最近关门大吉。
硬币的另一面,是来自中国的新型研究机构异军突起。短短三年,达摩院已搭建完整的“科学—技术—产品”研究体系,在AI、芯片、自动驾驶、量子计算等多个领域实现突破;达摩院不但在国际摘得60多项科技世界第一,发表千余篇国际顶级会议论文,还成功孵化两家高科技企业——平头哥半导体公司和小蛮驴智能科技有限公司。
达摩院是怎么做到的?
科技创新,科学家是基础
成立一个科研机构,即便是门外汉也明白,这个事需要人,而且得要人尖子。
2014年,研究大数据与人工智能的教授金榕,还在美国密歇根州立大学从事科研的工作。在象牙塔里待久了,他想寻找新的幸福感,回国干事业成为极具吸引力的选项。
他讲了个故事。上世纪80年代,金榕的邻居一家移民美国,20年后,金榕在美国又遇到了这一家人,他们竟然还在餐馆以刷盘子为生!
这件事对金榕触动很大。美国变化少,中国则一日一变。在这快速发展的大时代,中国有最好的成就自我、改变企业甚至世界的机会,金榕愿意贡献其中:“任何一个学术圈来的人,都会希望自己的技术能服务千千万万的人,这是一个最好的机会。”
就这样,金榕加入了阿里巴巴。他还带回了自己的好朋友——自然语言处理科学家司罗。司罗又找来了Facebook机器翻译主管黄非……散落在世界各地各领域的杰出科学家们,一个带一个地回到了国内,成为达摩院“扫地僧”。
在达摩院的这三年,金榕打造出AI基础研发体系,支持中国規模最大的国民应用;司罗搭建起世界领先的自然语言处理体系,用最前沿的技术服务最广泛的人们;黄非和团队做了支持214种语言的翻译系统,日均调用超过10亿次。人工智能就这样在达摩院扎下根,并逐渐通过阿里云服务全社会。
但这还不够。
那几年,量子计算成为最热门的科技领域,被认为有颠覆经典计算的潜力。这让达摩院院长张建锋“夜不能寐”,下定决心投入量子计算,并邀请资历最老的、世界知名量子科学家施尧耘加入。
达摩院成立时,院长张建锋阐述达摩院愿景。
施尧耘依旧记得当时张建锋的一番话。张建锋对他说,量子计算一定要做,因为可能你今天买成千上万台服务器,用性能最优的芯片,但抵不过人家一台量子计算机。
“这让我觉得阿里做量子计算是非常严肃认真的。”施尧耘说,他还感受到,在阿里,科学家有话语权,他记得与张勇的一次对谈。
施尧耘问:“什么是阿里巴巴?”
张勇回答:“你就是阿里巴巴。”
后来回想起,施尧耘觉得,是阿里管理层决定做量子计算,但怎么做最终要靠科学家自己,科学家拥有很大的自由度。
这让他和一众科学家们备受鼓舞:原来科学家在阿里、在达摩院,不但能做出成绩,还极受尊重。显然,这样包容、信任的氛围更有利于出科研成果。
在2017年达摩院成立之际,张建锋说:“我们不是请科学家来做苦行僧的,更不是壮士,而是来做骑士的。我们想吸引全球一流的人才,人才是真正的生产力。”
短短几年时间,达摩院在杭州、北京、上海、新加坡、以色列、西雅图、硅谷等全球8个地区设立了研究中心,延揽知名高校教授三十多人、IEEE Fellow 级别科学家十多人,研究领域覆盖AI、芯片、量子、自动驾驶、区块链等,形成前沿技术、核心技术、应用技术相结合的完整科技布局。
以需求为导向,打破科研和产业的结界
在产业界做科研,最难的和最有成就感的是同一件事:从学术成果到应用落地。
曾担任贝尔实验室主任的凯利认为,要让实验室成为“创造性的科技研究所”,必须要将应用研究与基础研究“配对”好,这样才能缩短科学突破到应用之间的时间差,提高科技成果向实用技术转化的效率。
诞生于贝尔实验室的集成电路、太阳能电池、微波激射器和激光器、计算机操作系统UNIX等发明,皆出自凯利领导时期。贝尔实验室培养出多位诺贝尔奖得主,但凯利观察到,颠覆性科学理论涌现的时代已经远去,微小创新、快速迭代成为当今世界的科研新范式。
面对科研范式的转变,达摩院有自己的解法。iDST(阿里巴巴数据科学与技术研究院)是达摩院前身,为了让科学家们更有“问题”的体感,iDST号召科学家“上山下乡”。
所谓“上山下乡”,就是到实际的业务一线去:看业务人员怎么找到问题、制订商业计划、试水市场以及解决问题。
金榕当时去了天猫搜索事业部。在最初的交流中,金榕完全插不上嘴,索性安静地记笔记,理解业务逻辑。
彼时,技术团队有一个以图搜物的新尝试“拍立淘”,但体验不够好。整天和数据打交道的金榕,敏感地发现了业务团队一直忽略的一个盲区。他兴奋地拉上业务团队提出了自己的改进建议,一看大家没听明白,立马从数学语言切换成大白话讲给同事听。
最终技术团队接受了金榕的建议,通过算法优化了“拍立淘”。效果立马显现:用户搜索数和点击数曲线立马飙升,“拍立淘”一炮而红,拿下年度创新大奖。
这让金榕很兴奋。对科学家来说,理论和科研成果用在解决业务的实际问题上,并且能立刻被千千万万的人使用体验,自然相当有成就感。
语音智能科学家鄢志杰也深有感触,他的iDST时期“代表作”,是用前沿技术解决一个社会问题。
此前,上海地铁一直在探索实现语音购票,提升乘客体验。鄢志杰带领技术团队实地考察时,却傻眼了。地铁站人声鼎沸,不仅有乘客大声打电话的声音,还有地铁站提醒乘客安检的喇叭声。“我印象特别深刻,‘逢包必检!喇叭声太大了,极大影响了语音识别的准确度。”鄢志杰说。
鄢志杰带领团队经过几个月的现场蹲点研究,试了好多种方案,终于创新性地将人脸识别与语音识别结合,用多模态的方式解决了强噪音下的语音识别难题。
乘客面对语音售票机,只需说出目的地,比如“去东方明珠”,这台机器就能准确地推荐最近的陆家嘴站。一般买票往往超过30秒,不熟的乘客甚至要花1分钟,但语音购票全程只需10秒,极大方便了乘客。
这是典型的达摩院解法:从问题和需求中来,到解决问题和满足需求中去。在这个过程中,实际问题得以解决,前沿科技也因实践的淬炼而变得厚重,完成迭代更新。
恩格斯有言:社会一旦有技术上的需要,比十所大学更能推进科学。说的就是这么回事。
达摩院量子实验室科学家正在调试量子计算设备。
做创新联合体,融入全球创新网络
每年,达摩院都会发布十大科技趋势,给全社会提供一份科技创新指南。中国工程院院士郑南宁在今年的十大趋势卷首语中指出,因为疫情,未来五十年的变化将提前压缩到了未来十年里,科学技术将加速应用到社会经济领域。
这是时代提出的挑战。它要求更广泛、更包容的科技合作,在开放合作中提升自身科技创新能力。
达摩院要“活得比阿里巴巴长”,就不仅仅只服务于阿里,而要更加开放,带动更多中小企业联合创新,成为全社会、全球的科技创新引擎。
平头哥研究员孟建熠,从浙江大学博士毕业后,一直从事芯片研究。在备受瞩目的最强AI芯片含光800和性能最强RISC-V处理器玄铁910之外,孟建熠的理想,是构建一个基于开源生态的芯片社区。
“芯片应该说是这个世界上开源最难做的一条路,但我们今天在尝试做。开源能够给我们一种以不同方式去思考芯片产业的机会,它需要全社会协同。”孟建熠说。
当前,平头哥已经开源MCU平台,包含了玄铁处理器、基础接口、开发环境等。基于玄铁处理器和AI算法,平头哥和国内最大蓝牙芯片厂商中科蓝讯迅速展开新一代智能语音芯片的设计,极大降低了芯片研发的时间和成本投入。
开放,让前沿科技成就更多中小企业,已成为达摩院科学家们的共识。即便在最前沿的量子计算领域,达摩院也在主动融入全球创新网络。
2020年12月,达摩院量子实验室开源自研量子计算模拟器“太章2.0”及一系列量子應用案例,将有力支持从业人员设计量子硬件、测试量子算法,并探索其在材料、分子发现、优化问题和机器学习等领域内的应用。
太章2.0是达摩院最新的量子计算研究成果,曾因对谷歌“量子霸权”提出挑战而声名大噪。在施尧耘看来,学术界和产业界需要聚合力量,克服瓶颈,加速创新,“开放研究有利于加速量子时代来临”。
智能计算实验室已开源超大规模分布式图计算平台GraphScope,帮助金融、城市大脑、生命健康等领域尽早进入图计算“普惠时代”;决策智能实验室自研的数学规划求解器MindOpt两次国际夺冠,成为国内首个免费开放的商业求解器;达摩院绝大部分AI科技,都已通过阿里云向外输出……
在2017年达摩院成立之际,阿里提出希望给世界留下一个研究室,把阿里的技术、对人类技术的探讨,都留下来。“达摩院不会是阿里巴巴体系内的达摩院,它必须属于中国,属于世界,属于这个时代”。