APP下载

数字经济时代的“智源密码”

2024-06-27陈宁

前线 2024年6期
关键词:研究院人工智能模型

陈宁

高速公路上,无人驾驶驶入现实,没有司机的出租车正搭载乘客,以“顶格”时速驶向机场;

手术室里,腹腔镜中纤毫毕现,医生正用医疗机械臂为远在新疆的患者实施肿瘤切除手术;

制造车间内,“钢铁巨象”翩然起舞,120余台焊接、抓取、组装和搬运机器人正围绕16条智能生产线各显神通;

……

这些,只是数字化时代的北京城市一隅。在数字经济蓬勃发展的今天,“智力”已如水、电、网一样流向日常生活,一步步实现着人们对新质生产力构造的活跃社会的渴望。

数字赋能千行百业,离不开“产业大脑”的支持。这“大脑”,就是人工智能的底座——大模型。

海淀区成府路150号。一栋看似普通的红砖建筑里,集结了几乎北京最顶尖的人工智能领域人才。这里,就是北京智源人工智能研究院所在地。也正是这栋楼里,诞生了我国首个大模型——“悟道”,这家研究院由此冲破西方国家的垄断,推动我国人工智能发展行至深处。

时不我待,构筑人工智能生态“护城河”

2020年5月,美国著名人工智能公司Open AI发布一款名为“GPT-3”的语义大模型,一时掀起行业巨浪——通过海量数据学习,人工智能首次出现了类似人类的逻辑推理能力。

中国的科研工作者在为GPT-3沸腾的同时,也产生了极大的心理落差——彼时,我国人工智能领域在各个方面并不占优。

《中国新一代人工智能发展报告2019》显示,当时,虽然我国人工智能领域论文数量全球居首,但引文影响力指标却相对落后;人才拥有量虽仅次于美国,但高水平人才却不到美国的五分之一。即使是在全国人工智能高地的北京,大模型方向的研究也几乎是空白。

更严峻的是,一旦被裹挟进入西方构建的人工智能生态圈,那么所有与之相关的产业链跃迁,都有可能被掣肘。如同手机上的应用软件,如果没有强大的系统支撑,开发得再多、再好也用不了。“必须聚焦攻关自主可控的底座大模型,构建起自己的人工智能生态‘护城河。”清华大学自然语言处理实验室主任孙茂松说。

孙茂松和同事们四处寻求合作者,却发现这项壁垒极高的研究,高校做不了,企业又不愿意做。虽是春暖花开的5月,他们却犹如淋了一身冷水。

高校通常以“项目制”牵头科研,大多以“年”为论证周期。但人工智能领域的科技创新瞬息万变,必须全力追赶。显然,这种科研机制与“大模型”的研发训练并不适配。

困扰企业的,则是投入产出比问题。大模型好似“空中楼阁”,需要算法、算力、数据的海量资金支持。况且,依据“摩尔定律”,投入的昂贵设备每18个月就会贬值一半,成果却遥遥无期。这让不少企业望而却步。

踌躇之际,孙茂松、刘知远、黄民烈等几位科学家不约而同地将目光投向了离清华只有几百米远的一所新型研发机构——北京智源人工智能研究院(以下简称“智源研究院”)。

这家新型研发机构,新在哪里?

成立于2018年11月的智源研究院,肩负着人工智能前沿探索使命,从主体、人才使用到成果转化,解决的是创新研发中生产要素错配、失配、低配造成的堵点、痛点、难点。

“作为科技部和北京市政府支持下成立的民办非营利性研究机构,智源实行理事会领导下的院长负责制。这就决定了它可以不设考核和阶段性目标,鼓励科学家自主决策,去破解那些颠覆性技术和前沿技术难题。”智源研究院理事长黄铁军举了一个生动的例子,“重大的国家级科研项目,用两三年时间研究立项并不鲜见。但在智源,只要论证科学严谨,两小时通过由业内顶级专家组成的‘院务会、即刻拨付数百万元研发资金,都是常态。”

制度集成、创新赋能,这是“时间不等人”的胆识。科学家们与智源研究院一拍即合。

以技术为信仰,勇闯大模型研发“无人区”

2020年11月,智源研究院以北京市筹集的1000P算力支持为起点,决心背水一战。

没有作业可以抄,没有经验可以循,有的是以技术为信仰的一腔热情和锚定国家重大战略需求的不懈努力。智源研究院将参与者整合为3个小组,深入中文大模型研发“无人区”——一个个高风险、非共识、颠覆性的研究领域。

以文源团队负责的超大规模预训练语言模型为例。他们遇到的第一个困难,就是怎么阻止大模型“词不达意”和“答非所问”。原来,当时全球通用大模型数据训练集里,中文语料仅占1.3%。团队搜索得来的50TB原始数据,主要源自电商、社交、搜索等渠道,存在大量的数据偏见。高质量中文数据,一度成为稀缺品。

中文语义深奥又灵活多变,给大模型“投喂”的语料质量,对运行效果影响极大。团队决心秉持细节上的“技术洁癖”,构建高质量数据集,让大模型高效、经济地运行。团队负责人刘知远与黄民烈所带的8名博士生,全被派去做数据标注与“清洗”。

他们夜以继日地比对、推敲着每行编码,以确保数据的完整、全面、合法且唯一。其间,团队没有发表过一篇学术论文。这样做,无论是对教师还是对学生,都是极大的冒险。“如果一无所获,我们在学校的学术考核将被认定为不合格。”黄民烈说,“这是拿着大家的职业生涯去做赌注。幸运的是,我们的方向找对了!”

最终,团队将原始数据压缩至2.6TB,中文大模型有了第一个高质量数据集。

从高端芯片到深度学习框架,从算力、算法到数据……智源研究院集中优势资源,奋力攻关。2021年3月,“悟道1.0”问世。3个月后,“悟道2.0”亮相,参数规模是GPT-3的10倍。

“悟道”,骤然改变了世界人工智能领域一家独大的发展格局。正是从这时起,智源研究院被全球人工智能领域三巨头之一的微软公司视为主要竞争对手。与此同时,国家加快布局人工智能产业,并将其写入“十四五”规划。

以人工智能为引擎,高质量发展的底色更加鲜明。智源研究院的不懈探索,仿佛解开了中文大模型的研发密码。随即,犹如百舸争流,科技企业纷纷跟进,创新火花竞相迸发。截至2024年3月,国内大模型数量超243个。我国的大模型发展,已经形成了一条壁垒极高的技术“护城河”,得以涵养整个产业生态。

理想与使命合一,形成人才“强磁场”

“群星闪耀”,有人用这样的词,形容智源研究院的人才生态。

众所周知,人工智能作为前沿科技,离不开人才驱动。近年来,智源研究院已经遴选并支持以“智源研究员”和“智源青年科学家”为主体的94名智源学者,其中近一半为38岁以下的青年学者。他们的学术背景横跨高校、科研单位及企业研究机构,形成了代表我国人工智能领先科研水平的“北京队”。

人们不免疑惑:作为一家民办非营利研究机构,智源研究院既没有“帽子”,待遇也无法与头部企业对标,缘何吸引这样一批顶级人才?

“在这里,既是在做自己想做的事,也是在做国家和社会需要的事。当理想与使命合一,就会迸发最强驱动力。”智源研究院副院长林咏华用亲身经历给出了答案。

近两年,国内人工智能领域已进入“百模大战”阶段。为避免无序竞争,智源研究院将目光转向营造更健康的大模型生态圈。

2023年,林咏华决心以“科学度量大模型评测基准”为研究方向,申报科技部重点课题。作为人工智能领域的开创者之一,林咏华觉得一切本该水到渠成。当她兴冲冲地去领申报材料时,却被告知不符合初选资格——没有正高级职称。

只能尽快申请职称。但了解政策后,林咏华又遇波折——由于研究的领域太过前沿,自己根本没有符合的职称序列可以申报,更找不到合适的专家来评审。

了解情况后,黄铁军找到她:“只要有好的想法,智源会创造一切条件帮助科研人员实现。”不问出身、不看论文,只看是否取得标杆性成就、有没有成为标杆的潜力——从诞生之日起,智源研究院的选人、用人机制,就一直向学术实力和科研潜力倾斜。

2023年3月,黄铁军找到北京市人力资源和社会保障局寻求帮助。“职称评聘工作的改革方向,必须与国家发展战略同心同向。”市人社局答复。

仅仅一个月后,《北京市高层次、急需紧缺、特殊特艺人才高级职称考核认定办法》出台。通过“一事一议”“一人一策”“随时随刻”评审、“3+1”实名举荐,很快,林咏华获得了正高级职称。她也成为受益于此办法的第一人。

同年,林咏华承接的国家科技部重点课题正式立项。这个课题,也让智源研究院完成了从“运动员”到“裁判员”的角色转变。

“这在别处是难以想象的。它给我们的动力,不是优渥的待遇能给予的。”林咏华如是说。

林咏华的经历,只是智源研究院众多科研人员的一个缩影。“智源是以公共利益为导向的研究机构,注定无法提供最具竞争力的薪酬”,智源研究院院长王仲远说,“但这也是一种筛选同行者的良性机制。”3个月前,他刚从业界一家头部公司离职,降薪90%来到这里。

从“实验室”走向“应用场”,赋能千行百业

作为开源系统,“悟道”大模型已被下载2000余万次。每次下载,都有可能是对某条生产线、某个企业甚至某个产业的一次数字赋能。“这也是智源的一个重要使命,让科技创新成果不断从‘实验室走向‘应用场。”黄铁军说。

功成不必在我。不仅是开源大模型,在科研过程中生发成熟项目,智源研究院在助推成果转化时,同样不遗余力。

算法工程师赵撼宇,一毕业就来到了智源研究院。他的一项专利技术,在“悟道”与OPPO手机小布语音助手的合作项目中,发挥了关键作用。“在成果落地的那刻,我感到自己的价值得到了认可。”赵撼宇说。

同许多手机厂商一样,OPPO小布以往依据的是互联网数据,有数以亿计的问题难以回答,非常影响用户体验。但如果自建语料库,周期长、人工数据标注成本高,企业难以承受。他们找到智源研究院学术副院长唐杰寻求帮助,唐杰将“悟道”大模型中赵撼宇负责研发的“生成式回答系统”推荐给了企业。

2023年年底,OPPO小布接入“悟道”,一纸专利,使手机语音助手的单条回答建设成本降低了99%,彻底解决了一个行业的共通性问题。

“科研工作者虽然有极强的创新能力,但成熟项目的转化落地并不尽如人意。”智源科研运营部经理赵小帆说,“企业如何选址、怎样融资和申请政府引导基金、去哪里组建工程技术团队等问题,智源都会手把手地帮助他们落地。”

曾任赛迪集团总裁的孙会峰,在我国加入世贸组织谈判过程中,随团调研了大量中国企业。他发现,大部分企业70%的时间都花在了了解产业链、合作伙伴、竞争对手和各地产业政策上,在企业研发上投入的精力显得力不从心。

当接触到“悟道”大模型时,孙会峰豁然开朗:“借助智源的产业知识计算引擎,能俯瞰整个生态,为企业打开‘上帝视角,观察趋势。”抱着这样的想法,他决心自己创业。

来到智源研究院,孙会峰感觉收获更多。2021年,借助智源研究院天使轮投资1000万元,孙会峰成立了北京上奇数字科技有限公司(以下简称“上奇数科”)。几个月后,智源研究院又帮他畅通了国家专利局的专利绿色通道,以往1年半时间才能获得的专利授权,现在4个月就拿到了,这让上奇数科得以在激烈的人工智能“卡位赛中”占得先机。

不仅如此。当孙会峰为如何优化产业链精度而苦恼时,智源研究院又为他推荐了算法工程师史业民。“一次调教,产业图谱的精度便从70%上升至98%。”孙会峰说。现在,上奇数科的产业知识图谱“上奇产业通”两秒就能实时生成包括100余条产业链、5000万家企业在内的40余类产业数据集。

好风凭借力。

成立仅3年,上奇数科迅速成长为国家级专精特新企业,估值达10亿元。

注重“从0到1”的原始创新,也注重“从1到N”的产业转化,通过产学研用紧密合作,智源研究院至今已孵化了“月之暗面”“深言科技”等近百家企业,其中10余家已成为“独角兽”。

有这样一组数据,令人振奋:作为数字经济发展的重要驱动引擎,2023年,北京人工智能产业的核心产值突破2500亿元,辐射产值规模已超万亿元!

又是一个草长莺飞的季节。前不久闭幕的中关村论坛上,智源研究院等16家机构发起并成立了中关村人工智能联盟。一群铭记国家使命的科学工作者,锚定国家重大战略需求和北京数字经济标杆城市建设,正在向科学技术的更深处进军……

猜你喜欢

研究院人工智能模型
一半模型
北京食品科学研究院
工程技术研究院简介
从心所欲不逾矩——为中国戏曲研究院成立70周年作
不是我!是他捣乱!
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
2019:人工智能
人工智能与就业
数读人工智能