APP下载

百川智能:百舸争流,勇立潮头

2024-07-13沙敏

中关村 2024年6期
关键词:百川小川搜狗

沙敏

王小川率领的百川智能,按部就班,有条不紊地,沿着他提出的“理想上慢一步,落地上快三步”目标在努力。

2024年3月,福布斯中国筛选出51家新晋独角兽企业名单,成立仅一年的百川人工智能科技公司(以下简称“百川智能”)上榜。4月23日,在中关村启迪科技大厦,记者来到百川智能,听百川人讲述着百川智能的创立、发展与未来。

技术极客,屡创奇迹

回首中国互联网历史,1994年被称为Internet的元年。

清华大学的钱天白教授,协助中科院网络信息中心,完成了中国国家顶级域名.CN服务器的设置,从此中国进入互联网赛道。网易、搜狐、新浪相继在纳斯达克挂牌上市,成为当时中国三大门户网站。中国互联网江湖上,人才辈出,各领风骚;风云际会,屡创奇迹。如果说张朝阳是中国互联网的教父,阿里的马云,则以电子商务占据半壁江山;马化腾创立腾讯后,1999年,腾讯开发的即时通信工具QQ软件上线,成为国内运用次数最多的通信软件。2011年微信应用软件上线,如今在海内外,已拥有1000多亿的用户。

年少有为的王小川,是位技术极客,擅长的是技术创新。在当今计算机应用与技术创新飞速发展的时代,商业模式创新与计算机技术应用的创新,改变着百姓的生活。美团创办者王兴,创办美团App,送餐变得快捷,外卖巨头诞生;字节跳动的张一鸣,创办今日头条与抖音,成为国民级的运用。技术创新的背后,同样也要有精湛业务背景的领导人,率领一支精干高效的团队。

搜狗与清华有密不可分的历史渊源,公司CEO王小川,更是清华大学计算机系的高材生,从清华本科毕业后,又读完硕士、博士。

搜狗的CEO(首席执行官)、CMO(首席营销官)、CTO(首席技术官)等高管均为清华校友。2003年开始研发搜狗搜索时,王小川最初的团队,均来自清华大学奥赛集训队,12名兼职学生中,已诞生过技术领军级人物。

搜狗的创始人王小川,当他还在清华大学读大三时,就在ChinaRen做兼职,负责站内搜索。1999年,21岁的他率领团队仅用两个月,就高效研发出ChinaRen新闻发布系统,搜狗跃升为中国第四大网站。张朝阳邀请王小川加入搜狐,成为爱将,两年后晋升副总裁。

2004年8月3日,他与团队正式推出拥有独立知识产权的搜索引擎搜狗,由于有马云支持,促成了搜狗与分拆与独立。搜狗创立了中国第一大输入法和搜索引擎,拥有独立的知识产权。

2015年,王小川获得北京市荣模,北京市科学技术一等奖。2017年11月9日,搜狗在美国纽约交易所挂牌上市,成为中国赴美上市第一股,此时的搜狗市值已破50亿。2019年,腾讯的马化腾入股搜狗,双方成为合作伙伴。

搜狗新的契机,发生在2021年。因为腾讯的商业版图中缺少这块业务,腾讯总裁马化腾,以20亿美元全资收购搜狗,搜狗CEO王小川宣布卸任,4月10日,他宣布成立百川智能。与搜狗总编辑孙彦新等人一起,投身大模型,立志为生命健康与医学逐梦,创立中国版OpenAI。

百川智能的团队认为,大模型将语言变成了数学模型,语言是数学模型、参数模型和权重模型。语言是思维与逻辑、知识与文化和交流的载体,当语言变成数学模型后,它代表的知识与经验与思维与逻辑,都能够用数学模型进行推演。王小川在学习大量医学知识的基础上,基于语言模型的思考,决定出来做大模型。初建的团队,由搜狗的核心团队组成,王小川以他任院长的清华计算机系天工智能研究院为人才研究库,开启了大模型生命健康与科学的创业之路。

百川汇海,开源双赢

“2023年是大模型元年开始,人类从信息时代走向智能时代,走入新的快车道”。王小川在演讲时的话语掷地有声!

百川智能,就诞生在2023年充满希望和机遇的春天。

4月10日,王小川宣布百川智能成立时,发表了演讲:“生活在二十一世纪是如此幸运,波澜壮阔的互联网革命还没有谢幕,通用人工智能时代又呼啸而来。大模型不仅将重塑现有行业,更将创造前所未有的价值和机遇”。

王小川是一个有很深厚家国情怀的人,是完美的理想主义者。

当时国内的大量高校、企业和事业单位,使用的都是美国的大模型,给核心技术增量自控带来了很大风险。中国应该有自己的开源模型!在他的率领下,公司员工守望相助,攻坚克难,高效率地完成任务。

4月底,算力迅速到位;6月15日,公司就发布第一款免费商用的大模型Baichuan7B并开源;第一款大模型一经推出,便受到业内瞩目。7月11日,第二款Baichuan13B发布;8月8日,发布Baichuan53B闭源大语言模型,其写作、文本创作能力达到行业最高水平。

9月6日,百川7B升级到2.0版本,发布Baichuan2-7B、Baichuan2-13B两款免费可商用的开源模型,并且公开了Baichuan2-7B的技术报告,详细介绍了Baichuan2-7B训练的全过程。2.0版本系列模型在评估任务中,大幅领先全球范围内最强的LLaMA2,引领开源社区走向中文开源大模型时代。Baichuan 2系列模型,在开源社区的下载量已经超过了700万次。

中国科学院院士、清华大学人工智能研究院名誉院长张钹,在主题演讲中提到“目前我国已经推出很多从几十亿到几百亿不同规模的大模型,这些大模型主要集中在垂直领域的应用上,我很支持开源大模型助力学术研究”。他对百川智能推出的用于基础研究的、开源大模型研究成果给予高度评价。

2024年1月29日,百川智能发布超千亿参数的大语言模型Baichuan 3,根据中文大模型基准测评2024年4月报告,测评选取了国内外有代表性的32个大模型,通过SuperCLUE测评结果发现,

Baichuan 3表现不俗,拔得头筹。在多个权威通用能力评测中,Baichuan 3均展现了出色能力,在中文任务上更是超越了GPT—4,是中文医疗任务表现最佳的大模型。

除此之外,百川智能助力知名高校的专项科研,为大模型研究项目提供资金扶持。2023年9月,百川智能与中国计算机学会(CCF)、北京英博数科科技有限公司一起,联合创立了“CCF—百川—英博大模型基金”,支持国内外高校及科研院所的青年学者,为大模型开展学术研究,提供资金支持。该基金累计已收到985院校及新加坡知名大学的100余份申请,已经完成资助清华大学、北京大学、上海交通大学、复旦大学、中国人民大学、新加坡国立大学等高校的15个申请项目。

2024年3月17日,百川智能与北京大学共同签署了“北大—百川通用人式智能联合实验室”共建协议,双方携手积极探索大模型的可解释性、安全性、稳定性等层面的创新,解决企业在大模型对齐领域的技术需求,为大模型的基础科学研究提供支持。

尽管百川智能成立仅一年,但保持着业内最快的模型更新速度,从以月度为单位,到以半月为单位,坚持开源与闭源结合,相继推出11款大模型,涵盖了开源、闭源、学术科研、国产算力等多个维度。公司未来会发布Baichuan 4,未来可期。

关爱健康,关爱生命

王小川率领的百川智能,按部就班,有条不紊地沿着他提出的“理想上慢一步,落地上快三步”目标在努力。王小川正朝着生命科学与医疗领域方向探索与前行。

在业内,医疗领域被称为“大语言模型皇冠上的明珠”。为了摘取皇冠上的明珠,从国外到国内,人工智能医学研究团队不懈地努力,攀登这座科学的珠穆朗玛峰。

在国外,2023年9月21日,谷歌蛋白质结构预测模型获2023年拉斯克奖。拉斯克奖,是在医学领域顶级奖项拉斯克奖,这一奖项也被誉为“诺贝尔奖的风向标”。将2023年基础医学研究奖,颁给了研究医学大模型的两位博士,因他们创造了一项能够预测蛋白质三维结构的革命性技术——AlphaFold。颁奖辞中写道:通过放飞想象力和才华,Hassadbis Jumper和他们的团队,完成了让科学家困惑半个世纪的任务,开启了研究和操纵蛋白质的新时代。

在国内,王小川提出:“理想上慢一步,落地上快三步”,最新发布的超千亿参数的最新版本大模型Baichuan 3,表明百川智能的医疗知识水平有所突破。Baichuan3的医疗数据集Token数超千亿,医疗能力逼近GPT—4。

对标世界先进的人工智能公司OpenAI,王小川颇有感触。在谈起与美国OpenAI交流时的体会时,他感叹道:“他们现在正在设计一个把1000万颗GPU连在一起去做模型的这样一种技术,这样一种想法像登月一样。”王小川说落地快三步,是要实现应用上的尽快落地,与OpenAI不计成本的追求技术上的天花板相比,我们要做的事是发挥自己的优势。

未来的百川智能有三个方向,一是AI顾问。大模型本身是造人,有知识有经验的顾问;二是要做AI医生。三是做太虚幻境。百川的产品在5月份起,将会逐步推向市场,大模型的超级底座和超级应用会接受用户的检验。

猜你喜欢

百川小川搜狗
以海纳百川之势讲好中国故事——以“百川奖”三部获奖作品为例
“热闹”的动物医院
“琴语” “律动” “百川”
腾讯拟147亿元全资收购搜狗
《金娃——龙舟》
搜狗三季度营收同比增长
《百川书志》成书与流传中的几个问题
搜狗分号工具箱 输入更便捷
聆听幸福
终于来WM了.搜狗手机输入法