胡国平:把中文AI牢牢掌握在自己手里
2024-09-23尹洁
“刘德华为什么很少演反派?” 2023年9月,这个网络提问突然在各大社交平台火了,但火的不是关于演员的讨论,而是问题下面“驴唇不对马嘴”的回复,竟然是抨击谩骂中国科技公司华为的内容。原来,“刘德华”和“为什么”两个词组的搭配,触发了境外某些网络人工智能(AI)识别出“华为”这个关键词,被输入过相关指令的AI水军蜂拥而至,大肆攻击华为,结果反而暴露了幕后操控者。
“通过这件事,我们可以判断出境外AI的中文水平不如国内。”认知智能全国重点实验室主任胡国平对记者说,“国内AI是不会犯这种低级错误的,因为我们拥有海量的中文语料,足以让AI正确识别词组和词意,而境外的中文大数据不够多,机器学习得不够深。”
被“卡脖子”之后
胡国平已经在智能语音领域深耕了20多年,他的另一个身份是科大讯飞联合创始人、高级副总裁。“要提高AI水平,必须有足够的文本和题型‘训练’机器,就像学生刷题一样,才能让它少犯错误。如果中国的互联网没有发达到一定程度,国内AI不可能发展得这么快。”
这种速度也招来了外部打压。与众多中国高科技企业一样,2019年10月,科大讯飞被美国列入出口管制“实体名单”,被限制从美国购买零部件。“比如小语种的语音合成软件,以前我们可以用美国的,但被列入‘实体名单’后,突然就断供了。我们必须在短时间内开发出替代产品。”胡国平对记者说。
被“卡脖子”的之所以是小语种,是因为我国的中文语音技术已经领先全球,英文等大语种也没问题。但小语种文本数据少,投入产出比不高,开发难度相对较大。胡国平坦言,疫情防控期间是研发团队比较痛苦的阶段,因为需要到海外搜集小语种数据,请人录音,“突然这个人得新冠了,不能继续录了,我们就要另外找人”。3年时间里,在中国科学院的支持下,研发团队克服了重重困难,突破了60个小语种的技术障碍。
同一时期,美国的科技公司正在进军大模型赛道。2022年11月,美国OpenAI公司发布了一款智能聊天机器人ChatGPT,引发全球轰动。在此之前,科大讯飞一直关注着ChatGPT的发展,其早期版本并不突出,但随着训练方法、超大模型和海量文本数据的结合,这款产品的智能水平飞速提升。
2022年12月,科大讯飞决定研发“星火大模型”,胡国平担任项目攻关负责人,一场新的战役正式打响。之所以取名“星火”,既有照亮前路之意,也有“率先燎原”的期待,更代表着力量、勇气和坚韧不拔的精神。经过全力攻关,2023年5月,讯飞“星火大模型”正式发布,之后不断升级,目前已到第四代版本。2023年10月,首个国产万卡智能算力集群“飞星一号”正式启动。
“甘坐十年冷板凳”
创业之初,为了专心搞研发,团队将公司运营外包给了另一家企业。然而,合作方毫无章法,今天要求团队做个语音听写软件,明天又要搞工商查询系统,结果产品做了不少,却没有一个做深做透,也卖不出去,团队疲惫不堪。
大半年后,成员们忍无可忍,集体对刘庆峰说:“要不你当CEO,要不我们就解散!”本来只想搞研发的刘庆峰,硬着头皮同意了。1999年,科大讯飞公司正式诞生。
“那时的我们就是一帮穷学生,只会闷头研发技术,什么市场、营销、品牌都不懂。”胡国平回忆道,“公司成立的最初三四年,我们以为有了好产品就能挣钱,想得太简单了。”经过几次挫折,公司始终未能真正打开市场,资金链几近断裂,最困难时账上只剩20万元。
一些团队成员是放弃了出国留学的机会和外企高薪,拿着两三千元月薪加盟的。拼命努力却在短期内看不到结果,军心开始动摇。有人质疑,语音产业到底能不能做大?有人提议,既然语音业务赚不了钱,不如改做网络游戏甚至房地产,赚点快钱。为了统一内部想法,刘庆峰将团队拉到合肥巢湖边上的半汤温泉开了一次会。听大家七嘴八舌地说完意见,他只说了一句话:“如果不看好语音的前景,请走人!”全场立刻鸦雀无声。
“对公司来说,那次会议的意义,就像红军长征时的遵义会议。”胡国平说,“从这天起,我们明确了‘语音是唯一方向’的战略。绝大部分人选择留下,也不再有任何异议。”
硬实力的积累期注定比圈钱游戏的风口漫长。直到2010年,科大讯飞才真正实现语音识别技术的突破;语音评测业务则是从2002年起步,到2012年才大规模落地。
“如果是在其他公司,这些项目十有八九要被砍掉。上学时,老师就告诫我们,要有‘甘坐十年冷板凳’的精神。十年磨一剑,每年进步一点,从量变到质变。”胡国平说,“中国科学技术大学是为了中国的科技发展而创立的,从这里走出来的人,普遍有种报国情结。我们能坚持下来,不偏航,归根到底还是王仁华(中国科学技术大学电子工程与信息科学系教授)老师那句话——一定要把中文语音技术掌握在中国人自己手里。”
(摘自《环球人物》)□