从感知认知到智能决策,持续推进AI创新
2023-12-22
本刊记者
通用大模型,被誉为“AI时代”的灵魂,是指一种集成了多种功能的AI系统。其在语音识别、自然语言处理、图像识别等领域的应用,极大地推动了人工智能技术的发展。
然而,一个普遍的事实是,当前,通用大模型存在算力成本高、本地化部署难、数据泄漏风险高、领域专业知识弱等痛点难点,市场需求难以得到满足。
在2023“直通乌镇”全球互联网大赛人工智能(大模型及数字人)专题赛上,北京中科闻歌科技有限公司(以下简称“中科闻歌”)以“雅意”大模型为参赛项目,针对行业的痛点问题,带来了中科闻歌的解决方案。
闻弦歌知“雅意”,善推理知决策
“闻歌”二字起源于《吕氏春秋》中的“闻弦歌知雅意”,从创立伊始,中科闻歌便将人工智能的内涵蕴藏于企业名字之中。“我们的愿景是通过大数据分析、人工智能技术洞悉行业难题及本质,解决隐藏其中的难点,以技术服务国家战略需求。”中科闻歌相关负责人说道。
而中科闻歌此次带来的“雅意”大模型,更是与企业名字暗合,闻弦歌、知雅意,善推理、会决策,“雅意”大模型的定位便是一款人工智能认知与决策技术领域的企业级通用大模型。
据介绍,“雅意”大模型由中科闻歌自主研发,拥有五大核心功能,包括实时联网问答、领域知识问答、复杂场景信息抽取、多语言内容理解、多模态内容生成,共100余项特色技能,支持云端MaaS使用、本地一体机部署、自主私有训练部署三种使用方式,可快速对接政府、企业数据并一键生成大模型专属应用服务。
作为垂直领域的专属大模型,“雅意”围绕行业垂直生态,推出“5+N”计划,面向媒体、宣传、金融、治理、安全等五大方向进行针对性训练,并泛化到家居、医疗、教育等行业,可适配多样化、专业的业务场景。目前,“雅意”已搭载在中科闻歌多款行业产品中,包括面向舆情信息领域的“晴天”多模态信息洞察平台、面向媒体数字化领域的“红旗”智能媒体操作系统,以及面向金融领域的“多投”投研資管平台等。
5到700,500万到10亿,0到4亿
许多人不知道的是,中科闻歌还藏着“国家队”的基因。2017年,“人工智能”首次被写入全国“两会”政府工作报告,报告提出,“要全面实施战略性新兴产业发展规划,加快新材料、人工智能、集成电路、生物制药、第五代移动通信等技术研发和转化,做大做强产业集群”。
在国家科技政策的鼓励支持下,人工智能市场迎来了发展高潮,出现万亿级的“时代赛道”。彼时,已在中国科学院深耕AI和大数据研究十余年的王磊等五位青年技术人员,选择走出实验室,在180平方米的办公室,拿着500万元的天使启动资金,就这样“下海”了。
“国家队”的基因为中科闻歌团队之后的研发成果输出,奠定了良好的科技基础。从王磊等人的中科院工作经历算起,到今天,前后共17年,核心团队一直坚持在人工智能与复杂数据解析核心技术创新领域。如今,企业研发人员占比达60%,硕博人才占比高,仅学术带头科学家便达20余人。有了科技基因和科技成果的中科闻歌,第三步便是发挥市场化基因,为此,企业建立了完全市场化的经营模式,组建起一支多元化的人才队伍。
从5个人到700人,从500万启动资金到10亿的资产规模,从0到年销售额达4亿元,从北京到全国15家分公司,中科闻歌一路稳扎稳打,逐步在人工智能领域走出了自己的道路。
今年9月1日,由国家信息互联网办公室发布的第二批境内深度合成服务算法备案名单中,中科闻歌“雅意”大模型算法便位列其中。目前,雅意大模型的性能在国内权威C—EVAL评测的所有模型中,名列第四,在国际权威评测LLM leaderboard评测的同等参数规模模型中同样名列前茅。
专注前沿科技创新,服务国家人工智能战略需求
习近平总书记曾指出,“新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源”。从2016年3月,“人工智能”一词写入国家“十三五”规划纲要开始,近年来,国家的重视为人工智能的发展提供了强劲的动能,而一大批像中科闻歌这样的科技企业,一直冲锋在攻克各项技术壁垒的前沿,为这个万亿赛道助力。
从梳理技术选赛道开始,中科闻歌几乎是一脚便站上了最难的赛道。从感知智能向认知和决策智能进军,这个研究方向在业界被称为人工智能皇冠上的明珠,是人工智能取得进一步突破的关键瓶颈,也是形成更大产业规模的关键技术。
在“雅意”研发过程中,技术壁垒便是层出不穷。据介绍,“雅意”是基于BigScience发布的bloomz—7b—mt模型(开源可商用的预训练模型,70亿参数)和Hugging Face发布的StarCoder(开源可商用的预训练模型,150亿参数)权重作为初始化权重,并基于词表进行扩展,前后经历了三个阶段的训练:第一阶段是面向通用技能领域,使用闻海自有数据筛选高质量多样性样本数据364万条,进行指令微调;第二阶段是在人工构造的高质量领域数据上,进行领域性指令微调,包括媒体、舆情、安全、金融、治理等五大领域数百种自然语言指令任务,共计80万条高质量知识数据;第三阶段则是针对安全性/毒性等场景,做了针对性训练,训练数据约5万条,并结合人工反馈优化增加模型的忠实性和安全性。
在经过内部构建的55个任务综合评测后,“雅意”与目前主流的几个大模型相比,取得了不俗的性能,在基础能力测试方面,其整体性能与目前开源的同等规模参数的大模型能力相当。
“中科闻歌一直致力于引领人工智能从感知向认知、决策技术跨越,目前正在训练的一个千亿规模的大模型,在数据、模型、应用等方面拥有完全自主知识产权,希望将来能以先进的大模型技术服务行业数智化转型,服务国家层面的人工智能战略需求。”
谈及此次乌镇之旅,项目团队负责人表示,通过大赛,不仅接触到了最新的大模型和数字人技术,通过与专家和同行的交流,项目团队还了解到了更多的新研究方向和应用场景,这对中科闻歌未来的研究和实践有很大的帮助,同时对国内大模型和数字人赛道的未来发展前景充满信心。