全球首个多模态地理科学大模型发布
2024-10-28
文萃报·周二版 2024年39期
多模态地理科学大模型“坤元”(Sigma Geography)9月19日正式发布。这是全球首个多模态地理科学大模型,由中国科学院地理科学与资源研究所联合中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发。
“坤元”首席科学家、中国科学院地理科学与资源研究所研究员苏奋振介绍,该模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,目前完成了地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作。
据了解,“坤元”具备“懂地理”“精配图”“知人心”“智生图”等特点。
懂地理,是指“坤元”建立了涵盖4大类、16小类的地理全学科语料库,提供320亿词元供大模型自监督学习,并制作了4万余条高质量地理学指令进行模型微调。相比通用语言大模型,“坤元”更熟悉地理学的语言模式、专业术语和领域知识,在地理学基准测试集上的准确性提升了31.3%。
精配图,是指“坤元”可以根据生成的文字答案检索不同地理要素,并匹配地理景观照片、专题地图或示意图表呈现给提问者。
知人心,是指“坤元”能充分考虑地理知识爱好者、地理学专业学生以及科研人员的地理科学知识体系认知和表达差异,以图文共现的方式给出适配用户知识结构的地理学专业问题解答。
智生图,则是指团队基于“坤元”开发的科研助手,可以根据用户指令完成概念理解、数据获取、信息分析、制图综合等流程,最终生成用户需要的专业地理图表。
“‘坤元’目前主要支持科研用户,未来将逐步面向公众开放。”苏奋振表示。
(摘自《光明日报》)