基于通用人工智能的图书馆知识服务研究*
2023-03-11张庆来
张庆来 苏 云 张 军
(1.兰州大学管理学院 甘肃兰州 730000)
通用人工智能(Artificial General Intelligenc,AGI)具备通用任务解决能力和持续自主学习能力,在认知、决策等多个方面达到了类人脑的智能特征[1]。特别是ChatGPT 的出现掀开了AGI 走近民众的序幕,让民众对大模型时代从数据、信息到知识,乃至智慧的转化给予了更多关注。尽管基于AGI 的知识生成还存在许多不足之处,但AGI 平台的快速应用,为图书馆知识服务发展提供了新的技术支撑。
1 AGI 技术为图书馆知识服务带来机遇
1.1 AGI 技术应用将进一步打通图书馆知识服务的DIKW 信息链
传统的信息技术应用主要增强了DIKW(数据-信息-知识-智慧)模型中的数据、信息两个环节,而人工智能技术通过向用户提供数据、信息和知识,强化了DIKW 模型中的知识与智慧两个环节,既贯通了从数据、信息、知识到智慧的链接,也推动图书馆应用AGI 开展知识服务由浅层服务转向深层服务、由通用服务转向精确服务、由数字化服务转向智能化服务,使图书馆进一步成为社会运行的知识服务枢纽和核心数字基础设施。
1.2 AGI 技术应用将进一步赋能图书馆知识服务的品质提升
AGI 具有文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力与多模态能力等七大维度的能力[2]。 图书馆可以充分运用AGI 所具备的文本生成、语言理解、知识问答、逻辑推理和多模态能力以提升自身的知识服务能力,如让读者用户以自然语言提问,随后进行交互式数据分析,最后以多模态方式提供结果。通过AGI 平台提供知识服务,图书馆用户将不必掌握检索文献、资源库搜集等相关知识,仅需直接输出问题即可通过与AGI 平台的交互逐步获取所需知识,一站式解决问题。AGI 甚至还会根据用户的问题进一步提供智能化分析与引导。
2 基于AGI 的图书馆知识服务内容
2.1 基于AGI 的图书馆传统知识服务
图书馆将AGI 应用于参考咨询服务、学科服务、定题情报服务、知识产权服务等传统知识服务,目前已有一定的实践探索。如瑞典国家图书馆利用馆藏资源开发出基于BERT 的瑞典语语言模型,该模型可以使数字藏书用于自动分类、增强搜索能力、OCR 自动 识 别 等[3]。 俄罗斯多家联邦 图 书 馆 使 用ChatGPT 3.5 完成书目描述与推荐、对俄语论文制作摘要、基于内容相似度推荐文献等,结果表明Chat-GPT 3.5 具有与工作人员同等甚至更高的能力,但仍需要对结果的可靠性进行控制[4]。
(1)参考咨询服务。美国加州大学尔湾分校图书馆的“ANTswers”、日本东京都立中央图书馆的智能问答系统、清华大学图书馆的“小图”等人工智能系统或机器人是图书馆界耳熟能详的参考咨询服务人工智能工具,而AGI 为参考咨询服务提供了新的发展思路。 图书馆可以依靠丰富的文献数据资源搭建AGI 平台以替代图书馆员为用户提供虚拟参考咨询服务。目前已经出现了如武汉大学图书馆的“小布”[5]等虚拟咨询馆员。据2023 年的一项研究统计,我国42 所“双一流”高校图书馆中已有20 所高校图书馆应用虚拟馆员[6]。
(2)学科服务。学科服务是一种典型的图书馆知识服务应用场景,目前,国外高校多采用美国Springshare 公 司 的LibGuides 平 台[7],国 内 高 校 主 要 依 托CALIS 来开展学科服务。LibGuides 学科服务平台可将图书馆内外的资源进行有效的组织与集成,但在数据分析方面却存在一定不足。AGI 的出现使大量的数据转换为知识成为可能[8],有研究就指出AGI 可以用来发现图书馆与研究课题相关的资源[9]。 将AGI技术应用于学科服务,可以从完成学科资源聚合与整合、支持交互式协作分析等方面提升学科服务的能力与水平。
(3)定题情报服务。 定题情报服务(Selective Dissemination of Information,SDI)主要用于跟踪特定主题的知识进展。 传统SDI 通常由经验丰富的图书馆员完成,并需要根据用户的需求不断做出调整。充分发挥AGI 在信息检索方面的先天优势进行信息检索与跟踪[10],就可以为定题情报服务提供更大的灵活性、适应性和扩展性。如Open AI 推出的GPTs 服务,它不仅可以提供个人定制化的服务,用户还可以设定它的目标和功能,上传配置文件让它适应特定场景和任务[11]。
(4)交互式检索。作为AGI 代表的ChatGPT 在寻找答案、解决问题的效率上已经远远超越了现有的搜索引擎。 因而有学者指出可以将大语言模型与关联数据相结合,在特定领域进行深度检索[12]。 而相较于传统的图书馆文献检索需要用户掌握必要的检索知识与技能,AGI 技术只需用户将自己的需求用自然语言表达出来,就可以通过与AGI 的交互进行检索,使信息检索知识服务从命令驱动转向意图驱动[13],且以智能化、交互化的交互式检索过程,显著提高检索效果。
2.2 基于AGI 的图书馆创新知识服务
基于AGI 的图书馆知识服务,实际上就是将AGI 的通用智慧能力与图书馆知识服务所需的领域知识有效结合起来,从而实现知识服务广度与深度的同步扩展,使开展以前图书馆不能实现的创新性知识服务成为可能,并让基于AGI 的知识服务体现出与传统知识服务不同的创新能力。
(1)基于垂直性语言模型的专业领域知识服务。领域知识是特定专业或行业范围内的专门知识与技能,用于解决本机构面对的特殊用户需求。随着各种基于AGI 开发、服务于特定领域的垂直性语言模型的大量涌现[14],基于垂直性语言模型的图书馆专业化领域知识服务成为必然。图书馆对垂直性大数据模型的数据、模型、参数、指令等基于领域特殊需求进行微调[15],就可以形成知识服务协作网络、提高专业化分工,从而实现图书馆在知识服务层面的跃升。如爱数推出的领域认知智能框架,可以用于构建领域知识网络,包括领域概念库、领域知识图谱和领域规则库[16]。
(2)面向特定用户的精准化知识服务。有学者研究指出,人工智能驱动的图书馆知识服务发展方向是智能化、精准化、个性化[17]。如高校图书馆可以根据服务对象的类型,由AGI 平台基于图书馆丰富的资源及知识库,面向用户提供从入学到毕业、从入职到成长的全周期、全流程指导类、辅助类、支撑类知识服务。如面向科研群体,AGI 平台可以基于个人偏好如语言风格、服务更新周期、知识格式要求等大数据、历史数据,对个人定制的文献资源、数据库资源、研究进展、学术会议、热点新闻等进行精准提供,并可以根据用户的使用情况和习惯不断优化服务,让每个服务用户拥有一个专用的人工智能助手。
(3)AGI 赋能的多模态融合知识服务。 相较于传统的知识服务结果以文字表达为主,AGI 平台提供了多模态融合服务能力,知识服务结果可以随时在文字、图片、音频和视频之间进行转换。 由于知识服务主动权的变更,以及AGI 平台基于上下文对话的支持,会让检索、问答、知识转换等要求更加符合用户的需求,提供的结果更加直观,易于理解。 对于本馆存储的科学研究数据集合,甚至可以让用户通过对话的方式,不断探索新的统计结果、发展动向等[18]。
3 基于AGI 的知识服务框架设计与实现
图书馆知识服务的实现,既要明晰服务模式、服务体系、服务工作、服务水平和服务质量,也要构建和设计包括了图书馆服务的组织、设计、管理、评价等步骤[19]或内容的框架结构。本文通过跨学科的理论迁移,将信息技术领域的服务管理流程引入图书馆知识服务管理领域,提出了基于AGI 的图书馆知识服务框架,随后探讨了知识服务层中的知识服务实现过程。
3.1 基于AGI 的图书馆知识服务框架
3.1.1 图书馆知识服务框架的理论支持
信息技术基础架构库(Information Technology Infrastructure Library,ITIL)是由英国商务部开发的一套针对IT 行业的服务管理标准库,迄今已经发展了四十多年,是信息技术服务管理(Information Technology Service Management,ITSM)的最佳实践,被世界范围内的IT 企业广泛采用。须借助于IT 系统所实现的AGI 图书馆知识服务,既与ITIL 具有高度的类似性,但与IT 部门提供的运维服务仍存在一些差别。如IT运维服务基本仅限于IT 服务,而图书馆知识服务为综合服务,涵盖更广。因此,图书馆知识服务框架需要对ITIL 框架进行调整,主要包括:图书馆知识服务虽然需要战略分析,但主要聚焦于知识服务领域,因此将服务战略修改为服务规划;图书馆知识服务不存在一个明显的系统切换过程,而是一个漫长的服务升级过程,因此将服务转换更改为服务设计方案的实现;在知识服务领域,图书馆中的IT 部门与业务部门之间不是服务与被服务关系,而是共同协作实现知识服务的关系,因此将服务运营更改为服务提供。
3.1.2 图书馆知识服务框架的具体设计
借鉴ITSM 的阶段划分,结合AGI 及图书馆知识服务的特点,本文提出了基于AGI 的图书馆知识服务框架(见图1)。 其中,交互协作层负责完成用户、馆员与AGI 平台之间的互动,实现人机协作。 主要涉及如何采用有效的提示词与AGI 平台交互,通过交互过程指引AGI 平台完成数据搜集与推理过程等。 知识服务层负责完成知识服务的加工与提供,从横向角度完成基于AGI 的图书馆知识服务过程,从纵向角度涉及系统平台的构建、知识库的构建,以及将二者有机结合完成知识服务的提供。 环境支撑层负责为AGI 平台提供IT 与人员两个方面的资源支持,如算力支持、系统安全、技术能力、学科馆员数量与知识结构等。
图1 基于AGI 的图书馆知识服务框架
3.2 基于AGI 的图书馆知识服务实现
3.2.1 基于AGI 的图书馆知识服务规划
本阶段重点内容是需要明确知识服务目标、知识服务需求、知识服务类型等,以及考虑预算和成本等方面的因素。(1)知识服务目标:对基于AGI 的图书馆知识服务面向的服务对象、服务内容与服务规模做出评估,确定知识服务需要实现的目标。(2)知识服务需求:首先,对本馆的知识服务用户进行分析,并根据本馆的服务特色、资源优势、地域特征等因素,合理确定知识服务的用户范围;其次,对每类用户的服务内容、数据来源、服务平台和知识更新周期等进行调查。(3)知识服务类型:对调查得到的知识服务需求进行梳理,以根据用户需求的变化不断更新服务类型。
3.2.2 基于AGI 的图书馆知识服务设计
本阶段主要完成服务目录和服务水平的设计。(1)服务目录设计:结合用户需求、本馆资源与服务能力,明确面向用户提供的知识服务清单与目录。(2)服务水平确定:对每一项知识服务,需要明确服务水平。 其中,对面向大众的知识服务,由图书馆分析历史数据和需求变动情况,确定服务的质量与级别。 对专业性、特殊性等小众知识服务,如服务于某个科研团队的学科知识服务,可以通过协商确定服务协议,在协议中明确服务水平及层级。
3.2.3 基于AGI 的图书馆知识服务实现
本阶段主要完成知识服务平台论证与构建、各类知识库建设、知识服务加工等工作。
(1)知识服务平台论证与构建。图书馆需根据服务规划与服务设计,综合考虑算力、技术应用能力、技术人员等因素,对AGI 平台做出选择。简单如技术能力强、算力强大、已有一定的应用基础,可以下载大语言模型本地化部署。 如应用场景涉及多个大语言模型协作,如文字到图片、视频,可以尝试智能组合平台。如涉及复杂任务求解,可以尝试自主智能平台。 知识服务平台的构建则主要包括大语言模型本地化部署或开发、使用开源软件包、采用Web 平台、使用其他类型工具等方式。
(2)知识库建设。图书馆AGI 平台工作不仅需要传统的数据资源,也需要增加新的知识资源与知识来源。在提供基于AGI 的知识服务之前,图书馆必须先调查清楚本馆的资源,就是要确定数据与知识资源的使用方式,对于图书馆来说,可能准备的资源包括文献库、数据库、知识库等。各类数据资源加工好之后,通过提示词工程、外挂数据库、进行数据嵌入等方式向平台提供数据。 随后就是明确数据与知识资源的类型,除传统的文献资源库、学科服务知识库外,AGI 知识服务还会用到图书馆各类系统与平台中的数据、开放数据,以及其它AGI 平台的知识资源与服务等。随着AGI 技术与系统的快速发展,一些机构开始构建专门服务于AGI 平台的共享开放数据。如上海人工智能实验室于2023 年8 月14 日宣布,开源发布“书生·万卷”多模态预训练语料,包含文本数据集、图文数据集、视频数据集三部分,数据总量超过2TB[20]。
(3)知识服务加工。图书馆AGI 平台与提供公共服务的AGI 平台的重要区别在于领域专业知识的提供,这就需要对于每项知识服务进行专门的训练与强化学习,以保证服务的质量与水平,因此需要将每一类知识服务作为一个单独的项目进行管理。对于完成的每一个知识服务项目,都要做好面向最终用户的发布计划,可以先覆盖知识服务广度,再提高知识服务深度,以在短时期内取得最大效果。
3.2.4 基于AGI 的图书馆知识服务提供
本阶段主要任务是完成服务运行监控,并对知识服务进行评价。(1)服务运行监控:对知识服务的过程与效果进行监控,对于出现的各种问题予以快速解决。 通过不断解决问题,逐步提升AGI 平台的服务质量。(2)知识服务评价:主要包括基于用户反馈数据的评价、基于AGI 平台的评价和基于专家的人工评价等。基于评价的结果,整理出知识服务平台建设、知识库建设、知识服务中存在的问题与原因,探讨可能的解决措施。
3.2.5 基于AGI 的图书馆知识服务改进
这一阶段主要完成服务优化,确保服务可以持续得到改进。(1)服务优化:不断识别出新的知识服务用户,增补知识服务主体;持续扩大知识资源来源,增强服务平台功能;周期性分析知识服务平台功能、服务内容和协作机制;设计改进方案并实施,对于已经不符合用户需求的服务,建立退出机制。 (2)持续改进:制定知识服务的持续改进计划,并确保知识服务改进工作按计划进行。
4 结语
图书馆既拥有丰富的信息资源,又拥有稳定的用户群体,AGI 技术的应用可以为其知识服务带来可预期的提升与创新。虽然AGI 技术非常强大,但它仍然存在一些缺陷,应用创新类型也较为单一,多为形式变换与组合,对于AGI 产生的知识,要根据主题和应用场景的不同进行相应级别的评估,考虑容错概率后才可以使用。无论如何,作为提供知识资源与服务核心基础设施的图书馆,需要在AGI 时代勇于尝试,引领知识服务的创新,发挥自己的独特价值。