APP下载

ChatGPT赋能图书馆知识服务:原理、场景与进路

2024-09-19郭亚军马慧芳张鑫迪冯思倩

图书馆建设 2024年3期
关键词:知识服务人工智能图书馆

[摘 要] ChatGPT带来的技术机遇将为图书馆知识服务转型提供新思路。GPT类技术拥有情感分析能力、数据整理能力、知识推理能力、数字指导能力,将为图书馆传统的参考咨询服务、学科知识服务、情报服务以及教育培训服务等场景带来新的变革。图书馆在推进知识服务业务时应当提升多源多模态信息汇聚与整序能力,构建对话型生成式学术搜索引擎,促进情报检索语言与人工智能融合,增强自然语言模型的逻辑推理能力,积极拥抱人工智能等生成技术,提高图书馆自身智慧知识服务水平。

[关键词] ChatGPT 人工智能生成内容 图书馆 知识服务 人工智能

[中图分类号] G250 [文献标志码] A [ DOI ] 10.19764 / j.cnki.tsgjs.20230788

[本文引用格式] 郭亚军,马慧芳,张鑫迪,等.ChatGPT赋能图书馆知识服务:原理、场景与进路[J].图书馆建设,2024(3):60-68.

*本文系国家社会科学基金项目“数智驱动的公共图书馆适老化服务模式创新研究”,项目编号:22CTQ013;河南省高等教育教学改革研究与实践项目“三全育人导向下研究生思政教育协同创新研究与实践”,项目编号:2021SJ GLX244Y;郑州航院研究生教育创新计划基金项目“元宇宙场域下的图书馆虚拟阅读服务研究”,项目编号:2022CX42的成果之一。

ChatGPT Empowers Library Knowledge Services: Principles, Scenarios, and Approaches

Guo Yajun, Ma Huifang, Zhang Xindi, Feng Siqian

[Abstract] The technological opportunities brought by ChatGPT will provide new ideas for the transformation of library knowledge services. GPT-like technologies have the ability of sentiment analysis, data organization, knowledge reasoning, and digital guidance, which can bring certain improvements to traditional reference consultation, disciplinary knowledge, intelligence services, and education and training services in the library. When promoting knowledge service business, libraries should enhance the ability to gather and organize multi-source and multimodal information, build a dialogue based generative academic search engine, promote the integration of information retrieval language and artificial intelligence, enhance the logical reasoning ability of natural language models, actively embrace generation technologies such as artificial intelligence, and improve the library’s own level of intelligent knowledge service.

[Keywords] ChatGPT; AIGC; Library; Knowledge service; Artificial Intelligence

0 引 言

人工智能技术的发展推动着自动问答、数据分析、资源组织与信息查询等智能服务不断提升。同时,ChatGPT、Bard、文心一言等智能问答产品的出现,将促进知识服务的快速迭代,为图书馆事业提供新的推动力。2022年中共中央、国务院印发的《关于推进实施国家文化数字化战略的意见》[1]强调要建立具备情感计算、深度学习、模式识别的区域性智能计算中心,构建一体化的文化计算服务体系。国内文化产业在技术环境的变迁和国家机制的引领下,算力、人工智能、模型等将融入图书馆智能化建设的过程中,ChatGPT等生成式人工智能大模型也将促进图书馆知识服务与新兴技术深度融合,推动多资源环境下知识服务场景的范式转变,实现普惠大众的图书馆智慧知识服务[2]。

国内外对于数字技术赋能图书馆知识服务的研究已取得诸多成果。例如,初景利等[3]提出“人工智能”“互联网+”“智慧图书馆”和“云计算”等新场景已开始融入图书馆知识服务。Gao[4]结合多媒体技术对智慧图书馆知识服务质量形成机制、影响因素等方面提出鼓励服务技术方法创新、建立意识激励机制等服务策略。Ahmed等[5]认为图书馆和信息科学专业人员的信息和通讯技术(Information and Communication Technology,简称ICT)技能对增强图书馆服务非常重要。在ChatGPT问世后,图情领域对其广泛关注,储节旺等[6]认为AIGC(AIGenerated Content,人工智能生成内容)视域下图书馆服务将优化知识组织方式,提升知识服务能力;郭亚军等[7]提出ChatGPT赋能图书馆智慧服务将实现资源建设、科研服务、咨询服务、社会教育等服务场景间的融合协同;Chen[8]通过比较ChatGPT与传统图书馆聊天机器人的参考咨询服务能力,提出图书馆界应关注变革性技术带来的影响;李书宁等[9]认为ChatGPT等智能技术将助力图书馆咨询服务,助推知识服务改善图书馆检索系统的用户体验;张晓林[10]认为支撑技术和机制已经或者即将到位,技术与人才的发展都将面临变革;Panda等[11]分析了ChatGPT替代图书馆传统知识库聊天机器人方案的可行性;赵瑞雪等[12]提出图书馆及相关信息机构应充分融合大数据和人工智能等新兴技术,全面提高其智能知识服务水平。

以上研究认可了新兴技术对图书馆相关服务的重要性,为本文更加深入探讨ChatGPT技术主导下图书馆知识服务场景变革与推进路径提供了参考。虽然ChatGPT目前尚未正式进入中国市场,但GPT类技术赋能知识服务的研究值得深入探索。基于以上背景,本研究从ChatGPT背后的支撑技术原理出发,探讨智能技术推动下图书馆知识服务的创新形式,分析技术变革对图书馆原有知识服务场景的影响,并提出ChatGPT赋能图书馆知识服务推进路径,旨在丰富和拓展图书馆知识服务的研究内容和研究领域,为图书馆领域相关业务发展提供参考。

1 ChatGPT赋能图书馆知识服务作用原理

ChatGPT作为具备大规模语料库训练的生成式自然语言处理模型,具有自动文本生成、智能信息处理、语义搜索与判识、智能图像生成等功能[13],它所展现的技术优势与图书馆知识服务的发展要求不谋而合。探讨ChatGPT背后的支撑技术将有利于通用大模型的赋能,为创新图书馆知识服务注入情感分析能力、数据整理能力、知识推理能力和数字指导能力等新鲜血液,并为接下来服务场景变革研究提供理论支撑。本文根据ChatGPT背后的人类反馈强化学习(Reinforcement Learning from Human Feedback,简称RLHF)、变换器(Transformer)、思维链(Chain-of-thought,简称CoT)、AIGC等技术特点,分析图书馆知识服务新的增长点。ChatGPT赋能图书馆知识服务作用原理如图 1 所示。

1.1 基于人类反馈强化学习技术的情感分析能力

RLHF是ChatGPT应用的核心技术机制之一。该技术通过模型学习人类指令与回答的这一过程,对语言模型进行监督微调,再经过标注人员对模型输出结果按人类偏好进行排序,通过回答数据训练奖励函数、评估模型[14],利用强化学习的优化策略使用奖励函数以训练监督模型,从而优化模型生成的答案质量[15]。RLHF技术的应用,使得自然语言模型生成的内容更符合人类的语言习惯,用户与ChatGPT交流的过程更加自然。通过这样的语言代码生成的训练方式,模型能够在监督微调的过程中理解用户的交流意图,拓展了自然语言模型的情感分析能力。

图书馆行业依靠人工智能、机器学习和语义平台的支持,不断在人机智能问答交流过程中进行创新和实践,如上海交通大学图书馆的聊天机器人“小交”,主要功能是随时随地为读者提供帮助,解决读者的咨询问题等。机器人提供的智慧服务已经成为图书馆不可或缺的一部分。在RLHF技术支撑下,ChatGPT的互动模式、学习思维与技术理念能够进一步匹配用户的知识获取与表达方式,且向用户提供的相关信息具有结构条理性、内容饱满度和语言规范性等拟人化的表现特征,甚至超越人类的回答反应速度,并拥有丰富的情感立场,重塑了图书馆智能参考咨询服务的新样态。除此以外,ChatGPT还可以处理多种语言,帮助图书馆员向更广泛的用户提供更加全面的智慧服务。GPT类技术的出现将为图书馆带来新的契机,借助于ChatGPT开放接口对接图书馆服务系统,从而实现对现有参考咨询服务的超越。

1.2 基于变换器技术的数据整理能力

Transformer模型这一概念首次出现在谷歌研究人员于 2017 年发表的著名论文Attention is All You Need [16]中,其核心原理是基于注意力机制的深度神经网络结构,也是ChatGPT模型的基本组件之一。Transformer架构开发的预训练语言模型脱离了人工标注数据集的弊端,能够充分利用训练资料的全局信息,有效捕捉数据集中的长距离依赖关系,使得大规模语言模型具备对自然语言的理解和生成能力,从而实现了模型质量的提升。从平行智能视角考虑,Transformer能够驾驭大型语料库,拥有高的计算能力和通用的预训练能力,这一技术优势能够为图书馆现有海量文本数据带来数据整理优化能力,最大限度地发挥图书馆学科知识服务的价值。

学科知识服务是图书馆由来已久的一项重要职能。 现有的服务方式基于一定的资源组织标准和方法,利用信息技术手段将特定学科或主题领域的数字资源集成在一个界面中,为用户提供浏览检索等增值服务的专门性门户[17]。Transformer架构技术能够迁移学习,快速适应其他任务。图书馆可以借助预训练的Transformer模型,利用训练数据中学习隐含语言规律和语言模型的强大功能,将图书馆现有的小型数据集微调Transformer预训练语言模型,从而提高现有馆藏数字资源的数据信息发现能力和资源组织水平。同时,Transformer模型在现有的技术进步上已实现较强的技术适用性,为图书馆学科知识服务预训练已有的音视频等多模态馆藏信息资源提供用户服务创新。

1.3 基于思维链技术的知识推理能力

CoT技术可以辅助ChatGPT等系统完成复杂推理任务,即将一个大问题分解为多个小问题,生成一系列的思维链提示的中间推理步骤[18]。CoT技术将传统“问题—答案”的解决问题模式转变为“问题—思维链—答案”模式,该技术的推理能力是面向用户的,为用户呈现答案的推理过程,但并不一定与模型的实际运行机制准确对应[19]。复杂推理是对以大型语言模型训练的原始数据集进行增强,提高模型的泛化能力,通过改变语境、句子结构和替换词汇等数据增强训练的方法,实现对自然语言模型性能的提升。大型语言模型能够通过人机对话中提供的上下文信息,领悟理解人类表达的语言请求,而CoT技术能够让机器在处理复杂任务时更加灵活,更准确地回答用户提出的问题。

图书馆可以根据个人或项目团队的研究目标和需求开展情报服务,利用CoT技术提供连续性的、跟踪式的专题服务或定题服务,满足用户的个性化需求。ChatGPT的信息检索能力、深度学习能力、知识推理能力都远超个人的能力范畴,通过模仿人类的思维过程,实现智能创作,自动生成帮助用户解决问题的内容。GPT-4新增的CoT技术能够面向用户解释自身输出结果的步骤和原因,这种解释可以帮助馆员在进行复杂的情报服务时更加高效率地理解并处理面临的问题,增强了馆员对于人工智能生成内容的信任,一定程度上抑制了自然语言模型回答的不真实性等问题。CoT技术充分体现出其针对复杂问题的推理能力,可以帮助馆员在情报服务中实现贯穿研究项目始终的问题探究和解决路径。

1.4 基于人工智能生成内容技术的数字指导能力

ChatGPT是基于人工智能生成技术的一种内容生产方式,可以实现海量数据计算、持续内容创新、深度认知交互[20]。内容生产主体经历了从专业人员到网络用户、再到人工智能的跃升,逐步形成“机械反馈—智能识别—深度学习”的技术生产驱动逻辑,人机交互实现了从被动式反馈向多维操控再到智能交互的变迁。以ChatGPT为代表的新一代AIGC技术具备了更强的数据分析能力、自然语言处理能力和数字指导能力,因此,图书馆的数字指导教学将是用户掌握数字技能课程、体验教育培训推荐服务的重要途径。全面深度地了解用户的信息素养需求,挖掘用户需求特征,提供多样化的数字指导和服务帮助,能够使用户随时获取其所需的数字支持,并可以进一步优化图书馆教育培训服务。

ChatGPT赋能信息素养教育模式升级,能更好地提高学习的体验感、交互感,适应新技术环境下用户对于知识、技能的获取要求。在GPT类模型的赋能下,图书馆能够开发出基于人工智能的信息素养教育软件,以自动识别检索信息,提供个性化推荐服务。同时,利用“提示词”技术自动搜索馆藏各类资源,并生成丰富多彩的素材和教学文档,让用户更好地理解信息素养教育的内容。搭载了预训练数据库的人工智能机器人则可以调研图书馆基于人工智能技术和数据可视化沉浸式服务的满意度,搭建图书馆信息素养教育社区,为用户提供实时的信息传递,以及教育和研究活动的指导与帮助。

2 ChatGPT赋能图书馆知识服务应用场景

ChatGPT已成为当前机器学习和深度学习的集大成者,训练好的自然语言模型只需微调即可应用于多种任务和场景,正在推动“数据即服务”向“模型即服务”的范式转变,开创了模型主导内容生产的时代[21]。ChatGPT的出现,为生成式的人工智能系统平滑地迁移到垂直领域的应用场景提供了示范。在图书馆知识服务领域,ChatGPT将对参考咨询服务场景人性化、学科知识服务场景精细化、情报服务场景直观化、教育培训服务场景个性化等方面产生更加积极深远的影响。

2.1 参考咨询服务场景:从数智化到人性化

随着Web 3.0时代的到来,图书馆服务方式和服务能力也在不断发展。从纸质文献到数字化文献,从人工借还到自助借还,从传统咨询到智能咨询,在转型升级的过程中,机器人充当着体力和脑力劳动者,极大地解放了馆员的劳动力,使得馆员将更多精力投入到为用户服务的创意工作中。服务范围带来的变化为用户提供了更高效、便利的服务,也使得参考咨询服务达到了贴近人性化水平。但现有的服务仍存在一些局限性,如图书馆无法为用户提供每天24小时的人工参考咨询服务,咨询机器人只能回答一些简单的问题等。当前的参考咨询服务在节省人力、财力、时间上还有待进步,而ChatGPT能够辅助图书馆处理用户自然语言提问,很好地理解用户意图,提供及时准确的信息服务,帮助图书馆参考咨询服务实现人性化的转型。

ChatGPT技术能够根据用户的提问,通过语义分析,学习其语言环境,并通过模仿学习来改进聊天机器人的回复结果,将最佳答案提供给用户。同时,ChatGPT技术可以帮助图书馆构建更加智能的人机问答系统,精准识别用户的提问,并以智能的方式回答用户的问题。用户可以通过自然语言与系统进行交流,获得精准的答案。ChatGPT技术还可以通过深度学习技术,提高系统的智能服务水平,实现更准确的问答服务。在建立智能问答系统时,可以利用ChatGPT的预训练模型进行微调,使其适应图书馆参考咨询服务场景的问答。例如,可以利用ChatGPT对图书馆中的常见问题进行训练,使得ChatGPT更好地回答这些问题。ChatGPT在深度学习算法的突破,不仅可以塑造机器人的性格,还能使机器人更好感知、理解、预测人类的需求,包括情感需求,并提供有情感的、精准的、实时的、专业的个性化服务。这都将驱动图书馆参考咨询服务由数智化向人性化转变。

2.2 学科知识服务场景:从专业化到精细化

智慧图书馆的核心目标是提供智慧化的“知识服务”[22],而知识服务的质量与知识组织息息相关。当前,图书馆的知识组织更多地是沿袭传统的信息组织手段,即文献编目。不管是手动编目还是自动编目,随着用户需求资源类型的多样化和个性化程度不断提升,图书馆所提供的专业化知识组织活动已经难以满足用户的需求,这直接影响图书馆的学科知识服务水平。

ChatGPT的出现可以推动图书馆知识组织的优化,升级知识服务。图书馆利用ChatGPT在文本、图像、视频之间的跨模态生成功能以及生成标题和摘要功能,可以建立馆藏结构性和非结构性数据之间的关联,建立文本、图像与视频之间的关联,并通过对现有资源重新聚类,自动形成主题化、专题化的分类揭示,为用户提供更高效、更精准、更多样的学科知识服务。ChatGPT依靠强大的机器学习可以深入文献资源的内容,使得图书馆资源描述从主题、关键词、摘要、来源等表面信息组织方式,转变到语义内容组织方式,图书馆挖掘细粒度、多粒度知识对象的能力显著提升[23],实现知识组织的精细化管理。ChatGPT与图书馆现有的数字资源进行重新整合、主题识别、语义关联分析、分类,形成具有丰富检索内容的知识库系统,支持用户自然语言检索、多模态检索,并且可以自动生成答案,补充来源和案例说明,根据用户需求进行智能化推荐,还支持对话聊天框形式。微软已经在搜索引擎(Bing)和浏览器(Edge)中应用下一代OpenAI模型,以提升检索效果和改善用户体验[24]。随着ChatGPT和图书馆知识组织的深度结合,能够为图书馆用户提供更加精细化的服务交互体验。

2.3 情报服务场景:从宽泛化到直观化

图书馆信息检索服务的效果,直接影响馆员提供情报服务的检索体验,也关系图书馆服务水平的高低。而图书馆现有的检索系统,包括各类商业数据库和自建数据库以及目录检索系统和资源发现系统,基本上以关键词和主题检索为主,借助布尔逻辑式和高级检索来限制检索范围,支持筛选优化,以提高检索效率和效果。但馆员通过专业检索的检索结果并不能提供针对性的内容,相反检索结果呈现范围较为宽泛,而ChatGPT具有强大的创作和生成功能,能够根据上下文语义进行多轮对话,图书馆情报服务人员可以通过ChatGPT,快速有效地获得直观的答案而非从海量的检索结果中进行筛选分析,极大地提高了检索效率和准确率,进而缩短图书馆情报服务周期,为用户提供更高效的情报服务。

ChatGPT可以对已有的训练数据进行知识总结和检索输出,目前已实现自动分类、智能索引、自动标引、机器翻译、自动文摘等进程。机器智能创作逻辑结构对数据分析、情报研判、智库支持等情报服务功能产生变革性影响,丰富和充实了图书馆情报服务方法论体系。作为大模型最新应用进展代表的GPT-4不仅可以在理解上下文语义的情况下生成文字、图像、音频、视频等多模态信息,还可以实现非结构化的文案撰写、多语言的翻译任务和程序代码的编写,拓展了情报服务内容,能够更好地辅助馆员满足用户的多样化需求。同时,馆员在利用ChatGPT进行检索时,自然语言模型通过理解输入内容,将更加符合检索结果的信息反馈给馆员,满足了馆员对情报的直观化需要,丰富了馆员对于检索结果的理解。通过对信息的整理,一次性或是定期不间断地为用户提供相关服务内容,完成定题服务。在人工智能技术的支持下,图书馆需要进一步对海量元数据进行资源整合,夯实数字化数据存储,加强数字信息资源建设,为动态精准智能化信息检索奠定资源基础。

2.4 教育培训服务场景:从普适化到个性化

在人工智能和互联网时代,自媒体盛行,使得用户更加注重创意,而图书馆仅仅依靠普适化推送的服务方式将无法吸引用户的兴趣,需要结合新的技术去创新服务方式,以增加用户黏性。图书馆现有的服务推荐系统往往基于用户的历史借阅记录或者图书的元数据进行推荐,这种方式容易陷入信息过载的困境,当用户的个性化信息素养技能需求与图书馆资源推荐不匹配时,就很有可能致使用户产生消极使用情绪,导致图书馆用户的流失。ChatGPT强大的自然语言处理能力、深度学习能力将使自动推荐系统可以根据用户聊天内容中的信息需求,自动推荐与其最相关且适宜的内容,从而提高用户使用馆藏资源的积极性。

图书馆的教育培训功能正在逐渐被网络和社会机构所弱化。转变服务模式,以用户为中心提供精准的个性化服务内容,将是图书馆强化知识服务主体地位的有效途径。图书馆可以利用ChatGPT技术建立一个智能化的自动推荐系统,用户通过自然语言描述个人的阅读偏好和学习兴趣,或者ChatGPT根据用户历史浏览记录提取关键信息,利用人工智能技术对用户的阅读行为、内心想法和兴趣指向进行预测的功能,为用户精准地推荐相应水平的个性化教育培训资源。同时,传统教育培训服务更多地是举办线下或线上活动,而ChatGPT的出现,使得图书馆教育培训服务方式不必局限于活动形式,可以采取一对一的辅导方式、内容推荐方式实现从用户主动型订阅搜索、被动型推荐投送到互动型智能推荐的转变,催生以用户为核心、以交互推荐为表现的教育培训服务新模式。随着GPT 类技术的不断发展,预示着教育培训用户推荐服务将产生新一轮范式的转变,自然语言处理技术等将为用户提供更加个性化的服务。

3 ChatGPT赋能图书馆知识服务的推进路径

ChatGPT技术的演进已经在人机自然交流、语料体系整理、知识演绎推理和自然语言理解等功能上取得巨大进展,AIGC的时代已经来临。图书馆可以借助已有的技术变革机遇,针对参考咨询服务、学科知识服务、情报服务、教育培训服务等知识服务场景,在提升多源多模态信息汇聚与整序能力、构建对话型生成式学术搜索引擎、促进情报检索语言与人工智能融合,以及增强自然语言模型的逻辑推理能力等方面实现变革性开拓,推动图书馆知识服务跃上新台阶。

3.1 提升多源多模态信息汇聚与整序能力

在图书馆资源建设中,经常提到“多源数据”“多模态信息”与“多源融合”等概念,其表达的是多来源大规模的文本、视频、音频等不同模态的数据集[13]。而在大语言模型技术的发展中,训练数据的体量、质量、种类、模态决定了模型最终生成的效果,机器学习领域 CLIP(Contrastive LanguageImage Pre-Training,对比语言-图像预训练)模型和Diffusion(扩散)模型的出现使不同模态的数据在语义特征尺度上实现融合转换,为多模态语义融合提出了解决方案,让 ChatGPT 仅通过输入文字内容就可以生成音频、视频或 3D 模型。在大数据时代背景下,图书馆能否依靠模型提升业务效率的前提,取决于其能否满足不断增长的语料和算法需求。高价值语料工作是图书馆服务的基础。知识时代既蕴含大量知识,也创造海量知识,而知识本身就是模型时代的语料。图书馆积累汇聚了海量的语料信息资源,大都以文本形式保存。提升多元多模态信息汇聚与整序能力,将馆藏语料信息源激活启用,从而发挥语料的最大社会效益和经济效益,是图书馆需要关注的重点议题。

多源多模态信息汇聚与整序是图书馆开展知识服务研究的基础。多源多模态信息汇聚是ChatGPT加持下图书馆开展参考咨询服务的必经之路,图书馆汇聚了海量的主题馆藏、电子图书资料、文献资源和业务数据等,具有多维度、多元化特点,将馆藏中相对高质量的资源数据作为大语言模型的预训练语料,利用人工智能算法实现数据融合分析,实现ChatGPT技术支持下以用户需求为中心的精确人性化微观人机问答服务,也为多维度资源汇聚下馆员宏观决策提供依据。多源多模态信息整序是指图书馆依托高性能算力支持集成各类数据整序技术,面向多模态数据进行关联整序,动态重组知识单元,面向图书馆参考咨询服务重构信息资源序列,创新多模态信息组织能力,发掘馆藏资源的服务能力,挖掘信息资源深层隐性知识,进而提升人机交流服务内涵,促进知识交流。在这种模式下,用户可以直接与大规模资源对象中的分布式内容和隐含知识实时交互,有助于降低用户使用门槛、提升馆藏资源服务体验。

3.2 构建对话型生成式学术搜索引擎

在图书馆检索系统与搜索引擎并行发展的时代里,超过八成的用户转向了以搜索引擎为信息查询起点,借助搜索引擎实现自己的检索目标[25]。为吸引用户利用图书馆精确高效地找到所需资源并比较信息内容的关联性,实现学科知识服务的精准性,图书馆提升学术检索服务变得迫在眉睫,而ChatGPT的出现有助于解决这一难题。大语言模型的核心要素算法、算力、数据已经实现从量变到质变的飞跃,使ChatGPT具备较好的语言理解、数据整理、逻辑推理与内容生成能力。深度学习、自然语言处理等人工智能技术在学术检索中的应用,带来了搜索引擎向对话型学术搜索引擎的升级。因此,图书馆需要加强建设大规模语料库,训练关联数据成为语料资源,创新知识组织方法,将文献资源库转换成知识库,提高用户对知识库中学术搜索引擎的利用率,充分发挥ChatGPT自然语言处理能力,推进图书馆学科知识服务应对用户不断变化的信息需求能力,提升图书馆与用户之间的黏性。

对于图书馆学科知识服务来说,ChatGPT可以帮助图书馆构建更智能交互化的学术搜索引擎,结合传统的OPAC系统,并利用神经网络、语义网、自然语言处理、深度学习等人工智能技术,实现资源检索到资源发现的转变,从而提高检索结果的准确度,更好地满足用户的搜索需求。同时,ChatGPT还能够通过理解用户的交流意图,结合用户搜索主题、历史记录、偏好兴趣等分析用户需求,为用户提供智能交互的拟人化搜索体验,减少了用户信息筛选环节,进一步提高学科知识服务效率。从用户接受度层面而言,图书馆将ChatGPT与传统搜索引擎相结合,将创新用户检索体验,最大程度地提高学术搜索引擎的高效化和智能化水平。

3.3 促进情报检索语言与人工智能融合

ChatGPT在人机自然语言交互方面取得的成功表明了检索语言的重要价值,图书馆也要提升在大语言模型中情报检索语言改革的能力。ChatGPT对信息的检索和问答已经刷新了人们对人工智能的服务认知和服务体验。因此,当前的情报服务工作不能停留在传统的人工检索式的定向、定题、限量等服务层面。图书馆情报服务要充分利用新的模式、方式,扩大创新情报检索语言的应用范围,依托人工智能技术,结合已有的文摘、索引、目录检索服务,在馆员为用户提供情报服务时,要尽可能细化情报检索匹配条件,按照服务需求进行高精确度检索,方便馆员或用户快速准确地获取所需信息。人工智能技术的应用与情报检索语言的组织、管理息息相关,见证了情报服务的变革、创新和发展,是情报服务开展的着力点、切入点和关键点。

ChatGPT正在实现模糊搜索到精准推送的跨越,改变了以往关键词检索的服务形式,通过人机交流对话理解上下文自然语言内容,能够为馆员提供文字总结或是与检索结果相关的网页链接[26]。情报检索语言是图书馆提供情报服务必不可少的手段和工具,ChatGPT的出现将引领检索语言的代际变革。图书馆情报服务系统将形成新的检索语言范式,通过将自然语言转换为检索规范语言,从而实现情报检索语言与人工智能的融合,从自动文摘、自动综述等检索结果出发,优化知识组织与情报检索的效果。此外,图书馆情报服务挖掘信息数据的使命是帮助用户从海量的信息中发现更有价值的知识,其目的不是替用户做判断,而是供用户做判断,即给用户提供有价值的结果性的信息描述,尽可能减少“黑箱”的干扰。基于海量数据情报信息,图书馆要积极探索情报检索语言与自然语言处理等人工智能生成技术的融合,以满足用户对情报检索语言的差异化、多样性和灵活性需求。

3.4 增强自然语言模型的逻辑推理能力

Web3.0时代,以ChatGPT为代表的自然语言模型能够通过上下文语境理解用户提出的问题,为用户提供精准的信息内容,并可以在持续的交互过程中基于人类反馈强化学习技术实现机器学习,以增强大模型的完善程度和能力。ChatGPT拥有的逻辑推理能力由训练语料的概率计算决定,并非由人类思维逻辑推理得到,其生成的结果高度依赖训练语料的质量,并且,ChatGPT存在明显的训练语料局限,当用户提出超出训练语料范围的问题,自然语言模型可能生成错误的答案误导用户。从长远发展来看,如果图书馆在应用ChatGPT等人工智能生成软件时不重视此类情况,可能会造成虚假知识泛滥、虚构历史等错误的教育信息推荐与生成情景,且当用户学习辨别能力有限时,大模型的应用反而会影响图书馆教育培训服务的初衷和愿景。

图书馆在应用ChatGPT外挂基础设施为用户提供教育信息培训服务时,应尽可能挖掘和整理馆藏资源,或多馆联盟训练属于图书馆的大规模自然语言模型,使其训练语料符合多样性、高质量、大规模等特点,并对各种馆藏数据进行规范化清洗。通过大量的馆藏训练语料库培养大模型的逻辑推理能力,使模型能够在充分理解用户的意图后提供正确、完整的教育培训信息推荐服务。因此,逻辑推理对图书馆提供教育培训等服务至关重要,将逻辑推理能力纳入自然语言理解系统自人工智能技术出现以来一直是一个活跃的研究主题[27]。ChatGPT目前仅仅学会了推理的表面逻辑,不具备较强的逻辑推理能力和因果关系的数理运算能力。对于图书馆建立大模型来说,逻辑推理仍然具有挑战性,图书馆应在突破训练语料的限制上,在与用户的交互过程中不断学习,了解用户真正的信息素养需求,实现对模型的调优和反馈,让用户获得一种创造性和主动性的交互体验。

4 结 论

ChatGPT的发展历程是科技进步的一个缩影,从全景视角来看,未来不论是国家之间还是企业之间的竞争合作,信息技术都将是一个重要的参考指标。本文分析了ChatGPT背后支撑技术的作用原理带来的服务能力的变革,相较于传统的信息技术在图书馆知识服务的应用,新兴技术的实践将带来情感分析能力、数据整理能力、知识推理能力、数字指导能力四个方面的转变。结合对参考咨询服务、学科知识服务、情报服务以及教育培训服务等知识服务特有场景变革的影响,本文从图书馆发展视角出发,提出图书馆需提升多源多模态信息汇聚与整序能力、构建对话型生成式学术搜索引擎、促进情报检索语言与人工智能融合,以及增强自然语言模型的逻辑推理能力等路径,以期为图书馆知识服务的理论与实践发展提供参考。

参考文献:

[1] 中共中央办公厅国务院办公厅印发《关于推进实施国家文化数字化战略的意见》[EB/OL].[2023-04-26].http:// www.gov.c n/xinwen/2022-05/22/content 5691759. htm.

[2] 张晓林,梁娜.知识的智慧化、智慧的场景化、智能的泛在化——探索智慧知识服务的逻辑框架[J].中国图书馆学报,2023,49(3):4-18.

[3] 初景利,任娇菡,王珏.图书馆知识服务与出版知识服务的比较分析[J].图书情报知识,2021,38(6):110-122.

[4] GAO Y J. Intelligent library knowledge innovation service system based on multimedia technology[J]. Personal and ubiquitous computing,2020,24(3):333-345.

[5] AHMED S, SHEIKH A.Information and communication technology skills among library and information science professionals:a predictor of enhanced library services[J].Journal of librarianship and information science,2021,53(3):444-453.

[6] 储节旺,杜秀秀,李佳轩.人工智能生成内容对智慧图书馆服务的冲击及应用展望[J].情报理论与实践,2023, 46(5):6-13.

[7] 郭亚军,郭一若,李帅,等.ChatGPT赋能图书馆智慧服务:特征、场景与路径[J].图书馆建设,2023(2):30-39,78.

[8] CHEN X.ChatGPT and its possible impact on library reference services[J].Internet reference services quarterly,2023,27(2):121-129.

[9] 李书宁,刘一鸣.ChatGPT类智能对话工具兴起对图书馆行业的机遇与挑战[J].图书馆论坛,2023,43(5):104-110.

[10] 张晓林.从猿到人:探索知识服务的凤凰涅槃之路[J].数据分析与知识发现,2023,7(3):1-4.

[11] PANDA S, KAUR N.Exploring the viability of ChatGPT as an alternative to traditional chatbot systems in library and information centers[J].Library hi tech news,2023, 40(3): 22-25.

[12] 赵瑞雪,黄永文,马玮璐,等.ChatGPT对图书馆智能知识服务的启示与思考[J].农业图书情报学报,2023, 35(1):29-38.

[13] 叶鹰,朱秀珠,魏雪迎,等.从ChatGPT爆发到GPT技术革命的启示[J].情报理论与实践,2023,46(6):33-37.

[14] CHRISTIANO P F,LEIKE J,BROWN T,et al.Deep reinforcement learning from human preferences[J]. Advances in neural information processing systems, 2017,30(1):4302-4310.

[15] SCHULMAN J,WOLSKI F,DHARIWAL P,et al.Proximal policy optimization algorithms[J/OL].arXiv, 2017[2023-05-08].https://doi.org/10.48550/arXiv. 1707.06347.

[16] VASWANI A,SHAZEER N,PARMAR N,et al.Attention is all you need[C]//Advances in Neural Information Processing Systems.Cambridge:MIT Press,2017:5998-6008.

[17] 姚雪梅.面向知识服务的公共图书馆空间再造研究[J].图书馆工作与研究,2023,323(1):28-34.

[18] WEI J,WANG X,SCHUURMANS D,et al.Chain of thought prompting elicits reasoning in large language models[J/OL].arXiv,2022[2023-05-08].https://doi.org/ 10.48550/arXiv.2201.11903.

[19] 桑基韬,于剑.从ChatGPT看AI未来趋势和挑战[J].计算机研究与发展,2023,60(6):1191-1201.

[20] 何哲,曾润喜,秦维,等.ChatGPT等新一代人工智能技术的社会影响及其治理[J].电子政务,2023,244(4):2-24.

[21] 张智雄,曾建勋,夏翠娟,等.回应AIGC的信息资源管理学人思考[J].农业图书情报学报,2023,35(1):4-28.

[22] 蔡迎春,严丹,周琼,等.元宇宙时代智慧图书馆的实践路径——从图书馆的智慧化走向智慧的图书馆化[J].中国图书馆学报,2023,49(4):103-113.

[23] 张智雄,于改红,刘熠,等.ChatGPT对文献情报工作的影响[J].数据分析与知识发现,2023,7(3):36-42.

[24] Reinventing search with a new Al-powered Microsoft Bing and Edge your copilot for the web[EB/OL].[2023-05-12].https://blog smicro soft com/blog/2023/0207/ reinventing search-wih-a-new-ai-poweredmicrosoft-bing-and- edge-your-copilot-for-the-webl.

[25] CATHY D R,JOANNE C,MATTHEW C,et al.Perceptions of libraries,2010:context and community[R/OL].[2023-05-02].https://fieseric.edgov/fulltext/ED532601.pdf.

[26] 曹树金,曹茹烨.从ChatGPT看生成式AI对情报学研究与实践的影响[J].现代情报,2023,43(4):3-10.

[27] CRESSWELL M J.Logics and languages[M].London: Routledge,2016:45.

[作者简介]

郭亚军 1979 年生,博士,郑州航空工业管理学院信息管理学院教授、研究生导师,研究方向为元宇宙、虚拟图书馆、知识管理、ChatGPT等,本文通讯作者,ORCID:0000-0001-8441-3328。E-mail:guoyajun0619@126.com。

马慧芳 1996年生,郑州航空工业管理学院信息管理学院图书情报硕士研究生,研究方向为ChatGPT、知识管理。

张鑫迪 1996年生,郑州航空工业管理学院信息管理学院图书情报硕士研究生,研究方向为元宇宙、数字人文、信息无障碍。

冯思倩 1998年生,郑州航空工业管理学院信息管理学院图书情报硕士研究生,研究方向为信息行为、元宇宙、知识管理。

[收稿日期:2023-05-28]

猜你喜欢

知识服务人工智能图书馆
2019:人工智能
人工智能与就业
图书馆
数读人工智能
构建图书馆知识服务理论体系的思考
嵌入心理契约的馆员知识服务能力建设研究
飞跃图书馆
中学师资培训系统的设计
从西方国家保护消费者权益政策看用户信息消费的安全管理
下一幕,人工智能!