生成式人工智能赋能智慧图书馆创新的实现策略和风险挑战
2024-05-14闫芳芳
摘要:文章阐述了生成式人工智能赋能智慧图书馆建设可以极大地提升用户体验,为图书馆服务创新带来无限可能,但也面临着风险挑战。图书馆在积极寻求技术赋能的同时要保持审慎的态度,在充分尊重用户隐私和保障用户信息安全的基础上发展适用于图书馆需求的智慧化服务创新,规避技术背后的安全风险。
关键词:生成式人工智能;智慧图书馆;应用场景;策略;风险
中图分类号:G250.1文献标志码:A
0 引言
近年来,以ChatGPT为代表的生成式人工智能技术的出现引发了全世界的人工智能热潮,为各行业带来新的发展契机,也对智慧图书馆的发展产生了重要影响。如何将生成式人工智能技术融入图书馆服务创新与体系重构中,提升图书馆信息检索和知识服务的智慧化水平已经成为业界关注的重点。技术赋能带来了数据真伪、个人隐私泄露、知识产权和学术道德等风险。本文旨在探讨生成式人工智能赋能图书馆创新的实现策略,并深入分析其中可能面临的风险和挑战。
1 生成式人工智能对图书馆事业的冲击与机遇
2022年11月,OpenAI公司发布的智能聊天机器人ChatGPT引发了全球范围内的人工智能热潮。随后,各大科技公司竞相加入大语言模型(Large Language Model)赛道,微软将GPT集成到“必应”搜索引擎中,谷歌发布了Bard,随后推出了生成式人工智能模型“双子座”。国内的大模型应用也迅速推出,如文心一言、讯飞星火、智谱清言、紫东太初、通义千问等,大模型可以进行文案创作、语音识别、编写代码、绘画、视频制作等任务。生成式人工智能展現了广阔的应用前景,为各行业的数智变革带来了新的发展机遇。对图书馆而言,生成式人工智能带来巨大冲击的同时伴随着巨大的发展机遇。学界对生成式人工智能对图书情报工作的冲击和影响展开了大量研究。储节旺等[1]认为AIGC技术应用到图书馆服务可以优化知识组织方式,提升知识服务能力;张智雄等[2]、尹克寒[3]研究了ChatGPT对情报信息工作的影响;李书宁等[4]从图书馆业务效率提升、智能咨询和检索服务等角度探讨了ChatGPT对图书馆行业的机遇与挑战;赵瑞雪等[5]认为人工智能技术可以提升图书馆智能知识服务水平;郭亚军等[6]研究了ChatGPT赋能图书馆知识服务的原理、场景与进路等。研究表明,生成式人工智能在图书馆智能检索、资源组织与管理、知识发现、学科服务、参考咨询、阅读推广领域有广阔的应用前景。图书馆必须重视生成式人工智能带来的信息生产方式变革以及用户信息获取方式变革,积极利用生成式人工智能实现资源与服务的转型与升级,推动多资源环境下知识服务场景的范式转变,为用户提供更加智慧化、精准化和个性化的服务,提升服务的质量和效率。
2 生成式人工智能赋能智慧图书馆服务应用场景
2.1 智能化检索服务场景
图书馆现有的检索系统以关键词和主题检索为主,借助布尔逻辑式和高级检索来限制检索范围,这些检索技能需要进行专业的信息素养培训,部分用户因为缺乏专业训练,不了解检索规则,很难得到满意的检索结果。利用生成式人工智能打造图书馆的智能检索平台可以有效降低使用门槛,读者只要按照自己的需求用语言如实陈述,就可以快速得到想要的结果。生成式人工智能可以结合读者的搜索历史、浏览记录、兴趣偏好为读者提供个性化推荐,节省读者的信息筛选时间,提升检索效率。
2.2 智慧化知识服务场景
知识服务能力的提升是智慧图书馆建设的重点。图书馆可以利用生成式人工智能的信息抽取、主题识别和分类能力对现有资源进行重新组织和整理,使得图书馆资源管理从主题、关键词、摘要等表层信息深入到文献内容层面,实现细粒度知识的挖掘、重组和分析。建立不同数据类型之间的关联,进行主题化、专题化的分类揭示,形成高质量的知识库系统。服务方面,利用人工智能的学习能力、逻辑推理能力,图书馆可以根据用户的需求和指令,自动抽取和总结文献内容;分析学科发展趋势和研究热点,自动生成分析报告;帮助用户精准快捷地实现杂乱信息到结构化知识的转换。图书馆可以在全面了解用户知识需求的基础上,为用户打造个性化知识社区,构建以用户为中心的知识网络,提升智慧化知识服务能力。
图书馆可以利用生成式人工智能开发智能问答机器人,为用户提供不受时空限制的参考咨询服务。用户以自然语言方式提问,机器人通过对话精准识别用户的意图,进行相关信息的检索和回答,大大提高了智能咨询服务的覆盖面和质量。机器人可以根据用户的浏览历史和阅读数据分析用户需求,提供更加准确和有针对性的咨询建议,进而为用户提供个性化的阅读推荐和定制化的服务。
2.3 沉浸式虚拟阅读体验场景
图书馆可以利用生成式人工智能的图像识别、视觉推理、多模态融合等技术将重点资源可视化,构建虚实融合的阅读空间,为读者打造高沉浸感的阅读体验场景。比如让读者以“虚拟化身”形式“进入”文学作品中,通过“穿越”古代场景或“进入”虚幻世界达到“身临其境”的效果。读者从之前依托文字描述进行“想象”的旁观者,转变为亲身体验的互动者和参与者,这种“虚实相融”的新型阅读场景可以带来高沉浸感的阅读体验和乐趣。图书馆还可以结合虚拟现实技术生成虚拟数字人,虚拟数字人具有类人情感和逻辑思维能力,与读者的沟通交流更加流畅自然,可以带领读者沉浸式体验书本内容,分享阅读心得、解析作品内涵等。
2.4 个性化信息素养教育场景
传统的信息素养教育主要以推介资源和培训信息素养为主,随着自然语言理解与处理技术的广泛应用,对用户来说,复杂专业的检索知识不再是必须技能,更重要的是学习如何准确表达自己的需求,以获得更有价值的结果。“高效提问的能力”成为人工智能时代信息素养教育的重点。图书馆必须适应用户信息需求的变化,利用生成式人工智能打造个性化的信息素养教育场景,培训用户掌握正确的人机互动方法以及如何通过反馈快速解决问题的技能。利用人工智能打造用户专属的虚拟学习空间,智能机器人可以辅助用户制定学习计划、进行知识点总结、课程测试等,帮助用户提升学习效率。这种智能化、个性化的教学方式能够使信息素养教育更有针对性,提升教学质量和学习效率。需要注意的是,智能机器人并不完全具备人类的高阶思维能力和推理能力,在利用智能机器人进行信息素养教育时,必须人机协同工作,以人类教育为主,机器人智能辅助为辅,教育者需要关注智能工具的使用限制,对因为技术原因产生的知识覆盖面不足、错误回答等问题及时进行人工审核和信息勘误,警惕安全风险,保护用户隐私。要关注用户对智能工具的过度依赖问题,加强用户的批判思维和独立思考能力的培养,引导用户多方查证信息来源,多角度思考问题,而不是对智能工具盲目信任。
3 生成式人工智能赋能智慧图书馆服务创新的实用策略
3.1 创新馆藏资源建设与管理模式
在文献资源建设方面,图书馆可以利用智能工具自动分类采编数据,校订书目信息,更加便捷地分类和管理文献,提升数据质量和编目效率。图书馆可以利用AIGC技术中的Transformer架构进行迁移学习,借助预训练的模型提高图书馆现有馆藏数字资源的数据发现能力和资源组织水平。模型的强大数据分析与处理能力可以实现多模态数据的实时采集与分析,将不同模态的资源进行优化整合。通过对特色资源和特定专业领域知识的内容挖掘,实现资源细粒度知识的组织和揭示,打造特色专题知识库,满足专业领域高质量的知识服务需求。目前,商业用的大模型数据主要是网络公开资源,在专业性和准确性上存在不足,图书馆丰富的馆藏资源可以为大模型训练提供高质量的语料库,发挥资源的最大社会效益和经济效益,为社会提供更多的知识价值。数据与算法模型是生成式人工智能的基础,由于大模型的投入成本与算力要求很高,图书馆无力承担技术与成本需求,政府可以进行统筹规划,图书馆与互联网公司合作开发图书馆应用模型。
3.2 构建智慧化的知识服务新方式
图书馆可以利用AIGC技术对馆藏数据实现有效管理和深度挖掘,从海量数据中挖掘潜在的关联关系和深层次的语义信息,为用户提供更加智慧的知识发现服务。首先,通过构建知识图谱实现知识的智能化组织与管理,将不同领域的知识进行语义化表示并建立关联,帮助用户快速定位相关知识和深度探索关联知识,实现知识的精确匹配与自动推荐。其次,为用户提供文献解析、热点追踪、科研写作等深层次的知识服务,帮助用户发现科研思路、分析整理文献、制定研究方法等,成为用户高效率的科研助手。
3.3 打造智能问答系统和个性化阅读推荐平台
利用生成式人工智能开发智能问答系统,用智能问答代替传统的信息检索,根据用户需求,使用文本、语音、图片、视频等多模态信息输出代替单一的文本输出。智能问答系统的核心是人工智能算法,借助自然语言处理技术、语义关联技术了解用户的提问意图,并根据语义相似性和上下文关系为用户提供回答建议。系统不仅会通过监督学习和无监督学习方法进行模型训练,还会利用强化学习和深度学习等技术不断修正结果,提高回答效率和准确性。
图书馆可以通过多模态信息资源的汇聚整合打造个性化的阅读推荐平台,基于用户的检索历史和兴趣偏好,为其进行个性化的阅读推荐,为用户提供更具深度和广度的阅读指引。可以通过对用户阅读时段、阅读时长与阅读频率等数据的分析,了解用户的阅读情况和满意度,通过反馈学习,不断优化推荐效果。图书馆还可以借助人工智能技术生成虚拟数字人作为阅读推广形象大使,通过生动的形象向公众展示图书馆的资源和服务,增强读者的认知度和亲近感,为用户提供更加智慧、高效、个性化的阅读体验。
4 生成式人工智能技术的使用限制和安全风险
4.1 输出数据的真实性问题
智能对话机器人的技术基础是生成式大语言模型,它基于大量的计算和概率分布生成最符合要求的答案,并不能保证生成内容的真实性和准确性。一些专业领域问题或者模型训练数据中没有的知识,机器人无法提供准确的回答,会出现回答质量不稳定或者编造答案的情况。因此,智能对话机器人应用于图书馆参考咨询、智能检索服务时,必须与人工服务相结合,对服务内容进行人工审核和勘误,避免给用户带来不必要的误解或错误。
4.2 个人隐私数据泄露风险
智慧图书馆的智能化检索、个性化知识服务需要收集大量用户數据,如姓名、电子邮箱、电话或者人脸识别信息等敏感信息,在收集、使用用户数据的过程中,会存在扩大收集范围、侵犯用户隐私等风险,如果管理的数据被泄露和滥用,可能会导致网络诈骗、网络暴力、人身歧视等问题。因此,图书馆在使用人工智能技术时要重视个人隐私数据安全,遵守相关的政策和法规,如2023年8开始施行的《生成式人工智能服务管理暂行办法》《中华人民共和国个人信息保护法》《数据安全法》等,在收集、使用、存储、传输用户个人信息时,应该遵循最小必要、知情同意、安全合法、保护隐私等原则[7]。图书馆应该采取措施对用户的个人信息进行加密处理,避免被泄露和滥用。相关工作人员要进行培训,增强隐私保护意识,严守操作规程,向第三方提供用户信息时应该遵守法律规定,征得用户同意,对敏感信息进行脱敏处理,避免用户隐私泄露。
4.3 知识产权和学术道德风险
生成式人工智能在图书馆服务中的知识产权问题,一是生成内容的著作权问题,我国法律目前对于人工智能创作的作品著作权归属还没有明确规定。二是智能对话机器人在提供服务时生成的回答和建议可能包含了拥有版权或专利保护的内容。图书馆在使用人工智能进行知识服务的时候要确保使用经过合法授权的资源,加强监管,遵循相关法律法规,避免侵犯他人知识产权。涉及学术研究或论文写作方面问题时,应注意遵守学术道德规范,明确侵权责任和惩罚措施,确保任何生成的数据或回答都符合学术诚信的要求,避免产生学术不端或抄袭的行为。
5 结语
面对人工智能发展浪潮,图书馆在积极寻求技术赋能的同时要保持审慎的态度,充分认识到人工智能技术给图书馆带来的机遇与挑战,保持技术理性和价值理性的平衡,在充分尊重用户隐私和保障用户信息安全的基础上发展适用于图书馆需求的智慧化服务创新,规避技术背后的安全风险。
参考文献
[1]储节旺,杜秀秀,李佳轩.人工智能生成内容对智慧图书馆服务的冲击及应用展望[J]情报理论与实践,2023(5):6-13.
[2]张智雄,于改红,刘熠,等.ChatGPT对文献情报工作的影响[J].数据分析与知识发现,2023(3):36-42.
[3]尹克寒.ChatGPT的发展对情报信息工作的影响及启示[J].图书馆理论与实践,2023(3):15-22.
[4]李书宁,刘一鸣.ChatGPT类智能对话工具兴起对图书馆行业的机遇与挑战[J].图书馆论坛,2023(5):104-110.
[5]赵瑞雪,黄永文,马玮璐,等.ChatGPT对图书馆智能知识服务的启示与思考[J].农业图书情报学报,2023(5):29-38.
[6]郭亚军,马慧芳,张鑫迪,等.ChatGPT赋能图书馆知识服务:原理、场景与进路[J/OL].图书馆建设:1-16[2024-02-28].http://kns.cnki.net/kcms/detail/23.1331.G2.20230713.1606.004.html.
[7]徐芳.智慧图书馆生成式人工智能应用场景及其法律问题[J/OL].情报资料工作:1-10[2024-02-28].http://kns.cnki.net/kcms/detail/11.1448.G3. 202312 25.1753.005.html.
(编辑 何 琳编辑)
Implementation strategies and risk challenges of generative artificial intelligence empowering innovation in smart libraries
Yan Fangfang
(Library, Henan University, Kaifeng 475001, China)
Abstract: The article elaborates that empowering smart library construction with generative artificial intelligence can greatly enhance user experience and bring infinite possibilities for library service innovation, but it also faces risks and challenges. While actively seeking technological empowerment, libraries should maintain a cautious attitude and develop intelligent service innovations that are suitable for library needs, and fully respecting user privacy and ensuring user information security, to avoid security risks behind technology.
Key words: generative artificial intelligence; smart library; application scenarios; strategy; risk
基金項目:2022年度河南省图书情报研究项目;项目名称:新媒体时代高校图书馆信息素养教育新路径探析——以媒介素养为例;项目编号:HNTQL-2022-107。
作者简介:闫芳芳(1980— ),女,馆员,硕士研究生;研究方向:信息素养教育,阅读推广。