国际图联视域下图书馆人工智能应用的战略对策研究*
2023-03-21张久珍
刘 聪 张久珍
(1.北京大学信息管理系 北京 100871)
近十年来,人工智能技术进入了蓬勃发展时期,从深度卷积神经网络、生成对抗网络、自然语言处理,到战胜人类棋手的AlphaGo,再到生成式预训练模 型Tran sformer(GPT)、ALphaFold 2、DALL-E 和GitHub Copilot 等的相继问世以及2022 年轰动一时的ChatGPT 的上线,一次次关键技术的突破,使人工智能技术迅速渗透到金融、制造、交通运输、医疗、教育、文化等各个行业,成为各行业发展创新的助力和推手。作为全球图书馆界最具权威、最有影响力的专业性国际组织,早在2013 年,国际图联(IFLA)就将人工智能列为影响图书馆未来发展的关键技术之一[1],并于2020 年发布《IFLA 关于图书馆与人工智能的声明》,为政府、图书馆协会和图书馆行业应用人工智能提供了建议[2]。2021 年11 月,IFLA 发起成立人工智能特别兴趣小组(AI SIG)[3],并联合相关机构密集召开以人工智能为主题的卫星会议和各类研讨会,发布帮助图书馆应用人工智能的资源列表,加速推进和指导图书馆行业应用人工智能的战略布局。
2023 年4 月,谢菲尔德大学信息学院同时在线上和线下召开研讨会,邀请图书馆界5 位专家就“人工智能在图书馆的战略地位”进行研讨。会议从生成式人工智能对图书馆的影响、人工智能带来的伦理问题、图书馆应对人工智能所需的技能、图书馆战略制定等视角讨论了人工智能背景下图书馆面临的问题和解决方案。会后,会议召集人安德鲁·M·考克斯博士综合会前调查、会中与会后讨论,于2023 年6 月4 日发布征求意见稿《制定图书馆应对人工智能的战略对策》,再次在线上征集意见和建议[4]。2023 年7月,负责人将会前对111 所学术图书馆的调查数据添加至征求意见稿以获取更广泛和专业的建议。在此基础上,2023 年11 月24 日,IFLA 综合截至2023 年11月20 日收集到的各方意见,发布《制定图书馆应对人工智能的战略对策》报告(以下简称《报告》),列出有关图书馆制定应对人工智能战略对策应考虑的事项和决策建议[5]。该报告可以看作是《IFLA 关于图书馆与人工智能的声明》的升级版,是IFLA 基于图书馆调查、会议研讨、建议征集和全球人工智能技术最新发展趋势而为图书馆提供的建设性、策略性建议,对图书馆人工智能应用战略制定具有重要的参考意义。本文拟从IFLA 视域下对图书馆人工智能应用的战略对策进行研究,以期为促进图书馆人工智能应用实践提供参考。
1 IFLA 视域下图书馆人工智能应用的战略对策分析
1.1 人工智能对图书馆运营的影响
《报告》认为,人工智能的应用会对图书馆工作产生广泛而深刻的影响,包括馆藏、服务、宣传推广、空间建设等。 一是人工智能可以采集大量馆藏数据并进行挖掘、分析和处理,从而使馆藏获取更加容易,资源检索也更加智能,对图书馆馆藏建设、资源利用工作会产生根本性影响;二是随着越来越多的学者在研究中使用人工智能技术,用户希望获得数据管理支持的需求也会增长,如数据发现、版权问题、数据管理和数据保存等方面的需求;三是生成式人工智能具有的翻译、文本生成等功能会直接影响图书馆的常规知识服务,尤其是大量的人工智能工具和应用程序的出现,如ResearchRabbit、Scite、elicit等文献检索工具甚至可以帮助用户完成文献综述的任务;四是人工智能能够准确地执行复杂的日常任务,这意味着它可以被部署在图书馆的后端系统中,典型的应用如使用机器人流程自动化技术(RPA)来处理书目数据;五是聊天机器人可为用户提供常规的服务咨询、信息检索、书目查询等,物理机器人通常布置在图书馆智能空间,实现图书的自助借阅和归还、智能盘点等;六是人工智能能够创建自适应学习内容或通过聊天机器人为用户学习提供支持;七是人工智能可用于预测用户行为模式从而能够辅助图书馆进行决策;八是由于人工智能的广泛应用,用户的人工智能素养培训需求加大。此外,生成式人工智能生成的文本能够满足特定受众的需求,因此,对图书馆的宣传推广工作也会产生影响。
而对111 所学术图书馆的调查结果显示,“提升用户的人工智能素养”是图书馆计划和试点开展最多的人工智能相关服务项目,成熟的项目以聊天机器人开发最多,其次是馆藏知识发现和科研数据服务。《报告》认为,虽然人工智能对图书馆资源、服务和空间等都可能产生影响,但实践中究竟应该采取什么样的策略、开展哪些项目来应对人工智能带来的变化,还需要考虑多种因素,如哪些项目对资源需求最少且能满足用户需求并与图书馆职责保持一致,哪些项目有助于重塑图书馆服务,人工智能如何提高服务水平,能帮助图书馆应对哪些挑战等。
1.2 人工智能应用战略环境和图书馆SWOT 分析
IFLA 认为,图书馆应在政府政策以及现有的法律框架下制定人工智能战略。 2019 年以来,许多国家都将人工智能视为战略重点,这些国家的政策中有很多共同关注的焦点,如开发相关的人力资源、推动负责任的人工智能应用、建立人工智能研究基地、实施管控、开发数据基础设施、制定相关政策等。毫无疑问,图书馆在这些方面均可发挥作用,如帮助公民提升人工智能素养,倡导负责任的人工智能应用,为科研人员提供数据管理服务以及数据基础设施的设计和使用等。 然而,需要注意的是,虽然各国在人工智能战略上有许多共同点,但不同国家政策的侧重点也不相同,有学者将其分为三种类型:一是侧重发展,引导人工智能实现政府制定的发展目标,如中国、日本、俄罗斯和东欧的一些国家;二是侧重管控,通过政策监管规避人工智能发展可能带来的风险,如欧盟;三是促进创新,尤其是私营部门的创新,政府通过出台一系列政策推动和促进人工智能的发展,如英美等国。从整个国际大环境来说,由于ChatGPT 上线后进一步加剧了有关人工智能社会伦理的争议,国际社会已从推动人工智能发展转而更注重对其进行监管,这可能也会对人工智能在图书馆领域的开发和使用产生根本性影响。对于图书馆来说,应对人工智能带来的变革需要与更广泛的机构、部门和国家优先事项紧密联系起来,展示图书馆的重要作用,并主动寻求在相关领域发挥领导作用。
《报告》通过SWOT 分析法评估了图书馆在人工智能方面的总体战略地位。其中,图书馆的优势在于:首先,负责任的人工智能开发是由学习者的利益驱动的,这与图书馆以用户需求为核心的发展理念相一致。 其次,数据是人工智能的关键,而图书馆在数据描述、数据所有权和许可、促进数据共享和数据保存、清除文本和数据挖掘的法律和技术障碍等方面具有优势。再次,人工智能带来的诸多伦理问题如虚假信息、隐私泄露、偏见、可解释性、透明度等,反过来也突显了图书馆作为可信赖的信息中心的地位。同时,在应对伦理问题上,图书馆也有诸多优势,如提升用户人工智能(算法)素养,提倡知识共享和让所有人获得知识的理念与实践还有助于弥合人工智能商业化应用带来的数字鸿沟。
图书馆的弱势主要体现在:一是许多图书馆缺乏技术开发能力,使得基于人工智能的项目难以运行,而商业产品价格昂贵。二是在数据方面,与主导人工智能发展的科技巨头相比,图书馆可能缺乏对部分馆藏(如电子资源)和用户数据的所有权,且数据量较小,同时基于现代数据的算法训练可能并不适用于图书馆的历史数据。此前对111 所学术图书馆的调查显示,缺乏数据和数据质量问题是实施人工智能项目的重要障碍。三是人工智能的发展还与图书馆的价值观如保护隐私、消除偏见、共享和开放等相冲突,调查中有55 所图书馆认为对伦理问题的担心是实施人工智能项目的关键障碍。此外,围绕人工智能产生的跨界合作形式,也面临新的挑战。四是技术的发展往往存在竞争,而图书馆更侧重于其学术技能提升和教育功能的发展,并不是技术方面的创新。
图书馆面临的机会主要有:人工智能工具通过描述内容、总结、翻译等促进了对馆藏知识的获取;人工智能能够执行日常任务,为馆员从事更有价值的工作提供了时间和空间;生成式人工智能所合成信息的弱点增加了人们对图书馆可信赖信息的需求;人工智能为图书馆新的合作形式创造了机会,如与数据科学人员进行合作;人工智能可用于改进图书馆决策;图书馆可影响系统供应商将人工智能融入其产品,这为人工智能在更广泛的基础设施应用带来机会;图书馆可影响基于图书馆价值观的人工智能相关政策的制定。
图书馆面临的风险有:由于媒体对人工智能的报道,尤其是ChatGPT 上线以来的报道引发的炒作和恐惧,会对决策环境造成一定干扰;人工智能的变革由科技巨头主导,其速度之快和影响力之大使图书馆等机构难以作出及时反应;人工智能行业劳动力缺乏多样性可能对社会公平产生负面影响,而目前平等、多样性和包容性(EDI)已被公认为人工智能发展的优先事项,过度关注技术可能会导致对人的忽视,而与图书馆的价值观背道而驰。
1.3 图书馆人工智能应用的战略响应
IFLA 在《报告》中列举了图书馆针对人工智能有可能做出的战略响应,并对其利弊进行了分析。这些响应措施包括以下几个方面:
(1)招聘具有人工智能技能的新员工,建立一支成熟的人工智能团队。这有助于图书馆应对实施人工智能项目所需的复杂技术,但同时图书馆一方面需要支付更高的薪酬,另一方面很难确定团队需要具备哪些技能。提高现有员工的人工智能相关技能是一种更为积极主动的应对策略,在快速变化的环境中保持员工的适应性和竞争力,为他们规划更好的职业发展前景,可提高员工的学习兴趣,亦可加强组织的应变能力,同时也是一种符合成本效益原则的应对策略,缺点则是学习内容复杂,目前还没有经认可的人工智能培训课程或教学大纲,并且需对不同类型技能做出优先排序。在对111 所学术图书馆的调查中,将人工智能应用于知识发现时馆员认为需要的知识和技能类型,排在前10 位的分别为开放的心态和学习意愿、了解用户行为和需求、如何从人工智能工具中获得最佳结果、对人工智能的总体了解、利益愿景、职业道德、知识产权和版权、解决问题、协作技能、数据(资料)管理,而与人工智能技术密切相关的统计学、编码方法则被排在了最后,这说明馆员更重视将图书馆专业知识与人工智能基础知识和应用相结合。
(2)了解用户行为从而做出应对。人工智能发展迅速,尤其是ChatGPT 正在改变用户发现信息和写作的方式,进而改变他们的学习方式,因此,了解人工智能对用户信息行为的影响至关重要。如了解不同用户是如何使用人工智能的,图书馆如何支持所有用户在符合道德标准的情况下使用人工智能,从而最大限度地提高人工智能的利用效益。 这一应对方式的好处是与图书馆关注用户需求的服务宗旨相一致,缺点是用户的需求复杂而多样化,了解这些需求并做出应对需要图书馆付出人力、技术甚至是数据资源的成本。
(3)研究行业最佳实践可以汲取他人的经验教训,从而做出明智、有效和合乎道德的决策,但是目前并没有太多的案例可供借鉴。运行概念验证项目可最大限度地降低风险,提高项目的成功机率,尤其在人工智能领域,复杂的技术和创新往往需要在全面实施前进行验证。这一策略的好处还在于能在项目运行过程中逐步培养团队成员的技能,并在实践中测试需要解决的问题。缺点之一是试点项目预期难以管理,如何做到既提高服务水平,又能提升用户体验,达到用户满意,从而使项目效果最大,副作用最小,对于图书馆来说具有一定难度。同时,运行概念验证项目需要图书馆的资源投入,如人力、物力、技术等有形资源以及部门间的协调、管理组织变革、承担风险的能力等无形资源。另外,如何将概念验证项目转化为服务本身就是一个重大挑战。
(4)以合作的方式应对,包括外部合作和内部合作。 与系统供应商合作,通过外包的形式购买或获得技术解决方案是图书馆常用的合作方式,可有效降低人力资源成本、技术成本以及项目风险。但做出符合组织目标并为运营带来价值的决策有赖于详尽和周密的市场调查,需要图书馆界集体努力来影响市场的发展。同时,外包给外部机构执行的业务流程图书馆无法控制,使服务质量难以把控。另外,还可以通过与图书馆行业组织甚至是整个GLAM(美术馆、图书馆、档案馆及博物馆)领域的机构合作来降低风险,从而最大化专业网络的优势。目前已有一些专门从事GLAM 人工智能应用的组织,如IFLAAI SIG,专注于图书馆、档案馆和博物馆人工智能应用的AI4LAM,欧洲国家图书馆馆长联席会议(CENL)的AI 图书馆网络小组等。在组织内部合作方面,高校图书馆可以考虑与学校的IT 部门、未与图书馆整合的学生服务项目、科研和教学部门(尤其是计算科学、哲学以及新兴学科如数据科学)、教师参与决策的项目如人工智能教育(AIED)等进行合作,这样做的好处是可以共享资源,但需要找到与图书馆人工智能应用的相关性。
(5)采取观望的态度。这一做法可以节省资源,并向早期采用者学习,但需要谨慎评估和平衡行动开始的时间点,确定图书馆想从哪个阶段开始:创新者、早期采用者、早期多数采用者,后期多数采用者或后期采用者,否则将面临落后和失去相关性的风险。
基于以上分析,《报告》认为,实践中图书馆可能会采取以上一种或几种策略的组合,但现阶段图书馆要重视以下三个重要策略:一是运用描述性人工智能改善馆藏信息检索和揭示方式,创建负责任、可解释的人工智能应用范例,以应对人工智能商业应用所带来的伦理问题;二是发挥馆员的数据管理能力,为各领域的数据科学人员提供服务,如促进数据的共享、开放和互操作性,解释数据的来源、质量和有效性,存储、保存(或销毁)数据等;三是提高组织内部和社会公众的人工智能素养,《报告》认为这是最符合现有图书馆业务和馆员职责的战略。
2 IFLA 图书馆人工智能应用战略对策对我国的启示
2.1 将负责任的人工智能应用作为首要战略原则
人工智能技术自诞生之日起,其带来的复杂伦理问题就一直备受各界高度关注。近年来,我国政府高度重视人工智能伦理的研究和实践,并在世界范围内倡导人工智能治理。2017 年7 月,国务院印发《新一代人工智能发展规划》,提出要建立人工智能法律法规、伦理规范和政策体系,形成人工智能安全评估和管控能力的任务[6];2018 年1 月,中国电子技术标准化研究院发布《人工智能标准化白皮书(2018 版)》,呼吁制定人工智能安全与伦理标准;2021 年9 月25日,国家新一代人工智能治理专业委员会发布《新一代人工智能伦理规范》,提出人工智能管理、研发、供应、使用等特定活动的18项具体伦理要求[7];2023年7 月10 日,国家互联网信息办公室等7 部门联合发布《生成式人工智能服务管理暂行办法》,对提供和使用生成式人工智能服务应当遵守的法律、行政法规、社会公德和伦理道德进行了规定[8];同年10月18日,习近平主席在第三届“一带一路”国际合作高峰论坛开幕式主旨演讲中宣布中方将提出《全球人工智能治理倡议》,对个人隐私与数据保护、数据获取、算法设计等提出了具体的原则准则和建议[9]。 以负责任的人工智能应用为首要原则制订应对策略,与当前我国政府倡导的的人工智能基本发展方向和社会各方关注的优先事项保持一致,让人工智能应用从一开始就保持正确的发展方向,使图书馆成为负责任的人工智能开发与应用的倡导者和引领者,不仅能够突显图书馆作为公益性文化机构所承担的增进人类福祉、促进公平公正、保护用户隐私、确保信息可控可信的社会责任,同时只有获得社会公众信任的人工智能技术开发与应用才能持续健康发展。需要强调的是,负责任的人工智能应用应成为我国图书馆界整体的人工智能应用战略原则,而不仅仅是单馆的战略方向,这需要图书馆行业协会的引领和相关部门的重视,并在图书馆界达到共识。
2.2 从资源入手成为负责任的人工智能应用典范
馆藏是图书馆赖以服务的物质基础,改善馆藏信息检索和揭示方式是近二十年来图书馆提升用户服务质量的重要手段。正如《报告》所指出的,运用描述性人工智能进行馆藏分析、信息标引、检索优化,促进知识发现,创建负责任的人工智能应用范例是目前图书馆最容易、也是最具有实践基础的应对策略。从全国来看,“十四五”时期,文化和旅游部面向公共图书馆系统组织实施了智慧图书馆体系建设项目,其中就包括利用语义网、知识图谱、大数据、智能计算等技术对数字资源及新型资源的精细化标引,对各类资源进行重新聚类实现智能化知识发现以及对馆藏特色资源开展VR/AR 等新型资源建设。2021年9 月,国家图书馆制定了《智慧图书馆知识资源建设指南》,为全国各级图书馆开展智慧图书馆知识资源建设提供参考,同时还开展了线上线下的相关培训。经过近两年的建设,涌现出了一大批优秀的项目,如广州图书馆的智慧媒资管理平台、杭州图书馆“杭州印象”知识资源平台、深圳图书馆的“方志里的深圳”小程序、中国科学院文献情报中心的专题情报数据管理与智能分析平台等。这些项目运用不同的人工智能技术强化图书馆的知识发现、组织和管理功能的同时,坚持以人民为中心的导向,严格按照版权法、互联网信息传播等相关法规进行资源加工和发布[10],确保所提供信息和知识符合负责任的人工智能应用伦理和道德原则。文化和旅游部公布的2021 年智慧图书馆建设项目验收结果中,基础数字资源建设任务111 个,完成知识资源细颗粒度标引650 余万条,8 个省份参与基础支撑平台建设[11]。由此可以看出,我国图书馆利用描述性人工智能在馆藏资源揭示、挖掘、知识化提取等智能化资源建设方面已经具备了一定的实践基础,有可资借鉴的实战经验,是目前我国图书馆塑造负责任的人工智能应用典范的最佳路径。
2.3 以用户需求为导向的人工智能素养教育策略
人才是图书馆创新发展的根本。正如《报告》所指出的,提高组织内部和社会公众的人工智能素养是与图书馆现有业务和馆员职责最为匹配的应对策略,也更有利于图书馆在人工智能应用中掌握主动权。一项对我国642 家公共图书馆人工智能应用现状的调查显示,76%的受访图书馆认为“人员和经验不足”是其应用人工智能技术的主要困境,而开展与人工智能相关的人才培养和业务培训的图书馆仅占11%[12]。可见,馆员的人工智能素养教育迫在眉睫,馆员必须能够跟上人工智能的发展,图书馆在人工智能应用领域才不至于落伍。随着人工智能对图书馆空间和服务的影响逐步深入,馆员的人工智能素养教育方向应以用户需求为导向。英国利兹大学近期发布的一份《人工智能在图书馆的应用潜力报告》列举了馆员在人工智能环境下需履行的职责,实际上就是馆员需具备的满足用户不同层次需求的人工智能素养,包括一般素养和专业素养,值得图书馆界借鉴。这些素养包括:为用户提供最新的与人工智能及其应用相关的馆藏资源;帮助用户寻找和获取人工智能发展及其对社会影响等的信息和资源;进行数据质量控制,确保馆内人工智能系统中使用的数据准确、可靠;帮助用户获取人工智能工具;数据管理,包括组织、保存和维护人工智能系统中使用的数据(发挥馆员的数据管理能力,也是《报告》所强调的重要应对策略之一);设计数据基础设施,包括创建系统并管理和组织在人工智能系统中使用的数据;帮助用户利用人工智能系统并解释与系统相关的数据和信息;为用户提供人工智能素养培训,包括评估和理解用户遇到的数据或信息;设计AI 机制,包括有助于任务和流程自动化的系统;数据分析和算法设计,创建基于数据做出预测和决策的算法[13]。 此外,馆员人工智能素养的提升,除了图书馆自身的努力外,行业协会也应发挥相应的作用,将馆员人工智能素养教育纳入协会发展战略。欧美一些图书馆协会已经开展了类似的培训活动,如美国高校与研究型图书馆协会(ACRL)开展的线上人工智能与关键信息素养课程[14]。
2.4 通过宣传、交流与合作扩大行业及社会影响力
通过强化宣传、交流与合作,扩大图书馆人工智能应用在图书馆行业和社会的影响力,反过来促进人工智能在图书馆应用的可持续发展。主要包括以下三个层面:一是面向政府和社会层面,宣传符合图书馆价值观的负责任的人工智能应用以及图书馆在人工智能治理中的重要作用、涉及图书馆馆藏资源和数据所有权的版权法例外、图书馆人工智能应用对人工智能和图书馆事业发展的重要意义等,进而推动和影响人工智能在图书馆应用的相关政策、法规的出台,为图书馆人工智能应用争取更多的话语权和政策、资金的支持。面向政府和社会层面的宣传需要图书馆界共同发力,除了利用媒体宣传外,还应加强图情领域人工智能应用的研究与实践,通过研究成果和负责任的人工智能应用案例扩大影响。二是转变与系统供应商的合作模式。长期以来,图书馆行业虽然对新技术较为敏感,但由于缺乏技术开发能力,对新技术的应用更多地依赖于系统供应商,系统供应商生产什么,图书馆就使用什么。正如《报告》所指出的,图书馆需要通过影响系统供应商将人工智能按照图书馆的需求融入其产品,从而在人工智能基础设施应用上把握主动权,避免出现不符合图书馆价值观的人工智能应用而处于被动地位。三是与其他公益类机构加强人工智能应用合作,扩大行业影响力。如公共图书馆与博物馆、档案馆的合作,高校图书馆与校内机构的合作等,这些机构往往与图书馆有着共同的用户群体以及相同的服务理念,人工智能应用的合作不仅能够实现资源共享,还能为用户提供更加多元化的服务,从而扩大行业影响力。如2012 年开始建设的“欧洲时光机”项目,利用计算机通信与人工智能等技术,与40 多个国家的美术馆、图书馆、档案馆、博物馆合作,构建了以历史大数据为核心的大规模、长时间、细粒度、多维度的智慧数据基础设施,是一个典型的GLAM 人工智能合作项目[15]。目前,我国博物馆、档案馆等文化场馆的智慧化建设以及智慧校园建设正在逐步展开,图书馆人工智能应用的跨界合作也应及早布局。
3 结语
人工智能被认为是21 世纪最具创新性和影响力的技术之一,图书馆也必将成为人工智能应用的重要场景。 应对挑战,把握未来,及早制定人工智能应用战略规划和策略,坚持免费、开放、公益、平等、创新等的图书馆核心理念,推动负责任的人工智能应用的同时,为用户和社会创造更大价值是图书馆义不容辞的责任,也是图书馆可持续发展的重要保证。