“人工智能+图书馆”的应用前景分析
2023-01-18张创军
张创军
(西北民族大学图书馆,甘肃 兰州 730030)
被工业界冠以第四次工业革命的人工智能(简称AI)技术,将重塑全新的未来[1]。作为一种新的生产力因素,人工智能本质上是机器通过大量的数据训练作出智能决策的能力。传统的计算方式,机器只能按照预先编写的程序处理信息,一旦出现没有预设的情况,或者需要结合大量上下文的判断,机器将无法处理。而人工智能能够促使智能机器拥有会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、定理证明等)、会学习(机器学习、知识表示等)、会行动(机器人、自动驾驶汽车等)[2]等能力。
2019 世界人工智能大会,微软、IBM、腾讯、阿里巴巴、深兰科技、亚马逊等全球极具影响力的人工智能领跑者,向人们展示了人工智能在各领域的无限可能[3],各行业已普遍达成人工智能技术落地的共识。在图书情报领域,2017 年国际图联将人工智能列为驱动图书馆发展的四大战略性技术趋势之一[4],国内学者专家掀起了对人工智能的研究热潮。学者吴建中认为,人工智能与图书馆密切相关,图书馆界和情报界要利用自己的专业优势,参与并在人工智能的发展中有所作为,并从人工智能发展的技术环境、人工智能与信息组织以及人工智能在图书馆的应用三个方面,探讨了人工智能对我国图书馆事业发展的影响,指出人类应转变观念,以更积极的态度拥抱人工智能这一新型工具[5-6]。傅平等[7]对发表在国内外有影响的期刊文章和最新产业界人工智能技术应用的实例进行了研究,发现目前人工智能在图书馆领域的应用基本上还处于狭义人工智能或称为弱人工智能的机器学习阶段,但强人工智能技术应用于图书馆新一代信息检索系统的前景比较明朗。王世伟[8]对人工智能与图书馆的服务重塑问题进行了探讨,内容包括人工智能将引发图书馆服务、图书馆文献资源、图书馆人力资源、读者用户、图书馆服务空间、图书馆服务项目等问题的重塑,并探讨了人工智能与图书馆服务新增长极、人工智能导入路线图和时间表的可及性、处理好以人为本与数据驱动的关系、发展人工智能时代的图书情报学、人工智能推进中的价值引领等问题[9]。
借助人工智能等智能技术的驱动,图书馆将迎来革命性改变,其中智慧图书馆将成为未来图书馆新的发展方向。作为智慧图书馆建设和发展的驱动力之一,人工智能将解放和优化图书馆的人力资源,辅助馆员开展更深层次的服务,以满足用户个性化、多样性的需求,最大限度地从用户处获得更多的价值认同,从而达到提升图书馆服务质量、提高图书馆自身的活力和生命力的目标[10]。本文以人工智能在智慧图书馆的典型应用案例为切入点,深入分析机器人和智能搜索在图书馆的应用现状,并对其研究应用所面临的问题进行分析思考,以期能够对未来图书馆建设提供参考和借鉴。
1 人工智能在图书馆的应用现状
当前,人工智能的应用仍处于弱人工智能阶段,图书馆概莫能外。对人工智能在图书馆相关研究还较浅,研究热点相对比较分散,多集中在一些具体的应用方式上,未形成高密度的系统化研究课题群,但出现了局部聚集的趋势。在深入研究擅长领域的同时,部分学者的研究趋向于与计算机技术进行结合。但核心热点依旧是人工智能、图书馆、语义网络、知识工程和智慧图书馆等,主要是受限于相关专业知识的欠缺,还有是未能突破“按需研究”的思维定势[11]。综合上述成因,本文选取两个典型的应用场景,进行研究分析。一是机器人应用于图书盘点、智能咨询等,二是智能搜索应用于图书馆信息检索系统。
1.1 机器人应用于图书馆
机器人是人工智能系统的物理延伸,该技术的成熟与普及将为智慧图书馆带来新的内涵。早在1983 年,国内就发表了第一篇介绍机器人技术在图书馆应用的文章[12]。1987 年,自动存取系统ASRS[13]探索和开创了图书馆机器人技术的新纪元,并得到了较为广泛的应用。多年来,国内外专家、学者从理论探讨、应用测试、真实场景应用等方面,对机器人应用于图书馆进行了不断地探索和实践总结,并从经济的角度论证其在图书馆的应用前景。随着互联网技术、信息技术的普及,图书馆应借助自身专业优势,积极参与机器人技术的融合应用研究,助力机器人快速发展。机器人技术应用于图书馆主要涉及图书盘点、射频识别(RFID)、智能咨询、人机交互、语料技术等方面。
1.1.1 智能盘点机器人
近年来,不少机构和学者从理论研究、可行性分析和技术研发等多个层面,开始探索机器人在图书馆盘点定位中的应用。新加坡国家图书馆的机器人货架扫描系统(Autonomous Robotic Shelf Scanning System),利用超声波传感器技术,通过读取RFID 标签来报告图书丢失或错架信息[14];王展妮和张国亮[15]归纳机器人技术在图书馆的应用现状,指出图书定位、机器人导航和书籍拾取机构设计三项技术是构建图书馆机器人系统的关键技术;南京大学图书馆研发的基于超高频RFID 技术的图书盘点机器人,该自主盘点机器人利用可升降式扫描天线,以适应不同的书架层高,达到盘点每一层图书的目的,同时具有自主设计寻书定位路线、高效盘点和自助充电等功能[16];江波和吴永祥[17]深入分析比较各种RFID定位方法的原理和优缺点,基于数十家图书馆的实际建设经验,提出优化图书定位方案;何赫等[18]设计基于RFID 的图书定位查找系统,利用射频识别读写模块对贴有电子标签的书籍进行定位和查找,通过LabVIEW 软件实现上位机系统设计,提高了图书馆员在找到馆藏书籍和快速盘点方面的效率。基于超高频RFID 技术,智能盘点机器人能做到高效、动态、实时盘点图书,极大地提高了读者找书的成功率,实现图书盘点的常态化,但是依然面临一些挑战:一是在与盘点机器人的互动协作需要依赖技术馆员;二是智能盘点机器人的使用场景仅限于固定的图书馆区域[19],图书馆尚且不具备智能馆舍空间的要求。
1.1.2 智能咨询机器人
智能咨询机器人的应用拓展了图书馆业务咨询的维度,使得咨询服务更加个性和智能。Allison[20]创建了涵盖图书馆网站和聊天日志记录的数据库,通过分析日志提升机器人的聊天效果。清华大学图书馆开发的机器人“小图”[21],深圳图书馆应用“小图丁”IM 咨询机器人[22],南京大学图书馆的微信智能问答系统[23],通过预先搭建和调用图书馆的知识库为用户提供实时的智能咨询服务。西密歇根大学(WMU)图书馆网真机器人提供一种介于视频聊天和面对面交谈之间的交流方式,是人机交互在图书馆应用领域的一次重要尝试[24]。目前,由于图书馆专业语料库不够丰富且不能对其提供动态的自动更新,智能咨询机器人对于自然语言形式的提问,识别准确率较低,往往答非所问,使得智能咨询机器人在图书馆的应用还处于尝试和性能完善阶段,专业性咨询和服务上远未达到读者的需求,还不能像真人一样完成复杂场景的交互[25]。
1.2 智能检索应用于图书馆信息检索系统
人工智能应用于搜索引擎系统由来已久,谷歌早在1996 年建立之初,针对以指数级增长的网页信息,对所有网页按照重要性进行排名,从而提高了网络用户的搜索效率[26]。马斌等[27]利用本体领域研究的最新成果作为知识表示工具,通过智能语义Web 技术与信息检索方法相结合来实现对专业领域信息的有效查询,实现了面向领域的智能检索。Semantic Scholar学术搜索引擎,基于应用内容分析的学术影响力评价指标,利用深度学习技术,在为用户提供简单的文献检索功能同时,筛选、过滤和理解用户的需求和对所引用文献的态度,可助力科研工作者快速获取重要文献,提升科研工作者的效率[28]。中国最大的网络搜索引擎公司百度于2019 年首次发布“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”的24 字愿景,将人工智能提升为公司未来整体战略,并率先布局深度学习等人工智能基础技术和关键赛道。
中文分词技术作为推动搜索引擎主体发展最重要的助推器,虽很难彻底解决这样的自然语言处理领域问题,但引入语义网、知识图谱等新一代信息搜索支撑技术,将逐步提高搜索引擎查准率。依据用户的行为信息,如检索习惯、检索历史等,通过用户画像,依据深度算法推测用户的实际意图。在实际应用中,结合用户反馈信息,通过多次反馈迭代,达到具备理解语义和有效推理的能力,最终将符合算法的资源筛选推荐给用户。回顾搜索引擎的发展历程,从主题语言到自然语言,从文字检索到与语音、图像和视频结合检索,智能化、个性化、特色化、多媒体化将成为搜索引擎未来的发展趋势[29]。以百度学术、Semantic Scholar 学术为代表的学术搜索引擎的逐渐完善,无疑将启发、指引和推动图书馆信息检索系统的改进和升级。
2 人工智能在图书馆的应用前景
人工智能在未来将渗透融入经济社会发展的各个领域,人工智能领域的下半场即人工智能技术落地的交锋已在行业内达成共识,其中协作机器人Cobots,即具备与人类协同工作的机器人,将成为最主要的发展趋势之一。图书馆作为知识密集度相对较高的服务领域,人工智能机器人对图书馆人才资源的重新配置将成为不可避免的趋势。机器人产业结构复杂,图书馆应制定一套符合自身产业实际的机器人替代方案。就现阶段而言,机器人替代的普及度还不算广,其替代程度取决于行业使用机器人的普及程度和自动化程度。但随着机器人购买、维护成本的下降,政府对机器人产业的扶持,以及人力资源成本的上涨[30],使得机器替人成为必然。试想如下的协作场景:机器人和图书馆员一起工作,机器人通过监控设备接收来自读者用户的服务请求,与图书馆员一起分工协作,按顺序依次完成各自任务,最终制定并提出最佳的方案。这些解决方案包括语音、手势和对人类动作意图的正确识别。任务分工应基于以下原则:机器人擅长的依旧是在规则明确的重复性领域,图书馆员做好与用户的沟通,进一步了解用户的更多需求。
3 人工智能在图书馆建设中所面临的问题
3.1 数据方面
在摩尔定律的驱动下,随着人工智能赖以学习的标注数据的指数级增长,存储、分析数据的能力也在同步拓展,大数据已成推动人工智能发展的重要因素之一。作为人工智能的一个典型应用场景,用户数据是理解和分析用户行为的重要依托,是人工智能发展和应用的基础。在大数据的海洋里,从看似杂乱无序的数据中,寻找总结原本看似不明显的相关关系,以便更好地理解和影响用户行为。图书馆在应用相关技术收集、分析用户数据记录时,面临一定程度的信任风险,同时,对于需要收集哪些数据,以及为什么需要收集这些数据存在分歧。数据的收集、处理与分析整个流程,太依赖于以往的先验知识。在笔者看来,图书馆馆员数据素养和大数据思维培育、大数据可用性问题的改进是目前图书馆在人工智能时代亟待解决和面临的问题。
(1)提升图书馆员数据素养,培育正确的大数据思维方式。数据素养是信息素养的一种外延,主要包括数据意识的培养(对数据的敏感度、批判思维、感知数据价值等意识)、数据能力的提升(数据收集、数据管理、数据应用等基本知识与操作技能)和数据伦理的规范引导(数据隐私、信任与安全、获取、发布与使用规则、法律与道德规范等)三个部分[31]。在掌握以上相关理论和技能之外,图书馆馆员还需不断培育和打造大数据思维。大数据思维是伴随大数据发展而形成的一种新的思维方式,培育和建立正确的大数据思维方式,要首先从大数据本体观、特主观、价值观和共用观四个方面正确认识数据。其次,置身于大数据环境下,正确理解大数据的范畴。最后,在实践活动中不断体验、审视、检验和修正对大数据的认知和判断,从而真正形成大数据思维[32]。数据素养的提升和大数据思维方式的建立有助对数据的科学理解,有助于协同创新,有助于促进人工智能在图书馆的应用。
(2)加大数据可用性问题研究,提高源数据质量。自大数据产生,“数据是一种重要的战略资源”的理念就被提到前所未有的高度,但数据缺乏规范、不完整或陈旧、不正确或不准确、存在各种误差甚至错误等数据可用性问题由来已久,严重困扰着信息社会。
人工智能需要不断获取新的数据进行分析、学习,糟糕的数据可能带来反向的分析结果。同时,人工智能可以生产假数据,目前却无法准确识别这些造假数据。Fakespot 估计,沃尔玛官网上,有约52%的用户评论是“不真实和不可靠的”;而在亚马逊平台这一数据约为30%。流量造假、账号造假、内容造假进一步说明数据可用性问题的严重性。数据可用性对于人工智能而言具有重要战略意义,建设数据可用性评价体系[33],是助力人工智能良性发展的重要保障。
3.2 伦理方面
人工智能技术已取得显著成效,尤其是深度学习技术在智能家居、无人驾驶、语音合成等众多领域的突破,人工智能技术的快速发展将改变人类的生产生活及思维方式。在享受人工智能技术带来诸多福利的同时,围绕人工智能产生的伦理问题愈来愈突出,不断思考和探讨人工智能技术带来的伦理问题,做好有效规避已成为众多行业无法回避的问题。纵观整个学术界,对人工智能伦理问题的研究明显滞后,尚未形成完整的针对人工智能管理体系及其相关限制的法律法规。究其本质,在于人工智能技术本身和对其伦理问题的研究都尚处在初级阶段[34]。再者,人类的片面认知所带来的人工智能恐慌,影响了对人工智能伦理问题的理性思考。
在未来,人工智能与图书馆的有机融合,使得图书馆员职业精神受到了极大的挑战:机器人的普及可能会导致图书馆员责任感的降低;日常工作中对人工智能算法的过度依赖,可能会抑制图书馆员的求知欲,滋生惰性思维,导致其主动思维能力日渐下降。同时机器人的出现,要求图书馆员必须开始学习如何与其友好相处。如何有效规避以上问题,建议从以下几方面入手:
(1)在相关立法完善的同时,根据需要对《中华人民共和国公共图书馆法》做出相应的修改,规范人工智能开发与应用的责任,确保对人工智能的研发、生产、销售和使用整个流程的有效监管。
(2)加强对人工智能技术与产品的管理,确保恶意代码未嵌入人工智能程序,对人工智能产品设置唯一的识别码,在产品内部放置可实时远程控制的监控器。
(3)提高图书馆员对人工智能的认知素养,以科学严谨的态度,引导用户认识了解人工智能,沉着应对人工智能技术带来的冲击,减少不必要恐慌[35]。
4 结语
在当前人工智能驱动图书馆建设的条件下,完全依靠人工智能实现图书馆转型升级还不够现实,需充分利用人工智能在基础工作中的高效率和在创造性领域的独有优势,走人机协作道路,在人机协作趋势下,图书馆应具备人工智能的思维方式。人工智能技术的发展是一个循序渐进的过程,受限于现有馆舍、技术及人才等,从现有人工智能技术应用于图书馆的具体案例来看,应用仅限于一个点,集成多项人工智能技术应用的并不多,展现的智能化特征不高,离真正的“智能”还有很长的路要走。未来研究应注重结合图书馆的多场景特征,需在环境感知、逻辑思维、判断决策和反馈控制能力等方面深入研究。人工智能发展的核心基础是数据,提升图书馆员数据素养、培养图书馆员数据思维有助于解决人工智能技术在图书馆应用所产生的底层问题。伦理问题对图书馆员的职业精神提出了挑战,需要非凡的勇气和智慧来维护。人工智能和图书馆两者是相辅相成的,人工智能是图书馆发展的一种友好辅助,图书馆则是人工智能不可或缺的应用场景。图书馆应未雨绸缪,积极参与到人工智能建设中来,与企业、政府加大沟通和合作力度,从反向助推人工智能技术的发展。