人工智能时代图书馆的发展机遇与变革趋势
2018-03-12黄晓斌吴高
黄晓斌 吴高
摘 要:人工智能与基因工程、纳米科学一并被称为21世纪三大尖端技术,近年来,许多国家将人工智能技术发展列为国家战略规划,人工智能技术的快速发展将会给图书馆带来巨大的影响。大数据环境下图书馆发展面临着用户流失、资源整合以及智能搜索等多方面困境。人工智能技术发展则给处于困境的图书馆在文献资源建设、馆舍空间建设以及用户管理服务等领域带来了重要机遇。人工智能发展给图书馆带来的变革趋势主要体现为环境、资源和服务三个维度,即未来的图书馆将具备智能馆舍空间、智能资源系统和智能用户服务三要素。
关键词:人工智能;图书馆;大数据;发展机遇;变革趋势
中图分类号:TP18;G250.7 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2017109
Abstract Genetic engineering, artificial intelligence and nano science was known as three cutting-edge technology in the 21st century and in recent years, many countries have regarded artificial intelligence technology development as a national strategic planning. The rapid development of artificial intelligence technology will bring great influence on the library. In the big data environment, library development is faced with many difficulties such as user loss, resource integration and intelligent search. The development of artificial intelligence technology will bring important opportunities to the embarrassed libraries in the fields of literature resources construction, building space construction and user management services. Change trends brought about by artificial intelligence development to the library will mainly embody in three aspects such as environment, resources and services, namely the future library will be of intelligent library space, intelligent resource system and intelligent customer service.
Key words Artificial Intelligence; library; big data; development opportunity; change trends
自1956年约翰·麦卡锡第一次将“Artificial Intelligence”(人工智能)引入学术研究领域以来,人工智能发展经历了多次起落。然而在2016年、2017年Google AlphaGo分别与李世石、柯洁两位世界冠军的人机围棋大战中,AlphaGo分别以4:1和3:0取得了压倒式的胜利,不仅彻底引爆了人们对人工智能的兴趣,而且也让经历了60年发展的人工智能瞬间到了爆发的前夜。2017年10月,《自然》杂志上一篇研究论文指出AlphaGo Zero采用新的超强学习算法,能够进行自我学习训练,并以100:0战绩击败“前辈”[1]。全社会也都意识到,目前全球正经历以人工智能为引领的第四次产业革命,这是继蒸汽技术革命、电子技术革命、信息技术革命之后的又一次科技革命,这次革命以数据为主体,以人机共生为目标。同时,由于人工智能被看作是21世纪三大尖端技术(基因工程、纳米科学、人工智能)之一,尤其在近几年成为热点话题,许多国家将人工智能技术发展列入国家战略规划。
图书馆的发展与信息科学技术紧密关联,作为计算机科学的一个分支和前沿领域,人工智能技术的快速发展将会给图书馆带来巨大的影响。正如青年学者张兴旺[2]所言,图书馆作为信息科学领域和信息检索技术应用的“前沿阵地”,信息科学理论、信息技术体系、信息服务模式的创新将会给图书馆理论、应用与实践研究带来巨大的机遇与挑战;著名学者吴建中[3],也将人工智能作为中国图书馆发展的十大热点话題之一。图书馆界如何在第四次技术革命时期,利用自身专业优势,把握机遇,主动参与人工智能与图书馆的融合应用研究,就显得尤为必要了。
1 人工智能概述
1.1 人工智能理论发展由来
1956年,在美国达特茅斯召开的学术会议上,人工智能概念被正式提出,这场会议也被认定为全球人工智能诞生的标志[4]。何谓人工智能?人工智能是计算机科学、控制科学、信息科学、认知科学、神经科学、神经生理学、心理学、语言学、脑科学等多种学科互相渗透而发展起来的一门综合性学科,其本质是研究智能机器或智能系统制造、模拟人类智能活动、延伸人类智能的科学。人工智能可分为三大类型:符号主义、联结主义和行为主义。符号主义是基于逻辑推理的智能模拟方法来模拟人的智能行为;联结主义主要原理为神经网络及神经网络间的连接机制与学习算法;行为主义原理为控制论及感知-动作型控制系统。目前人工智能研究所涉及的热门技术领域有:问题求解、自然语言处理、人工神经网络、遗传算法、专家系统、知识工程、人工生命、深度学习、智能控制等[5]。从1956年至今人工智能的发展可分为四个阶段:起步阶段(20世纪50年代—60年代末)、停滞阶段(20世纪70年代)、曲折发展阶段(20世纪80年代初—21世纪初)和高速发展阶段(21世纪10年代—至今)[6]。人工智能概念很宽,有多种分类方法。如按照人工智能的总体水平,可将人工智能划分为弱人工智能(仅在某些方面擅长)、强人工智能(与人类智能相当)和超人工智能(全面超越人类智能)三个等级;从人工智能发展总体水平来看,目前人类已经掌握了弱人工智能,但强人工智能尚未实现。endprint
1.2 人工智能的发展政策与规划
近年来人工智能成为全球科学界和工业界的研究热点,许多国家也出台规划将人工智能上升为国家战略。Google和百度分别推出了“谷歌大脑”和“百度大脑”计划,微软也成立了人工智能研究院。2017年7月,Science发布《人工智能改变了科学》特刊,专门对人工智能在各个学科领域取得的进展和应用进行介绍[7];2016年10月,美国白宫科技政策办公室发布了题为《Preparing for the Future of Artificial Intelligence》《The National Artificial Intelligence Research and Development Strategic Plan》两份重要报告;英国也发布了《Artificial Intelligence:opportunities and implications for the future of decision making》(2016)等报告,两国均将人工智能发展列为国家核心战略。2015年7月。我国出台了《国务院关于积极推进“互联网+”行动的指导意见》,明确了推进“互联网+”人工智能,依托互联网平台,提供人工智能公共创新服务;2016年3月,《国家十三五规划纲要》提出要发展人工智能,同年5月,发改委牵头制定《“互联网+”人工智能三年行动实施方案》。2017年3月,首次将人工智能、虚拟现实等内容写入《政府工作报告》;同年7月,国务院出台了《新一代人工智能发展规划》。
1.3 人工智能的未来发展
人工智能过去60年来发展道路曲折,几度进入低谷。但最近随着大数据、云计算、物联网、移动互联网等新一代计算机技术生态的形成、发展和完善,同时在神经网络的低成本并行计算、大数据、深度学习等关键技术领域取得突破性进展,人工智能得到飞速发展;反过来,人工智能的发展又推动了大数据、云计算、物联网以及移动互联网等技术和应用的创新,各种技术之间形成正反馈效应。李修权[8]提出,新一轮人工智能发展进入了大数据驱动智能发展、智能技术产业化、认知智能研究探索阶段。特别是由于以深度学习为代表的人工智能核心技术的突破,极大地提升了图像识别、语音识别以及自然语言处理等前沿技术的应用效果,因此全球顶尖互联网巨头公司,纷纷布局人工智能领域,构建了一系列人工智能开放平台。如在国内,百度发布整合大数据、百度地图的智慧商业平台,成立自动驾驶汽车事业部;腾讯推出撰稿机器人Dreamwriter;阿里巴巴推出人工智能平台DTPAI;华为成立诺亚方舟实验式,研发出神经应答机,发布了基于深度学习的单轮对话生成模型;科大讯飞开发了语音智能服务开放平台,图谱科技搭建基于深度学习技术的图像识别开放云平台;再如在国外,Facebook提出要在未来5-10年内,让人工智能完成某些需要“理性思维”的任务;IBM的Watson在智力竞猜电视节目中击败了优秀的人类选手,未来可应用于医疗诊断、法律助理等领域;微软发布名为“微软小冰”的人工智能伴侣虚拟机器人,能够与人进行情感交流与对话。最近Google开发了一套具备自主学习能力的猫脸识别神经网络系统,成为人工智能的新突破[9]。虽然到目前为止,人类大脑是我们所知宇宙中最复杂的东西,但随着科技的爆炸式发展,也许通过强人工智能的道路并不遥远。美国未来学家雷·库兹韦尔甚至大胆预测到:“2045年左右,人工智能将来到一个‘奇点,跨越这个临界点,人工智能将超越人类智慧,人们需要重新审视自己和机器的关系。”[10]
2 大数据环境下图书馆发展面临现实困境
2.1 用户流失困境
当今世界是大数据时代,近几年全球的数据量以每年58%的速度增长,预计到2020年全球数据总量将超过40ZB(相当于4万亿GB)[11],全球社会因技术的发展正处在巨大变革中,社会环境、信息技术、学术交流模式等都在发生变化,随着尤其是用户行为和用户需求发生了巨大改变,导致图书馆用户不可避免面临用户流失困境。2017年8月,中国互联网络信息中心(CNNIC)发布的第40次《中国互联网络发展状况统计报告》指出,截至2017年6月,我国网民总量达到7.51亿,占全球网民规模20%;互联网普及率為54.3%,超过全球平均水平4.6个百分点;手机网民达7.24亿,与2016年相比增加2830万人;使用手机上网人员所占比例由2016年底的95.1%提升至96.3%[12]。2017年4月,中国新闻出版研究院发布第十四次全国国民阅读调查报告,数据显示2016年我国国民人均图书阅读量为7.86本,较2015年增加了0.02本;人均每天微信阅读时长为26分钟,较2015年增加了3.37分钟[13]。早在2010年,OCLC报告显示出了新信息环境下用户对图书馆认知和行为的变化:84%的用户使用搜索引擎开始信息检索,没有人从图书馆网页上开始信息的检索[14]。根据英国图书馆2014—2015年度调查报告,2010年以来,访问英国图书馆的人数下降了14%[15]。2014年,北大图书馆的书籍借阅总数为62万本,是近10年的最低数量,与2006年的107万本,下降了42%[16]。尽管这些年来图书馆电子资源利用率与以前相比,有了很大增幅,但在商业搜索引擎的强力冲击下,图书馆似乎已经丧失了被用户作为资料查找途径的首选地位,同时到馆读者和纸本图书借阅量不断降低。
2.2 资源整合困境
目前由于受到多种因素制约,数据开放程度较低,在知识服务领域,“信息孤岛”现象普遍存在。就图书馆而言,以超星、CNKI、Elsevier、EBSCO等为代表的国内外各资源建设出版商成为图书馆数字资源供给的主体,然而这些异构的数字资源运行平台、存储方式、关联方式、数据格式各异,给图书馆大数据整合带来极大困扰,即便采用现有的数据挖掘技术或采购商业整合平台,还是存在许多问题,难以进行高效的知识发现。许多专门针对图书馆用户开发的、能够统一搜索商业学术资源或开放获取学术资源的搜索引擎,如国外的三大主要外文学术资源发现系统EDS、Summon、Primo[17],国内的三大主要中文学术资源发现系统如知网学术搜索、超星发现系统、百度学术搜索等[18],均未能完美解决信息查准性、知识关联、个性化呈现等问题。复旦大学图书馆工作团队通过实地测试,发现EDS、Summon、Primo三大资源发现系统的查全率查准率有待进一步提高,其高级检索功能更适合初中级读者而非科技查新者使用[19]。2016年4月,美国图书馆协会(ALA)发布的《State of Americas Libraries Report 2016》[20]显示,在学校图书馆馆员报告的学校图书馆在数字内容支持方面面临的挑战调研中,认同师生很难找到合适的数字内容的比例从2010年的10%提升到2015年的29%,认同老师使用数字内容时用户体验不佳的比例从2010年的33%提升到47%,不难发现,图书馆资源整合效果不佳是产生上述问题的重要原因。毫无疑问,正是由于大数据环境下,传统的数据挖掘方法已经无法适应对关系型数据、非结构化的或半结构化的数据挖掘以及深度分析的用户需求,如何研发先进的、能进行高效知识挖掘和知识发现的人工智能算法就成为必须。endprint
2.3 智能搜索困境
搜索引擎(Search Engine)是运动特定的计算机程序,根据一定的策略和规则,在对从网上所收集的信息进行组织和处理后,将用户检索的相关需求信息以多种形式展示给用户的系统。作为用户和信息源之间的沟通渠道,搜索引擎被认为是人类主动意识与互联网之间最重要的关联和连接方式,能够帮助人类在广袤无垠的信息海洋中快速获取有效信息。对图书馆未来发展影响最根本和最核心的人工智能技术是智能搜索引擎技术。虽然,多年来全球各大搜索系统不断发展完善,但总体上看,还属于传统被动式搜索模式。不管是国外的Google、Bing、Yahoo!Search、Ask、Aol Search、MyWebSearch、WebCrawler、Wow、Infospace、Blekko等国外十大知名搜索引擎,还是国内的百度、搜狗、搜搜、爱问、有道、中搜、360等搜索引擎,均以被动式搜索为主,其特点主要有:(1)依靠关键词索引技术,对关键词的相关网页进行机械呈现,系统交互性低,由用户自己根据需要挑选信息;(2)无法实现网页、语音、视频、图片等多维度整合搜索,目前仅能提供网站链接结果;(3)无法完好解决词汇的“忠实表达”和“表达差异”问题,缺少适应信息源的动态变化要求,更无法实现高度个性化搜索结果呈现。因此,要实现智慧搜索,需要从以下两方面对人工智能算法技术取得突破:(1)对数量巨大的结构化和半结构化数据进行高效率的深度分析,深入挖掘隐性知识,如从自然语言构成的文本网页中理解和识别语义、情感、意图等;(2)对数量更为庞大的非结构化数据进行分析,能够将海量、复杂、多维的语音、图像和视频数据转变为能被机器识别、语义清晰的信息[21]。
3 人工智能技术发展给图书馆带来的机遇
3.1 重要报告介绍
正是基于对人工智能技术发展的现状和乐观认识,多份重要研究报告均认为在未来几年人工智能技术将在图书馆、教育等领域得到普遍应用。如《International Federation of Library Associations Trend Report 2013》将人工智能与大数据、移动终端和3D打印并列为四大技术发展趋势之一。该报告提出人工智能对未来图书馆主要产生了三个方面的影响:(1)下一代网页浏览器能够超越关键词分析和对网页特定内容进行语义分析(语义网);(2)网络设备能够具备语音识别、机器翻译、语音合成以支持实时多语言翻译等综合功能;(3)能够对多元、复杂网页内容的云服务众包翻译和识别[22];《The NMC/CoSN Horizon Report: 2017 K–12》指出,基本教育中所采用的技术分别是:1年或1年以内,创客空间、机器人技术;2-3年,分析技术、虚拟现实;4-5年,人工智能、物联网[23];《NMC Horizon Report:2017 Higher Education Edition》指出,高等教育中教育技术的重要进展包括自适应学习技术、移动学习、物联网、下一代学习管理系统、人工智能以及自然用户界面[24]。《NMC Horizon Report:2017 Library Edition》指出,学术研究图书馆今后重要的技术发展是:1年或1年以内,大数据、数字学术技术;2-3年,图书馆服务平台、在线身份识别;4-5年,人工智能、物联网[25]。
3.2 面临重要机遇
(1)文献资源建设领域。人工智能算法的不断进步,为图书馆学术资源智能搜索系统的发展提供了可能。从人工智能最核心的算法层面看,智能搜索引擎涉及到自然语言处理、机器学习、计算机视觉、人机交互、数据挖掘和信息检索等人工智能技术,其中最核心的技术是能够准确理解用户的搜索组合或口语化表达的自然语言处理技术,自然语言处理包括语音识别、语言翻译、文本分析、搜索引擎、语义理解等。人工智能算法性能的改善和提升,将会带动智能搜索引擎搜索效率和查准率的大幅度提升,从而为图书馆提供更加人性化、个性化和智能化的信息服务奠定了坚实基础。
(2)馆舍空间建设领域。数字時代图书馆提供纸质阅读的功能不断弱化,图书馆正成为人与信息、人与人之间交流的知识共享空间。空间体验被认为是图书馆的核心价值之一[26]。吴建中教授提出图书馆由“人”“资源”“空间”三要素构成,认为要“发掘图书馆作为场所的价值”“发挥图书馆作为城市第三空间的价值”,图书馆是“虚拟与实体高度融合的交流空间”[27]。借助人工智能技术,结合物联网技术,建设包括智能照明系统、智能通风系统、智能发布系统、智能广播系统、智能消防系统、智能安保系统、智能温湿度控制系统等在内的综合性智能建筑管理系统以及个性化、舒适化、智能化的信息共享或创客空间成为可能。
(3)用户管理服务领域。大数据是国家基础战略性资源,是新资源、新技术和新理念的混合体。随着大数据的快速发展,以及各国均以建设“数据强国”为目标的实施,数据管理和服务将在图书馆扮演着越来越重要的地位。2015年,美国ACRL出版的《Environmental Scan 2015》[28]指出,数据管理服务是学科馆员的新方向,并且很多图书馆试图通过共享图书馆集成系统/资源管理系统、加强大规模、跨机构的数字化馆藏或技术设施合作、开展关联数据,数据挖掘及分析工具等用户驱动研究来支持知识发现服务。这些都充分说明图书馆今后的资源建设和服务模式的变革应坚持数据驱动导向,数据驱动发现成为一种新的科学进步路线,数据治理成为图书馆事业发展的新机遇[29]。借助不断发展的人工智能技术,图书馆今后在信息素养智能教育、智能阅读辅导、智能语音服务、智能图书管理、智能用户服务等方面取得重要进展。
4 人工智能发展给图书馆带来的变革
4.1 环境维度:智能馆舍空间
4.1.1 智能馆舍设计:从人工设计到智能设计
建筑不仅是人类遮风避雨、抵御侵犯的安身之所,也是所处时代之精神与道德观念的物化表现[30]。尤其对于图书馆这种具备文化和艺术属性的特殊公共建筑来说,图书馆建筑是人类文化、科学和艺术共同孕育的结晶,是一个人的心灵与情感在此最大限度敞开的地方。近些年来不管是各地方政府还是各大高校在建设新图书馆时,都将图书馆定位为灵魂驿站和文化地标或者是大学文化精神的象征。何谓智能图书馆建筑设计?一是从建筑结构角度理解,建筑结构设计要智能化,二是从设计过程角度理解,建筑设计过程要智能化。这具体体现为:一方面,现有的图书馆建筑或者在内部结构设计上未能很好体现图书馆人性化、开放化、生态化、智能化的理念,或者在功能需求设计上未能有效适应现代化图书馆以用户为中心的多样化功能空间布局需求,或者在外在造型设计上未能有效结合当地传统历史和文化特色;另一方面,建筑设计过程主要还是由设计师人工完成,这不仅是一项体现设计师阅历、审美、创意的创造性工作,同时也是一项具有大量重复性劳动的体力活,这就非常有必要在建筑设计阶段引入人工智能系统。endprint
当今和未来,随着人工智能技术的发展和在建筑业的广泛应用,建筑设计师能够借助智能建筑设计软件更好地开展智能化图书馆建筑设计。据新闻报道,在我国小库科技公司研发了世界第一个人工智能建筑师——小库(XKool),它结合了机器学习、大数据、云计算、智能显示与VR等技术,将多种先进的算法融入到最简单易用的操作界面中;它能帮助建筑师和开发商完成常规的规划和建筑设计前期工作;其近期目标是成为建筑师的智能助手,远期目标是成为人工智能建筑师。据说小库可以减少90%的前期投入和经济投入,降低错误率99%以上[31]。就目前来说,笔者以为,人工智能建筑设计软件在图书馆建筑设计方面主要发挥了两方面的作用:(1)为建筑设计师减少前期工作。建筑设计是一项包含了大量前期规划、绘图计算的工作,智能软件通过承担大量前期性、重复性、基础性的设计工作,并大幅度降低错误率,让设计师集中精力在特殊需求和创造性设计上;(2)为建筑设计师提供创意源泉。其实,目前国内真正了解图书馆的建筑设计师并不多,像采用“美丽书籍”造型的广州市图书馆设计方案也是出自国外设计师之手,因此系统通过内置古往今来全球各大图书馆建筑设计成千上万个成功或失败的案例,帮助设计师快速学习和准确把握图书馆建筑的特有属性和新型理念。
4.1.2 智能感知空间:从简单感知到智能感知
一个具有人脑般聪明智慧的建筑物应该包括什么内容?有人形象地概括为三个部分:[32](1)大脑——建筑管理系统。该系统能够监测天气变化,控制并监测主动和被动环境系统的运作情况,如出气口、通风片、百叶窗、日光灯、机械通风、供暖制冷设备、防火和安全系统等等, 从而保证能源最高使用率;(2)神经网络——弱电技术和传感器。弱电技术(传播信号、进行信息交换的电能)和传感器(直接与被测对象发生联系,感受被测参数变化,并发出相应信号)犹如人类的神经网络,能够有效帮助智能建筑中能够从四面八方并时时刻刻收集信息,并通过执行器开展信息处理、分析、控制、反馈和协调工作;(3)皮肤——智能外墙。通过采用净化空气混凝土外墙,净化二氧化硫、氮氧化物、甲醛、苯等有害气体,使建筑外围能履行主动的、自我调控的职能,就如同人体的皮肤一样具有灵敏性、自我调节功能、自我恢复功能、自我保护功能。笔者以为,构建图书馆馆舍空间智能化主要包含图书馆空间设施物联化和建筑系统智能化两个方面,空间设施各类信息的感知和收集是基础,对收集的感知信息进行有效分析和个性化呈现离不开统一的智能化管理平台,两者缺一不可、互相促进、相辅相成。就建筑系统智能化而言,目前我国智能建筑发展存在智能化水平较低、智能系统协调性不足等问题;就空间设施物联化而言,现有研究和实践更多集中在提供物理馆藏定位管理和自助服务当中,结合地理定位和全方位情景感知信息提供的个性化服务的研究和应用还有很多不足。
在人工智能技术的帮助下,图书馆的感知空间可以从简单感知变为智能感知,具体体现为:(1)空间设施物联更加智能化。构建智慧图书馆的首要前提就是要借助物联网技术,将图书馆各种信息资源(如环境、文献、空间、家具等)进行定义、感知和采集,为实现智慧化服务管理奠定前提。用户通过可穿戴设备、智能手机的APP或蓝牙可操控预约使用网络终端空调设备、打印复印、视频终端、流媒体播放器等设备;馆员还可遥控指挥智能机器人开展工作。目前物联网传感器包括但不限于光传感器、声音传感器、气味传感器、运动传感器等,主要采用RFID、Zigbee等技术[33],随着智能交互技术、人工智能视频识别、语音识别技术的快速进步,采用视频识别、语音识别传感器进行情景感知信息收集成为可能,加上信息收集之后的大数据智能挖掘分析技术,从而使空间设施物联更加智能化;(2)建筑管理系统更加智能化。建筑智能化系统包括智能照明系统、智能温湿度控制系统、智能通风系统、智能消防系统、智能安防系统、智能信息发布系统、智能广播系统等内容。然而目前各系统普遍存在逻辑序列判断水平不高、互相难以协调、交互程度低等问题[34],借助人工智能技术,使建筑智能化管理系统能够基于同一平台进行自我学习、自我协调、自我诊断,并能很好地与图书馆其他智能应用系统(如智能交互系统、智能资源搜索系统、智能管理系统等)进行对接和信息交互,最终为用户提供基于时间、地点、个性化、互动性等多样化情景感知的个性化服务提供条件。
4.2 资源维度:智能资源系统
4.2.1 智能资源建设:从经验决策到智能决策
文献资源建设是图书馆各项工作的核心。图书馆界也认识到文献资源建设的原则应从馆藏驱动转变为用户驱动,但是在实际工作中,由于受到传统思维惯性、用户需求难以准确把握、需求信息获取成本过高、相关激励考核措施或制度保障不到位、资源采购管理机制不完善等多种因素的综合影响,目前还真正难以完全做到“以用户为中心”采购文献资源,导致资源重复采购和利用率较低[35]。如Levine-Clark[36]和 Schroeder[37]分别对丹佛大学图书馆和杨百翰大学图书馆的图书使用频率进行调查发现,利用传统方式购买的图书从未被借阅过的占比为50%以上。为更好解决上述问题,一种全新的资源建设模式——读者决策采购(patron-driven acquisition,PDA)应运而生。读者决策采购意味着让读者从文献资源建设的终端和接受者转变为首端和发起者,该模式在美国大学图书馆资源建设尤其是电子图书建设中得到较为广泛地应用,我国也进行了探索和尝试。早在2010年,ARCL在《学术图书馆十大趋势》中就把PDA排在首位,提出图书馆馆藏的增长已经变为读者驱动。虽然PDA采购模式有很多优点,但不可否认,数字时代该模式更多地是指图书馆基于读者的实际浏览与阅读情况,以是否达到预先设定好的标准(或参数)而触发对某一文献购买指令的资源建设模式[38]。这种模式从某种程度上说是简单粗暴的需求决定供给模式,它对于如何更好解決纸本图书按需采购、如何合理协调不同类型资源采购比例、如何科学分配不同学科领域资源采购经费、如何吸引更多用户参与资源采购推荐、如何准确获知开放资源情况等问题解决就显得力不从心了,因此在很多时候图书馆文献资源采购在极少量的用户推荐之外,更多是基于采购人员的经验来进行决策。endprint
随着大数据和人工智能技术的发展,系统能通过深度学习机制,自动对所有用户个性化需求信息和各类型文献资源信息进行收集整合和交叉对比分析,从而使构建智能化文献资源采购决策系统成为可能。智能采购系统建设需要关注两个重点:(1)要科学合理确定影响因素。图书馆可结合用户群体特征(如性别、年龄、教育背景、职业等)、用户个性化信息(如在高校,各专业师生人数、学科设置、学科地位排名、学校重点建设学科、师生兴趣爱好、学校开设课程名)、荐购图书综合信息(与专业相关度、图书的受欢迎程度或利用率、图书价格等)、专家建议(学科建设、图书利用率、图书复本率等)及年度经费预算等综合因素,建立科学的、客观的决策模型,从而完成图书订购计划,使图书购买经费得到最优化的配置[39];(2)要全面收集分析开放资源。目前随着全球开放存取运动日渐深入人心,越来越多的资源成为免费开放可获取。2015年10月经合组织发布《让开放科学成为现实》[40],标志着开放科学进入各国政策领域。截至到2017年10月22日,DOAJ网站上登记有10663种免费开放获取期刊,276万篇文章[41]。2013年Archambault的研究表明,到2011年出版后以两种开放形式(立即获取和出版后延期获取)出版的论文已经占据了总论文量的50%,并且还在以每年2%的速度增长[42]。除了开放期刊外,网上还有大量的机构知识库、电子图书、MOOC、多媒体视频、音频资料,开放运动推动了图书馆转型。智能采购系统通过智能收集分析开放资源,并和采购资源目录进行交叉对比分析,为采购馆员提供辅助决策参考。
4.2.2 智能资源搜索:从被动搜索到智慧搜索
人工智能技术和智能搜索引擎技术相辅相成、互相促进。智能搜索引擎所具备的大数据优势能够极大促进人工智能技术发展;而人工智能算法性能的改善和提升,又會带动智能搜索引擎搜索效率和查准率的大幅度提升。智能搜索引擎涉及到自然语言处理、机器学习、计算机视觉、人机交互、数据挖掘和信息检索等人工智能技术,虽然当前百度智能搜索、Google的Rank-Brain、Facebook的Deep Text、Yahoo!的CatteOnspark以及微软的RankNet等主流搜索引擎大都融合了上述技术,但技术并未出现革命性突破,不过从长远来看,随着语义搜索、知识图谱、高精度搜索等人工智能技术不断发展,搜索引擎技术呈现智能化、个性化、场景化和交互变化的升级发展趋势,具体表现为:[43](1)搜索依托的终端设备,从PC端向手机、平板、可穿戴设备等移动终端泛化;(2)搜索请求的理解方式,从传统的文字识别向音频识别、图像识别、视频识别等多模态自然语言处理转变;(3)搜索运行的场景体验,由传统网页输入向基于位置的场景化自动感知拓展,使得搜索服务无处不在;(4)搜索结果的呈现技术,从传统网页排名技术向智能化感知用户需求的用户导向技术过渡,能够个性化、智能化、高效化展示信息流。
随着搜索引擎从传统搜索演进为智能搜索,即从过去的对用户需求被动响应的“即搜即得、即搜即用”到目前的对用户需求智能化感知的“不搜既得、个性呈现”,智能资源搜索系统在图书馆的未来可能应用领域有:(1)研发文献资源利用智能问答系统。该系统借助人工智能超强学习算法,基于大数据开展超大量的自我学习训练,把搜索查询转化为可回答问句的交互形式,通过人机问答和多轮交互方式来逐步提升文献资源搜索交互效果;(2)拓展文献资源利用搜索场景范围。能够为用户提供除文本资源以外的语音、图片、视频等各类型文献资源搜索,并结合位置感知搜索和移动场景,结构化呈现精准信息内容,从而大幅提升信息服务能力;(3)整合文献资源利用搜索数据来源。将来不仅能够克服目前各类型、各国别、各出版社文献资源数据孤岛化的弊端,全面整合“网上+图书馆+出版社+合作伙伴”等书目数据信息来源,而且也会突破语言障碍,即通过任何一种语言搜索均能获得全世界所有语言相关搜索信息;(4)优化文献资源利用搜索呈现技术。通过不断优化深度学习算法,实现对用户属性、状态、兴趣、情感状态、需求内容等语义信息的精准判断,借助从亿万级知识碎片中深度挖掘知识关联而形成的知识图谱,为用户提供兴趣自动识别、内容语义理解、信息过滤推送,使搜索结果更加人性化、个性化和智能化。
4.3 服务维度:智能用户服务
4.3.1 智能用户教育:从人工培训到智能教育
公民素质的提高是一个国家强大的根本。公民素质包括思想道德修养、科学教育水平、民主法治观念等多个内容。国家高度重视公民素质的教育提高,除了教育系统外,图书馆在提高公民素质方面也扮演了重要作用。我国甚至将全民阅读推广上升为国家战略,不仅在2013年首次将“全民阅读”写进政府工作报告,而且制定了《全民阅读促进条例》。全国各级各类图书馆如火如荼开展诸如读书讲座、读书知识竞赛、悦读分享会、真人图书馆等形式多样的阅读推广活动,取得了不错效果。此外,互联网时代,光推进阅读让更多人有识字能力还是不够的,公民的信息素养(数字素养)也是公民素质的重要内容。为此,各国国民教育课程也逐渐将数字素养纳入教育范畴,欧盟2011年开始实施“数字素养项目”,2010年美国将数字素养工程纳入到国家宽带计划[44]。甚至,国际阅读协会(International Reading Association,IRA)也改名为全球国际素养协会(International Literacy Association,ILA),以积极推动公众信息、媒体、数字和技术等多元素养教育。同时大学或研究型图书馆也比较重视用户信息素养能力的培训和提升,如ACRL于2015年1月通过了《美国大学与研究图书馆协会高等教育信息素养框架》,提供了信息素养教育指导标准。在我国首届全国高校图书馆服务创新案例评奖中,共有32个案例获奖,其中有6个获奖案例属于阅读推广范畴,2个获奖案例属于信息素养教育范畴[45]。总体来说,目前图书馆针对用户的教育培训还是以人工培训、人与人之间互动交流为主。endprint
随着人工智能技术的发展,人工智能可以充分参与到用户教育培训过程中,教育人工智能是人工智能与学习科学相结合而形成的一个新领域。影响教育人工智能发展的关键技术主要有知识表示方法、机器学习与深度学习、自然语言处理、智能代理及情感计算等。图书馆对用户实施信息素养培训或阅读推广活动,本质上就是一项教育过程。今后人工智能在图书馆用户教育的典型应用可能有:(1)作为辅导学生个性化学习的智能导师。即智能导师系统通过对教育大数据进行挖掘、处理、分析和数据建模,寻找学习者学习结果与学习内容、教学资源、教学行为等变量之间的关系,同时根据学生兴趣、习惯、学习需求、专业背景、知识结构以及现有信息素养水平,为其制定个性化的学习方案,并对学习情况进行评价、反馈,进而不断调整和优化教育决策,重构教学内容和教学计划。如美国普渡大学构建的“课程信号”教师教学支持与学习干预系统就是一种初步尝试。早在2009年,日本东京理科大学研制出机器人教师“萨亚”;(2)作为辅助教师承担重复性工作的智能助手。智能助手机器人既可以帮助教师完成朗读课文、点名、收集整理资料、监考、收发试卷,或辅助教师进行备课和科研活动,从而减轻教师负担,提高工作效率;又可以帮助学生管理学习时间和合理安排学习任务,借助智能语音技术,进行语音对话咨询活动。如网龙华渔教育所研发的“未来教师”机器人、苹果手机研发的Siri智能语音助手等。美国佐治亚理工大学研制出机器人助教“沃特森”,在线与学生通过邮件互动了5个月,竟然没有任何学生发现;(3)作为陪伴儿童成人阅读学习的智能伙伴。开展阅读推广是各级各类图书馆的重要服务功能之一,公共图书馆可以引进智能伙伴机器人,陪伴儿童一起阅读学习、开展智力问答游戏和讲故事比赛活动、提供绘画或手工指导等。如北京紫光优蓝机器人公司研发的“爱乐优”家庭亲子机器人就是一种大胆尝试[46]。此外,针对成人阅读,可借助智能语音技术,开发电脑合成语音朗读经典著作产品,用户可以个性化定制朗讀声音,体验“明星大咖为你读书”,如咪咕数媒与科大讯飞正在共同打造的高品质朗读包产品。
4.3.2 智能管理服务:从传统服务到个性服务
网络时代,图书馆服务正面临内忧外患窘状:一方面人们信息获取渠道灵活多样,数字或网络阅读、新媒体阅读方兴未艾,图书馆传统服务正不断失去吸引力,用户流失现象严重;另一方面,许多图书馆内部普遍存在馆藏陈旧、因循守旧、功能单一、人浮于事等现象。2011年,美国一学者甚至撰写了《2050年高校图书馆尸检报告》[47]一文,认为高校图书馆的传统馆藏将过时,图书馆培训变得没有必要,信息素养成为普通教育的一部分,图书馆工作被合并到信息技术部门,参考咨询服务将消失,服务质量将屈服于经济压力,因而到2050年高校图书馆最终将消亡,这引发了人们热烈讨论。先暂且不论此论断是否完全具有科学性和合理性,但让我们不得不认真思考现代图书馆该如何转型和变革,毕竟没有变革和创新,图书馆就没有发展和未来。2011年8月,在美国波多黎各召开国际图联年会主题为“超越图书馆”(Libraries beyond Libraries)。推动图书馆的转型就是要构建第三代图书馆——从以藏书为中心的第一代图书馆、以开放借阅为中心的第二代图书馆,向以人为本、注重人需求的第三代图书馆转变。第三代图书馆将会超越图书、超越图书馆,将更加注重人的需求、可接近性、开放性、生态环境和资源融合,致力于促进知识流通,创新交流环境,注重提升多元素养和激发社群活力[48]。因此积极推动传统服务转型,借助人工智能技术,建设以人为本和满足用户个性化需求的第三代图书馆,就成为必然之举。
人工智能技术在未来第三代图书馆建设中的应用主要体现在以下三方面:
(1)开展精准信息智能提供服务。通过基于大数据、物联网、人工智能技术对用户进行信息收集和行为分析,获取用户阅读习惯、研究兴趣、教学内容、专业领域、科研方向、科研团队、教育背景、相关群体等有效信息,根据特定情景,为用户提供精准的、个性化的、高质量的信息资源和知识推送,如推荐借阅图书、某领域专题文献信息、最新前沿研究热点、教学参考课件和资料等等,馆员可以此为依据嵌入用户教学过程和科研团队。如百度教育和武大合作,将武大本身的学术资源与百度教育和学术资源库进行巧妙整合,借助人工智能技术,能对读者阅读偏好和专业进行分析,以提供千人千面的推荐推送,并透过大数据挖掘学生的兴趣与天赋[49];又如,2017年两会期间光明日报推出的人工智能融媒体产品“小明AI两会”,通过利用认知服务技术、语音识别技术、图像识别技术、深度学习、大数据分析与挖掘技术,从而实现对代表委员的照片认知、展示履职情况、绘制人物图谱关系等核心功能[50],非常值得图书馆借鉴学习。
(2)开展馆内空间智能导引服务。在智能感知空间建设基础上,用户可借助馆内触摸显示屏或手机、可穿戴设备等移动终端,利用知识地图程序,可享受智能语音服务、智能座位预定、图书精准定位、馆内智慧导航、机器智能咨询(可与虚拟现实技术相结合)等智能导引服务。如亚马逊推出的“阿列克夏”(Alexa)人工智能助手突破了语音识别的难题。目前一些图书馆在智能导引服务方面已有初步探索,如深圳盐田区图书馆引进的机器人“欢欢”,具备图书信息查询,自主借书服务、个性化的人机交互、24小时移动安保监控、异常报警系统等功能。又如,英国亚伯大学Hugh Owen图书馆引进了咨询机器人,不仅可以提供书目查询功能,还能根据学生身份自动指引学生找到与课程相匹配的推荐书目;再如,清华大学图书馆开发的具有学习与记忆功能的“小图”咨询机器人,能够实现智能人机交互[51]。
(3)开展日常工作智能高效管理。智能管理工作是指利用相关人工智能技术解决业务流程动态监控、资源利用和设施、设备维护等管理与服务、工作计划任务优先程度安排等问题,以提高管理效率,降低管理成本,提高用户满意度,具体包括用户管理、书籍管理、机房管理、资产管理等内容。用户管理是指借助设备或平台智慧收集用户信息和行为数据,保存至图书馆管理系统中,建立个人数据档案,方便馆员管理和用户分析。书籍管理是指图书智能分编、自动借还、智能清点等,如南京大学图书馆引进盘点机器人。机房管理是指智能巡查机房、智能收集数据、智能监控等,如浙江移动将人工智能机器人“光缆卫士”引入网络运维管理[52]。资产管理是指通过对资产设备植入芯片或电子标签来进行清点、监控和维护,避免资产丢失。endprint
5 结语
自从1956年人工智能概念在达特茅斯学术会议上被正式提出以来,人工智能发展经历了起步、停滞、曲折发展和高速发展四个阶段,特别是2016年AlphaGo战胜了世界围棋冠军,引发了人们对人工智能的研究热潮。许多国家将人工智能发展上升为国家核心战略,我国《十三五规划纲要》提出要积极发展人工智能。同时国外多份重要研究报告认为在未来几年人工智能技术将在图书馆、教育等领域得到普遍应用。必须承认,目前大数据环境下图书馆发展正面临着用户流失、资源整合以及智能搜索等多重困境,而人工智能技术发展不仅给处于困境的图书馆在文献资源建设、馆舍空间建设以及用户管理服务等领域带来了重要机遇,而且也会从环境(智能馆舍空间)、资源(智能资源系统)、服务(智能用户服务)三个维度来推动未来图书馆的变革发展,即智能館舍空间包括智能馆舍设计从人工设计到智能设计,智能感知空间从简单感知到智能感知;智能资源系统包括智能资源建设从经验决策到智能决策,智能资源搜索从被动搜索到智慧搜索;智能用户服务包括智能用户教育从人工培训到智能教育,智能管理服务从传统服务到个性服务。
参考文献:
[1] Silver D,Schrittwieser J,Simonyan K,et al.Mastering the game of go without human knowledge[DB/OL].[2017-12-12].http://www.nature.com/articles/nature24270.
[2] 张兴旺.从AlphaGo看人工智能给图书馆带来的影响与应用[J].图书与情报,2017(3):43-50.
[3] 吴建中.再议图书馆发展的十个热门话题[J].中国图书馆学报,2017,43(7):4-17.
[4] J McCarthy,M Minsky,N Rochester,et al.A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence[EB/OL].[2017-12-12].http://www-formal.standford.edu/jmc/history/dartmouth/dartmouth.html,19950831/20170415.
[5] 刘海滨.人工智能及其演化[M].北京:科学出版社,2016:5-8.
[6] 张坤颖,张家年.人工智能教育应用与研究中的新区、误区、盲区与禁区[J].远程教育杂志,2017(5):54-63.
[7] AI Transforms Science[EB/0L].[2017-12-12].http://science.sciencemag.org/content/357/6346.
[8] 李修权.新一轮人工智能发展的特征及展望[J].高科技与产业化,2017(6):18-19.
[9] Google 的猫脸识别:人工智能的新突破[EB/0L].[2017-12-12].http://www.robot-china.com/zhuanti/show-1251.html.
[10] 中央电视台大型纪录片《互联网时代》主创团队.互联网时代[M].北京:北京联合出版公司,2015:278.
[11] IDC新闻[EB/OL].[2017-12-12].http://news.idcquan.com/talk/86351.shtml.
[12] 第40次《中国互联网络发展状况统计报告》发布[EB/OL].[2017-12-12].http://news.xinhuanet.com/zgjx/2017-08/07/c_136506155.htm.
[13] 第十四次全国国民阅读调查报告出炉[EB/OL].[2017-12-12]. http://book.sina.com.cn/news/whxw/2017-04-18/doc-ifyeimqy2574493.shtml.
[14] OCLC.Perceptions of Libraries,2010:Context and Community[EB/OL].[2017-10-22].http://www.oclc.org/content/dam/oclc/reports/2010perceptions/2010perceptions_all.pdf.
[15] 李忠东.英国公共图书馆“逆境求生”[N].新华书目报,2016-07-15(8).
[16] 高校图书馆借阅量创十年新低[EB/OL].[2017-12-12].http://news.xinhuanet.com/edu/2015-04/16/c_127695519.htm.
[17] 秦鸿,钱国富,钟远薪.三种发现服务系统的比较研究[J].大学图书馆学报,2012,30(5):5-11,17.
[18] 赵功群,王恒.国内三大中文发现系统比较分析及评价[J].图书馆研究,2016(6):72-77.
[19] 殷沈琴,唐武京,邵诚敏,等.三家资源发现系统的调研、测试和评估[J].图书馆杂志,2013,32(12):82-86.
[20] State of Americas Libraries Report 2016[EB/OL].[2017-12-12].http://www.ala.org/news/sites/ala.org.news/files/content/state-of-americas-libraries-2016-final.pdf.endprint
[21] CAICT:2016年大数据白皮书[EB/OL].[2017-12-12].http://www.199it.com/archives/552352.html.
[22] International Federation of Library Associations Trend Report 2013[EB/OL].[2017-12-12].https://trends.ifla.org/literature-review/advances-in-artificial-intelligence.
[23] The NMC/CoSN Horizon Report:2017 K-12[EB/OL].[2017-12-12].http://www.nmc.org/publication/nmccosn-horizon-report-2017-k-12-edition/.
[24] NMC Horizon Report:2017 Higher Education Edition[EB/OL].[2017-12-12].http://www.nmc.org/publication/nmc-horizon-report-2017-higher-education-edition/.
[25] NMC Horizon Report:2017 Library Edition[EB/OL].[2017-12-12].http://www.nmc.org/publication/nmc-horizon-report-2017-library-edition/.
[26] 郎杰斌.空間体验——图书馆的核心价值之一[J].大学图书馆学报,2013,31(2):42-48.
[27] 吴建中.转型与超越——无所不在的图书馆[M].上海:上海大学出版社,2012.
[28] Environmental Scan 2015[EB/OL].[2017-12-12].http://www.ala.org/acrl/sites/ala.org.acrl/files/content/publications/whitepapers/EnvironmentalScan15.pdf.
[29] 顾立平.数据治理——图书馆事业的发展机遇[J].中国图书馆学报,2016,42(9):40-56.
[30] 陈海珠.图书馆建筑及其功能的历史变迁[J].新世纪图书馆,2014(9):69-72.
[31] 建筑界的AlphaGo,史上第一个人工智能建筑师出现了![EB/OL].[2017-12-12].http://www.360doc.com/content/17/0601/11/5236664_658965516.shtml.
[32] 人工智能进军建筑,未来房子比人还聪明[EB/OL].[2017-12-12].http://baijiahao.baidu.com/s?id=1561452439803333&
wfr=spider&for=pc.
[33] 秦格辉.Zigbee与RFID整合应用研究——智慧图书馆感知网组网设计[J].图书馆论坛,2014(5):86-91,144.
[34] 王同磊.人工智能技术在智能建筑中的应用[J].电子技术与软件工程,2017(3):256.
[35] 吴高.基于用户驱动的数字资源采购机制构建研究[J].现代情报,2015(2):48-52.
[36] Michael Levinclark.Developing a Multiformat Demand-Driven Acquisition Model[J].Collection Management,2010,35(3-4):201-207.
[37] Rebecca Schroeder.When Patrons Call the Shots:Patron-Driver Acquisition at Brigham Young University[J].Collection Building,2013,31(1):11-14.
[38] 刘华.以读者为主导的文献资源建设——美国学术图书馆读者决策采购(PDA)研究[J].图书情报工作,2012,56(5):89-93,127.
[39] 卞丽琴,陈峰.基于人工智能的图书订购策略分析[J].图书馆杂志,2015,34(8):39-43,56.
[40] Making Open Science a Reality[EB/OL].[2017-12-12].http://www.oecd-ilibrary.org/science-and-technology/making-open-science-a-reality_5jrs2f963zs1-en.
[41] Directory of Open Access Journals [EB/OL].[2017-12-12].https://doaj.org/.
[42] E.Archambault etc.,Proportion of Open Access Peer-Reviewed Papers at the European and World Levels--2004-2011 [EB/OL].[2017-12-12].http://www.science-metrix.com/pdf/SM_EC_OA_Availability_2004-2011.pdfrg.
[43] 王冲鶄.智能搜索技术发展态势分析[J].现代电信科技,2017,47(3):75-78.endprint
[44] 许欢,尚闻一.美国、欧洲、日本、中国数字素养培养模式发展述评[J].图书情报工作,2017,61(16):98-106.
[45] 孟祥保.叶兰首届全国高校图书馆服务创新案例大赛获奖案例的分析与思考[J].图书情报工作,2015,59(3):42-49.
[46] 闫志明,唐夏夏,秦旋,等.教育人工智能(EAI)的内涵、关键技术与应用趋势——美国《为人工智能的未来做好准备》和《国家人工智能研发战略规划》报告解析[J].远程教育杂志,2017,35(1):26-35.
[47] Academic Library Autopsy Report,2050[EB/OL].[2017-10-22].http://chronicle.com/article/Academic-Library-Autopsy/125767/.
[48] 吴建中.走向第三代图书馆[J].图书馆杂志,2016,35(6):4-9.
[49] 把人工智能引进图书馆,百度联合武大重新定义“借书”[EB/OL].[2017-12-12].http://smb.pconline.com.cn/992/992616
9.html.
[50] 陳建栋.人工智能让信息服务有趣更有料——以“小明AI两会”为例[J].青年记者,2017(12):90-91.
[51] Fei Yao,Chengyu Zhang,Wu Chen.Smart talking robot Xiaotu:participatory libarary service based on artificial intelligence[J].[2017-12-12].http://www.emeraldinsight.com/0737-8831.htm.
[52] 浙江移动将人工智能引入网络运维管理[EB/OL].[2017-12-12].http://www.c114.com.cn/news/118/a1025762.html.
作者简介:黄晓斌,男,中山大学资讯管理学院教授,博士生导师,研究方向:竞争情报研究、信息分析、网络信息开发利用、数字化信息资源管理等;吴高,男,广西师范大学图书馆研究馆员,硕士生导师,研究方向:信息资源管理、公共文化服务、知识产权法等。endprint