APP下载

人工智能技术在图书馆中的应用研究综述

2019-07-06

图书馆学刊 2019年4期
关键词:本体数据挖掘学者

沈 玲

(上海大学图书情报档案系,上海 200444)

1 引言

人工智能作为2016年底Gartner 公布的2017年十大具有战略意义的重大科技发展趋势之一被广为关注[1]。根据麦肯锡发布的报告《人工智能:下一个数字前沿》,可以看出,人工智能在高科技、金融服务、通信、医疗、零售、电力等行业有广泛的应用[2]。早在1985年,学者谢元泰在其论文《新技术革命的挑战与图书馆的发展策略》中就提到了人工智能在图书馆的应用[3]。至2017年,人工智能在我国图书馆中的应用研究已经有32年的时间,研究文章已经增长到202篇。人工智能在《新媒体联盟地平线报告:2017年图书馆版》中被列为图书馆界的六大技术发展之一[4],在《国际图联趋势报告》中被列为四大技术趋势之一[5],在吴建中教授的论文《再议图书馆发展的十个热门》中被列为十大热门话题之一[6]。笔者顺应人工智能的研究热潮,将我国32年来人工智能技术在图书馆领域应用的研究文献进行梳理分析,根据人工智能领域和图书馆领域的研究现状,找出其研究发展阶段及其阶段特征,探索人工智能在图书馆领域应用的发展趋势,为该领域内的深化研究提供参考。

2 人工智能在图书馆中的应用研究

人工智能(Artificial Intelligence)简称AI,人工智能一词是1956年“人工智能之父”McCarthy提出的,学术界关于人工智能的定义说法不一。麻省理工学院学者Marvin Minskyren 提出:“人工智能是一门科学,它使机器做那些由人需要通过智能来做的事情”[7];在此基础上,G.F.Luger教授给出的定义是:“人工智能是计算机科学中关于智力行为自动化的分支”,学者刘凤岐在其著作中结合G.F.Luger 定义和人工智能的发展趋势,将其定义为“人工智能研究构成智力行为基础或呈现智力行为机制,途径构造与评价按制定的这些机制设计的人造物”,并将人工智能分为:博弈、自动推理与定理证明、专家系统、自然语言理解、模拟人生的性能、规划与机器人、AI语言和环境、机器学习、神经网络与遗传算法、AI 与哲学,共10 个应用领域[8]。人工智能在图书馆中的应用研究由来已久,但热度未减。2002年郭军等人指出人工智能已在图书馆分类、编目、索引、流通管理、情报检索等工作环节得到应用[9];2017年姚钱等人提出人工智能在图书馆自动化中得到应用,提高了图书馆的工作效率[10]。笔者现就人工智能在图书馆的应用情况进行分析。

2.1 数据来源

为了解和廓清我国人工智能技术在图书馆应用的研究历程和研究内容,分析其发展阶段、发展现状和发展趋势。利用中国知网,采用“人工智能”“图书馆”“机器智能”“机器人”等主题词,进行高级检索,去除重复和无关论文后,得到202 篇高相关度论文。

2.2 数据分析

采用文献计量法,将202篇相关文献进行计量分析。将文章按照时间排序后,发现1985—2000年间年度发文量均在3 篇以下,笔者将2001年到2017年间每年发表的文献数量用折线图表示(见图1),并分析其增长趋势和增长阶段。

图1 2001—2017年度发文量

结合发文趋势和具体研究内容,将国内人工智能在图书馆中的应用研究大致分为5 个阶段。第一阶段:1985—2000年,年度发文量在3 篇以下。该阶段的研究内容较为基础,讨论人工智能的学科特点及新技术在图书馆的应用,属于该研究的启蒙阶段。第二阶段:2001—2008年,年度发文量大体呈平稳增长趋势,该阶段的论文主要探讨人工智能技术在数字图书馆中的应用,属于初步发展阶段。第三阶段:2009—2010年,年度发文量急剧下降,研究内容延续上一阶段,属于发展低谷阶段。第四阶段:2011—2016年,年度发文数量回升但几乎趋平,属于平稳发展阶段,该阶段研究主要是对智能检索技术、数据挖掘技术、本体等具体技术进行了更加深入的研究,介绍人工智能技术在图书馆中的新应用。第五阶段:2017年发文量急剧上升,属于快速发展阶段。该阶段研究的主要内容是信息资源建设、智能检索、本体、个性化服务、无障碍阅读、智慧图书馆中人工智能的应用等。

2.2.1 启蒙阶段(1985—2000)

本阶段属于研究的启蒙时期,我国人工智能开始应用于图书馆。本阶段年均发文量在3 篇以下,未形成核心作者,研究比较分散。本阶段研究内容主要是人工智能的学科特点及其技术在图书馆中的应用:①人工智能学的两个方向(知识工程学和认知科学)与图书情报学科的结合,以学者岸美雪和邹永利为代表;②专家系统的定义、构建、发展和应用,以学者简明、张炎烈、杨宗英、沈国强为代表;③人工智能的发展带来的其他新技术,如沈正华介绍了美国国会图书馆编制的Bibliofile 智能目录[11]、张大华介绍的盲人自动阅读系统[12]、杨友春介绍的大规模一体化的医院信息系统[13]、学者胡运发等人介绍的智能化的大型图书馆管理和决策支持系统[14]。

2.2.2 初步发展阶段(2001—2008)

本阶段发表的论文有81 篇,占发文总量的40%左右,年度发文量总体呈平稳增长趋势。本阶段获得各级各类资金支持的论文数量为8篇,开启人工智能技术在图书馆应用研究的初步发展阶段。作者采用文献计量的方法分别对题名和关键词中出现的相关词进行词频统计(见表1)。

表1 相关词词频统计

续表

由表1可知,人工智能技术在数字图书馆中的应用是本阶段研究的重点。其中,在检索、本体、Agent、搜索引擎、数据挖掘、信息服务、文本分类和知识管理方面讨论的学者比较多。着重讨论出现次数较多的检索和本体,其他关键词涉及的技术集中讨论。

人工智能技术在数字图书馆信息检索中的应用,主要表现在扩展与延伸人类智能方面,如:知识发现技术、知识获取技术、知识处理技术、机器学习、机器推理的过程等[15]。本阶段主要讨论了几个典型的应用:①学者廖明光、徐亨南、秦嘉伟、王兰成等人讨论了基于本体的智能检索技术;②学者阚忠良在其硕士论文中讨论了基于结构与内容的文本信息检索技术[16];③学者徐亨南论述了基于神经网络动态反馈的智能检索技术[17];④学者徐亨南讨论了智能检索Agent系统,张琼等人进一步提出了智能Agent 技术在网络信息检索中的应用[18];⑤朱伟伟等人提出将人工智能与实时咨询相结合,提高信息检索服务质量[19];⑥李晓莹研究了异构数据库检索系统[20];⑥学者曾福兴介绍了机器人搜索引擎、元搜索引擎、主题目录、浏览器等网络检索工具[21];⑦学者赵嘉凌介绍了智能搜索引擎的工作原理和体系结构以及其在数字图书馆中的作用[22]、学者毕维峰、王峰在其趋势分析性论文中均认为信息检索技术的智能化程度会不断提高。

本体在数字图书馆中除了检索方面,主要体现在以下几个方面:①特定领域本体构建。牟冬梅在其硕士论文中提出医学领域本体构建应利用医学主题词提供的推理功能,并构建了中文肝炎本体模型,揭示了在特定领域知识组织中本体的应用[23];学者谷建军提出以叙词表为基础的中医古籍文献领域本体建模方法[24];学者常春首次将中国农业科学叙词表的一部分转化为本体论,并构建出食物安全本体论原型[25]。②知识库系统本体构建。张鸣在其硕士论文中提出将知识组织理论应用到知识库系统,探讨了如何利用现有的分类表和叙词表在知识库系统中构建本体[26]。③本体和语义网。学者黄媛提出,在可扩展标记语言、资源描述框架、本体互换语言和其他新标准的帮助下,语义网将对已存在的网络数据提供更多的结构与意义。语义网的实现将会对数字图书馆的发展产生巨大的影响[27]。学者王洪磊分析了资源描述对数字图书馆的作用,对语义网技术及相关本体论在数字图书馆中的应用进行了论述,并设计了的数字图书馆资源语义描述框架以解决效率低下的问题[28]。

人工智能在数字图书馆其他方面的应用。①数据挖掘:学者许增福研究网络信息数据挖掘技术,以期解决数字图书馆信息资源组织建设问题[29];学者蒲筱哥将人工智能技术与数据挖掘技术结合,构建了一种个性化网络信息智能挖掘系统[30];雷刚在其硕士论文中采用数据挖掘及人工智能等技术实现个性化数字图书馆的信息推荐[31]。②文本分类和聚类:杨淑棉在其硕士论文中对粗糙集理论文本分类系统进行了研究[32]、柳培林在其硕士论文中对以向量空间模型为基础的中文文本分类技术进行了研究[33];任美睿在其硕士论文对数字图书馆中的词频提取与自动文本分类方法进行了研究[34]。

2.2.3 低谷阶段(2008—2010)

本阶段发文数量急剧下降,研究出现低谷。该阶段依然延续了上一阶段的研究内容,主要研究人工智能技术在数字图书馆中的应用。作者推测,这一时期出现低谷的原因,应该与2009年的经济危机导致的人工智能技术发展缓慢和学者研究经费削减有关。

该阶段主要研究进展为以下几个方面:①形式概念分析。主要研究人工智能技术在数字图书馆、信息检索、软件工程以及知识发现等方面结合应用。王利东在其博士论文中以粗糙集和AFS理论为工具,对形式概念分析的扩展形式及应用展开研究[35]。②智能咨询系统模。学者潘鹏程融合人工智能理念和信息咨询的方法、技术,构建了图书馆智能咨询系统模型。该模型既具有人工智能的特点,又能适应网络信息资源动态海量异构特征,具有可行性和参考性[36]。③Folksonomy。它是新互联网信息环境中的一种信息组织工具。郑燃在其硕士论文中从信息组织角度,对Folksonomy的特点、功能及运行机制等进行了详细论述[37]。④文本分类。文本分类是处理以文本格式存储的信息的重要支撑技术。学者王彦霞对基于相关主题模型的文本分类方法进行了深入研究[38]。

2.2.4 平稳发展阶段(2011—2016)

本阶段发文数量为54 篇,占总发文量的30%左右。本阶段较低谷阶段发文数量增加,整体增长趋势平稳,属于经济复苏后的平稳发展阶段。该阶段研究的主要内容为智能检索技术、数据挖掘技术、本体等,并且以此为基础,探索出人工智能技术在图书馆中的新应用。

部分学者对前3 个阶段产生的人工智能技术成果进行了深入探讨。①人工智能在数字图书馆检索方面的进一步应用:王立政在其硕士论文中提出将本体与形式概念分析相融合,并运用其优化基于本体的知识检索模型[39];刘京京在其硕士论文中探讨了基于概念格的语义检索模型[40]。②数据挖掘技术。学者陈畅分析了数据挖掘在图书馆信息提取和利用方面的作用,阐述了其在图书馆个性化服务中的应用[41];吴淼在其硕士论文中用数据挖掘技术对图书馆借阅记录进行了分析[42]。③除本体在检索中的应用外,刘阳在其硕士论文中提出了建立基于关系数据库的本体模型,并实现其生成工具[43]、林宝望进一步讨论了基于数据库的本体自动构建的关键技术——保持语义一致的映射构建方法[44];鹿彦在其硕士论文中探讨了非结构化数据的本体学习的技术[45];学者王任栋等人分析了本体在数字图书馆的知识组织应用中的不足,并提出基于本体的知识组织模式以及其流程[46];李新广在其硕士论文中提出了数字图书馆用户偏好模型及其个性化推荐的研究[47]。④在无障碍阅读方面,周星辰在其硕士论文中提出了以深度学习为基础的脱机手写体汉字的识别方法[48]。

此外,部分学者提出了本阶段新兴研究点:①人工智能技术在图书馆参考咨询服务中的应用研究出现新进展:咨询机器,共有6 篇相关文献。首次发表关于图书馆智能咨询机器人的研究论文的是学者孙翌等人,以上海交通大学图书馆为例,提出基于BotPlatform平台构建的图书馆智能化IM咨询机器人服务模型,并且尝试设计和实现不限时机器人实时咨询服务[49];学者王艳描述了IM 咨询机器人在深圳图书馆的应用,并使用实际运作数据分析本馆IM咨询机器人的应用效果与其存在的问题[50];陈雨祺指出了图书馆智能IM 咨询机器人系统主要的管理技术[51];学者杨艳飞以智能化IM咨询机器人为基础构建了数字图书馆信息服务系统[52];罗涛等人提出了基于BotPlatform平台的MSN咨询机器人的构建方案[53],学者曹畋探究了基于Android平台的咨询机器人的构建[54]。②人工智能技术在高校图书馆中的应用:学者黄艳华提出了将虚拟现实技术与高校图书馆的参考咨询服务技术相结合[55];学者陈玲等人提出了将数据挖掘技术与高校图书馆信息服务管理相结合[56];学者温若春则列举了人工智能在高校图书馆软硬件中的应用,如机器视觉、智能信息检索技术、智能翻页技术和咨询机器人等[57]。正如学者黄婷等人所说,人工智能技术带来的新成果,将创新高校图书馆信息服务的方式,拓展高校图书馆信息服务的广度[58]。③人工智能技术在图书馆领域内的其他应用:学者何都益、王萍等提出人工智能在图书馆资源建设方面的应用;学者王学光、宋路露等对图像识别技术进行了研究,学者田金蕊、胡瑛分别提出了微信智能服务和飞信机器人在图书馆服务中的应用等。

2.2.5 快速发展阶段(2017)

2017年,人工智能技术在图书馆的应用研究进入快速发展阶段,发文量的增长与2016年、2017年政府的支持和人工智能的研究热潮有较大关系。本阶段研究的主要内容体现在信息资源建设、智能检索、本体、个性化服务、无障碍阅读等方面,其中值得关注的是本阶段提出了人工智能在智慧图书馆中的应用。另外,还出现一些总结性文章,包括人工智能在图书馆应用研究综述、给图书馆带来的影响和改变、未来的发展趋势等主题。

本阶段主要是对前一阶段人工智能技术的进一步研究:①在人工智能参与图书馆的信息资源建设方面,学者陆颖隽以CADAL 为例阐述了将虚拟现实技术应用于图书馆信息资源建设的创新方式[59];学者刘相金等人提出在大数据环境下,采用数据挖掘技术和人工智能技术设计的“抢单式”中文图书的采选方式,以实现图书馆和馆配商的双赢[60]。②在智能检索方面,学者刘艳将大数据技术和人工智能相结合,完善了基于内容的检索技术,并提出两者的结合将是信息检索技术的发展方向[61]。③在本体方面,张娟等人提出以养生领域的领域本体和文献信息等知识资源为基础来构建养生单元信息的知识服务系统[62]。④学者张荣等人,再次提出了数字图书馆要为用户提供准确的个性服务,应建立用户偏好模型以及加强对数字图书馆用户偏好模型及其个性化推荐的研究[63]。⑤在无障碍阅读方面,学者王凯丽对人工智能语音应用于图书馆信息无障碍服务进行了探析[64]。

值得关注的是人工智能在智慧图书馆中的应用,学者陆婷婷预测人工智能时代图书馆发展趋势将由智慧图书馆转变为智能图书馆[65];学者江康在2017年浙江省图书馆年会上分别阐述了人工智能和智慧图书馆的现状、人工智能技术在智慧图书馆中的应用[66];郭利敏等人介绍了机器学习,并探讨了其在图书馆领域应用的可能性和应用场景[67]。学者吴建中将人工智能列为图书馆发展的十个热门话题之一[6];学者姚钱等人分析了人工智能技术的基本原理与特点,介绍了人工智能技术在文献检索、文献分类、图书馆自动化中的应用[68];学者张兴旺以介绍AlphaGo的发展为切入点,阐述了人工智能给图书馆带来的影响:研究方法论的创新突破、知识管理的创新发展、知识服务的创新发展、服务模式的影响与再造。该学者还阐述了发展趋势以及阻碍[69]。学者林军提出未来人工智能将与图书馆员共同参与图书馆服务,为了更好地服务读者,尽早构建针对人机共存的规则和道德行为框架,并提出只要有不断学习且有经验的图书馆员存在,人机共存的关系就不会改变[70]。

综上所述,人工智能技术在图书馆的研究具有如下特点:研究主体由传统图书馆转变为数字图书馆、再发展为智慧图书馆,甚至是智能图书馆;研究内容一直以智能检索、本体、数据挖掘、模型构建、文本分类、资源建设、个性化服务等,为研究热点;研究特征表现为阶段性明显、技术性强、研究范围广、研究的延续性强等;研究方向呈现重技术轻人文的特点[71],绝大多数文章都是研究人工智能技术的文章,极少数文章提到图书馆如何看待人工智能的发展、图书馆员应该如何应对人工智能的发展等问题。

3 人工智能技术在图书馆领域的研究趋势

3.1 人工智能技术在智慧图书馆中的应用

人工智能在智慧图书馆中的应用研究将是下一个持续的研究热点。学者蒋康提出人工智能可以应用在智慧图书馆的个性化感知系统、信息资源智慧处理系统、信息智能化分析系统、图书资源信息收集、图书资源分类的智能化、资源安全管理、网络建设等方面,并且对人工智能在智慧图书馆中的应用前景进行了可行性分析。学者王世伟提出,智慧图书馆建设以数字化、网络化、智能化信息技术为基础,以互联、高效、便利为主要特征,以绿色发展和数字惠民为本质追求,是现代图书馆科学发展的理念与实践[72]。人工智能技术符合智慧图书馆的发展理念,与互联网、云计算、物联网等技术结合在图书馆的应用会逐渐增多。人工智能技术能够提高图书馆的工作效率,改善图书馆的服务方式,加速智慧图书馆的发展。

3.2 利用人工智能技术提升读者个性化服务水平

人工智能技术将被更加广泛而深入地应用到图书馆个性化服务中。一方面,利用人工智能技术提升个性化推荐服务:进一步研究将人工智能技术与算法融合到个性化服务业务链中去,通过对读者行为数据的分析,整合读者信息,进行个性化匹配,从而实现个性化服务[73],例如信息推荐、阅读推广、读者荐购等。朱志伟提出人工智能在图书馆的应用趋势主要集中在数据挖掘、学习分析、个性化推荐等领域[74]。另一方面,利用人工智能技术提升个性化空间服务:通过人工智能技术与物联网技术相结合,建立包括智能安保系统、智能通风系统、智能照明系统、智能广播系统、智能发布系统等在内的综合性智能建筑管理系统。另外,可利用人工智能技术实现图书馆空间再造,设计个性、舒适、智能的信息共享空间或创客空间,为读者提供个性化空间服务[75]。

3.3 人工智能技术或将引领图书馆进入4.0时代

2018年9月17日,世界人工智能大会在上海举行,发布了《2018 世界人工智能产业发展蓝皮书》,提出人工智能是科技革命与产业变革的核心驱动力量,对世界各地的经济、社会和人类生活产生了深刻的影响[76]。人工智能技术的使用推动了工业4.0 和Web4.0 的发展,在此时代背景下,图书馆也开始由图书馆3.0向图书馆4.0过渡。学者董曦京提出,图书馆4.0时代希望实现以读者个性化服务为中心、以全时空、全媒体和高度人工智能化为特征的图书馆服务体系[77];Younghee Noh提出的图书馆4.0 的概念模型,将其确定为智慧图书馆、大数据分析处理能力、增强现实图书馆、内容感知、尖端识别能力、无限创意空间的组合形式[78]。笔者认为,投入使用人工智能技术,能够在图书馆馆藏、图书馆管理、图书馆服务、图书馆空间以及图书馆员等各个方面,满足读者需求的智能化图书馆。由人工智能引领的图书馆4.0时代,将成为研究的热门话题。

3.4 图书馆如何应对人工智能带来的人文挑战

习近平总书记在写给2018年世界人工智能大会的贺信中提出,人工智能为经济发展注入新的动力,要把握人工智能发展趋势,同时也要处理好人工智能与法律、政府治理、安全、道德伦理、就业等方面的关系[79]。由此可知,人工智能在图书馆的应用研究更加注重对技术方面的研究,而忽视人文方面的研究。笔者赞同学者王申罡等人提出的观点:技术是过程所需而人文是方向指引与归宿[72],对人工智在图书馆中应用的研究最终会回到对于人本身的研究上。因此,在今后的研究中,除了要考虑人工智能功能属性、技术特征、在图书馆的应用范畴等技术因素外,还需要从宏观层面思考如何将人工智能与图书馆人文研究相结合,在图书馆发展战略、图书馆管理和服务方面综合考虑人工智能技术的引进,关注人工智能技术的应用给读者带来的影响。

4 结语

对人工智能在图书馆中应用研究的相关文献分阶段分析与综述,有利于进一步预测人工智能在图书馆领域研究的发展趋势。对人工智能在智慧图书馆中的应用、人工智能如何更好地为读者提供个性化服务、人工智能技术或将引领图书馆4.0 时代、图书馆如何应对人工智能带来的人文挑战等方面的研究,将成为新一轮的研究方向。此外,在制定人机共存规则和道德规范框架方面同样还有诸多问题需要进一步探索和研究。

猜你喜欢

本体数据挖掘学者
改进支持向量机在特征数据挖掘中的智能应用
学者介绍
学者简介
学者介绍
眼睛是“本体”
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
一种基于社会选择的本体聚类与合并机制
软件工程领域中的异常数据挖掘算法
学者介绍