APP下载

基于人工智能的图书馆个性化知识服务建设初探*

2022-02-08陈安琪

山东图书馆学刊 2022年2期
关键词:检索个性化智能化

陈安琪

(南京图书馆,江苏南京210000)

1 引言

人工智能技术的发展给图书馆界带来了深刻的变化,信息过载现象加剧,读者需求的差异化程度越来越高,图书馆的知识服务方式亟需转型升级,以满足读者的个性化需求。人工智能应用于图书馆知识服务,能够通过智能化地采集读者的个人信息和行为信息,掌握读者的个性化需求和偏好,同时能够深度整合和挖掘文献信息,形成知识产品,从而有效提高知识服务的智能化和个性化水平,推动图情领域的创新和发展。本文对人工智能融入图书馆知识服务的研究热点和成果做了总结梳理,列举了人工智能在知识服务中的典型应用,并构建了个性化的知识服务框架,对未来图书馆应用人工智能提供知识服务的实践提出了建议和思考,以期为图情领域的相关工作和研究提供借鉴。

2 人工智能与知识服务概述

人工智能(Artificial Intelligence)指的是研究和开发能够模拟人的智能的技术方法,即让机器模仿人的思考方式,拥有自主思考和学习的能力[1]。人工智能技术包括认知和感知两大类,感知技术能够赋予机器与人类相似的感官能力,如文字和语音识别技术,认知技术赋予机器与人相似的思考和学习能力,如自然语言处理、深度学习、智能搜索等技术。人工智能目前已广泛应用于金融、医疗、教育和零售等多个行业,代替人类从事简单、重复的劳动,大大提高了效率。

知识服务是指通过整合和挖掘各种隐性和显性知识,提供知识产品和深层次的信息服务,满足用户需求的过程[2]。知识服务源自国外,最初被称为企业知识管理,旨在帮助企业提高效益和竞争力。美国图书馆协会率先尝试将知识服务融入图情领域,并于2001年指出,知识服务是图书馆未来的发展方向[3]。图书馆拥有大量的文献信息资源,以及能够挖掘、整合资源,形成知识产品的专业馆员,具备提供知识服务的能力。

未来图书馆将在人工智能的支持下,随时随地提供知识服务,实现知识的互联互通[4]。人工智能在知识服务中的应用体现在知识生产、用户分析和智能服务三个方面。人工智能的深度学习、自然语言处理、知识图谱、神经网络等技术,能够实现智能化的知识生产;情境感知和智能穿戴技术的发展,有助于图书馆进一步搜集用户信息,分析用户的偏好和需求;应用人机交互技术和智能机器人提供知识服务,能够替代馆员简单、重复的劳动,提高服务效率。

3 人工智能融入图书馆知识服务的研究现状

图情领域已经有众多学者注意到了人工智能的发展,并开始研究如何将其应用于图书馆知识服务中。本研究基于文献分析法,对该领域的主要研究进行了梳理,发现目前的研究热点和研究成果主要体现在以下几个方面:

(1)在信息智能化检索中的应用。自然语言处理、文字和图像识别、视觉搜索、深度学习等人工智能技术在信息检索中的应用优化了检索方式,能够使检索结果的准确性更高,且检索速度更快,推动了个性化、智能化搜索的发展。谢智敏和郭倩玲介绍了引入深度学习技术的智能搜索引擎Semantic Scholar[5],周伟等则研究了基于差分进化算法的智能搜索引擎[6]。

(2)智能机器人在知识服务中的应用。随着语音识别、人机交互技术、自然语言处理和传感技术的发展,智能机器人技术越来越成熟,被广泛应用于图书馆知识服务。学者在该领域的研究主要通过实证分析,探究当前智能机器人服务存在的不足之处,从而指出如何进一步将图书馆服务与智能机器人相结合,发挥其优势。如鲍劼等论述了中国矿业大学图书馆引入智能机器人提供服务的实践[7],樊慧丽和邵波论述了智能机器人在国内外图书馆的应用实践,并指出要培养专业人才,积极构建语料库,开发相关技术[8]。

(3)在信息分类和数据挖掘中的应用。该领域研究者主要围绕神经网络、数据抽取、自动分类算法和大数据技术,研究在对信息进行处理和分类的过程中,如何提高速度和准确性,并设计了多种数据挖掘工具,如Spss Clementine、Knowledge Mine等[9],以及如何在海量数据中挖掘有价值的信息,并应用于用户需求分析,如付斌等研究了如何在预测需求的过程中,基于BP神经网络技术进行数据挖掘[10]。

(4)在研究前沿及热点探测中的应用。对研究前沿和热点的探测和发现,是图书馆提供知识服务的重要依据。该领域学者的研究重点在如何将自然语言处理、K-means算法、知识元共现技术融入主题演化分析,从而优化现有的分析方法,更准确地探测研究前沿和热点,如孙震和冷伏海基于知识元共现技术,提出了一种ESI研究前沿知识演进分析方法[11]。

(5)知识服务框架构建和展望。图情领域有众多研究者基于对人工智能的研究及其在图书馆知识服务中的应用,构建了基于人工智能的知识服务体系和框架,并对知识服务未来的创新路径提出了思考和建议。张晓林认为,人工智能技术的发展将重新定义知识服务,对知识服务进行创新和供给侧改革[12];柳益君等基于人工智能技术和以用户为中心的服务理念,构建了知识服务体系和路径,对图书馆知识服务进行了创新[13];MINSKY等指出,人工智能技术能够根据个体在不同情境下的具体需求,定制个性化的服务方案[14]。

4 人工智能融入图书馆知识服务的实践

4.1 文献资源的智能数字化

纸质文献资源的数字化,是图书馆一项重要的工作,也是图书馆为读者提供数字化知识服务的基础。图书馆目前一般采用人工的方式对纸质文献进行数字化,但效率较低,且可能损害珍贵的纸质文献[15]。人工智能技术可以完成对纸质文献资源的自动化扫描,并基于精准的文字识别和图片识别技术,识别文献的内容。Kirtas是知名的机器人制造商,其制造的全新扫描机器Kabis采用真空吸附技术,能够模拟人手翻书的动作进行扫描,同时尽可能避免人手可能对珍贵文献造成的损害,且扫描速度高达每小时3300页,大大超过人工扫描的速度。剑桥大学图书馆、哈佛大学图书馆和微软在线图书馆,都曾在文献数字化项目中应用Kabis[16]。

4.2 智能化的知识发现和检索

知识发现泛指通过对数据的处理,在海量的信息资源中识别、检索、分类、表示、存储有用的知识,并发掘知识之间的关联的过程[17]。随着“互联网+”的发展,数据和信息出现爆炸式增长,海量的非结构化信息,导致用户获得有用信息的难度越来越大。传统的数据发现和挖掘工具,已经无法适应当下的数据环境,存在检索准确率低、无法实现个性化知识发现的问题。人工智能环境下,基于Ontology和Agent的智能检索技术被广泛应用于图书馆的知识检索和发现系统。康奈尔大学图书馆的“My Library”系统能够预测用户的需求和兴趣,具有智能化的信息过滤和推送功能,实现了知识发现的智能化和知识服务的个性化[18]。此外,基于位置的检索和移动视觉检索也已经被应用于图书馆信息检索实践,大幅降低了用户的检索成本。

4.3 智能机器人

随着技术的发展,用户使用知识服务的方式和习惯也发生了改变,对服务的便捷性、即时性提出了更高的要求。过去,图书馆主要采取表单、邮件等方式提供参考咨询服务,这种服务方式效率较低,难以即时响应用户的需求,实时知识服务成为了必然的选择。国内的部分图书馆开始尝试用智能机器人替代馆员,例如清华大学的参考咨询机器人“小图”,以及深圳图书馆的“小图丁”[19]。人机交互和自然语言处理技术的发展,使得用户以自然语言表达的需求也能被机器人理解,并迅速得到回应。与真人馆员相比,机器人的响应速度更快,可以通过调用图书馆的知识库,实时地与读者进行交互,解决读者的需求。

4.4 基于知识图谱的知识组织

知识图谱使用“实体—关系—实体”模型描述数据,不仅能够表现各种客观存在的实体和知识,还能体现个体间的关联,从而形成语义网络,引入知识图谱可以挖掘知识之间的关联,将其组织成有一定内在逻辑、能够满足用户需求的知识体系[20]。自动抽取技术实现了准确地在大数据中抽取实体和关系,从而发现知识之间的关联,是智能化构建知识图谱的核心技术。具有可视化功能的本体编辑工具RelFinder、RDF-Gravity和LD-VOWL等正逐步完善,并应用于实践中,可见基于人工智能的知识图谱构建平台已成为现实,实现了智能化的知识组织。上海图书馆建成了用于编辑本体知识的本体服务中心OSC平台,包括检索中心和校验中心两部分,能够查询和校验本体[21]。此外,压缩感知技术和区块链的引入,能够解决知识图谱在数据传输和安全方面存在的隐患,进一步完善知识图谱技术。

5 基于人工智能的图书馆个性化知识服务框架

本研究结合人工智能和图情领域现有的相关研究成果,以及目前图书馆引入人工智能进行知识服务的实践,结合用户画像技术对读者需求的预测,构建了个性化的知识服务框架,包含数据采集层、画像应用层、知识生产层和个性化服务层,具体如图1所示。

5.1 用户数据和知识信息采集

用户数据的采集包括静态和动态的数据。静态数据又称显性数据,主要包括用户的性别、年龄、学历、专业、研究方向等基本属性;动态数据又称隐性数据,主要是指用户使用图书馆知识服务时的行为轨迹,以及对知识服务内容的偏好,如浏览历史、搜索记录、咨询信息等,这些数据需要清洗、过滤、整合之后才能加以利用[22]。初次接触和使用知识服务的新用户,其有效数据集中在静态的显性数据,关于用户行为的动态数据较少,而用户使用图书馆知识服务的过程,也是图书馆不断收集动态数据,完善用户画像的过程。

人工智能的发展使图书馆能够以更高的效率,采集规模更为庞大的用户数据。人机交互系统能够在与用户交互的过程中,记录用户的需求和反馈;情境感知和智能感知技术使得用户数据的来源更为广泛,通过可穿戴设备和传感器,能够实时识别入馆读者,并采集其行为信息,包括读者在图书馆的位置、移动路线、停留时长等,有效记录读者所处的位置和动态;视觉搜索、语义搜索等智能搜索技术的发展,有助于掌握用户的信息搜索习惯。

智能化的知识信息采集包括读者驱动采购、开放资源获取和资源的智能数字化。人工智能在情境感知、知识图谱、人机交互方面的技术优势,能够即时抓取读者信息并进行分析,帮助图书馆针对读者的兴趣和习惯,进一步优化采访工作。对于互联网上随处可见的开放资源,人工智能软件能够自动采集,及时更新,并构建专题数据库。此外,基于人工智能技术开发的智能机器人可以实现纸质资源的自动化扫描,并识别其中的文字和图片,完成纸质文献的数字化。

5.2 基于用户画像的个性化需求预测

通过用户画像的构建,可以对各类用户对于图书馆知识服务的个性化需求和偏好进行更加精准的分析和预测,为图书馆后续整合资源、设计个性化服务提供基础和依据。

画像生成模块基于采集到的用户数据对用户进行标签化,然后基于人工智能的知识图谱技术,对数据进行深度挖掘,将标签可视化,生成用户的个体画像。在个体画像绘制完成后,通过K-Means等聚类算法,从海量个体画像中抽取一定数量作为簇的中心,然后计算其他画像到中心的距离,根据计算结果,把每一个个体画像都归到一个类中,构建出不同用户群体的群体画像。

在服务设计方面,为了加强服务的针对性,需要保证所提供的服务和资源与用户群体之间具有较高的匹配度。图书馆可以引入协同过滤算法,包括基于内容的协同过滤,和基于用户的协同过滤。前者根据用户使用知识服务的行为和偏好,为其推荐相似的内容,即将用户对于知识服务的偏好作为向量,计算内容之间的相似度,然后找出相似的内容推荐给用户;后者通过比对用户的个体画像,找出与该用户的个人属性和行为偏好相似度较高的其他用户,然后根据其他用户的画像分析其对内容的偏好,从而预测该用户的偏好和需求,为其推送类似的资源和服务。此外,还可以引入KNN(K最近邻,K-Nearest Neighbor)分类算法,即如果与某个样本相似的k个样本都属于某一群体,则将该样本也可归入这一群体,然后计算资源和服务与每一个群体的匹配度,根据每一个用户群体的自身特性,为其适配相应的资源和服务[23],从而设计出个性化的知识服务产品。

5.3 基于人工智能的知识生产

人工智能可以实现智能化的知识发现、知识检索,以及自动化的知识组织,使知识生产更加高效。

人工智能能够实现智能化的知识发现。人工智能运用文本挖掘、机器学习、聚类分析、自然语言处理等技术,抓取和分析各类信息资源中所蕴含的知识内容,抽取其中有用的部分进行知识组织,形成知识库。

人工智能的跨库检索、智能检索、自然语言处理和神经网络技术应用于图书馆的信息检索系统,能够提高信息检索的准确率,并实现全文搜索和预测性搜索。同时,人工智能的应用和发展,使读者检索信息的方式更为多样化,得到的结果也更为丰富。过去,读者通过输入关键词在图书馆系统中检索,得到的结果通常为数字或纸质文本信息。人工智能使用户可以通过图片、语音等方式检索,并结合移动视觉检索和位置检索,得到更为精准和丰富的检索结果。

人工智能通过算法和技术的革新,可以基于知识自动抽取绘制知识图谱,实现知识组织的自动化,并可视化地展示知识之间的关联。此外,人工智能可以自动检索元数据,并创建MARC记录或MODS文件,达到理想的知识揭示和标引效果,解决过去各个图书馆之间由于没有制定统一和完善的元数据标准,无法实现统一的信息组织的问题[24]。

5.4 基于人工智能的个性化知识服务

基于人工智能所构建的个性化知识服务层,包括知识导航、知识推荐、知识共享和知识咨询四大功能模块。

知识导航能够整合多个知识库,并基于可视化知识图谱技术,将知识关联起来,实时展示知识之间的动态关系、学科热点和研究前沿,将知识体系清晰地呈现在用户眼前[25]。智能化的知识导航系统能够实现自助式的读者服务,帮助读者自主发现感兴趣的知识,全面把握知识脉络,同时也大幅减轻馆员的服务压力。

知识推荐是人工智能在图书馆信息服务中的典型应用场景,不需要用户主动提出明确的需求,可以自动根据用户画像和信息检索行为实时分析用户的信息需求,智能化地向用户推荐他们最需要、最感兴趣的资源,提升信息利用效率和用户满意度[26]。知识推荐系统主要运用人工智能的情境感知技术,实时感知读者所处的位置和动态,然后运用数据挖掘技术对海量用户数据进行处理,生成用户的个体画像和群体画像,分析用户的个性化需求和所处的具体场景,为其匹配嵌入式的知识服务,通过多种渠道向用户推送,并根据用户的行为和反馈实时调整。

知识共享模块包括用户之间,以及图书馆之间的知识共享。首先,图书馆鼓励用户通过分享、传递和交流,将个体的知识转化为个体的知识,实现协作共赢。基于人工智能技术进行数据挖掘,构建社会图谱,可以发现知识传播网络中的关键节点,从而构建知识共享社区,实现知识的社会化传播。其次,图书馆可以通过馆际协作,构建共享知识服务平台,有机整合各个成员馆所开发的知识产品,形成统一的数据格式和服务标准,实现资源和服务的共建共享。

知识咨询模块引入人工智能技术,可以实现针对简单咨询的自动问答,以及针对复杂需求的嵌入式服务。自动问答主要依靠智能机器人实现,能够通过语音识别和文字识别技术理解读者的问题,并自动匹配答案。智能机器人能够大幅减轻咨询馆员的工作压力,让馆员可以集中精力进行知识产品开发,提供深度服务。

6 人工智能应用于图书馆知识服务的展望和建议

6.1 加强多方协同,实现共建共享

为进一步发挥人工智能在图书馆知识服务中的作用,图书馆应在协同合作的基础上,实现知识资源的共建共享,以及知识服务的智能化、精准化和个性化。

首先,图书馆之间要加强沟通与合作,包括不同地区的图书馆,以及高校馆和公共馆之间的合作,成立专业性的图书馆联盟和区域图书馆联盟,乃至国际图书馆联盟,并基于大数据和人工智能技术,共同建设智能化的知识服务平台,结成基于人工智能技术的智慧图书馆联盟。其次,要加强图书馆与企业、政府之间的协同合作。图书馆的优势在于拥有大量文献资源以及用户数据,但技术力量比较薄弱,缺少相关的技术型人才,因此需要相关企业提供技术支持,为图书馆量身定做符合图书馆定位、能够向用户提供个性化和智能化服务的产品,如机器人馆员等。但是,由于图书馆本身具有非营利性,与企业追求经济利益的目标有天然的矛盾,因此还需要政府发挥协调作用,提供必要的资金支持,在企业和图书馆之间搭建统筹协作平台,帮助图书馆顺利引入人工智能技术,实现知识服务的智慧化升级。

6.2 用人工智能推动馆员队伍的发展

知识服务是一个动态的过程,知识服务团队也应该在人工智能的推动下积极探索和尝试,不断自我完善。人工智能将使知识服务团队向“小而精”的方向发展,即队伍规模缩小,人员素质提高。随着人工智能的发展,馆员的一些简单、重复,标准化程度高的人力劳动将被机器取代,例如服务咨询、资源上架、资源采编等,使馆员有精力从事更多的知识密集型工作,提供更深入的知识服务。同时,人工智能的机器学习、神经网络和深度学习等技术,需要有海量训练数据作准备,因此也会出现一些专业化程度更高的新兴岗位,如负责挖掘、整合图书馆海量用户数据的数据分析师,负责对机器进行训练的人工智能训练师等。未来,知识服务馆员应持续发挥主观能动性,积极学习和应用新的技术,在坚持用户为中心的基础上,进一步将人工智能融入知识服务实践。

6.3 健全法规和制度,引入生物识别技术保护用户隐私

海量用户信息的采集和挖掘,是图书馆分析用户画像,提供精准化服务的基础,但基于人工智能的用户信息挖掘,会导致信息安全和用户个人隐私面临风险。

为了防范数据泄露,保护用户隐私,政府和图书馆首先应进一步健全相关的法规和制度。欧盟制定了《通用数据保护法》,明确规定了企业和政府应如何使用用户信息和隐私数据,并对利用大数据获利的行为做了限制[27]。我国也应加强相关立法,特别是图书馆领域的立法,合理规范人工智能在图书馆的应用,明确用户隐私信息的边界,加强信息安全的管理。

此外,人工智能的生物识别技术,如指纹识别、人脸识别、语音识别等,已经逐步应用于图书馆领域,在有效采集必要的用户信息用于分析的同时,避免了传统身份认证和信息采集方式可能造成的数据泄露问题。例如,在采取指纹识别方式的时候,不需要完整获取和保存用户指纹信息,只需要进行矢量测量,然后用算法转换成一串数字,与读者的身份信息绑定[28]。当读者通过指纹识别获取知识服务时,图书馆可以有效识别读者身份,记录其行为数据,且不会泄露隐私信息。

7 结语

在“互联网+”时代,信息总量迅速增长,图书馆仅凭文献借阅等传统服务很难继续吸引用户,融入人工智能的新型知识服务能够满足读者的个性化需求,将成为图书馆新的服务方向。目前,人工智能领域的深度学习、自然语言识别和处理、人机交互、视觉搜索等技术已经广泛应用于图书馆知识服务,实现了信息检索和组织的智能化。但从总体发展进程来开,图书馆探索将人工智能应用于知识服务的实践尚处于起步阶段,如何使知识服务进一步普及,提高信息的传播和交流效率,推进服务的智能化、个性化和精准化,将是今后的研究重点。

猜你喜欢

检索个性化智能化
智能化战争多维透视
大型公共建筑智能化系统造价控制
坚持个性化的写作
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
基于多尺度投影的相似颅骨检索
基于“物联网+”的智能化站所初探
上汽大通:C2B个性化定制未来
同桌宝贝
石油石化演进智能化