“图书馆学五定律”视角下的情境感知推荐系统研究
2022-05-07汪圳
汪 圳
(长安大学图书馆,陕西西安 710064)
1 引言
著名图书馆学家阮冈纳赞的《图书馆学五定律》(Five Laws of Library Science)一书系统阐述了图书馆学思想,出版后对图书馆界产生巨大影响,逐渐成为图书馆人的指路明灯。不仅影响着图书馆事业的发展,而且指导着现代图书馆的实践,至今仍然指引着图书馆未来发展的方向。“图书馆学五定律”自1931年诞生至今,随着移动互联网的普及和信息技术在图书馆领域的应用,五定律中“读者”与“图书”的概念已经被“公民”“用户”和“资源”“信息”“知识”“情报”等概念所代替。
随着“大数据(Big Data)”时代的发展,互联网随时产生大量的信息资源和新的知识需求,推荐系统平台以海量信息的组织与整合为特点,推荐结果的冗余问题依旧存在,用户面临的“信息过载(Information Overloading)”问题愈加严重,在这种背景下,如何实现用户与信息资源的智能匹配和个性化服务,成为推荐系统发展中面对的一个重要问题。情境感知(Context Awareness)技术开拓了个性化推荐研究的新方向,电子商务[1]、图书馆[2]、商业旅游[3]及智慧医疗[4]等系统逐渐引入情境信息,围绕情境感知系统的构建展开了研究。
2 相关研究综述
1994年,Schilit将情境定义为:用户、位置及实体之间的识别和变化[5],随着情境感知概念的提出,情境感知技术迅速被应用在个性化推荐领域。最早关于情境感知推荐系统(Context-Aware Recommender Systems,CARS)的研究可追溯至2001年,Herlocker和Konstan将儿童偏好的书籍作为任务相关的情境,将情境要素融入推荐系统,过滤掉相关的书籍信息,提高了推荐结果的质量[6];Mallat N 等论证了情境信息对用户的行为偏好会产生影响,阐明了推荐系统引入情境要素的重要性[7];Adomavicius G指出情境感知推荐系统的核心是将传统的二维推荐提升至多维推荐,将时空、环境、系统等全面的情境信息融入个性化推荐系统[8],同时提出了三种情境信息融入推荐系统的基本模式:情境预过滤、情境后过滤和情境建模[9],并且设计了基于情境驱动的搜索和基于情境的偏好推理与评估推荐系统[10];研究表明融入情境信息的推荐算法所产生的推荐结果,可以提高用户的体验[11][12];顾君忠认为完整的情境感知推荐系统包括情境信息的获取、表示、推理、使用及存储五个部分[13];陈媛嫄等概括了情境感知推荐系统的三个特点:获取实体的情境信息、推理系统的状态及挖掘用户行为偏好[14]。
综上所述,国内外图书馆界关于情境感知推荐服务的研究蓬勃发展,将情境要素引入推荐系统是一新兴的研究方向和必然的趋势[15]。然而由于研究的领域、对象及背景等多方面的差异,情境感知推荐系统的内涵同情境一样,也没有形成广泛认可的定义;另外大多数研究停留在情境要素的分类、获取及融入情境信息的推荐策略等方面,真正意义上的应用实践并不多见。表面上看“图书馆学五定律”通俗易懂,却因其顺应历史发展、揭示真知、言简意赅而广受业界认可[16],至今仍然指引着现代图书馆事业理论与实践的发展。本文期望透过“图书馆学五定律”视角,对情境感知推荐系统展开关联性的研究,分析和探讨情境感知推荐系统的内涵及组成要素,进而揭示五定律对情境感知推荐系统未来发展的指导作用。
3 透过“图书馆学五定律”内涵的情境感知推荐系统分析
阮冈纳赞“图书馆学五定律”的内容言简意赅:“书是为了用的”;“每个读者有其书”;“每本书有其读者”;“节约读者的时间”;“图书馆是一个生长着的有机体”。
3.1 书是为了用的:情境感知推荐系统的出发点
第一定律——“书是为了用的”,这是图书馆学的基本定律,是图书馆开展服务的出发点和目的,指出了图书馆的主要职能不是丰富馆藏资源,更重要的是让图书得到充分使用,实现“为人找书”“为书找人”及“节约用户时间”的三个目标。
情境感知推荐系统的目标就是完成用户与信息的智能匹配,让知识资源产生价值,与第一定律的内涵是一致的。回顾数字图书馆的OPAC系统,用户在明确知道自己的兴趣偏好,通过导航目录、关键词检索等查询方式获取需求的知识,这一平台以用户为主,虽然实现了“为人找书”“节约用户”的时间两个目标,却忽视了“为书找人”的命题[17];而情境感知推荐系统首先是以五定律中包含的三个关键词——读者、书、图书馆(设备、空间及馆员等)为出发点,获取包括用户、知识资源及图书馆系统三个方面的信息,然后基于用户行为、大数据、推荐算法及人工智能等技术,最终实现“为人找书”“为书找人”及“节约用户时间”的目标。
3.2 每个读者有其书:用户情境
第二定律——“每个读者有其书”,由此很容易联想到“读者要有什么样的书?”的疑问[18],用户情境是推理用户需要什么样书的理论依据,所谓观其言、察其行、知其底,方识其人,这是知识集成与个性化知识服务的基础。
图书馆的知识服务并非图书馆单方发起的活动,用户是其中至关重要的参与者[19],由于在不同的任务情境下,用户的角色千差万别,导致对知识的需求有所不同[20],用户情境作为情境的一个维度,能描述用户的行为信息,反映其时间和地点等状态的信息,从而推理用户内心的动机、兴趣偏好等[21],用户情境化挖掘的实质是将用户偏好信息与情境信息整合在同一个模型中[22],研究人员根据不同的研究对象使用不同的情境要素分类标准[23],在情境要素判定规则的指导下,确定研究对象的信息要素[24]。虽然用户情境的内涵及要素分类等方面在学界没达成共识,但用户情境是情境感知推荐系统中不可或缺的部分,其数据来源主要包括两个方面,第一,用户的基本信息,例如籍贯、年龄及专业背景等信息;第二,用户的情境信息,例如用户的查询与借阅记录、用户的各种职业技能考试的需求、当前的科研任务以及时间地点等情境信息。用户情境的信息分类框架如图1。
图1 用户情境信息的类别框架
用户情境信息的获取方式有显性与隐性获取两种方法。显性获取方法中,通过设计简洁的问卷直接获取用户的偏好信息,这种方式有两个缺点,一方面,面向用户的程序操作复杂;另一方面,对调查人员而言,用户偏好的准确程度与用户配合、问卷设计有关[25]。隐性获取方法中,系统基于用户的基本信息与行为信息来推断兴趣信息。用户所处的当前情境信息则可以通过网站接口、终端及传感器等方式获取[26]。
3.3 每本书有其读者:知识情境
第三定律——“每本书有其读者”,这同样会引发“书适合什么样的读者?”的疑问[27]。知识资源是用户需求与图书馆进行知识服务的内容载体,图书馆在传统的阅读推广方面以知识内容为主体,忽略了用户的心理状态和兴趣偏好,缺乏对用户所处情境的考虑。
刘志国等认为图书馆为用户提供的服务应该是知识情境[28],汪圳等在研究科研用户的知识推荐时,借鉴了知识管理领域知识情境的概念[29],分析了应用情境、知识载体、知识内容三个要素及其属性关系,构建了数字图书馆的知识模型:用户在特定情境(Context(H))下使用包含特定知识内容(Content)的知识载体(Carrier)[30]。图书馆知识模型LKM={Context(H),Content,Carrier}可以理解为,用户在期末考试借阅包含考试内容的书籍;科研用户进行某科研时查看或者下载包含相关研究对象的文献。
本文借鉴潘旭伟提出的集成情境的知识管理模型[31],构建的图书馆知识应用情境包括知识载体、知识内容、用户情境及三者之间的关系4个组成部分,融合了用户情境的知识应用情境集成过程如图2所示。
图2 图书馆知识应用情境的模型
该模型中,用户在特定的情境下查询知识,当图书馆系统提供的知识资源支持用户的需求,将知识应用情境提交至情境管理系统。
3.4 节约读者的时间:服务情景
第四定律——“节约读者的时间”,这主要强调用户获取知识资源的效率,服务情境主要解决用户与知识资源的智能匹配,实现节约读者的时间及提高图书馆知识服务的质量,用户选择了图书馆提供的知识服务的过程被视为该次服务所处的服务情境。服务情境框架如图3所示。
图3 服务情境框架
在服务情境框架中,单一匹配策略无法实现节约读者时间的目标,因此用户需求与知识资源的匹配需要考虑多种推荐策略来实现。情境匹配中心包括三种推荐策略:基于热门资源的推荐、基于用户情境及知识情境的推荐。
用户在数字图书馆平台没有产生任何信息的情况下被视为游客用户,因此数字图书馆平台需要对知识资源进行质量评判,对用户进行热门资源或新资源上架的推荐,通过知识资源的质量评价体系,应用皮尔森(Person)线性相关分析法,构建知识资源的热门程度模型,最后根据知识资源的模型筛选用户可能感兴趣的资源集合W。该推荐策略可以弥补仅根据用户需求产生的推荐资源单一而导致质量不高的问题。
在数字图书馆系统新注册的用户缺少历史信息,随着用户的使用,系统会获取用户更多的行为及任务等信息。当系统仅获取了用户注册时的基本信息,可通过相似性匹配算法查找目标用户的相似用户群,识别用户的需求,据此产生推荐集合X;随着用户与系统的交互,用户的情境信息逐渐增加,数字图书馆平台可以根据其基本信息及情境信息建立用户的偏好模型,通过分析用户对知识资源的需求度产生资源集合Y。
在集成了用户情境的数字图书馆知识管理平台,随着知识应用情境的不断扩充,提取用户情境模型与知识应用情境模型的多维信息的属性值,通过情境相似性计算集成用户需求的知识资源,产生用户相似情境的资源集合Z。最终将集成的知识资源列表推送至图书馆人机交互界面,便于用户的浏览、阅读及收藏等。
3.5 图书馆是一个生长着的有机体:技术层面的情境感知推荐系统
第五定律——“图书馆是一个生长着的有机体”,这将图书馆看作一个不断生长的有机体。情境感知推荐领域相关的研究在技术层面为图书馆的发展补充新鲜的养分,情境感知推荐系统可以在技术层面实现:①用户所处情境信息的获取及推理(为人找书的前提);②高质量的知识情境服务(为书找人);③推荐结果信息过载的降低(节约用户获取需求知识的时间),基于情境的双向推荐策略可以实现读者与资源的智能匹配,是“每个读者有其书”“每本书有其读者”及“节省读者的时间”这三条定律能够真正落地的技术之一。全景式的情境感知推荐系统框架如图4所示。
图4 情境感知推荐系统框架
该框架中,用户情境是“人找书”的理论基础,相比传统的用户特征信息,用户情境是用户基本信息与情境信息的整合,用户情境是推断“读者要有什么样的书?”的理论依据;知识情境是“资源寻人”的前提,知识情境可以理解为集成了情境信息的知识,融入了情境要素的知识资源可以有效解决“书适合怎么样的读者?”的问题;服务情境通过多种推荐策略可以实现用户情境与知识情境的智能匹配,提高了用户获取资源的效率及知识资源的使用率,从用户情境与知识情境两个方向进行资源推送,进而实现“节约读者的时间”的目标。
4 结语
本文以情境感知推荐系统为研究对象,透过“图书馆学五定律”的视角,分析了用户情境、知识情境、服务情境及情境匹配等情境感知推荐系统的要素,指出情境感知在技术层面可以实现“每个读者有其书”“每本书有其读者”及“节省读者的时间”三个目标。显然,情境感知推荐系统在技术层面上的研究丰富和延伸了“图书馆学五定律”的内涵;反之,“图书馆学五定律”又从理论层面上指导着图书馆情境感知系统的理论发展及实践应用。