APP下载

基于用户情境的数字图书馆平台推荐系统框架研究

2021-05-12李建苗

图书馆研究与工作 2021年5期
关键词:个性化图书馆数字

汪 圳 李建苗 李 东

(1.长安大学图书馆 陕西西安 710064)

(2.西安信息职业大学数字经济管理学院 陕西西安 710125)

1 引言

在信息爆炸的时代,高校用户并不缺少数字化的信息资源,而是无法高效率地获取最需要的知识。越来越多的高校用户需要个性化定制信息推送服务。新时代的图书馆阅读推广服务,应同时考虑优质的内容和用户的知识需求。传统的图书推荐往往是基于对图书内容方面的考虑,但对于图书馆用户,除了借阅信息,其他维度的信息获取及分析还远远不够。用户兴趣爱好和学术背景千差万别,因此,传统的推荐策略和简单的借阅信息早已不能满足图书馆阅读推广服务的需要。基于此,在推进“资源找人”的个性化服务以改变阅读推广中的被动困境时,应充分考虑用户所处的情境要素对用户阅读偏好产生的实时性影响。

2 相关研究综述

情境可以全面准确地描述实体的所有信息,包括实体本身、应用程序及复杂的网络关系等[1]。用户情境作为情境信息的一个维度,主要包含了用户的基本信息、行为信息、时空信息,是多维度情境信息的集合。根据情境信息可以进一步挖掘用户内心的动机、需求及偏好等[2]。面对不同的研究对象时会使用不同的情境要素分类方法,情境要素维度的划分会影响系统识别用户情境的效率[3]。本文参考的相关用户情境的研究如下:Dey认为用户情境要素包括用户基本信息、心理特征、社会地位等多方面的要素信息[1];汪圳等人在研究面向科研用户的数字图书馆个性化知识服务中,从四个维度全景式地描述了科研情境,即科研人员在科研过程中研究科研对象来完成科研任务[4];邓仲华等人认为地学领域的科研用户情境包括个人信息、信息行为、处理资源、接受服务、时间历史及社会关系六个维度的信息[5];郭顺利等人在研究移动图书馆用户的需求时,将图书馆用户情境划分为用户的位置信息、基本信息和社会网络信息三个方面[6]。

近些年来,随着推荐策略研究愈加得到图书馆的重视,一些高校的数字图书馆引入了个性化信息服务。杨永权[7]介绍了美国具有代表性的大学图书馆的个性化推荐系统:华盛顿大学图书馆“My Gateway”系统、康奈尔大学图书馆“MyLibrary@Cornell”系统及北卡罗莱纳州立大学“My Library@LANL”系统等。在国内,具有代表性的图书馆个性化服务系统有中国人民大学数字图书馆的个性化推荐系统、深圳图书馆开发的“图书馆自动化集成系统”[8]以及浙江大学图书馆的MyLibrary系统[9]。尽管部分大学数字图书馆引进的个性化服务效果还不太明显,但都是对信息时代如何提高知识服务质量的积极探索。

综上所述, 目前高校图书馆在引入个性化服务领域还处于探索阶段,诸多数字图书馆的个性化服务采用了热门检索词或基于用户基本信息等老旧的方式,导致知识推送服务的质量还不太高。本文引入情境感知技术,同时考虑高校大学生群体在图书馆平台产生的行为信息及高校教务系统的课程信息,提出一种融入用户情境的数字图书馆平台推荐系统框架。

3 基于用户情境的数字图书馆知识推送服务框架

数字图书馆面向大学生群体进行个性化知识服务时,不仅要考虑高质量的知识内容,还要考虑用户所处的情境产生的知识需求。只有在恰当的时机推送用户最需要的知识,才能提高个性化服务的质量。

本研究提出了一种融入用户多维度信息的数字图书馆推荐系统框架,如图1所示,从左至右分别是用户情境、云端大数据处理中心及用户定制化服务。每个模块实现的功能分别为用户情境模型的构建、个性化推荐技术的支撑及用户的定制化服务。

图1 融入用户情境的数字图书馆平台推荐系统框架

3.1 用户情境的要素及模型构建

数字图书馆向学生群体进行信息资源推荐时,需要充分考虑在校大学生的实际需求, 情境可以较全面地描述大学生的状态,进而推理获取大学生群体的知识需求。

构建在校大学生的情境模型首先应对用户的情境要素进行抽取与分析。在数字图书馆应用环境中,考虑用户情境的3个维度的信息:用户基本特征信息(U-basic)、数字图书馆用户行为信息(U-lib)、高校教务系统信息(U-edu)。大学生群体的用户情境表示为:Context={ID,U-basic,Ulib,U-edu}。其中,U-basic={ID,Sex,Age, NativeP};U-lib={LB,LS,LD,LR};U-edu={ES,EC,Ecur,EG ,ET}。

用户情境要素的含义见表1。

组成数字图书馆用户情境的三个维度要素之间的交互关系如图2所示。本文构建了用户情境要素的交互模型。该模型能够准确识别数字图书馆用户所处的动态情境,从而推理用户的兴趣偏好,这是个性化服务的前提。

3.2 云端大数据处理中心

随着数字图书馆资源的急剧增加,大量的数据信息会影响目标用户对资源的识别和有效的获取。如何匹配数字图书馆优质的资源与用户的需求需要不同的推荐策略来实现。数字图书馆云端大数据处理平台会存储大量的指标数据。这些精细化、碎片化的数据信息能够反映用户偏好,将这些数据进行筛检处理,可以使用户需求更容易被系统理解,进而提供更符合用户需求的知识资源。

表1 用户情境要素的含义和说明

图2 情境要素交互关系图

云端大数据处理平台主要包括四种推荐策略:基于热门书目的推荐、基于用户相似度的资源推荐、基于相关课程信息的资源推荐及基于相似情境的资源推荐。数字图书馆知识推荐模型如图3所示。

3.2.1 基于热门书目的推荐

图3 数字图书馆资源推荐模型

知识资源个体存在差异,仅根据用户需求决定的推荐方案会存在推荐资源质量不高的情况,所以评判知识库内知识资源的质量也是推荐流程中非常重要的过程。本文在参考馆藏资源评价指标的相关研究[10-12]后,构建了资源评估体系,从资源特征、资源推荐热度、资源活跃度、新书上架、评价反馈5个方面来构建评价指标,最后应用皮尔森线性相关分析方法,搭建知识资源受欢迎程度模型。云端大数据处理中心根据知识资源的模型对用户的推荐方案进行筛选,在此基础上产生资源推荐集合W。

3.2.2 基于用户相似度的资源推荐

目标用户对数字图书馆资源的偏好受其所处情境的影响,这些情境要素也会对相似用户群体产生类似的影响。根据社会从众的心理机制,目标用户的兴趣偏好倾向于类似用户群,因此可以根据相似用户的阅读喜好为目标用户进行资源推荐。

相似性计算方法包括余弦相似性、皮尔森相似性和改进的余弦相似性三种。由于改进的余弦相似性克服了前两种算法的缺点,因此,本文选择改进的余弦相似性计算方法计算目标用户与已知用户群之间的相似性。

用户相似性计算表达式为:

其中,Ua为目标用户,Ui为系统中已有用户群中的第i个用户。

最后选择相似性高的N个用户组成相似用户集AUa,将其偏好定义为目标用户的偏好,在此基础上确定数字图书馆资源推荐集X。

3.2.3 基于课程相关的资源推荐

教务系统主要包括教师信息、学生信息和课程信息。不同专业背景的学生涉及到的课程信息包含不同的教材、资源与任课教师信息,通过对课程与知识资源、教师与知识资源的分析可以确定学生用户与知识资源的关联关系。云端大数据处理中心根据用户所处的专业、学习阶段等信息,为用户关联数字图书馆相关度高的资源集合Y。

3.2.4 基于相似情境的资源推荐

用户在特定的情境下产生知识需求,当数字图书馆提供的资源满足用户时,用户的查询信息和数字图书馆资源应用情境被管理系统存储。本文定义的数字图书馆知识模型(ILD)包括数字图书馆资源应用情境(Context(H))、数字图书馆资源载体(Carrier)和数字图书馆资源内容(Content)三部分。

即数字图书馆知识模型ILD={Context(H),Carrier, Content}。

当用户i情境信息较完整时,系统获取用户i的当前情境Context(C)i,与数字图书馆知识j的应用情境Context(H)j做相似性计算,即sin{Context(H)j,Context(C)i},在此基础上选取相似度最高的前N条知识资源组成用户潜在感兴趣资源集合Z推荐给用户。

在集成用户情境的数字图书馆知识管理平台中,用户在不同情境下产生了不同的知识需求,随着数字图书馆知识应用情境的不断扩充,系统能够保证更好的自行适应性。

3.3 我的空间之用户服务

定制化应用层面以提升优质馆藏资源的推送及用户线上体验为目标,期望提升数字图书馆资源的利用率。本文在上节分别得到了基于热门书目、用户相似度、课程相关及情境相似的数字图书馆资源集合。接下来,本文将根据图书馆用户的推荐情境分别设计不同的定制化应用,包括个人课程、个性化推荐、定制化信息检索及主题书架。

3.3.1 个人课程

(1)课程相关

根据用户课程名等信息,通过拆分分词,形成课程相关推荐,为用户关联馆藏资源,并将纸质文献与电子资源匹配,图书相应的新书、热门等标签就会清晰易见,将图书馆资源推送到相应课程中,形成课程与馆藏资源的匹配。

(2)专业精选

精选课程教学推荐、课程大纲或教师推荐等信息,提供包括推荐图书、课程网站、相关课件、其他资料等形式的定制化资源。专业精选推荐的图书将与馆藏图书进行匹配,并展现馆藏状态、电子书、新书、热门、推荐、教参等不同标签,通过图书馆馆藏辅助使得用户能够对相应课程进行深入学习。

相关课件和其他资料可由馆员自主上传到相应的课程中,用户可在该课程模块中下载学习,集聚课程的馆藏资源和电子教参资源,创新支撑线上教学。

3.3.2 个性化推荐

(1)热门推荐。在热门资源的基础上,根据用户设定的阅读偏好类别,进一步向用户展示个性化的热门资源,提高资源利用率。

(2)新书推荐。在新书资源的基础上,根据用户设定的阅读偏好类别,进一步向用户展示个性化的热门资源,提高资源利用率。

(3)智慧推荐。个性化推荐如果一味以用户需求为驱动(小到信息检索结果,大到资源宏观的优化配置)就会容易使用户陷入习惯性为兴趣所导、忽略更广阔信息资源的信息茧房,从而产生信息盲区。智慧推荐,即用云计算分析、学习用户的海量行为数据,如点击、搜索、收藏等,获取用户个人和群体的情境状态,综合考虑冷门资源、用户基础信息、专业背景等信息,进行权重排序,从而为用户提供智慧推荐。智慧推荐根据多维度的用户个人情境状态和相同资源借阅者、相同资源收藏者、相同搜索词使用者的群体情境状态,结合借还数据、点击数据、评分、收藏数据等,优化算法,增加用户与资源的偶遇率,从而激活睡眠用户,降低用户的信息茧房风险,进一步提升图书馆的资源使用效率。

3.3.3 定制化信息检索

(1)保存常用图书搜索词,设置个性化搜索偏好。可保存常用搜索词记录,方便多次检索,尤其为使用高级检索的用户提供便利。可设置出版时间范围、期望的出版社(数量可以设置)、期望的著者(数量可以设置),调整权重大小;还可设置搜索结果数,从而进一步精确结果范围,提高检索效率,满足深度检索需求。

(2)提供多种结果排序方式。提供多种结果排序方式,包括默认排序方式(按检索条件的符合程度依次排列)、按出版时间排列。

(3)搜索外部资源,并提供外部搜索结果的访问入口。针对保存的图书搜索词,在搜索馆藏之外,同时搜索图书馆的部分数据库资源,并提供访问入口,满足用户的阅读和科研学习需求。

3.3.4 主题书架

(1)新生入馆。可根据调查问卷或教务信息,按新生的籍贯、学习水平、兴趣方向自动生成主题书架,展示介绍本地、本校历史,优势专业,相关课程教师,课程简介等相关资源。

(2)考试专区。可根据调查问卷或教务信息,了解用户近期的考试需求,如英语四六级考试、研究生考试、公务员考试以及各种职业技能考试,自动生成主题书架,展示相关教辅、考试指南类资源。

(3)就业专区。可根据调查问卷,了解有就业需求的用户信息,自动生成主题书架,展示就业前景、往年毕业生就业报告书、产业现状、就职指南等相关资源。

(4)特色收藏。用户可对符合自己兴趣爱好或学习需求的图书或其他资源进行收藏,并自定义收藏夹名称(即特色收藏)。收藏夹内可嵌套新的收藏,层层分级,归集偏好资源,打造用户个人系统性的阅读和学习体系。在对接图书馆相关电子书镜像版或图书链接的情况下,支持搜索、在线查看和添加“特色收藏”,以便于学习需要和快速访问。

(5)我的数据库。展示全馆数据库,并提供简要介绍和访问入口。支持关键词搜索数据库和分类展示,用户可添加自己常用的数据库以便于快捷访问。

4 结语

情境要素的引入能有效匹配数字图书馆资源与用户需求。本文从用户基本信息、数字图书馆用户行为要素和高校教务系统要素三个维度构建了用户的情境模型,提出了一种融入用户情境的数字图书馆平台推荐系统框架,并分析了各组成模块的关键技术、实现的功能及模块间的交互关系。

猜你喜欢

个性化图书馆数字
一种融合PageRank和PersonalRank的多层个性化推荐算法
坚持个性化的写作
图书馆
答数字
上汽大通:C2B个性化定制未来
数字看G20
同桌宝贝
去图书馆
成双成对
数字变变变