数字图书馆联盟中基于情境感知的个性化推荐服务研究
2014-01-16周玲元段隆振
●周玲元,段隆振
(1.南昌大学信息工程学院,南昌330063;2.南昌航空大学经济管理学院,南昌330063)
数字图书馆联盟中基于情境感知的个性化推荐服务研究
●周玲元1,2,段隆振1
(1.南昌大学信息工程学院,南昌330063;2.南昌航空大学经济管理学院,南昌330063)
个性化推荐;情境感知;数字图书馆联盟;本体
数字图书馆联盟情境感知服务是图书馆在数字化、移动网络环境下面临的一个崭新课题。本文对情境感知推荐进行了系统研究,探讨了移动环境下情境感知计算流程,给出了基于本体的用户情境偏好模型,在此基础上提出了数字图书馆联盟情境感知推荐模型,并对功能模块进行了阐述,为数字图书馆联盟个性化推荐应用提供了理论参考。
1 引言
数字图书馆联盟是对传统图书馆联盟功能的进一步继承与深化,[1]以实现资源共享、互惠互利为目的而组织起来的、受共同认可的协议和合同制约的图书馆联合体。其目的是通过数字图书馆联盟门户网站的形式将分布在不同信息源的内容整合在一起集中实现统一检索、推送服务等网络服务。[2,3]
随着数字资源的指数级增长,出现了“信息超载”问题,因此,如何集成数字图书馆联盟的服务,为不同用户提供个性化服务,是当前数字图书馆联盟研究的热点问题。焦玉英[4]等提出了基于用户个性化需求的数据图书馆集成模型;牛亚真、祝忠明[5]对个性化服务中跨系统的用户建模方法进行了系统研究,总结归纳跨系统的用户建模方法;潘家武[6]等提出基于领域本体的数字图书馆跨系统用户模型。沈嵘[7]提出数字图书馆联盟的技术实现方案,利用企业技术联盟引入现代图书馆数字化建设中,解决数字图书馆联盟的信息资源共享问题。周明明[8]系统分析了“深圳文献港”数字图书馆联盟的数字门户,对区域数字图书馆联盟的门户功能进行研究。为提高个性化服务的准确性,胡慕海[9]、袁静[10]、潘旭伟[11,12]等分别提出基于情境感知的自适应个性化推荐服务方案。
目前对数字图书馆联盟的研究主要集中在两方面:一是数字图书馆联盟机制构建,主要研究对象为数字图书馆联盟机制、组织结构及功能、业务范围和版权保护等;二是数字图书馆个性化服务技术改进方面,主要研究对象为单个数字图书馆的个性化搜索和个性化推荐技术。对中国知网、万方论文检索发现国内还没有学者对数字图书馆联盟中的情境感知推荐服务进行研究。鉴于以上情况,笔者认为当前的数字图书馆联盟缺乏有效的情境感知能力,从而无法保证个性化服务质量。本文系统研究了情境感知及个性化推荐技术,利用语义web描述语言OWL用户情境偏好本体模型,在此基础上给出了面向数字图书馆联盟网络门户的情境感知推荐服务机制,并对推荐机制的核心模块进行了详细论述。
2 情境感知与个性化推荐技术
2.1 情境感知
在数字图书馆推荐系统领域,人们往往只关注“用户—项目”之间的关联关系,而较少考虑它们所处的情境(如时间、位置、周围人员、情绪、活动状态、网络条件等)。但是,仅仅依靠“用户—项目”二元关系并不能生成有效推荐。[13]例如,有的用户喜欢在“早上”而不是“中午”被推荐合适的新闻信息,有的用户在“心情愉悦”时更愿意被推荐一些轻松的杂志。情境感知推荐系统通过将情境信息引入推荐系统,以进一步提高推荐精确度和用户满意度,兼具“普适计算”和“个性化”两种优势,逐渐成为推荐系统研究领域最为活跃的分支之一,同时对于提高数字图书馆联盟的服务质量具有重要的理论及社会价值。
情境感知计算研究内容主要有:(1)情境获取,处于系统的数据收集阶段,主要方式有显示获取、隐式获取和推理获取三种;(2)情境建模,形式化表示情境模型,主要方法有面向对象模型、图模型、标记语言模型和本体模型;(3)情境用户偏好提取,将情境信息引入用户偏好建模,主要分为定性分析、定量分析两大类提取技术。
2.2 个性化推荐
为有效地解决“信息超载”问题,人们提出“个性化服务”的概念。推荐系统作为个性化服务研究领域的重要分支,帮助用户从大量数据中发现其可能感兴趣的项目,并生成个性化推荐以满足个性化需求。其中应用最为成功的是协同过滤推荐技术,但是该推荐技术依然存在着原始数据稀疏性、实时性、精确性等问题,特别是在移动网络情况下,用户所处的环境(如网络状况、位置等)易变,而这些因素影响用户需求的表达,使得上述问题更加严重。为此,国内外相关学者及研究机构对情境感知推荐系统理论、方法及应用展开了深入研究工作。相对而言,目前我国主要关注的还是非情境化的推荐系统研究。
随着3G网络的发展,移动商务越来越普及,基于情境感知技术的移动商务在时间和位置上拥有更高的自由度。情景感知推荐服务是未来移动信息服务的一个方向,它是不同产业融合的产物,能够有效的满足人们的个性化需求,将使人们的生活更加便利。因此移动环境下个性化推荐中融入情境感知技术的研究具有现实的理论意义和应用价值。
3 数字图书馆联盟中基于情境感知的个性化推荐服务
3.1 跨系统用户情境兴趣建模
考虑到用户偏好和需求会随着时间、情境发生变化,本文将用户情境划分为:用户情境、时间情境、设备情境和数字图书馆情境。其中,用户情境包括用户的个人信息、兴趣偏好等,时间情境包括用户登录退出系统的时间、数据停留等,设备情境包括用户终端显示设备、网络状况等,数字图书馆情境为描述系统任务对应的领域本体概念和数字图书馆联盟各馆情况数据。本体与情境之间的联系用元组H={O,C,R}来表示,其中,O表示本体的集合,C表示情境的集合,R表示本体与情境信息之间的关系。本体集合O={O1, O2,O3…},其中O1,O2,O3…等表示本体。情境集合C={C1,C2,C3…},其中C1,C2,C3…等表示情境信息。关系集合R={r1,r2,r3…},其中r1,r2,r3…表示情境信息直接的关系。在用户使用数字图书馆联盟门户的过程中,所需感知的用户信息主要包括登录、退出系统的时间、访问某场景的次数及在联盟系统上驻留的时间等。下面以此为例,具体说明如何用本体来表示情境信息。具体程序段如下:
上述程序段中,OWL描述为用户对数字图书馆联盟门户的访问情境记录,本文标记为一个本体类ⅤisitSZTSGLMSystem,它的属性描述了用户访问数字图书馆联盟门户过程中感知的情境信息,其中一阶谓词逻辑是情境信息的形式化表示,上述程序中用情境实例的方式表述一阶谓词逻辑形式。同时对数字图书馆的资源进行科学组织,建立数字资源领域本体,在此基础上构建用户偏好模型的空间向量表示。本文应用文献办法构建用户兴趣模型,[14]表示为U={(,),(,),…,(,)};表达式中c为数字图书馆中数字资源领域本体的概念单元,w为权重,表示用户对特征项C的兴趣程度,对于用户的n个兴趣,都有相应的权重与之对应。为了减少系统在计算上的开销,本文中选取m个权重较大的特征项组成特征向量表示用户的兴趣模型,如U={(,),(,),…,(,)}。
为实现跨系统的用户模型,本文提出结合数字资源领域本体的空间向量偏好模型表示方法,建模过程包括用户情境偏好概念的生成和用户兴趣度的计算,用户偏好模型中权重越大表明用户兴趣度越大。在数字图书馆联盟系统中,用户模型的构建步骤如下:(1)感知用户情境以及浏览行为,获取用户建模的数据;(2)参考数字图书馆联盟系统的领域本体,从用户访问的情境中提取用户兴趣特征项,即用户兴趣概念;(3)通过数字资源与兴趣概念的语义匹配算法计算用户模型中概念权重。
3.2 数字图书馆联盟情境感知推荐模型
数字图书馆联盟情境感知推荐模型不仅需要实现用户的无缝跨馆访问需求,而且需要满足移动用户动态情境环境下推荐服务实时性、准确性需求。推荐模型完成一个用户的个性化需求的大致流程为:用户情境知识获取、用户情境偏好提取、数字资源本体构建、用户情境偏好与数字资源匹配、发送检索结果,更新用户情境模型等任务。因此本文将数字图书馆联盟情境感知推荐模型分为五个模块:用户情境信息的获取与更新合成模块、数字资源本体构建模块、用户情境偏好模型构建模块、数字信息语义匹配模块、基于情境感知的数字图书馆联盟推荐服务模块(如图示)。
(1)用户情境信息的获取与更新合成。情境信息获取模块负责从分布广泛的传感器、工作流引擎、3G手机等终端设备中采集原始情境并进行初步处理,使情境感知与实际使用相分离,该模块的主要功能有情境的建模、过滤、推断和存储,其目标是通过对原始情境进行过滤、推断后得到各应用所需的高层情境。
(2)数字资源本体构建。根据数字图书馆联盟实际使用需要,构建数字资源本体,它分为两层:上层本体和数字资源领域本体。[15]上层本体有情境信息涉及的各种实体概念抽象而成,这些概念还可以各自细化成子类别;领域本体包含数字图书馆联盟应用中数字资源领域的具体子类(图书类别、出版社、作者等)。
图数字图书馆联盟情境感知推荐模型
(3)用户情境偏好模型。上文3.1节重点介绍了如果构建情境偏好模型,主要是对捕获的情境信息进行分析并根据主题内容进行分类,利用余弦相似度公式计算情境信息与领域本体中概念权重,权重越高表明用户兴趣越大,以产生模型实例进而描述用户情境偏好。
(4)数字信息语义匹配模块。该模块通过匹配算法确定数字资源与特定情境下用户偏好之间的匹配相似度,算法过程首先是将数字资源领域本体和用户情境偏好本体中的概念与实例都映射到通用本体概念结构树中,然后在扩展的本体概念间计算两者的匹配相似度,进而得到基于情境感知的个性化数字资源匹配结果集。
(5)数字资源情境感知推荐。结合用户情境模型对数字信息语义匹配模块产生的结果集进行重新排序等个性化处理操作,推荐给用户以及具有相同或相似情境需求的其他用户,实现用户之间的协同过滤推荐。同时根据用户的反馈及时更新情境模型,实现下一轮的个性化推荐。
[1]李富玲,卢振波.数字图书馆联盟研究[J].大学图书馆学报,2005(2):11-15.
[2]陈定权,等.数字图书馆门户的个性化[J].新世纪图书馆,2009(2):30-32.
[3]ShiriA,Chase-KruszewskiS.Knowledge organization systems in North American digital library collections[J].Program:Electronic Library andⅠnformation Systems,2009,43(2):121-139.
[4]焦玉英,袁静.基于情景模型的数字图书馆个性化服务研究[J].中国图书馆学报,2008(6):58-63.
[5]牛亚真,祝忠明.个性化服务中跨系统用户建模方法研究综述[J].现代图书情报技术,2012(5):1-6.
[6]潘家武.基于领域本体的数字图书馆动态用户兴趣模型的构建[J].图书情报工作,2010(8):64-67.
[7]沈嵘.技术联盟:高校图书馆数字化建设的新方向[J].图书情报工作,2010(5):71-74.
[8]周明明.区域数字图书馆联盟的数字门户构建[J].大学图书馆学报,2010(4):64-67.
[9]胡慕海,等.面向移动数字图书馆的情境敏感型知识推荐研究[J].计算机科学,2011(8):92-95.
[10]袁静,焦玉英.基于情景信息的学习资源个性化推荐[J].情报理论与实践,2009(7):116-119.
[11]潘旭伟,等.自适应个性化信息服务:基于情境感知和本体的方法[J].中国图书馆学报2009(6):41-48.
[12]周莉,等.情境感知的电子商务个性化商品信息服务[J].图书情报工作,2011(10):130-134,29.
[13]王立才,等.情境感知推荐系统[J].软件学报,2012,23(1):1-20.
[14]陈国栋,等.基于情境感知的人体经络个性化信息服务研究[J].电视技术,2012(13):78-82.
[15]严隽薇,等.基于本体用户兴趣模型的个性化推荐算法[J].计算机集成制造系统,2010(6):2757-2782.
G250.76;G252.62
A
1005-8214(2014)07-0067-03
周玲元(1982-),男,博士研究生,南昌大学信息工程学院讲师,研究方向:信息管理与信息系统;段隆振(1961-),男,教授,南昌航空大学经济管理学院博导,研究方向:数据挖掘与知识发现。
2013-06-25
[责任编辑]邵晋蓉
本文系江西省社会科学规划课题“手机图书馆情境感知服务研究”(项目编号:13TQ16),江西省艺术科学规划项目“基于网格资源匹配的数字图书馆个性化推荐服务研究——以南昌市高校为例”(项目编号:DB201209393)的研究成果。