情境化偏好知识库的构建与利用方法研究
2016-08-01张宇
【摘要】普适个性化内容推荐是近年来学术界和业界关注的热点问题。本文针对目前该领域研究缺乏从知识管理视角构建情境偏好关系方法的问题,在前期研究的基础上,分析了情境偏好关联构建的过程与方法,以内容推荐为目标,给出了上下文感知领域相关文献对于情境模型操作的解释。最后与相关方法进行了比较分析。
【关键词】普适个性化推荐;上下文;情境
一、引言
普适个性化内容推荐是指根据用户偏好、行为习惯和时空环境等因素,将相关内容通过各种网络终端主动推送给用户的一种动态的个性化服务模式。该领域的研究将个性化服务、上下文感知计算和语义网服务等领域的方法和技术相结合,致力于在一种开放、动态和集成的环境下,给用户提供随时随地的,更具针对性和智能化的服务。这些问题的研究对于支持内容服务模式的创新和内容服务行业的发展具有很大的理论意义和商业价值。
目前,该领域的研究仍处于探索阶段,成熟的规模化应用并不多见。原因在于个性化、上下文感知计算等领域的研究并未实现深度融合,以解决普适推荐领域的一些新问题。本文在前期研究的基础上,研究情境化用户偏好知识库的构建过程和利用方法,建立情境与服务之间的关系,解释相关文献并未给出的情境操作对于内容推荐目标的意义。
二、情境化用户偏好本体模型
本体模型构建的主要目的是实现知识共享和重用、消除数据冗余、克服数据稀疏性。利用到的重要本体模型片段如图2-1所示。
该模型包括用户偏好、上下文和情境3个主要概念。用户偏好描述用户频繁访问的内容服务类目,本文区分上下文(Context)和情境(Situation)两个概念:上下文是情境属性取值的概念集;而情境是由属性和取值构成的键值对集,形式化表示为:Situation={c1:V1; c2:V2…cn:Vn},其中ci为情境的属性,其值域定义为相应上下文本体中的概念。上下文起着衔接用户偏好与情境的桥梁作用,偏好并不直接依赖于情境,而是依赖于不同的情境属性,依赖度描述某类偏好对不同情境属性的依赖关系,用于约减不重要的属性维度。
三、情境偏好关联规则构建的过程与方法
(一)关联挖掘的过程
本研究通过关联规则描述偏好与情境的关系,关联规则提供的定量参数利于对存在冲突的规则进行甄选;结合形式概念分析理论,利用量化频繁标引格建立用户偏好与不同粒度情境之间的语义关联。情境偏好关联挖掘的过程主要分为如图3-1所示的5个阶段。
各个阶段的任务说明如下:
1、数据获取:是指从分布的各类应用系统中获得原始的用户访问历史数据,这些数据记录了用户在何时、何地和怎样的外部环境条件下获取过哪些内容。
2、本体映射:将原始数据通过映射规则转化为相应的本体概念,映射规则可用定义或学习的方法得到。
3、数据熔合:将本体映射阶段得到的统一规范的数据整合到集成数据库中,作为构建情境偏好语义关联的输入。
4、关联挖掘:通过垂直数据挖掘的方法挖掘不同粒度情境与偏好之间的关联,利用量化频繁标引格结构建立情境偏好知识库。该结构在后续推荐过程中当某些维度的上下文数据不可用的情况下仍然具有一定的有效性。情境偏好关联构建的方法与具体算法实现见诸于笔者的前期研究。
5、规则提取:根据推荐需求可沿不同路径提取情境偏好或偏好情境规则,求解当前情境下适宜推荐的内容或要推荐某种内容的最适宜情境。
(二)情境模型上的操作及解释
情境模型上的操作是一系列逻辑和时序操作的集合。上下文感知服务的目标是根据上下文的变化而采取服务行动,研究情境(Situation)的相关文献讨论了情境模型上的各种操作,如:Weiβenberg提出了情境模型的特化、泛化、比较等操作;Ye分析了情境之间的分解、组合和时序关系等。但这些文献均未分析情境操作与服务之间的关系。本文定义的情境形式化描述为:Situation={c1:V1; c2:V2…cn:Vn}。情境之间的基本分类组合关系如图3-2所示。
原子情境在本研究中是指能在情境格中搜索到的最细粒度的情境,如:图3-3中的第二层结点(#6,#7,#8,#9)对应的上下文取值描述;组合情境是由原子情境或其自身通过逻辑操作导出的情境。下面根据形式概念分析理论,给出情境逻辑操作的定义和解释。
定义3.1:定义Op为情境上的操作集,Op={Generalize, Specialize, Negate, Matching, Sequence},其中各操作依次表示:泛化、特化、取反、匹配和时序。
1、情境的泛化
Generalize(Situ1…,SituN)=Situ{Intersection(ContextFeature(Situ1),… ContextFeature (SituN))}
上式表示泛化情境的属性集是被泛化情境属性特征的交集。例如:Generalize (#6Situ1= {t:T1; l:L1}, #7Situ2= {t:T1; l:L2})=#2Situ {t:T1}
泛化的情境在格中体现为被泛化情境结点的公共上层结点,标引概念对应的服务内容种类增加,说明能够获取和利用的上下文数据越少,给用户提供的服务就会越粗糙。若被泛化情境的上下文属性取值没有交集,则称之为不相交情境,例如:结点#6和结点#9。
2、情境的特化
Specialize(Situ1…,SituN)=Situ{Union(ContextFeature(Situ1) ;…ContextFeature (SituN))}
上式表示特化情境的属性集是被特化情境属性特征的并集,例如:Specialize(#2Situ {t:T1}; #4Situ1={ l:L1})=#6Situ {t:T1; l:L1}
特化的情境继承了被特化情境的共同的属性特征,对应结点服务内容的种类会减少,说明能获取的上下文数据种类越多,提供的服务内容就会更精准化。若被特化的情境对应的结点中没有构成用户内容偏好的记录集,则称为无效情境,在本文情境偏好关联构建方法中,该类情境结点被剪枝。
3、情境的取反
Negate(Situ)=Situ{Complement(ContextFeature(Situ))}
上式表示情境取反操作得到的情境的属性集是被取反情境属性集的补集,例如:Negate(#6Situ {t:T1; l:L1})= ComposedSitu{#7Situ={t:T1;l:L2};#8Situ={t:T2; l:L1}; #9 Situ= {t:T2; l:L2}}
情境取反操作用于在该情境下推荐某种内容被用户拒绝等情况,但情境的取反并不意味着对描述该情境的上下文属性取值的全盘否定。
4、情境的匹配
Matching(SituX,SituT)=Situ{Matching(ContextFeature(SituT))}
实际情境与目标情境匹配得到的情境属性集由各种满足匹配度阈值的上下文构成,总的匹配度由各类上下文匹配度的加权综合评价得到,其权重可由信息熵等方法衡量。
5、情境的时序
Sequence(Situ1…,SituN))= SequenceComposedSituation
拟给用户推荐某种内容,在格中搜索到与用户内容偏好匹配的情境集合,利用时序操作对情境集合排序,然后利用情境之间的时间先后关系逐次与用户的现实情境匹配,直到推荐任务完成。
四、相关方法比较
Ye等基于粗粒度方法的思想提出情境格的概念,采用单维格结构对情境建模,在格中集成了情境的名称、层次、属性和上下文的层次,未考查情境与用户偏好之间的关系,采用该模型不易设置参数阈值。Hong采用Appriori算法挖掘多维上下文与用户偏好之间的关联,并通过决策树模型来描述。Appriori算法的思想是从频繁1项集开始,致力于挖掘最大频繁K项集,那么在本研究中就会挖掘出大量无用的上下文维间关联,如:L1T2W3等(即情境特征之间的关系,而非情境特征与服务之间的关系);采用经典的基于概念格的挖掘方法也会存在类似问题。本文采用分层建格的思路,在维间上下文连接操作时若所对应的记录集中没有构成用户偏好的内容服务集则进行剪枝操作,就不会有上述问题发生。决策树模型在系统工作过程中当某维度上下文数据无法有效获取时则失效;而频繁标引格结构则可以从多条路径搜索,在某维上下文数据无法有效获取时仍可以提供有用的规则。
五、总结
本文针对目前普适个性化推荐领域缺乏从知识管理视角构建情境与用户内容偏好关系的问题,结合本体和形式概念分析两种互补的知识形式化方法,在构建情境化偏好本体静态模型的基础上;研究了情境偏好关联规则挖掘的过程与方法,建立用户偏好与情境之间的语义关联;基于数据分析的视角,给出了相关文献对于情境模型操作以内容推荐为目标的解释。最后,对本领域相关文献提出的模型和方法进行了比较分析。
参考文献
[1]张宇,夏火松,吴金红.普适个性化内容推荐的方法与支持技术评述[J].情报科学, 2015,33(6): 155-161.
[2]蔡淑琴,张宇,胡慕海.基于频繁标引格的移动内容推荐方法研究[J].情报学报,2011,30(7):721-729.
[3]Weiβenberg N, Gartmann R, Voisard A. An Ontology-Based Approach to Personalized Situation-Aware Mobile Service Supply[J]. GeoInformatica, 2006, 10(1): 55-90.
[4]Ye J, Coyle L, Dobson S. Representing and manipulating situation hierarchies using situation lattices[J]. Revue dIntelligence Artificielle, 2009, 22(5): 647-667.
[5]Hong J Y, Suh E H, Kim S J. Context-aware system for proactive personalized service based on context history[J]. Expert Systems with Applications, 2009(36): 7448-7457.
作者简介
张 宇(1978-),男,湖北武汉人,博士,讲师,主要从事普适个性化服务、知识管理等方面的研究。
基金项目
教育部人文社会科学青年基金项目(15YJC870031);湖北省普通高校人文社科重点研究基地-企业决策支持研究中心重点项目(DSS20150103);武汉纺织大学基金项目(113100)。