APP下载

基于模糊逻辑的多代理推荐系统

2011-07-23施笑畏宓为建苌道方

上海海事大学学报 2011年4期
关键词:感兴趣代理修正

施笑畏,宓为建,苌道方,张 艳

(上海海事大学物流工程学院,上海 201306)

0 引言

数字电视作为一种全新的广播方式,为电视观众带来海量节目.为了让用户快速、准确地获取其真正感兴趣的内容,主动向用户推荐符合其需求的个性化推荐技术应运而生.

文献[1-3]提出的个性化推荐技术的特点:(1)推荐原理.根据用户喜好对基本电子节目指南(EPG)进行筛选.鉴于各因素的不确定性,仅凭基本EPG信息很难使推荐系统有效找到用户喜欢的节目.(2)喜好学习方法.文献[1]假设用户喜好是静态不变的;文献[2]仅采用清晰反馈法修正用户显性喜好;文献[3]采用清晰反馈与对频道观看频率的反馈统计相结合的方法来修正用户喜好,但根据频道学习的喜好远远不能完整表示用户的潜在需求.(3)用户喜好档案内容.3个系统仅包含用户喜好特征,忽略用户厌恶特征.实际上,厌恶特征对用户的节目选择同样起决定性作用.(4)筛选推荐算法.都采用清晰算法,即节目的评估结果是“感兴趣”或“不感兴趣”.清晰数学不能模拟人类的柔性推理思维,尤其是当一个节目既包括用户感兴趣的特征又包括用户厌恶的特征时,就很难评估该节目是否值得被推荐.

从以上分析可以发现,如何模拟人的思维,向用户推荐高质量的个性化节目是目前需要进一步研究的问题.

本文从以下几个方面入手提高推荐质量:(1)节目指南信息量的完善.鉴于即时电视规范(TVAnytime)[4]中,元数据不仅包括详细的节目内容描述信息,还包括用户喜好信息和用户观看节目的历史数据[5],本文在TV-Anytime环境下进行节目推荐研究.(2)用户喜好的真实性和完整性.用户档案同时包括喜好和厌恶特征,鉴于喜好随时间推移而变化发展,本文动态修正喜好档案.(3)模糊逻辑模拟人的思维方式.

1 多代理推荐系统

1.1 系统结构

推荐系统结构见图1.该系统主要包括模糊用户喜好档案、模糊筛选代理、模糊推荐代理、交互代理和档案修正代理.模糊筛选代理基于模糊逻辑推理,将即将播放节目的元数据与模糊用户喜好档案进行匹配,然后根据模糊阈值筛选出用户可能感兴趣的节目;模糊推荐代理向每个用户提供最优的节目推荐表,并发送到用户端;交互代理提供界面,负责收集用户清晰或隐含的反馈信息;档案修正代理基于交互代理递交的反馈信息,修正用户喜好档案.在多代理系统(MAS)中,代理间需要依赖相互通信实现不能单独完成的功能.通常,MAS中的代理间通信是基于知识查询和处理语言(KQML)完成的.[6-7]在本系统中,各代理间也存在通信关系,例如,为了得到用户新的喜好信息,需要模糊推荐代理和交互代理与档案修正代理通信.

图1 推荐系统结构

1.2 模糊逻辑控制原理在推荐系统中应用的原因

筛选推荐过程如下:初始状态下,系统仅具备部分的用户显性喜好知识,需要在推荐过程中不断学习用户的潜在喜好以及用户喜好的发展变化,为保证推荐的可靠性奠定基础.是否选择某个节目基于用户的显性和潜在喜好、各喜好及厌恶特征之间的综合考虑等,用户的决定是基于一些复杂反应的最终结果.换言之,由于很难量化用户对某个节目的各种感觉,整个推荐过程难以建立清晰的数学模型.鉴于模糊原理可以通过模拟人的思维方式来柔性描述并解决这类问题,本文在节目推荐系统中采用模糊逻辑推理方法.典型的模糊逻辑推理结构[8-9]见图2.

图2 模糊逻辑推理结构

2 模糊用户喜好档案

2.1 特征—喜好程度—权重(FLW)用户喜好档案

采用FLW用户喜好档案描述用户喜好特征和厌恶特征,其中每一个特征都用3维矢量(特征、喜好程度和权重)定义.在FLW中,特征指节目的属性,如特定的节目类型、演员等.

如果用户喜好档案U中有q个不同特征,则可表示为

式中:fi表示第i个特征;li表示对fi的喜好程度;wi表示fi的权重.权重是相关特征种类的重要性指标,如用户选择节目时看重节目类型,则节目类型的权重大.喜好程度则表示用户喜欢该特征的程度.相同特征种类的权重一样,不同特征的喜好程度不一定相同.

2.2 模糊特征—喜好程度—权重(FFLW)用户喜好档案

模糊用户档案将清晰参数值(喜好程度和权重)转化为隶属度,见图3.图中:l和w分别表示特征喜好程度和权重;μ为变量所属相关区域的可信度.l∈[-0.5,0.5],|i|越大说明用户喜欢或厌恶的情绪越强烈;w∈[0,1],w越大表示该特征越重要.

图3 用户档案参数的模糊化

为便于交换信息,本系统中节目信息和用户档案信息都用可扩展标记语言(XML)表示.[10]

3 模糊筛选推荐处理

3.1 筛选和推荐步骤

首先,模糊筛选代理基于模糊逻辑推理,对即将播出的节目信息与FFLW喜好档案进行匹配,预估出用户对该节目感兴趣的程度P.然后根据阈值筛选出用户可能喜欢的节目,按P对筛选的结果进行归类排序,由模糊推荐代理生成推荐列表,并发送至用户端.具体可被分解为3个子步骤:(1)特征匹配评估;(2)节目匹配评估;(3)设定阈值进行节目筛选和推荐排序.最后,用户收到的推荐表中不仅包含推荐节目的信息,还包含各推荐节目相应的P.P不仅包含反映节目与用户档案匹配程度的数值大小,还包含预计用户可能对该节目的情绪感受.感兴趣程度的模糊隶属函数分布见图4,该图不仅适用于节目匹配结果,也适用于特征匹配结果.

图4 感兴趣程度的模糊隶属函数分布

3.2 特征匹配

特征匹配是指评估节目中某特征与用户喜好的相关性.节目

式中:ti为第i个特征.

为了得到用户对该特征的感兴趣程度f,需要首先将节目中的该特征映射到用户喜好档案中.若用户喜好档案中不包含该特征,则f为“0”;若用户喜好档案中包含该特征,则执行以下步骤.

(1)选定输入输出变量.该步骤是能否体现模糊逻辑控制优越性的关键,对于以后控制结果的理想程度起着至关重要的作用.先选定输出变量,再找出对输出变量影响最大的变量作为输入变量.本文将f作为输出变量,选择对f影响最大的特征喜好程度l和特征权重w作为输入变量.

(2)输入输出变量的模糊化.对输入输出变量进行模糊区划分,给每个区一个唯一的名字,然后从语义上对每个标号定义相应的模糊集.根据大量的实验数据,本文确定的输入输出变量的隶属函数分别见图3和4.

(3)建立模糊推理规则.模糊推理规则主要是指联系输入/输出变量的控制规则.本文所得规则如下:① If l is“不喜欢”And w is“次要”Then f is“厌恶”;② If l is“不喜欢”And w is“重要”Then f is“非常厌恶”;③ If l is“一般”And w is“重要”Then f is“一般”;……;④ If l is“喜欢”And w is“重要”Then f is“很感兴趣”.

(4)去模糊化.为了最终输出控制动作,模糊推理结果的模糊量必须转换为清晰量.最常用的两种转换方法为面积重心法和最大平均值法:前者合成所有有激励输出的规则作为结果,适用于平滑控制,是过程控制常用的方法;后者取激励强度最大的规则作为结果,常用于最坏情况分析或风险分析等决策控制.

由于面积重心法可考虑到更多有用的因素,本系统采用该方法去f的模糊化,即

式中:μ[j]为第j条规则输出面积的高;yj为重心横坐标;m为规则总数.根据具体条件激励起的规则隶属度可求出f,其他未被激励的规则隶属度为0.

3.3 节目匹配

节目匹配用于评估P.由于节目的组成特征在评估时已考虑特征的喜好程度和特征种类权重等因素,可通过相关f的平均值计算得出

式中:n为节目中包含的特征总数.将P映射到图4中,可得到用户对该节目的预测态度.

3.4 筛选和排序

设置阈值筛选节目元数据,选择用户可能感兴趣的节目,然后根据P依次排序,并推荐给用户.在本系统中,由模糊推荐代理进行排序和推荐处理.

模糊筛选代理中设定的阈值既可以是一个清晰值,也可以是一个模糊值,比如“用户有多么喜欢它”.如果P大于阈值,说明用户想要看该节目,筛选代理把该节目的元数据发给模糊推荐代理.

4 档案修正

本系统中,用户喜好建模包括初始化和动态修正两个过程.用户档案模型的初始化可采用两种方法进行:(1)根据用户清晰反馈信息;(2)分析用户行为历史数据.第1种方法无须赘述,第2种方法类似于用户档案修正算法.由于用户无法清晰表达其潜在需求,并且用户的需求随时间不断发展变化,在初始建模后,用户喜好档案需根据清晰反馈和对行为反馈的学习不断地进行补充和修正.这些工作由档案修正代理负责完成.

对一个推荐节目,用户通常有3种态度:播放、删除和忽略.系统将根据用户行为进一步修正用户档案,算法描述如下:

(1)如果用户观看某个节目中的一段,在该系统中,对节目i,

式中:fji是节目i中第j个特征;wtji是特征fji属于t特征类型的权重;w′tji是修正后的wtji;lji是用户对特征fji的喜好程度;l′ji是修正后的lji;Wi是观看节目i的总时间;Ri是节目i本身的时间长度;θ是观看时间阈值,若观看时间小于θ,认为用户对该推荐节目不感兴趣,权重和喜好程度需下调;α,β∈(0,1),用于减小权重和喜好程度的变化速度.因为权重较之喜好程度更稳定,α≤β.参考图3,修正后的权重被约束在[0,1.00]区间内,而修正后的特征喜好程度被约束在[-0.50,0.50]区间内.

(2)若用户已删除某推荐节目,Wi为“0”.

(3)若用户忽略某推荐节目,无反馈.

5 应用示例

5.1 原型系统实验

实验包括1台 PC,1个 TriMedia card,多代理系统和1台电视.PC充当用户端PDR,存放节目源并安装系统,TriMedia card用于进行视频解码,电视用于演示节目.该系统在单机PC/Linux下运行.

图5为本推荐系统的主界面.界面左栏列出系统各个功能;中间列的上方为节目推荐表,下方为选中节目的信息.对选中的节目,用户可以选择播放、删除、忽略.对前两个选择,可获取反馈信息,用于修正档案.

图5 系统主界面

节目源:包含200个不同节目的片段,每个节目片段2~10 min.30个用户参加实验.

评估过程:首先,用户建立初始用户喜好档案;然后,200个节目分5批用于测试推荐系统的推荐结果是否符合用户需求.

评估准则:则用参数p和r评估节目推荐系统的推荐效果.p反映推荐的节目与用户兴趣的相关程度.r反映有多少用户感兴趣的节目被推荐,又有多少用户感兴趣的节目被误判为乏味的节目.

式中:nT是推荐的节目总数;nR是推荐符合用户兴趣的节目总数;nI是符合用户兴趣的节目总数.若用户观看某节目的时间大于该节目总时间的70%,则认为用户对该节目有兴趣.

表1是测试平均结果.

表1 实验结果

实验结果显示,该推荐系统可以学习用户的潜在需求,并能动态捕捉用户喜好的潜在变化,为用户提供可靠的推荐服务.当系统开始运行时,由于用户注册时的显性需求不足以完全表达用户的真正喜好,推荐效果一般;随着系统使用时间增加,推荐效果逐步提高.鉴于用户喜好总是缓慢进行潜在变化,推荐效果无法达到百分之百的满意.

6 结束语

如何模拟人的思维以提高推荐质量是个性化节目推荐中需要解决的问题.本文提出一个智能多代理节目推荐系统,用于在TV-Anytime环境下向多个用户提供个性化推荐服务.与传统方法不同,该系统基于节目元数据和模糊用户档案知识管理,将用户档案以一种紧凑简洁的模糊结构表示,包括用户喜欢的和不喜欢的特征.用户档案可进行动态修正,如根据反馈信息增加或减少相关特征的参数大小.筛选和推荐代理基于模糊喜好档案,使用模糊逻辑模拟人的柔性思维方式,可解决对一个既包含用户喜好特征,又包含用户厌恶特征节目评估的二义性问题.实验结果显示该系统推荐效果可靠.

[1]COTTER P,SMYTH B.PTV:personalized TV guides[C]//Proc 12th Conf on Innovative Applications of Artificial Intelligence,Austin,Texas,2000:287-295.

[2]Duco DAS,Herman ter HORST.Recommender Systems for TV[C]//Proc AAAI,1998:243-251.

[3]KURAPATI K,GUTTA S,SCHAFFER D,et al.A multi-agent TV recommender[C]//Proc User Modeling 2001:Personalization in Future TV Workshop,Sonthofen,Germany,2001:458-463.

[4]TV-Anytime system description document(informative with mandatory appendix B)[Z].WD608,TV-Anytime Forum,Aug.2004.

[5]TV-Anytime metadata specifications document[Z].SP003v12 Part A Appendix B,TV-Anytime Forum,Jun.2005.

[6]FININ T,FRITZSON R,MCKAY D,et al.KQML as an agent communication language[C]//Proc 3rd Int Conf on Inform and Knowledge Manage,1994:456-463.

[7]杨神化,施朝健,刘宇宏,等.多agent理论和技术在自动避碰决策系统中的应用[J].上海海事大学学报,2007,28(1):121-125.

[8]BABUSKA R.Fuzzy modeling for control[M].Norwell,MA:Int Series in Intelligent Technologies,Kluwer Academic Publishers,1998.

[9]陈锦标,吴广宇,应士君.基于灰色模糊综合评估法的大型船舶模拟操纵评价[J].上海海事大学学报,2008,29(4):1-5.

[10]JIS X4160-2007,XML Path Language(XPath)2.0[S].

猜你喜欢

感兴趣代理修正
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正这一天
更 正
合同解释、合同补充与合同修正
代理圣诞老人
代理手金宝 生意特别好
软件修正
复仇代理乌龟君
这样的智能厨房台面,你会感兴趣吗?
梦断交易会