APP下载

基于标签的个性化信息推荐系统动力学模型与仿真

2016-08-23武慧娟孙鸿飞崔金栋

现代情报 2016年3期
关键词:用户群标签动力学

武慧娟 秦 雯 孙鸿飞,2 崔金栋

(1.东北电力大学经济管理学院,吉林 吉林 132012;2.吉林大学管理学院,吉林 长春 130022)



·理论探索·

基于标签的个性化信息推荐系统动力学模型与仿真

武慧娟1秦 雯1孙鸿飞1,2崔金栋1

(1.东北电力大学经济管理学院,吉林 吉林 132012;2.吉林大学管理学院,吉林 长春 130022)

基于系统与控制理论,通过分析标签系统中标签、用户、资源的关系,运用系统动力学的方法分析个性化信息推荐的过程及影响因素,在此基础上构建信息推荐的系统动力学模型,并采用vensim PLE软件对模型进行仿真,最后通过对模型的有效性验证分析,揭示了信息推荐的特性及机理,为进一步研究基于标签的个性化信息推荐动态演变提供研究思路。

标签;个性化;信息推荐;系统动力学;模型;仿真

1 问题的提出

个性化信息推荐是根据不同用户的信息需求、偏好或行为模式,将用户感兴趣的信息、服务等推荐给用户的个性化信息服务[1]。1999年,Smyth,B最早提出通过用户偏好分析和信息过滤技术来生成基于用户个性化浏览偏好的观看电视指南[2]。但是较正式明确提出基于标签的个性化信息推荐概念的是2007年Jaeschke Robert将资源以标签的方式标注,以FolkRank为基础,通过比较协作化推荐和基于图的推荐,验证了基于图的推荐的优越性[3]。

此后,国内外许多学者对基于标签的个性化信息推荐从复杂网络、概念语义等角度进行了多方面的深度研究[4-6],但学者们关注较多的是标签系统的静态结构方面,而对基于标签的个性化信息推荐动态演变过程方面探讨的较少,对此,笔者用系统动力学方法对个性化信息推荐的过程进行建模仿真,为推荐策略提供理论依据。

系统动力学[7](system dynamics,SD)的概念最早由Forrester提出,适用于模拟研究高度非线性、高阶次、多变量、多重反馈、复杂时变的大系统决策问题的处理,它采用定性与定量相结合、系统综合推理的方法,能够在非完备信息状态下分析求解复杂问题,其建模过程是一个学习、调查、研究的过程,系统性和动态性是SD模型区别于传统的静态决策方法的两大主要特点。

基于标签的个性化信息推荐系统动力学建模首先需要建立因果关系图,确定影响信息推荐的各个关键因素,同时构建存量流量图,明确各种状态变量、辅助变量和常量的含义;然后确定个性化信息推荐模型中各变量的方程式,即各种状态变量、辅助变量和常量之间的关系;最后进行模型的有效性测度、灵敏性测度等,具体分析模型的结构和行为。

2 个性化信息推荐系统的因果关系分析

基于标签的个性化信息推荐主要研究的内容是信息在用户之间流动的过程,由于它遵循信息扩散和转移的基本规律,并且信息总量具有不断增长的耗散特征,因此,可以用系统动力学来研究它的演变过程[8-9]。

2.1 个性化信息推荐过程

在利用协同过滤算法提出基于标签的个性化信息推荐算法的基础上[10],笔者进一步将个性化信息推荐具体分为4个阶段,其中包括2个反馈回路,具体如图1所示。

图1 个性化信息推荐过程

第一个阶段是数据挖掘,通过对标签系统中的用户、资源、标签进行两两关系分析,挖掘用户的行为,进一步提取用户的偏好,并进入第二个阶段,即构建用户偏好模型,具体用向量Pij=TUi、Rj来表示用户的偏好,然后进入第三个阶段,即相似度比较,利用余弦相似度比较用户的偏好,将相同偏好的用户形成一个集合,针对该类用户集,提取用户标注过的资源,形成资源集Pm,再次利用余弦相似度比较每个用户偏好和每个资源集的相似度Pij=Pm,对每个用户的假设推荐资源进行排序,进行优先推荐。其中反馈1的作用是在相似度比较的过程中,如果相似度值低于既定的阀值,那么要对用户的偏好进行检查、过滤、调整。反馈2的作用是个性化信息推荐如果没有达到用户的满意度阀值,那么要对用户的行为进行再次分析、挖掘,重新构建用户偏好模型。

2.2 个性化信息推荐因果关系分析

系统动力学主要利用反馈循环机制研究系统的内部结构,从而研究系统的行为模式与特性,为决策的制定寻找依据。笔者在综合国内外研究人员分析信息推荐的影响因素的基础上[11-14],认为影响个性化信息推荐的主要因素有用户标注行为、用户群的粒度、用户群中的资源,具体如图2所示,进一步通过系统动力学模拟,标明个性化信息推荐过程中的重要因素。

其中,个人意向、社群影响、系统内置的标注行为选择算法正向影响用户标注行为[15],用户偏好由于时间的因素,会发生漂移现象,所以会负向延长影响用户偏好,因果关系图中主要的反馈回路为:

(1)用户A标注行为→+用户群的粒度→+用户群中的资源→+用户偏好和推荐资源的相似度→+个性化信息推荐→+用户A标注行为

图2 个性化信息推荐的因果关系

(2)用户A标注行为→+用户A偏好→+用户偏好和推荐资源的相似度→+个性化信息推荐→+用户A标注行为

(3)用户A标注行为→+用户群的粒度→+用户A偏好→+用户A标注行为

(4)用户A偏好→+用户偏好和推荐资源的相似度→+个性化信息推荐→+用户A偏好

(5)用户A标注行为→+用户A偏好→+用户A标注行为

(6)用户A标注行为→+用户群的粒度→+用户群中的资源→+用户偏好和推荐资源的相似度→+个性化信息推荐→+用户A偏好→+用户A标注行为

2.3 个性化信息推荐的存量流量图

存量流量图是在因果关系图的基础上进一步区分变量的性质,更加清晰的反映系统要素之间的逻辑关系,明确系统的反馈形式和控制规律。个性化信息推荐模型的基本假设:用户标注行为和用户偏好会不断上升但是不会永无止境的上升,由于偏好的漂移现象,用户的偏好随着时间会发生变化,那么针对新的偏好又会有新型的标注行为,所以用户标注行为和用户偏好会假设有一个阀值限制。

图3中共有2个状态变量(用户A的资源、用户群中的资源)、5个流率变量(用户A资源的增加、用户A资源的减少、资源的增加率、资源的失效、推荐的资源量)、4个辅助变量(用户A标注行为增加、用户的偏好和推荐的资源的相似度、资源缺口、用户采纳情境)、10个常量(个人意向、社群影响、系统内置的标签选择算法、用户A偏好的漂移速率、用户A偏好的稳定率、同类型资源的增加率、同类型资源的失效率、资源复杂度、文化程度、信任程度),下面分别对重要的辅助变量和常量进行介绍。

图3 个性化信息推荐的存量流量图

用户A标注行为影响率:由于不同用户对信息的需求、情境、偏好等的不同,所以文献[15]认为用户标注行为会受到三方面的影响,分别是个人意向,即用户会基于过去的标注行为来使用标签;社群影响,即用户的标注行为会受到其他用户的影响;系统内置的标签选择算法。所以用户的标注行为存在很大的不确定性,它的增加率是随机产生且不断发生变化的。

用户偏好和推荐资源的相似度:采用余弦相似度的方法来计算用户的偏好和推荐资源的相似度,分别看作是向量空间中的两个向量,可以通过计算两个向量的夹角的余弦来衡量相互之间的相似度,夹角越小,相似度越高。例如将某用户的用户兴趣转化为向量p,另一用户的用户兴趣转化为向量r,则通过下面的公式进行计算[10]:

(1)

其中d,p分别为即将要推荐给用户的资源向量d和用户偏好向量p,Rk和Uk分别表示用户的资源向量d和用户偏好向量p的第k个特征项的权重,similarity值越大表明二者内容越相近,设定一个阈值θ,设定为0.6,当similarity>0.7时,就可以将资源推荐给用户,或者将排名最前的n项资源进行推荐。

资源缺口:根据用户群中用户A已掌握的资源与用户群共有的资源相比较,求出该用户的资源缺口,它作为将向用户推荐的资源的一个参考值。

用户采纳情境:由于受到资源复杂度、文化差距、信任程度等因素的影响,用户对系统推荐的资源采纳情况会不相同,资源越复杂,用户采纳系统推荐的可能性就越大;用户的文化水平越高,分析、推断信息的能力就越强,从而采纳系统推荐的可能性就越低;用户对系统越信任,就越容易采纳系统推荐的信息。

3 个性化信息推荐的系统动力学模型设计

个性化信息推荐的存量流量图中各状态变量和辅助变量的动态方程详细情况如下:

用户A的资源=INTEG(推荐的资源量+用户A资源的增加-用户A资源的减少,5)

用户A资源的增加=用户A的资源*用户A偏好的显著性*用户A标注行为影响率

用户A资源的减少=用户A的资源*用户A偏好的漂移速率

用户群中的资源=INTEG(资源的增加-资源的失效,15)

资源的增加=用户群中的资源*同类型资源的增加率

资源的失效=用户群中的资源*同类型资源的失效率

资源缺口=用户群的资源-用户A的资源

推荐的资源量=DELAY1I(IF THEN ELSE(用户偏好和推荐资源的相似度<0.7,资源缺口*用户采纳情境,0),5,0)。当用户偏好和推荐资源的相似度超过0.7时,将向用户推荐该资源,同时,由于图2中整体个性化信息推荐的过程中存在一定的延迟,所以,使用一阶延迟函数来反映这个过程,延迟5个单位才开始信息的推荐,初始推荐的资源量设为0。

用户A偏好的偏移速率=DELAY1I(0.001*Time,50,0)

用户群偏好的偏移速率=DELAY1I(0.001*Time,55,0 )。当时间超过50周时,用户A的偏好才会发生偏移,所以,使用一阶延迟函数来反映这个过程,初始的速率设为0。同理,用户群的偏好在55周后才发生偏移,它比单个用户偏好偏移的时间要晚。

用户群偏好的显著性=WITH LOOK UP(用户群的粒度,[(0,0)-(60,0.1)],(0,0),(10,0.01),(20,0.06),(30,0.08),(40,0.09),(50,0.087),(60,0.079))

用户A偏好的显著性=WITH LOOK UP(time,([(0,0)-(60,0.1)],(0,0),(10,0.02),(20,0.066),(30,0.088),(40,0.098),(50,0.096),(60,0.09))

用户采纳情境=IF THEN ELSE(信任程度*资源复杂度>文化差距,信任程度*资源复杂度-文化差距,0)。为了便于模拟,设定信任程度、资源复杂度与用户采纳情境正相关,文化差距与用户采纳情境负相关。

4 个性化信息推荐的系统动力学模型测试

系统动力学认为,系统结构决定系统的行为,而典型的结构产生典型的行为,如内在规律性的行为等。仿真模型在Vensim PLE平台上构建并仿真运行。设定仿真时间为60周,时间步长为0.125,用户群中的资源初始值设为15,用户A的资源初始值设为5,用户偏好和推荐资源的相似度为0.8,调节信任程度、资源复杂度、文化差距的值,使用户采纳情境为0.1,个人意向、社群影响、系统内置的标签选择算法、用户偏好和推荐资源的相似度分别在[0,1]之间取值,最后仿真运行的结果如图4所示。

图4 个性化信息推荐仿真运行结果

从模拟的结果可以看出:(1)用户群和用户A的资源在模拟时间内都出现了快速增长的趋势,并且用户群的资源增长要比用户A的资源增长快的多。(2)资源的缺口和推荐的资源量的变化趋势相似,由于在用户偏好和推荐资源的相似度一定的情况下,用户采纳情境为0.1,较低,所以推荐的资源量随着资源的缺口增加而增加。(3)保持当前的参数不变,提高用户采纳情境分别到0.4和0.7,命名为方案Current2和Current3,得到模拟结果如图5所示。

图5 个性化信息推荐仿真测度

从图5可以看出,当用户偏好和推荐资源的相似度为0.8保持不变时,提高用户采纳情境,在相同的模拟时间内,Current2、Current3与Current1相比,资源缺口和推荐的资源量都与与原图形总体趋势保持一致,都随时间不短上升。其中,当用户采纳情境在区间[0~1]内逐渐变化时,资源缺口会先快速降低,然后缓慢降低;推荐的资源量会先快速增加,然后趋于平稳,最后由于资源缺口的降低,所以推荐的资源量也随之降低。总体上,推荐的资源量会随着资源的缺口变化而变化,但是两者会相互抑制,当推荐的资源量变大时,资源缺口就会降低。

5 结束语

在分析个性化信息推荐过程及影响因素的基础上,建立基于标签的个性化信息推荐的系统动力学模型,分析了模型的有效性和主要影响参数的灵敏度,揭示了系统与用户间信息推荐的特性及机理,为研究个性化信息推荐提供了一个有效的方法。由于真实的个性化信息推荐是一个复杂、抽象的演化过程,因此模型存在一定的局限性,如模型中各影响因素的考虑不太全面,变量及方程的设定都采取了简化等,所以,笔者下一步的工作是深入研究更为复杂的个性化信息推荐模型。

[1]Zhou T,Ren J,Medo M,et al.Bipartite network projection and personal recommendation[EB/OL].http:∥pre.aps.org/abstract/PRE/v76/i4/e046115,2013-02-05.

[2]Smyth B,Cotter P.Surfing the digital wave[EB/O L].http:∥link.springer.com/chapter/10.1007%2F3-540-48508-241?LI=true#page-2,2013-02-05.

[3]Jaeschke Robert,Marinho Leandro,Hotho Andreas.Tag recommendations in Folksonomies[EB/OL].http:∥www.kde.cs.uni-kassel.de/stumme/papers/2007/jaeschke07tagrecom-mendationsKDML.pdf,2013-02-05.

[4]Zhang Zi-Ke,Zhou Tao,Zhang Yi-Cheng.Personalized recommendation via integrated diffuseion on user-item-tag tripartite graphs[J].Physica A,2010,389(1):179-186.

[5]Shang Ming-Sheng,ZhangZi-Ke,Zhou,Tao.Collaborative filtering with diffusion based similarity on tripartite graphs[J].Physica A,2010,389(6):1259-1264.

[6]Godoy D,Amandi A.Hybrid Content and Tag based Profiles for Recommendation in Collaborative Tagging Systems[EB/OL].http:∥dblab.cs.nccu.edu.tw/presentation/.980525/9 80525.pdf,2012-08-22.

[7]FORRESTER J W.Industrial dynamics:a major break throughfor decision makers[J].Harvard Business Review,1958,36(4):37-66.

[8]王其飗.系统动力学[M].北京:清华大学出版社,1994.

[9]钟永光.系统动力学[M].北京:科学出版社,2009.

[10]田莹颖.基于社会化标签系统的个性化信息推荐探讨[J].图书情报工作,2010,54(1):50-53.

[11]Chuang MC,Chang CC,Hsu SH.Perceptual factors underlying user preferences toward product form of mobile phones[J].International Journal of Industrial Ergonomics,2001,27(4):247-258.

[12]Frias-Martinez Enrique,Chen Sherry Y,Macredie Robert D,et al.The role of human factors in stereotyping behavior and perception of digital library users:a robust clustering approach[J].User Modeling and User-adapted Intera Ction,2007,17(3):305-337.

[13]余力,刘鲁,李雪峰.用户多兴趣下的个性化推荐算法研究[J].计算机集成制造系统,2004,10(12):1610-1615.

[14]邓胜利,鲍唯.社交网站用户交互学习行为影响因素的实证分析[J].情报理论与实践,2012,35(3):57-61.

[15]ShiladSen.Tagging,Communities,Vocabulary,Evolution[EB/OL].http:∥portal.acm.org/citation.cfm?doid=1180875.1180904,2012-02-28.

(本文责任编辑:孙国雷)

System Dynamics Model and Simulation Based on the Tag of Personalized Information Recommendation

Wu Huijuan1Qin Wen1Sun Hongfei1,2Cui Jindong1

(1.School of Economy Management,Northeast Dianli University,Jilin 132012,China;2.School of Management,Jilin University,Changchun 130022,China)

Based on the system and control theory,the paper analyzed the relationship between tag,user,and resource in the label system,using system dynamics method to analyze the process of personalized information recommendation and the influencing factors,and constructed system dynamics simulation model on the information recommendation using the vensim PLE software,finaly this paper revealed the characteristics and mechanism of information recommendation for further research on the dynamic evolution on the tag of personalized information recommendation,through the verification of model in validity.

label;personalized;information recommendation;system dynamics;model;simulation

2015-12-09

教育部人文社会科学规划项目“社会化标注系统中个性化信息推荐多维度融合与优化研究”(项目编号:15YJC870024)、“基于微本体架构的微博信息管理机理研究”(项目编号:14YJA870001);东北电力大学博士科研启动基金项目“协同视角下社会化标注系统中资源深度聚合模式研究”(项目编号:BSJXM-201420)。

武慧娟(1979-),女,副教授,博士,研究方向:信息资源管理,发表论文10余篇,出版专著1部。

10.3969/j.issn.1008-0821.2016.03.002

G203

A

1008-0821(2016)03-0012-05

猜你喜欢

用户群标签动力学
具有Markov切换的非线性随机SIQS传染病模型的动力学行为
从资源出发的面向用户群的高校图书馆资源推荐模型分析
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
标签化伤害了谁
基于多进制查询树的多标签识别方法
基于随机-动力学模型的非均匀推移质扩散
公共图书馆的用户群和服务人员的分析
TNAE的合成和热分解动力学
C36团簇生长动力学及自由能