APP下载

基于改进相似度的电影推荐方法

2019-07-10胡宗耀

网络安全技术与应用 2019年7期
关键词:准确率协同评分

◆胡宗耀



基于改进相似度的电影推荐方法

◆胡宗耀

(辽宁大学信息学院 辽宁 110036)

针对当前的电影推荐方法推荐准确率不高的问题,提出一种改进相似度的电影推荐方法。该方法在通过皮尔逊相关系数计算用户间的相似度时通过用户之间共同观看过的电影数目来进行调节,实验结果表明本文算法在准确率和召回率上均有所提高。

电影;推荐方法;相似度

0 引言

第三次工业革命以来,尤其是1989年万维网的出现,使得使得网上的信息量逐年呈指数级增加,用户逐渐从信息的被动接受者变为信息的生产者,据有关机构统计,2010 Q4中国网页搜索请求量规模达640.2亿次。在互联网上,各种形式的信息以不同的类型呈现在网页上:如文字、图像、视频,音频,图表等等。同时,随着4g网络的发展和智能手机的普及,网民上网速度更快,网络质量更优。越来越多的用户能够方便快捷的接触网络,截至2018年6月,中国网民规模达8.02亿。中国工程院院士邬贺铨表示互联网每天产生的信息量约有800EB,由此带来了用户查找所需信息时间增长的问题。电影视频作为文化娱乐的重要内容,相比文字能传递更多的信息,影视传媒在人们的物质和精神生活中发挥着其他媒体所无法代替的作用,用户在电影视频推荐网站中查找感兴趣的内容时,面对眼花缭乱的内容,需要花费大量的精力筛选感兴趣的视频,查找所需要的时间变的越来越长,由此降低了用户的体验,也不利于网站的发展。因此越来越多的网站引入了推荐算法,由此给用户提供一些建议,将用户可能感兴趣的内容展现在用户的眼前,供用户筛选。因此,将推进系统应用在电影视频网站,为用户提供个性化的视频推荐,从而增加用户黏度,减轻用户负担,提高用户体验,提高网站流量,具有一定的商业效益。

1 传统的电影推荐方法

传统的电影推荐的主要方法有:基于内容的推荐和协同过滤推荐[1],前者以用户-项目评分矩阵中的用户数据计算用户间的相似度,后者以用户-项目评分矩阵中的项目数据,计算项目之间的相似度,然后向用户推荐。

2 基于改进相似度的电影推荐方法

设用户集合={1,2,···,u},电影集合={1,2,···,i}。先通过评分矩阵通过计算相似度来进选目标用户取近邻用户[2],然后选取目标用户未看过的电影作为推荐数据集,Top-k即为用户的最终推荐列表。具体步骤如下:

设用户表Users、项目表Items、评分表,目标用户∈,目标项目i∈,用户与的相似度sim(,)可由式(1)计算得到。

其中为用户和的共同评分项目,R为用户对项目的评分,`R为用户对所有项目的平均评分。

该相似度计算方法存在不足之处,若通过公式计算出两个用户的相似度很高,但是观看过的电影中的重合度不高,那么两个用户的相似度值应该有所惩罚。

设()为用户看过的电影集合,()为用户观看过的电影集合,则新的用户相似度公式为:

3 实验分析

为了验证本文算法的有效性Movielens 数据集数据作为评测集数据集来检验算法。首先将数据随机均匀分成5份,选取其中的4份当作训练数据集,剩下的1份作为测试集[3]。

为了对本文所提算法的正确性与高效性进行验证,实验将本文算法与传统的基于用户的协同过滤算法(UCF)及融合时间因素和用户评分[4]的协同过滤算法(CF-TP)从准确率(Precision),召回率(Recall)两方面进行对比分析。

准确率:推荐列表中用户喜欢的物品所占的比例,公式为(3):

召回率:测试集中有多少用户喜欢的物品出现在推荐列表中,公式为(4):

其中B为用户实际喜欢的项目,L为通过实验产生的推荐列表。

由图1可得,本文算法与基于用户的协同过滤算法(UCF)及融合时间因素和用户评分的协同过滤算法(CF-TP)[1]在推荐准确率(Precision)和召回率(Recall)方面均有所提高。

图1 算法的准确率对比

从图1和图2可以看出,当邻居数目较小时,本文算法和其他两种算法的准确率和召回率相差不大,随着邻居数目的增大,本文算法的优势体现出来。从图中可以看出,邻居数目对算法的推荐结果有一定的影响。本文固定邻居数目为50进一步的实验结果如图3所示。

从图3可以看出,当邻居数目一定且推荐项目逐渐增加时,本文算法的准确率与其他算法相比有一定的优势,但随着推荐项目数的增加,各算法的准确率均逐渐减小。

图2 算法的召回率对比

图3 准确率与推荐项目个数的关系

4 结束语

本文提出一种基于改进的相似度的电影推荐方法,并且通过对比实验验证了所给方法在电影推荐的准确率、召回率等方面有所提升,在一定程度上,改善了传统推荐算法准确率低的缺陷。推荐是一个情景化的事情,下一步的工作是利用上下文信息结合场景进行推荐,将上下文信息,例如地点信息加到推荐算法中,更好改善推荐效果。

[1]曾安,高成思,徐小强.融合时间因素和用户评分特性的协同过滤算法[J].计算机科学.2017,44(9):243-249.

[2]沈华理.基于内容和协同过滤相融合的推荐算法[J]. 电脑知识与技术.2018,(2): 232-234+282

[3]雷鸣,朱明情感分析在电影推荐系统中的应用 [J].计算机工程与应用.2016(10): 59-63+107

[4] 马宏伟,张光卫,李鹏.协同过滤推荐算法综述 .[J]小型微型计算机系统2009(07): 1282-1288

猜你喜欢

准确率协同评分
输入受限下多无人机三维协同路径跟踪控制
家校社协同育人 共赢美好未来
VI-RADS评分对膀胱癌精准治疗的价值
“互联网+医疗健康系统”对脑卒中患者HAMA、HAMD、SCHFI评分及SF-36评分的影响分析
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
我给爸爸评分
Castleman disease in the hepatic-gastric space: A case report