APP下载

基于协同过滤的智能影视推荐系统设计

2022-10-11张华欣韩霄萌王同梅

现代计算机 2022年15期
关键词:评分影视协同

张华欣,韩霄萌,王同梅

(1.天津滨海汽车工程职业学院,天津 300350;2.燕京理工学院,燕郊 065201)

0 引言

随着网络从4G到5G的提升,网络传输速度得到了进一步发展,为大数据时代互联网信息技术的发展和视频在线观看与下载提供了有力支撑。用户的需求随着科技的进步更加多样化,面对如此庞大的信息数据和用户多样化的需求,传统的检索式影视平台显然满足不了用户的观影需求,用户需要一种可以对庞大影视信息进行准确过滤和快速筛选的技术,保证日常需求,进而保证影视平台用户的忠诚度。因此智能推荐系统成为计算机领域研究的重点,其核心推荐算法的研究更是重中之重。

1 研究现状

目前国内外关于推荐算法的研究大致从人们点击、收藏、组群等行为信息中寻找特征并融合进自己的算法,例如协同过滤算法、分类方法等。而电影推荐领域,因举办Netflix竞赛一直受到人们的重视与关注。随着海量数据的快速增长,如何迅速找到有用信息成为研究人员研究关注的重点。Lemire等提出了Slope One算法,因其简单高效,在协同过滤算法中受到很大关注。麻省理工、加州理工大学的学者发表了关于协同过滤的论文,如算法Ringo—音乐推荐,算法Jster—笑话推荐,算法Video Recommender—视频推荐等。郭贵冰创办的LibRec团队开发设计了LibRec系统,它是基于java的开源推荐系统,其中包含了协同过滤、内容推荐在内的70余种推荐算法。

对推荐系统的应用不仅使客户拥有更好的用户体验,更提升了当代互联网公司用户的忠诚度。字节跳动公司通过推荐算法,开发了“今日头条”和“抖音短视频”两款用户过亿的应用软件,算法经过相关性特征、环境特征等信息训练之后,为用户推荐感兴趣的作品。阿里巴巴公司旗下淘宝网通过记录用户购买过的物品、浏览过的物品、收藏过的物品、年龄特征等一系列特征因素,建模预测该用户可能喜欢的商品。豆瓣的电影推荐系统,通过对目标用户行为偏好的抓取建立预测模型,进而对用户进行分类。百度公司对统计用户的搜索行为建模,为用户推荐其可能需要的信息。以上商业软件为商业领域推荐算法的研究提供了思路,但因其过于深奥,并不适用于学生学习,尤其是专科学生在算法及计算机应用方面的学习。

本文基于普通高等专科学校学生特点,设计和总结出基于协同过滤的智能影视推荐系统设计与实现,系统的实现可以帮助专科学生详细了解当前计算机领域热点内容,帮助学生搭建起算法及系统框架,为学生日后发展奠定基础。

2 基于协同过滤的智能影视推荐系统设计

2.1 建立用户模型

选用基于用户的协同过滤算法为本文个性化推荐提供技术支持,其优点在于用户-评分矩阵越完整推荐准确率越高。原理为:若对用户A进行智能影片推荐,首先算法计算出与用户A点击、观看等行为相似的用户群体G,然后把G群体观看过但用户A并未观看的影片推荐给用户A。

表1是用户user对项目item的评分,该矩阵的一个行向量表示为用户-项目评分向量。

表1 m*n用户-项目评分矩阵

评分数值根据用户的行为进行分析,表2为显性评分与隐性评分。

表2 评分内容

本文的智能影视推荐设计使用浏览、点击、收藏获得隐性评分值,再将该评分制作为评分矩阵。

2.2 寻找目标用户的最近邻

通过目标用户和其他用户相似度的计算,找出和目标用户具有最大相似值的其他用户,得到最近邻的数据集合。相似度计算步骤与方法如表3所示。

表3 相似度计算步骤与方法

中心另一家企业银川奥特信息技术公司董事长陈华和他的研发团队深耕智慧农牧领域,研发了“物联网+奶牛养殖技术”。有了这项技术,牧场主只要轻点手机,即便千里之外,也能随时随地掌握奶牛的健康、发情配种等情况。10月12日,奥特公司发布奶牛发情监测解决方案白皮书,进而在这一领域有了 “话语权”。

2.3 产生推荐项目

在用户最近邻集合NESi中查找用户,并将目标用户与查找到的用户的相似度的值作为权值,将邻居用户对该项目的评分与此邻居用户的所有评分的差值进行加权平均。计算方法如下:

2.4 个性化推荐算法实现

构建用户评分矩阵,轴为项目ID,轴为用户ID,单元格表示项目评分,单元格内为空表示没有评分,结果如表4所示。

表4 评分表

假设:已知用户1和用户2的向量,使用余弦相似性计算用户之间相似性,若找到用户1的最近邻,则计算用户1和其他所有用户的相似度,选择前十个结果作为最近邻居。根据此算法,不同的用户可以推荐出不同的影视,并且对于任意一个用户,他们的点击与浏览行为均有所不同,因此,可以实现个性化推荐。

2.5 系统设计思路

系统包括前台和后台两个模块,前台功能包括登录、注册、首页、电影分类、电影推荐、用户中心等功能模块;后台包括图片管理、电影管理、类别管理等功能模块,系统功能结构图如图1所示。

图1 系统功能结构图

数据库的设计使用E-R图描述各个功能需求,如图2、3、4所示,采用MySQL数据库管理数据,用户表(users)存储用户性别等基本信息,电影表(movie)存储电影片名等基本信息,系统中使用到的主要数据表有admin表、article表、asign表等。

图2 管理E-R体图

图3 影视信息E-R图

图4 影视类别信息E-R图

3 基于协同过滤的智能影视推荐系统实现

登录模块用来验证身份,管理员进入后台管理系统,进行如影片添加、删除、修改影片信息等操作。注册功能在注册界面,输入用户名、密码等信息即可完成注册,登录页面实现如图5所示。

图5 登录页面

电影推荐模块可以展示推荐电影,用户可以查看详情进行在线观看、添加、收藏等操作,影片分类模块主要展示不同类型影片,用户可以根据自己喜欢的影片类型进行分类查看。方便用户迅速查找自己喜爱的影片类型,图6为推荐模块的实现,图7为分类模块的实现。

图6 推荐模块

图7 分类模块

后台主要实现了图片管理、电影管理、类别管理等功能,系统管理员可以通过后台管理功能来实现对电影推荐系统的管理,图片管理功能模块可实现对图片信息进行查询、上传等操作;电影管理功能模块实现对电影信息的增、删、改、查操作。

检验软件系统是否符合预定要求的最后一步是系统测试,其不但可以为系统找出更多的错误,并且可以给出相对应的解决方法。用户注册测试、电影列表测试分别见表5和表6。

表5 用户注册测试表

表6 电影列表测试表

测试结果表明,界面完整且跳转正常,用户注册、用户登录等功能可以正常使用,电影列表可以正常点击、评论、收藏,本系统所有功能均可实现,操作简单、运行性能良好,符合预期设想与用户需求。

4 结语

本文以协同过滤算法为主要算法,本着服务职校学生理解与运用机器学习基本算法的实现原则,以讲解协同过滤算法为开端,构建系统模型,实现系统设计,完成系统测试,验证系统的有效性。将来继续以突破算法为重点,实现更精准的推荐。

猜你喜欢

评分影视协同
当文学作品扎堆影视化
车联网系统驾驶行为评分功能开发
文学转化影视,你需要了解这几件事
家校社协同育人 共赢美好未来
融合创新 协同发展
APACHEⅡ评分在制定ICU患者护理干预措施中的应用研究
双周最佳阵容
京津冀协同发展
四大网大影视公司核心业务
双周最佳阵容