基于图数据库的音乐推荐系统的设计与实现
2017-11-30韩滢晫甘肃中医药大学定西校区计算机系
韩滢晫 甘肃中医药大学定西校区计算机系
基于图数据库的音乐推荐系统的设计与实现
韩滢晫 甘肃中医药大学定西校区计算机系
随着科技和互联网在近年来的不断发展,使得信息在互联网上的传播变得十分迅猛,带来方便的同时,也带来了一定的不便。本文在使用图数据库的音乐推荐作为基础,采用不通的协同方法对数据和算法过滤作出了选择。
协同过滤 图数据库 推荐算法
1 绪论
互联网把我们带进了信息爆炸的时代,人们的娱乐生活日趋丰富,各种视频,包括电视节目以及各种娱乐视频等都存在在网络上,即面对大量复杂多变的信息,对于音乐爱好者来说,其利用网络在浩如烟海的音乐数据库中找到自己喜欢的音乐并不容易。
而事实上,到目前为止,我们经常所用到的百度音乐、网易客户端、腾讯QQ平台的崛起都在说明中国各软件供应商从未放弃过对个性化音乐推荐产业的蓬勃热情。
2 图数据库技术
图数据库的核心是根据“图”结构特点进行数据管理,具有结点、属性和边(即关系),而不是传统意义上的“图片”数据库,与关系型数据库对比,图数据库的管理结构不限于对三元组与网络的形势。
图数据库中的关系模式具有多变性,适合对数据结构变化较快的大量数据进行管理,而这一点是传统的关系型数据库所不具备的。图数据库的重要查询工具是“类图”,它用来计算图中结点之间的距离,以确定最佳数据访问策略。
结点:以具体的个人和相关企业等实体为基础。
属性:根据所涉及到的信息,将个人的基本信息包括姓名、性别和年龄等信息进行整理。
边:根据相关结点的属性,将重要信息放入边置,将互连信息放到结点之间。
3 各种推荐算法研究
3.1 基于内容的推荐
用户的访问分为多种类型和方式,包括点击和拖动等。在对用户兴趣进行研究时,需要针对用户的心给以及对用户的兴趣进行解释,并不能根据用户的单一动作进行判断,要综合用户的整体浏览时间,拖动、点击的次数以及时间,并对用户的相关行为进行详细的研究。
3.2 基于聚类的推荐算法
k-means算法是较为经典的算法,能够充分解决聚类问题,他通过对算法和理论进行处理,并能够实现较为快速简洁的计算,其不足是该算法使用的值能够导致不同的聚类结果,因此需要进行多种类型的聚类才能够实现其理想的聚类结果。此外,k-means主要采取迭代的方式进行最优解的计算,在其过程中主要保证误差的平方和局部的最优化,使最终的局部值最小化。然后进行应用的范围将逐步减小,其聚类数量K也需要进行设定,因此加重了其局限性。
3.3 协同过滤
协同过滤推荐技术以其独特的优势获得了个各大网站的认可。它是一种基于一类兴趣偏好类型相似的用户所感兴趣的事物对目标用户进行推荐的技术。和过去的一些过滤技术相比,协同过滤能够过滤难以进行机器分析的信息,并且能够对一些复杂的概念进行过滤,具有准确度高,适用强等特点。目前Amazon,CDNow等都采用协同过滤的技术来为用户服务并获得好评。
4 音乐推荐需求分析和系统设计
进行系统推荐,一般需要面向两类对象:用户和商品。系统最重要的部分就是进行推荐,因此需要将用户和相关物品进行彼此相连,而大多数的音乐推荐的工作是向用户推荐一个播放列表,因此音乐网站也纷纷建立起社交功能,以便于用户添加朋友和推荐等。
其存储层是用来对系统的数据进行储存。这要包括对用户、音乐和歌手等信息的基本储存,包括其推荐信息、用户的反馈等数据。
基本信息收集层包括对用户的维护、歌曲和歌手信息的管理等。
接口层与前台系统的通信中,由于系统的运行状态,需要在后台计算出相关的数据,并传递给前台进行展示。
5 基于协同过滤的音乐推荐系统的设计与实现
在进行音乐推荐的项目中主要针对对正余弦的方式进行核心算法的过滤。其具体的算法如下:
输入:目标用户的ID
输出:目标用户的推荐曲目集C
Step1.从数据库中读取所有用户-音乐的播放次数;
Step2.将用户-音乐的的播放次数转化为用户-音乐显示的评分数据,生成用户-音乐评分矩阵R;
Step3.通过公式5.1计算目标用户与其他用户的相似性;
Step4.将与目标用户最相似的K个用户作为其邻居用户,以邻居用户的评分为基础计算目标用户对未评分乐曲的评分;
Step5.将预测评分结果中评分最高的N的项目形成推荐列表,推荐给用户。
6 总结与展望
文章通过对系统推荐中的协同过滤算法进行研究,产生了基于不同项目的过滤算法。对系统进行整体的推荐使用和分析。由于对系统的设计主要是用于对用户提供高质量的音乐服务,但有些方面还是不够完善,在日后需要逐步提高其功能的使用,帮助用户得到更完善的体验。因此需要在日后进一步加强。
[1]马宏伟,张光卫,李鹏.协同过滤推荐算法综述[J].小型微型计算机系统,2009
[2]李忠俊,周启海,帅青红.一种基于内容和协同过滤同构化整合的推荐系统模型[J].计算机科学,2009
[3]孟均平,陈莉,马文宁,李华.图数据库中的相似性搜索算法研究与应用[J].计算机应用研究,2010
韩滢晫(1988-),女,甘肃定西人,助教。研究方向:数据挖掘。