APP下载

基于多级图的推荐系统框架研究

2017-11-20毕建军

移动信息 2017年7期
关键词:框架聚类样本

董 畅 关 胜 毕建军

大连东软信息学院,辽宁 大连 116000

基于多级图的推荐系统框架研究

董 畅 关 胜 毕建军

大连东软信息学院,辽宁 大连 116000

通过研究基于多级图的多级模糊聚类算法,运用模糊聚类的结果构建多级图个体集,以传统搜索引擎的推荐系统为基础,融合、优化多种推荐算法,建立一个更加智慧、高效并且具备自主学习能力的推荐系统的框架。将复杂网络图的描述理论和基于模糊聚类的多级图划分理论相结合,来解决问题的匹配和有价值信息的存储、整理、分析上的相关问题。通过与知识库中已有答案进行匹配,为用户提供准确答案,并将所有应答记录作为知识进行管理。通过不断更新知识库,使该推荐系统具备自主学习和自适应能力,使推荐体系更为完整和精确。

推荐系统;多级图;模糊聚类

引言

随着信息技术和互联网技术的高速发展,简单的信息分类已经不能够满足人们从诸多信息中准确、快速找到有用信息的愿景。人们于是提出“信息找人”的思想,搜索平台由此诞生。传统的搜索引擎技术没有考虑到用户的特征,将所有的用户等同处理,对不同用户的搜索信息返回同样的资源序列,且反馈信息量十分巨大,不能从根本上帮助用户从诸多信息中找到自己需要的信息。为解决信息超载问题,推荐系统应运而生。

推荐系统利用用户的一些行为和兴趣特征,通过一些数学算法,推测出用户可能喜欢的东西或从互联网海量的信息中挖掘用户可能感兴趣的资源,从而为用户做出推荐。从本质上来讲,推荐系统是自动联系用户和信息的一种工具,它能够在信息过载的环境中帮助用户发现令他们感兴趣的信息,也能将信息推送给感兴趣的用户。然而,现有的推荐方法都存在一定问题与局限性。为改善这种现状,本研究希望建立一个更加智慧、简明和高效的推荐系统。因此,本文融合多种推荐算法,在基于多级模糊聚类的推荐系统的框架研究上首创地加入了多级图的思想,使推荐体系更为完整和精确[1]。

1 研究方法

一般来说,一个推荐体系的优劣,即其准确度与高效性等性能指标与该推荐系统所使用的算法和基础数据量之间的联系十分紧密。一个科学、灵活的算法或算法组合可以对数据进行有效整合,将整个系统化繁为简,使系统变得更加高效和智能。智能推荐就是建立在海量数据挖掘基础上的一种高级智能平台,大量且有效的基础数据可以保证推荐体系的合理性与科学性,确保算法的精确程度[2]。推荐系统依托庞大数据量扩大信息覆盖面积,来减少系统的知识盲点。同时,推荐体系可以通过自主学习不断提高自身的精确度,保证推荐系统的工作效果。

1.1 多级图在推荐系统框架研究中的应用

多级图划分算法可以将推荐系统划分为多个层级,使其体系更加层次分明。在每个层级中再分别进行调整和逐层优化以获得更优的结果。传统的图划分算法针对的是静态的图,因此,传统的图划分算法并不能适用于复杂的动态网络。为突破传统图划分算法的局限性,本研究将基于数据库的推荐算法和多级图划分算法相结合,提出一种通用的推荐系统框架,并按照用户层、数据层和应用层三个层级介绍了该框架的主要模块。三个层级之间互相联系且结构独立,可以根据算法灵活调整。同时,针对每一层级中的图进行图的初始划分,以减少数据的复杂性,构建图的多级层次。对原始数据进行聚类成图处理,即根据选定的阈值把数据逐层进行迭代的过程,并选取阈值附近的点进行调整和优化[3]。

1.2 模糊聚类在推荐系统框架研究中的应用

用模糊数学的方法确定样本之间的模糊关系定量,从而客观且准确地进行聚类。聚类就是将数据集分成多个类或簇,使各个类之间的数据差别尽可能大,类内之间的数据差别尽可能小,即为“最小化类间相似性,最大化类内相似性”原则。根据层次聚类使用的是自底向上的原则还是自上向下的原则,我们可以把层次聚类分为凝聚的层次聚类和分裂的层次聚类。借鉴于凝聚型层次聚类,本文所提的算法一开始把每一个对象都看成一个单独的类,然后迭代中进行类的合并,把簇间距离小于距离阈值的类进行合并,直到满足评估函数局部最小的条件为止,这种方法能够快速地并对发现高度聚集的数据区域,并对高密度区域进一步进行分析与合并,通过评估函数的评估实现对传统的模糊聚类算法的改进[4]。

研究步骤如下:

(1)计算样本或变量间的相似系数,建立模糊相似矩阵。

(2)利用模糊运算对相似矩阵进行一系列的合成改造,生成模糊等价矩阵。

(3)最后根据不同的截取水平λ对模糊等价矩阵进行截取分类。

1.3 基于多级图的推荐系统框架研究

本研究将复杂网络图的描述理论和基于模糊聚类的多级图划分理论相结合,提出了自下向上的多级划分算法框架,并利用自下向上的策略降低储存开销,合理缩并以减小多级图划分问题的规模,则可以构建一个较为高效和智慧的推荐系统[5]。

基于多级图的推荐系统框架主要分为用户层、数据层和应用层三个模块。

用户层是面对用户的开放性模块,用户通过用户层模块输入查询的关键信息,推荐系统通过此模块获取查询信息并将推荐信息返回给用户[6]。因此,用户层是连接用户和推荐系统的接口。

数据层包含着系统初始化阶段管理员添加的所有“问题—答案对”的集合,以及曾经使用过该系统的用户浏览过的“问题—答案对”,同时也保留着每个用户的基础信息和浏览历史生成用户的行为日志。数据层由初始划分和优化划分两个阶段组合而成。分别对应问题集和答案集、问题关键信息集和答案关键信息集两个层次。初始划分对原始数据进行问题集和答案集的划分主要是为了更加快速、准确地定位到用户需要的信息并将其推荐给用户[7]。

应用层经过数据统计与数据挖掘,进行面向用户的疑问特征分析、面向问题的问题分布分析,以及基于时间的问题变化趋势分析,用来获取对于客户有价值的信息。基于多级图的推荐系统框架如图1所示。

研究步骤如下:

(1)选取适量的样本数据,找出其中的相似性或无关性,形成相应的层次。层次类别根据层次的增多相应减少,但具有包含关系。

图1 基于多级图的推荐系统框架

(2)用模糊数学的方法确定样本之间的模糊关系定量,从而客观且准确地进行聚类。

(3)计算样本或变量间的相似系数,建立模糊相似矩阵。

(4)确定所要选取的信息,找出其中的关键词,选取其所在的类别对应的矩阵,减少无关样本的干扰,提取核心,进行筛选。

(5)在此矩阵中进一步选取所要找的关键核心,进一步进行筛选。

(6)在所有的样本中运用此种方法,进行一层一层筛选,找到自己所要的内容。

2 研究结果与讨论

基于多级图的模糊聚类算法是根据模糊聚类算法而得来的,能够对样本数据进行更加准确的聚类分析,打破传统聚类非此即彼的性质,运用层次分析的方法,让每个层次进行聚类,因此每一层甚至每一类的内容都可能具有相互包含的关系。选取每一类的相似系数,建立模糊相似矩阵,从而提取样本的核心。分析每一层,进一步提取样本,减少相应的干扰,直至最终确定所选取的内容[8]。

基于多级图的模糊聚类算法相较于其他算法的优点在于其多级结构的实用性与高效性。其结构可以更加方便、快捷地存储信息,降低了系统每次检索知识库的时间复杂度。基于多级图的模糊聚类可以运用到生活中应用的各个地方,进行相似的基础聚类,相应地提取样本,然后分为对应层次,使结果更加清晰,继而提高使用价值。

3 结语

为克服传统推荐算法的局限性,提出了基于多级图划分的模糊聚类推荐算法。该算法在对系统中存在的产品使用多级图划分算法进行聚类的基础上应用协同过滤推荐算法对用户进行推荐。实验结果证明:该算法可以在对推荐准确率影响较小的同时,有效地提高推荐系统的效率。

[1]商杨.基于MapReduce的可扩展协同过滤算法的研究[D].大连:大连海事大学,2015.

[2]梁洁.基于混合模式的个性化推荐系统的研究与应用[D].武汉:武汉理工大学,2011.

[3]孔维梁.协同过滤推荐系统关键问题研究[D].武汉:华中师范大学,2013.

[4]刘剑波.基于协同过滤和行为分析的微博推荐系统[D].南京:南京理工大学,2014.

[5]李祉莹.基于语义的个性化推荐模型研究[D].北京:北京邮电大学,2015.

[6]李翠平,蓝梦微,邹本友,王绍卿,赵衎衎. 大数据与推荐系统[J]. 大数据,2015(3):23-35.

[7]邓钰亮.基于多元统计的电子商务性能分析算法框架研究[D].上海:复旦大学,2008.

[8]董文远.基于混合过滤的推荐系统开发研究[D].长春:吉林大学,2011.

Research on Recommender System Framework Based on Multi-Level Graph

Dong Chang Guan Sheng Bi Jianjun
Dalian Neusoft Information Institute, Liaoning Dalian 116000

Through the study of fuzzy clustering algorithm based on multi-level graph, constructing multi-level graph individual set by fuzzy clustering results, the recommendation system of traditional search engine based on the integration and optimization of multiple recommendation algorithm, establish a more efficient and have the wisdom,ability of autonomous learning recommendation system framework. This paper combines the description theory of complex network graph with the multi-level graph partitioning theory based on fuzzy clustering to solve the problem of matching and the storage, collation and analysis of valuable information. By matching the existing answers in the knowledge base, we can provide accurate answers for users, and manage all response records as knowledge. By constantly updating the knowledge base, the recommendation system has the ability of autonomous learning and self-adaptation, so that the recommendation system is more complete and accurate.

recommender system; multi-level graph; fuzzy clustering

TP391.4;TP393.0

A

1009-6434(2017)7-0084-03

猜你喜欢

框架聚类样本
框架
用样本估计总体复习点拨
广义框架的不相交性
推动医改的“直销样本”
基于DBSACN聚类算法的XML文档聚类
WTO框架下
随机微分方程的样本Lyapunov二次型估计
村企共赢的样本
基于改进的遗传算法的模糊聚类算法
一种基于OpenStack的云应用开发框架