基于网络数据挖掘的个性化电子商务推荐系统研究
2013-09-03濮力
濮力
【摘 要】电子商务是伴随着计算机技术发展起来的新兴事物,而推荐系统的任务则是解决信息过载问题。针对当前的协同过滤算法所存在的缺陷,引入了网络思想,解决了推荐系统现有的问题,可以在网络数据的基础上实现对用户的个性化服务,有利于电子商务的进一步发展。为此,本文就基于网络数据挖掘的个性化电子商务推荐系统进行了浅要探讨。
【关键词】网络数据挖掘;个性化电子商务;推荐系统
【中图分类号】C37【文献标识码】A【文章编号】1672-5158(2013)07-0109-01
引言
在信息化全方位发展的今天,电子商务之所以能在世界范围内迅速发展,其优势在于方便、快捷、成本低、受限少。然而,电子商务也同样存在一些必须解决的问题,就是用户和商家之间的互选问题,即用户对所需产品的挑选和商家对用户所需的了解。通过网络数据挖掘与电子商务的恰当结合,就可以很好的解决这一问题,对电子商务的发展起到了很大的帮助。
1 网络数据挖掘
1.1 网络概述
在社会生活中存在着关乎人们工作和生活的各种各样的系统,通过对其本质进行分析,可以得到一个抽象的包含众多节点和连接节点的边的网络。网络是复杂系统的研究工具,为复杂系统的研究提供了新的模式和思想方法。
1.2 网络数据挖掘推荐算法
1.2.1 基于二部分图网络结构的推荐算法
因为系统的主体都是用节点来表示的,但是网络中的节点可以是一个类型,也可以不是一个类型。节点的连接关系用矩阵表示,这类节点属于单模式网络;节点不是一种的类型,不同类型的节点之间才能连接的网络称为二部分网络。
运用二部分图结构的算法,把推荐的系统中项目节点看作是具备一定的,能够分配出去的资源,同时可以把资源分配给其他看好的商品项目。
1.2.2 基于用户关联网络的推荐算法
之所以可以将网络思想引入推荐算法,是因为电子商务系统中的用户与商品及用户与用于之间具有关联性,这种基于网络的商务系统具有非常强大的适应性。主要思想就是:首先,建立用户选择的商品与评价信息之间的关联图,以权值计量。然后,在已形成的关联图中,按某商品的全部使用记录,把该商品推荐给其它相关权值较大的用户。
2 个性化电子商务推荐系统
2.1 个性化电子商务推荐系统的内容
电子商务是指有商务能力的实体,通过现代的电子技术来进行商务活动的过程。特别是现阶段,电子商务所表现出的优势越来越明显。现有的个性化推荐系统在主动为用户提供所需的信息或服务的基础上,更能同时满足为企业谋利益的要求,能为企业大力发展潜在用户,也就是可以通过个性化推荐系统实现双向推荐。
2.2 推荐系统的主要研究内容
2.2.1 信息的获取以及模型建立
随着因特网在全球的迅速发展,在准确获取用户信息的基础上,包括用户浏览行为等内容在内的交互式用户信息获取方式成为发展的趋势,这就要求在获取用户信息时,要对信息提前进行分类。
模型建立和更新的数据来源于不同途径得到的用户信息数据,并与其数量和质量密切相关,通过数据清理和转换筛选出适用于建模的数据。现阶段常见的建模技术有:关联规则挖掘、基于内容的过滤、聚类算法等。
2.2.2 推荐算法设计的有关研究
推荐算法有实时、准确、高效的特点,现在使用的主要算法都具有不同的适用领域,由于电子商务系统的使用率日渐增多,用户数据库的内容也越来越多,因此必须要在保证算法准确性的基础上,同时对其实时性进一步研究。尽管新的设计正在不断被推出,但都有一定的片面性,所以,想要得到较理想的推荐算法还需要进一步的研究。
2.2.3 评价推荐系统存在的问题
由于推荐系统的应用领域较多,并且不同的推荐系统的评价目的各异,另外,现在的评价指标大多只注重评价系统的单一特征,想对目前的推荐系统进行客观的评价还是比较困难的。现在常用的六种准确度评价指标有:预测准确度、排序准确度、半衰期效用指标、距离标准化指标、预测打分关联、分类准确度。
2.2.4 一些应用方面的问题
研究推荐系统的目的就是使其能够在不同的领域中取得应用,虽然推荐系统已经取得很好的应用效果,但其发展空间还是非常巨大的,如发展企业需要的潜力用户、拓宽推荐系统应用领域等。
3 数据挖掘与个性化推荐系统
电子商务系统中的信息量非常巨大,并且保持与日俱增的趋势,数据挖掘技术可以让这些蕴含着非常有用的规则和模式的数据得到很好的运用,从而更好的提供个性化服务。
3.1 聚类分析技术
聚类就是把数据在无指导的情况下通过非预先设定方式进行分组划分,这些数据之所以具有潜在性是因为它们都是在划分过程中自动生成的。利用这种技术得到的数据更有关注意义,更适合于分析使用。在个性化推荐系统中,通过聚类技术将客户按照不同的特征划分成不同的部分,这就使得搜索工作的效率大大提高。
3.2 关联规则技术
关联规则就是在数量庞大的数据中找出项集中的有用规则,以其高效的性能和伸缩性而成为是一个很热门的数据挖掘技术。但关联规则也有它的不足之处,就是参数阈值设置时会影响规模的效率。
关联规则中有两个很重要的概念,即置信度和支持度。以商品销售为例,关联规则生成步骤如下:第一步,从所有销售产品中找到全部的繁项集,这也是关联规则挖掘的核心和热点所在。第二步,生成关联规则,在频繁项目集中找到同时符合最小置信度和最小支持度的关联规则。
3.3 协同过滤技术
协同过滤是现阶段使用频率最多、效果最好、最受欢迎的一项技术。该技术主要是针对用户,通过搜索目标用户得到用户的行为偏好同时做出商品评价。通常所说的协同过滤技术主要指基于用户的协同过滤技术,随着对该技术的不断研究和发展,基于商品项目的协同过滤技术也得到了不断的提高。
3.3.1 基于用户的协同过滤技术
该技术的研究对象主要是用户,并且在现实生活中的使用率较高。即通过假设,把对某一商品具有相似评价的用户列为相似用户,并由此推断归结到一起的相似用户对其他商品也会有相似的评价。
基于用户的协同过滤算法实施步骤:(1)获取用户信息,即利用用户—项目矩阵描述用户所获得的商品的信息,这是用户信息获取步骤中最主要的内容;(2)相似性的计算以及相似用户集的产生,就是通过相似性计算得到与目标用户相似的用户群,得到符合相似用户数的一定数量的相似用户;(3)生成推荐结果,是在相似用户集的基础上,根据推荐方法生成推荐结果。
3.3.2 基于项目的协同过滤技术
基于项目的协同过滤技术的研究对象主要是商品项目。该技术就是用相似性计算,得到用户评价的商品项目与目标项目的相似值。利用它们之间的共性,预测用户对目标项目的评价值,通过这样的方式来获得同类商品信息。
结束语
电子商务推荐系统的应用领域非常之广,特别是将网络数据挖掘技术与其相结合,更好的符合了电子商务领域的用户所需。本文系统地阐述了网络数据挖掘和个性化商务系统以及他们之间的结合,探讨了网络技术在个性化商务系统中的应用。在今后的工作过程中,还应加强对基于网络数据挖掘的个性化电子商务推荐系统的深入研究,以切实提升系统运行的安全性与可靠性。
参考文献
[1] 张远程,康永胜.基于swarm平台和社交网络的电子商务个性化推荐系统仿真模型的理论构建[J].计算机光盘软件与应用,2012,(21):124-125
[2] 艾丹祥,左晖,杨君.基于三维协同过滤的C2C电子商务推荐系统[J].计算机工程与设计,2013,34(2):702-706
[3] 吴海彬,刘利民,刘晓莉,等.电子商务个性化推荐原型系统的设计与实现[J].内蒙古工业大学学报:自然科学版,2012,31(3):26-31