APP下载

关联规则算法在电子商务推荐系统中的应用探讨

2014-04-29马宗亚张会彦

现代企业教育·下半月 2014年4期
关键词:加勒比海关联顾客

马宗亚 张会彦

摘要:通过数据挖掘在电子商务推荐系统中的运用,在使用关联算法的基础上为客户构建虚拟导购。同时,可分析某一热销产品捆绑另一产品可被一同购买的几率为多少。通过对客户偏好的商品类别分析和捆绑销售模式为顾客提供量身定制的服务,同时将电子商务平台所得利益最大化。本文简要介绍了电子商务推荐系统,在积累了前人构建挖掘模型的基础上建立了基于Apriori算法的电子商务推荐系统。研究关联规则算法在电子商务推荐系统中的应用,目前,Apriori算法已被广泛的运用到多个领域,准确度高、简单化等优点十分利于机器记忆与学习。

关键词:关联规则算法电子商务推荐系统应用

随着电子商务(Electronic Commerce)的迅猛发展,给人们的日常生活带来了众多的便利,同时也给电子商务能否提供快速高效的服务带来了挑战。电子商务中配备推荐系统能够很好地解决这一难题,该系统一经推出就收到社会各界的广泛关注。

1.电子商务推荐系统

电子商务推荐系统是指通过电商商务网站向购买者提供相关的购物建议和商品信息来帮助用户挑选商品,是一种模拟导购的软件系统。推荐系统主要有三方面的优点:第一,可提高网站之间的交叉销售力度。第二,将网站的浏览者挖掘为购物者。第三,可大大提升客户对网站的依存度。这些优点可挖掘出客户的消费模式,通过用户的浏览记录和购买商品趋势收集到关于用户喜好的大量信息。当用户登入时会其他用户出现类似的消费状态时就可提供与此相关的各类产品。推荐系统主要由数据采集、推荐运算和运算结果三部分组成。图1为常规的推荐系统模型图。其中,关联算法为电子商务推荐系统核心的组成部分,可达到高效运算并提供确切的关联规则的效果,电子商务推荐系统的成败就在于关联规则的确立是否正确。

2.关联规则算法在电子商务推荐系统中的应用

本文模拟在电子商务中购买电影票的情景来研究关联规则在电子商务推荐系统中的各方面的应用。Apriori算法是挖掘关联规则中较为繁琐的项集算法,Apriori算法的核心为在候选集与封闭测试两部分来分析项集算法。目前Apriori算法已被广泛的运用到多个领域,尤其是电子商务中。

2.1关联规则算法设计

2.1.2用户数据准备

挖掘模型的产生需要大量已存储的信息和数据供挖掘模型记忆。本文挖掘模型采用的是ZhaoHui Tang提供的MovieClick数据集完成算法的模拟实验。在模拟实验中涉及到Customers(顾客)和Purchase(购买)两个表格。Customers所代表的是客户信息,包括:年龄、性别、受教育水平等状况。Purchase为事务表,其中包含了顾客在电子商务平台中购买电影片的列表。

2.1. 2关联规则算法流程

创建Apriori算法是建立关联挖掘模型的第一步,然后就是挖掘模型的学习阶段,也成为训练阶段。简言之,就是通过挖掘算法达到收集客户数据内的知识。在本文中的情景模拟①准备了MovieClick的数据集样本,可对顾客的信息与顾客所购买的电影票之间产生关联模型的学习,从而形成最终的挖掘模型。挖掘模型组件完成后,它就具备了推测顾客的购买电影的趋势,从而来完成电子商务推荐。具体的关联挖掘模型如图2所示。

2.2关联规则算法设计结果与分析

通过对关联规则算法的流程模拟来构建挖掘模型,可促使电影商品与电子商务平台的发展与融合。同时,通过应用Apriori算法创建的关联挖掘模型发掘出频繁的项集从而形成最终的关联规则。由以挖掘出的关联规则进行探讨分析可知其中的大量有价值的数据。例如:在已成规则中客户已经购买了《加勒比海盗I:黑珍珠号的诅咒》和《加勒比海盗II:聚魂棺》,那么有近98.5%的几率会接着购买《加勒比海盗III:世界的尽头》和《加勒比海盗Ⅳ:惊涛怪浪》。通过这些规则我们可从《侏罗记公园》、《速度与激情》、《哈利波特》、《纳尼亚传奇》、《博物馆奇妙夜》 等具较强的连续性的电影,这一系列电影适合捆绑销售。同时,我们还可以发现一些喜欢《星河战队》、《谍影重重》、《虎胆龙威》等影片的顾客大部分为男性顾客,这说明《星河战队》、《谍影重重》、《虎胆龙威》等影片更受男顾客的欢迎,同时可关联到看过《加勒比海盗I:黑珍珠号的诅咒》和《侏罗记公园》年龄在28~35岁之间,婚姻状况为已婚,则说明年龄在28~35岁之间看过《加勒比海盗I:黑珍珠号的诅咒》和《侏罗记公园》电影的顾客有近78%为已婚人士,则可关联电影《速度与激情I》,年龄在32~41岁之间的顾客大部分为中年观众。

3.结语

目前,电子商务推荐系统中最主要的组成部分为Apriori算法关联挖掘算法的挖掘模型,通过本文的实验可见,电子商务推荐系统的设计部分需要更多的考虑顾客的个人需求,促使电子商务推荐系统智能化、人性化方面发展。但Apriori算法还存在一些缺陷,容易造成繁琐的运算规则,因此需要多次的数据库扫描,无形中提高了电子商务推荐系统运行的所消耗的资金。在实时的电子商务在线购物系统中,系统响应时间过长、整体效率偏低等因素限制了电子商务推荐系统的运算效率,这些问题都是往后研究中的重点,只有完成了这些难题的攻克才能从整体上提升电子商务系统的运行效率。

参考文献:

[1] 孙成喜,谢金生.基于Web挖掘的电子商务推荐系统设计[J].甘肃科技纵横,2011,40(2):20-22,184.

[2] 陈思敏,邢延.一种改进的量化关联规则算法在零售業中的应用[J].电脑编程技巧与维护,2011(6):24-25,34.

猜你喜欢

加勒比海关联顾客
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
“一站式”服务满足顾客
“一带一路”递进,关联民生更紧
Hola,来自加勒比海的问候
他是一个海盗
奇趣搭配
加勒比海
智趣
让顾客自己做菜
以顾客为关注焦点