关联规则分析在超市商品布局中的应用
2019-07-21张生华李佳慧李娜
张生华 李佳慧 李娜
【摘 要】论文利用关联规则分析对扬州市某中型连锁超市会员购物数据进行数据挖掘,从交易数据中发现顾客购物篮中的不同商品之间的关联性,哪些商品组合会被顾客经常一同购买,从而对具有强关联规则的商品进行捆绑促销,优化超市商品布局,为顾客提供一个快捷便利的购物环境。
【Abstract】This paper uses association rules analysis to mine the member shopping data of a medium-sized supermarket chain in Yangzhou City, and finds the correlation among different goods in the customer shopping basket from the transaction data. Which combination of goods will be purchased together by customers, so that the goods with strong association rules can be bundled and promoted, the layout of supermarket goods will be optimized, and a fast and convenient shopping environment will be provided for customers.
【关键词】数据挖掘;关联规则分析;商品布局
【Keywords】 data mining; association rules analysis; commodity layout
【中图分类号】F274 【文献标志码】A 【文章编号】1673-1069(2019)05-0061-02
1 研究背景与意义
超市商品布局是一个非常具有现实意义的问题,随着人们的消费水平日益提高,超市、卖场和便利店的数量不断增长,竞争越来越激烈,洁净的环境、优质的服务、合理的布局显得尤为重要。由于超市体量庞大,结构复杂,商品种类繁多,并不是每个顾客都对超市的环境、布局熟悉,需要花费大量时间去寻找目标商品,在节假日尤其是大促销的时期,超市内经常因为拥挤而带来安全隐患,排队结账时间过长影响顾客的购物体验,生活的快节奏要求超市能够在较短的时间内满足人们的购物需求,节约消费者购物时间,提升购物体验。因此,研究超市商品布局的优化很有必要。
2 关联规则分析的定义和算法
在数据库的数据挖掘中,关联规则就是描述两种或者两种以上的物品在一个事务中同时出现的规律模式[1]。关联规则分析(也叫购物篮分析)主要有Apriori算法和CARMA算法以及GRI算法,其中Apriori算法应用最为广泛。
3 关联规则分析在超市购物数据挖掘中的应用
本文随机采集了江苏省扬州市的一家中型连锁超市近半年来会员的部分购物数据,包含58个属性(包括客户编号、购物时间、购物金额以及55种商品),共有6502条交易记录。属性取值“0”表示顾客本次交易没有购买该商品,取值“1”表示购买了该商品。
对原始数据作了必要的处理后,我们在挖掘软件Clementine中使用Apriori算法挖掘强关联规则,设置规则支持度大于20%,置信度大于50%,运行得到47项关联规则,其中按规则置信度排名靠前的有这样若干条规则:①“干菜和啤酒=>精肉”;②“家居清洁用品和熟食=>纸尿裤”;③“纸尿裤和冲调食品=>奶粉”;④“学生办公用品和糖果饼干=>膨化食品”;⑤“食用油=>调味料”等。在上述模型结果中,规则“干菜和啤酒=>精肉”的支持度为:(1590/6502)×100%=24.457%,规则支持度为13.836%,表示整个数据集中有13.836%的事务包含项集(干菜and啤酒=>精肉),置信度为(13.836%/24.457%)×100%=56.574%,该规则的提升=1.135,后项(精肉)的支持度为64.211%,意味着在6502个客户组成的人群中,购买“精肉”的概率为56.574%,如果对人群加以控制即购买了“干菜和啤酒”的客户组成的人群,那么购买“精肉”的概率为64.211%,“精肉”被购买的概率提高了1.135倍。根据这些强关联规则进行超市商品布局优化设计,将精肉和干菜啤酒、纸尿裤和奶粉、学生办公用品和糖果饼干以及膨化食品尽量靠近摆放,将牙膏和牙刷、食用油和调味料等商品捆绑促销[2]。
4 数据挖掘结果分析
模型结果显示:干菜啤酒和精肉这三种商品组合的关联规则最强,其次是奶粉、纸尿裤和婴儿辅食等婴幼儿用品组合,其他如牙膏、牙刷和护肤品、学习办公用品和零食以及食用油和调味料等商品组合关联性也比较强。经实地走访了解,发现该连锁超市位于郊区中心繁华地段,附近有中小学、幼儿园、美食街、拆迁安置区和行政办公场所,当地人比较热衷的一道菜就是干菜烧肉,饭店都是客人下单后直接去超市购买食材,顺便带点啤酒或者白酒,当地不少家庭也是隔三差五做这道菜。随着近几年城镇化的迅猛发展,大量失地农民收入提高,纷纷涌入城镇购房结婚生子,从而带动了奶粉、纸尿裤、婴儿辅食等婴儿用品的热销[3]。小孩子钟爱糖果饼干、膨化小食品等零食,和家长一起去超市购买学习用品的同时,会选擇顺便买一些薯片、薯条和饼干糖果等零食,因而将这些商品靠近摆放可以刺激顾客的购买欲望[4]。
5 结语
本文针对超市购物数据利用关联规则分析进行了研究,旨在为超市商品布局优化提供建设性方案,找到合理的商品捆绑促销组合,为顾客提供快捷方便的购物环境。本文分析的数据来自某个中型超市的顾客购物信息,由于提取的数据量少,带有一定的随机性,得到的结果可能并不精准和完美,不过挖掘原理大致相同,得到的结果具有一定的借鉴和指导意义。
【参考文献】
【1】于芳.关联规则分析在超市营销中的应用研究[D].哈尔滨:哈尔滨工业大学,2010.
【2】熊平.数据挖掘算法与Clementine实践[M].北京:清华大学出版社,2011.
【3】张云涛,龚玲.数据挖掘原理与技术[M].北京:电子工业出版社,2004.
【4】王军.数据挖掘技术[M].北京:中国科学院计算技术研究所,1998.