数据挖掘在“薄利多销”销售策略中对折扣力度与商品 销售额以及利润率的关系的研究
2020-07-04张泽公龙彦天
张泽公 龙彦天
摘 要:本文利用数据挖掘,围绕“薄利多销”的营销策略,通过商品流水及打折信息等数据,构建折扣力度概念,借助Excel和SPSS等工具,由散点图初步得出了折扣力度与营业额近似是正相关,折扣力度与利润率近似是负相关。
关键词:数据挖掘;大数据;薄利多销;最小二乘估计;Excel;SPSS
一、背景
常言道“薄利多销”。在我们的日常生活中,购物时常常会遇到打折降价的情况,打折促销是超市商场常用的销售手段。“薄利多销”是商家通过降低每个商品的利润来诱使消费者购买更多商品,增加销售数量,从而使商家更多盈利的一种扩大销售的策略。对于富有弹性的商品来说,当该商品的价格下降时,如果销售量增加的幅度大于售价下降的幅度,商家的总收益还是会上升。这就是为什么在实际经营中“薄利多销”原则被广泛使用的原因。
在打折活动中,打折力度也是一个重要概念,它与传统意义上的折扣数有所区别,打折力度可以用来衡量某一段时间内商家的折扣活动大小,但是现有资料对于打折力度缺少明确定义。本文依据商品销售额、利润率、促销时间等可计算量建立一个算率,用较为直观的公式来描述每日商家的打折力度。那么,打折力度对商品的销售额以及利润率之间有什么关系?如果有关系,是线性相关,还是无关?这些都是值得研究的问题。
数据挖掘是从海量数据中提取隐含在其中的有用信息和知识的过程,通过数据挖掘技术来处理大量的数据内容极大地提高了人们处理信息的效率,从中可以获取大量有价值的信息和知识来帮助人们进行决策工作。因此,在大数据支撑的现代社会,本文利用数据挖掘,从大量的数据中通过算法搜索隐藏于其中的信息。我们采用某商场2017年4月15日到2018年3月22日的销售流水数据,利用SPSS和Excel内置中多种数据处理工具,进行数据挖掘、分析打折力度与商品销售额以及利润率的关系。
二、采用的基本假设
为了研究数据挖掘在“薄利多销”销售策略中对折扣力度与商品销售额以及利潤率的关系,采用了以下假设:
(1)假设修正后的数据符合常理。
(2)润率计算中不考虑商场运营中的人工、场地、水电等运营成本。
(3)不考虑商品超出保质期、损坏等造成的损失。
(4)假设一天内打折力度保持不变。
三、数据筛查
某商场2017年4月15日到2018年3月22日的销售流水数据有上百万条,各个日期的商品打折明细也有数万条之多。通过对销售流水数据的挖掘、分析,我们发现有一些异常的数据,还有一些数据缺失。为了使本研究的结论更具说服力,首先应当对数据的合理性进行检验并做出处理。
1.删除错误数据
我们考虑到数据列表给出的原始数据可能会存在相对集中的无关数据,以及一些有违常识的异常数据,因此应当除去与研究问题无关的数据,以减少后面处理数据时的干扰。我们通过SPSS软件的“降序排列”功能对数据进行了重新排布,发现了一些未完成交易对应的数据组合(原因可能是消费者退货或者数据记录出错)以及一些“商品数量”为负,或者商品条形码缺失的数据。这些数据会对我们后面的分析计算产生负面影响,所以我们把它们视作无关数据并做了删除处理。
2.修正异常数据
我们继续对原始数据进行分析发现,存在一些可能由于数据收集或者记录偏差而产生的可更正异常数据,如果直接将这些数据删除,可能导致我们之后的数据分析不准确。为了得到准确的结论,我们应当对这些数据进行修正,以确保数据完整性。This paper uses data mining, around the marketing strategy of “low profit and high sales”, constructs the concept of discount strength through the data of commodity flow and discount information. With the help of Excel and SPSS and other tools, it preliminarily obtains that the discount strength is positively related to the turnover, and the discount strength is negatively related to the profit margin.
利用SPSS处理数据时我们发现,有些商品名称缺失,但是商品代码没有缺失,根据商品代码与商品名称一一对应的关系,可以将这部分缺失的异常数据进行补齐,方法是通过Excel里面的VLOOKUP函数在商品清单中将商品名称与商品代码一一绑定,再补充到缺失行列中。
四、折扣力度概念的引入
通过对商场销售流水以及折扣活动记录的分析,我们引入“折扣力度”这一概念来综合衡量折扣活动对消费者的吸引力,用字母表示为Dp。
由日常生活经验可知,打5折的商品比打9折的商品的折扣力度大,亦即折扣力度的一个影响因素是商品折扣数,商品折扣数为商品实际售价与商品定价之比,用Dr表示。用购买数量Sc除以限购数量Lc来表示打折活跃度Da。现假设有两种商品分别为A、B,两者的用途相同且可以相互替代。它们有相同的标价,并且同时举行了打折数相同的折扣活动,但是商品B的成本价高于商品A。这时消费者会更倾向于购买商品B,也就是此时商品B的折扣力度更大。由此可见,当折扣数相同时,利润率低的商品的折扣力度更大。商品利润率为商品的利润总额与商品的成本总额之比,用R表示。此外,消费者在折扣活动中消费的数量也是反映折扣力度的一个重要因素。显然,消费者购买的限购商品数越多,说明折扣活动对消费者的吸引力越强,折扣力度也越大。综合以上三种主要因素,我们给出的折扣力度计算公式为:
公式中,分子与分母的值均在0到1之间,其运算结果的方差较小,具有较好的可比较性。对于Da来说,由于实际生活中活动商品的限购数量往往是十分庞大的,因此Da的值在实际中往往较小。考虑到在一天之内商场中可能会有多种商品打折,我们规定某一天之内商场的总折扣力度为当天所有参加折扣活动商品的折扣力度的平均值。
五、折扣力度、利润率、销售额的计算及其它们的关系
首先,我们根据更正后的销售流水记录计算出该段时间内每日超市的营业额Y。公式为:
公式中Spi为商品i的销售价格,ni为商品i销售量,I为当天不同商品销售总条数。根据此公式我们可以计算出2017年4月15日到2018年3月22日商场每日的营业额如下图:
由散点图我们很容易能看出折扣力度与营业额近似是正相关,折扣力度与利润率近似是负相关。我们可以利用皮尔逊相关性检验来验证我们的结果是否准确:
利用SPSS计算得到营业额与折扣力度之间的p值很小(<0.0001),相关系数R=0.134>0,所以符合正相关。值得注意的是:当折扣力度大于3时,营业额与折扣力度的正相关性不明显,甚至消失。这说明打折力度不宜过大,打折策略如果选择得不正确,也会影响商场收益,而这也与我们的直观感受一致。
同理,利用SPSS计算得到营业额与折扣力度之间的p值很小(<0.0001),相关系数R=-0.449<0,所以符合负相关。
六、讨论
我们可以将问题推广,进一步探讨:如果考虑商品的大类区分,打折力度与商品销售额以及利润率的关系会有何变化?我们对采集到的数据中所包含的各种商品进行了分类,结果如下图所示:
价格弹性是衡量商品的供给量和需求量对价格信息的敏感程度的量。当价格弹性系数等于1时,商品销售量的上升幅度与价格的下降幅度是相同的;当弹性系数在0到1之间时,商品销售量的上升幅度小于价格下降的幅度,这时我们就说这类商品是缺乏弹性的,或者说价格不敏感;反之,当弹性系数大于1时,商品销售量的上升幅度大于价格的下降幅度,我们称这类商品是富有弹性的,亦即是价格敏感的。大多数食品,生活日用品的价格弹性通常比较低,而大多数奢侈品的价格弹性较高。
商品的价格弹性受到多方面因素的影响,这些方面主要包括:商品的可替代性、商品对于日常生活的重要性、消费者的预算、商品的用途等。本文依照以上因素,将各大类的商品粗略地分为价格弹性大和价格弹性小两大类:
价格弹性大的商品类别包括:进口商品、手机、水产、玩具、运动户外、鲜花礼品、宠物生活、水果/蔬菜、营养保健。
价格弹性小的商品类别包括:办公用品、纺织用品、服装饰品、个洗清洁、烘焙、家居家装、家用电器、节庆用品、酒水饮料、家居日用、粮油副食、美食、母婴、情趣用品、日化用品、日配/冷藏、肉品、文化用品、休闲饰品、医疗器械。
使用本文所述的方法对上述两种类别的商品进行分析后,我们得出了以下结论:
对于销售额来说:折扣力度对价格弹性大的商品的影响较大,折扣力度越大,商品的销售额越高,正相关性较为明显;而对于价格弹性较小的商品来说,两者之间的正相关性就不是那么明显。对于利润率来说,无论是价格弹性大的商品还是价格弹性小的商品,都可以明显地看到折扣力度与利润率之间的负相关性;进一步分析可以发现,弹性较大商品的利潤率对折扣力度更加敏感,而弹性较小商品的利润率的下降会随着折扣力度的增大而有所放缓。
七、结论
本文通过对采集到的约120万条商场流水记录进行数据挖掘,从中筛选出了有效数据约91万条。通过对这些数据进行整理和分析,我们提出了一个可以较为合理地衡量折扣力度的公式。以此为基础,我们进一步使用最小二乘法拟合出了每日折扣力度与商场每日销售额以及日利润率之间的关系。接着,我们又根据商品的价格弹性将其粗略地分为两类,并且分析了折扣力度的大小对这两类商品的销售额和利润率的关系。总而言之,本文通过科学的方法证实了所谓“薄利多销”在实际生活中运用的合理性,本文中新提出的“折扣力度”的概念将为后续的分析和研究提供方便。
参考文献:
[1]联商.商场打折的运作策略与艺术[J].商业时代,2018(18):14-14.
[2]吴依兰.信息时代下数据挖掘技术的应用探讨[J].数据挖掘,2019,9(4):131-134.
[3]陈珍珍,著.统计学:厦门大学出版社,2002年.
[4]吴喜之.统计学:从数据到结论[M].中国统计出版社,2005.
[5]陈通.宏微观经济学[M].天津大学出版社,2003.
作者简介:张泽公(2000.08- ),男,汉族,河南郑州市人,北京交通大学理学院,本科在读,研究方向:力学