APP下载

基于大数据技术的大型超市数据分析

2021-03-23李清蔓

科学技术创新 2021年7期
关键词:发货销售额订单

李清蔓 杨 杉*

(四川大学锦城学院 计算机与软件学院,四川 成都611731)

1 概述

随着大型超市和连锁超市的快速发展,超市业已成为商业领域最具活力的商业业态[1],我们日常生活中经常会去超市采购日用品,超市已经成为我们生活中不可或缺的一部分,超市的发展也紧密连系着我们的生活。全球大型零售商沃尔玛在分析大量的数据时发现,男性顾客在购买尿布时,常会买几瓶啤酒,于是将啤酒和尿布摆在一起。[2]在之后的数据表明使尿布和啤酒的销量都大幅增加了,这是大数据的经典案例“啤酒+尿布”。可以看出通过大数据技术的数据分析等等方面可以挖掘到超市一些隐藏的有效数据信息,其中数据挖掘就是利用数据分析工具从海量数据中提取隐含的、表面不为人们所知但又有价值的信息获取过程。[3]零售领域是数据挖掘的主要应用领域之一,[4]比如大数据技术可以了解消费记录、消费额、地区销售额等数据,有针对性地对重点区域进行广告投放,助力超市的发展。

2 研究思路

以一家全球大型超市四年的销售数据为研究对象,数据是2011-2014 年该超市的销售数据,对该数据进行一个多角度的分析,采用python、图表秀,对该超市进行销售情况、商品情况以及客户情况三方面分析。具体分析了超市这四年的发货情况、利润情况、整体地区布局、各类商品销售情况、销售数量、超市客户类型占比、客户增长情况等。

3 数据说明

3.1 数据来源

数据来源于kaggle 平台公开的一家全球超市四年的销售数据,数据表中包含了行编号、订单编号、订购日期、发货日期、运送方式、顾客ID、顾客姓名、市、州、国家、市场、地区、类别、产品名称、营业额、数量、折扣、利润、运输费等24 个特征,共50000多条数据,12M。

3.2 数据预处理

在数据表中,存在一些空值、异常值、错误值和无效列等等数据,因此对数据进行了数据预处理,筛选出了我们需要的、正确的数据,把不需要的数据进行了剔除,其中主要使用了订购时间、发货日期、市、州、市场等字段的数据进行分析和探索。通过筛选空值发现,邮政编码这一列存在大量空值,并且对数据分析没有作用,因此删除该列。数据中订单优先这一列有为空值的数据,并且发现这些数据存在错位现象,删除订单优先为空值的数据行。筛选中发现,Sales 这一列有不是数值的数据,删除销售额为字符串的数据行。

4 销售情况分析

4.1 发货情况分析

图1 发货时间差可视化展示

一共有50629 笔订单,每笔订单的发货时间差平均为1 天左右,最长的发货时间差为7 天,并且发货时间差为0 天的订单数量为38472 个。由图1 可知:当天就发货的订单数量占所有的75%以上证明该超市发货时间差较小,大多都能够在短时间内发货,效率较高,也证明该超市的商品库存量基本都保持在一个充足的状态下。

4.2 利润分析

图2 2011-2014 年月利润情况可视化展示

由图2 可知,该超市从2011-2014 年的总利润同比上一年相比呈现上升的趋势,2011-2014 年的下半年利润总体都大于下半年利润,该超市的销售季节性非常明显,上半年是销售淡季,下半年是销售旺季。但上半年中6 月份利润额呈现一个上升的趋势,利润偏高,下半年中7 月份的利润额较下半年的其他月份偏低。

对于上半年,结合多种原因分析其6 月份利润额偏高的原因,利用这些原因可以进行一些销售活动,提高6 月份的利润额。上年半年的其他月份,可结合商品的特点制定销售策略,还可以举办一些促销活动,促销可以刺激和诱导消费者购买商品。促销主要是聚集人气、吸引客户、提高销售额。而一般情况下, 消费者进入超市,计划性购买仅占30%~40%,而冲动性购买则占到60%~70%。超市只有通过开展多种促销活动,才能扩大销售、提高营业额。[5]

对于下半年,在保持原来的营销策略基础上,可以针对其具有季节性特点的商品,举办活动,加大商品投入。

4.3 销售地区分布

图3 2011-2014 年不同地区销售情况可视化展示

该超市销售额中,APAC(亚太地区)销售额最高,Canada(加拿大)销售额最低,APAC、LATAM(拉美)、US(美国)、EU(欧盟)这四个地区就达到了85%以上的销售额占比。根据图3 可知:除加拿大地区以外,其余的六个地区销售额每年呈现一个上升趋势。APAC、EU 两个地区的每年销售额增长较快,具有巨大的发展潜力,该超市可以将市场重点放在APAC 和EU 上面,加大投入,在重点区域有针对性的投放广告等,增加每年销售额。其余地区可以参照APAC 与EU 的经营模式和策略,将两个地区的超市负责人与其他地区的负责人进行一个交流,将其余地区也做大、做强。

5 商品情况分析

各类商品销售额贡献情况:

图4 各子类商品销售额占比、利润可视化展示

由图4 可以看出:只有Tables(桌子)的利润为负,说明桌子目前处于亏损的状态,通过筛选发现大部分桌子都在打折并且打折力度很大,超市要看是否是因为桌子滞销而打折出售的,如果不是此类情况就该考虑改变营销策略,减少亏损。

Copies (复 印 机)、Phones (手 机)、Bookcases (书 柜)、Appliances(电器)、Chairs(椅子)、Machines(机器)、Storage(储藏箱)这几类商品是销售额比较好的,一共占到了总销售额的一半以上,这几类商品是该超市主要销售商品。销售额比较少的几类商品,Paper、Supplies、Labels 都是办公用品中的小商品,超市可以在不亏损的情况下,降低这些小商品单独买卖的定价与复印机、书柜这几个销售额较高的办公用品一起打包销售,或者采用买多少送一些小商品的营销策略。

6 客户情况分析

6.1 不同类型客户消费情况

图5 不同类型客户2011-2014 年销售额可视化展示

从图5 可以看出:消费者占该超市客户数量最大,说明普通的消费者是该超市的主要客户,企业占比也比较高,企业的单子都比较大且固定,多多加强与企业的合作有利于超市的发展。

2011-2014 年各类型客户的销售额呈现逐渐上升的趋势,说明该超市的经营模式比较好,可以继续保持该经营模式。

6.2 每年客户数量变化

图6 2011-2014 年客户数量变化情况可视化展示

从图6 可知:2011-2014 年的订单数量是在逐年增加的,但每年新增的客户呈现一个逐年下降的趋势。证明该超市客户的回购率比较好,经营情况保持的也比较好,订单主要都是老客户。保持老客户,吸引更多的新客户才是企业的生存之道。该超市可以举办一些销售活动或者不定期的进行超市的宣传、营销活动吸引更多的新客户注入超市。

7 结论及建议

7.1 销售情况方面。发货时间差有75%以上都是当天发货,可以继续保持。2011-2014 年,订单数量是逐年增加的,说明超市的经营比较好。该超市从2011-2014 年的总利润同比上一年呈现上升的趋势,销售季节性明显,上半年是淡季,下半年旺季。在上半年可以举办一些促销活动,还可以结合商品的特点制定销售策略。下半年,在保持原来的营销策略基础上,可以针对其具有季节性特点的商品举办活动,加大商品投入。销售地区分布 中,APAC 销 售 额 占 比 最 高,Canada 销 售 额 最 低,APAC、LATAM、US、EU 达到了85%以上的销售额占比。APAC、EU 两个地区的每年销售额增长较快,该超市可以将市场重点放在APAC 和EU 上面,加大投入,其余地区可以参照APAC 与EU的经营模式和策略,将地区之间进行交流,把其余地区也做大做强。

7.2 商品情况方面。销售额前三是:Phones、Copiers、Chairs,利润前三的商品是:复印机、手机、书柜,可以加大这几类利润高的商品的营销和推广。桌子目前处于亏损的状态,超市要看是否是因为桌子滞销而打折出售的,如果不是此类情况就该考虑改变营销策略、减少亏损。降低Paper、Supplies、Labels 等小商品单独买卖的定价与复印机、书柜这几个销售额较高的办公用品一起销售,或者采用买多少送一些小商品的营销策略。

7.3 客户情况方面。消费者是该超市的主要客户,可以多加强与企业的合作。2011-2014 年各类型客户的销售额呈现逐渐上升的趋势,该超市的经营模式比较好,可以继续保持。每年的订单数量是在逐年增加的,每年新增客户为下降趋势,说明该超市客户的回购率比较好,经营情况保持的也比较好,订单主要都是老客户。该超市可以举办一些销售活动或者不定期的进行超市的宣传、营销活动吸引新客户。

猜你喜欢

发货销售额订单
春节期间“订单蔬菜”走俏
订单农业打开广阔市场
吉日发货
《日本动漫产业2019》:海外销售额首次超过1万亿日元
中国奥园:销售额首破千亿元 净利润同比增长近八成
零投诉
零投诉
“最确切”的幸福观感——我们的致富订单
销售旺季难掩下滑势头
Lily无人机推迟发货时间