基于共词聚类的 家具企业电子商务营销数据挖掘
2018-09-10余伟刘莲陶云杰
余伟 刘莲 陶云杰
摘要:如何帮助电子商务企业有效地从海量数据中提取其所需要的信息,关键在于挖掘出客户最喜爱购买的产品关键词组合,使之能够提供精准的营销信息。本文根据电子商务平台提供的数据,对某家具企业的热销关键词进行数据挖掘,通过聚类分析法,揭示出这些关键词之间的亲疏关系,为精准营销提供有益参考。
关键词:共词聚类;家具;电子商务;数据挖掘
引言
许多家具品牌依赖于家居或者建材大卖场的活动来进行推广,家具的销售渠道依然是传统的经销商渠道。但是市场竞争已经变得越来越猛烈,只会坚守传统,不做任何创新的家具厂商必然会遭到社会的淘汰,家具电子商务其实就是销售渠道的创新。飞速壮大的电商市场给家具行业带来了新的发展契机,家具电商利用便捷的线上支付,联合线上个性化定制为消费者提供了更多的可靠选择。
数据挖掘在各行各业的使用效益已经越来越突出,而在竞争激烈的传统家具行业,若谁能率先挖掘出大数据下隐藏的秘密,通过不断地创新和利用来窥探规律,谁就更有把握引领一个行业的未来。如果家具电商能利用数据挖掘掘取用户最需要的产品,结合互联网营销手段,通过产品的不断迭代和快速的线下配送服务,将能为消费者带来更便捷和更贴心的消费体验。
1、关键词聚类分析流程
共词分析法在20多年的发展中,被广泛运用到了科学计量学、人工智能、信息系统、信息科学和信息检索等多个领域。聚类分析是共词分析法中最常用的一种方法,在统计的基础上对这些词进行分层聚类,揭示这些词之间的亲缘关系,进而分析它们所在类团的结构变化。其分析流程如下。
(1)收集相关数据:数据挖掘要选取要能确保数据的真实性和准确性。本文所需要的数据则直接来源于淘宝指数和天猫旗舰店的实际销售记录。
(2)转换为计量软件可以识别的数据格式:不同的行业有不同的数据记录方式,需要将这些格式转换为对应软件系统特有的分析格式,用以统一处理。
(3)数据预处理:对收集数据中存在的问题进行预处理,例如数据的格式不统一、近义词重复等。如关键词中的“成套家具”和“整套家具”代表同一个含义,应视为同一个关键词,诸如此类的进行预处理。
(4)利用软件进行分析:借助MATLAB和UCINET软件,得到直观的的共词矩阵和聚类图,分析这些数据之间的相互关系,找出聚类关键词,为精准营销提供依据。
2、热销关键词的提取与分析
以林氏木业为例,其于2007年建立,是与阿里巴巴共同成长的家具电商企业,在2014年八月首次创造出线上线下电子商务模式,全面安排线下渠道,更注重体验式的销售模式。本文参考的淘宝指数于2011年年底上线,是淘宝官方提供的免费的数据分享平台,用户可以通过它来窥探消费者在淘宝的购物数据,并能了解消费者的购物趋势。通过淘宝指数的真实记录可获取消费者的消费意向、年龄统计、地区分布、工作层次情况等。
结合林氏木业天猫官方旗舰店的总销量和淘宝指数,选取所展出的前50的热销产品,并结合不同季度卖出的不同产品做出统计和搜集,共整理出其中最热销产品的一百组关键词。利用MATLAB软件建对一百组关键词进行统计并按照拼音排序,共计有158个不重复关键词。
统计158个关键词出现的不同频数,排名前三的关键词分别共出现了45次、 36次、29次,即关键词“简约、小户型、现代”,为客户选择的首要考虑性能。其中出现频次排名前20的关键词可作为研究林氏木业客户的最大需求,為“简约、小户型、现代、环保、白色、真皮、储物床、布艺、转角沙发、梳妆台、双人床、韩式、多功能、欧式、创意、储物柜、田园风、钢化玻璃、组合、电视柜。”
3、家具热销关键词的网络中心性分析
UCINET网络分析软件有很强的矩阵分析功能,是目前深受欢迎的、便于使用的的社会网络分析软件。其程序本身不包括图形可视化程序,但数据可以被处理,并发出至相关绘图软件绘制图表。UCINET可进行中心性、子群的网络结构分析。
从图1可以看出,有很多不同大小的方块色点,色点的面积越大表示其与其他的存在关系越密切。如面积最大的点代表的关键词“小户型”,在所有158个热销关键词中拥有最大的中心性。可选取其中心权力排名前20的关键词作为营销参考:“小户型、简约、床垫、现代、双人床、真皮、储物床、欧式、梳妆台、韩式、板式床、多功能、中式、环保、布艺、床边柜、转角沙发、组合、创意。”
4、家具热销关键词的派系分析
多数网络研究者都坚持如下结构观,即社会结构是一种存在于社会行为者之间的关系模式。网络分析者给出一系列算法,用来分析网络的整体结构如何由小群体结构(如n-派系、n-宗派、k-丛)组成。社会网络分析者的任务之一是对“社会群体”概念进行形式化处理。在他们看来,能够通过网络里行为者子群的相关特征来刻画、研究社会群体。
从图2可以看出不同派系的频数统计,共有274个派系,其中序号1,2,4,6,10,12,14等63个关键词不隶属于任何派系。群体共享成员(group co-membership method)方法产生一个包含如下的大群体{2,27,45,50,59,61,123,132,150…}以及其他分立成员。举例来说,从网络{3,27,45,61,132,150}、{27,45,61,109,132,150}、{8,27,61,132,150}、{50,59,61, 132,150}等可以看出,61、132和150的这个子派系处于重要地位。这与之前的数据分析的结果显然是一致的。
通过以上的数据分析,我们从中可以看出客户在选择电商平台购买林氏木业的家具时的一些需求。客户多在考虑小户型家具的条件下,会倾向于选择简约、现代和环保的家具,其中多以白色为主,且消费者对床和沙发的需求量比较大,在选择这些产品的时候,多会考虑真皮或者布艺材质的。
消费者在考虑美观的同时也会注重家具的实用性,比如多功能性、可拆洗性、储物性。事实上,林氏木业的主打产品便一直是小户型布艺转角沙发,其余的热销产品包括环保钢化玻璃茶几和白色简约储物双人床。该研究可以为林氏木业电商家具产品提供针对性的生产和营销优化对策。
5、结论
大数据以及电子商务给人类生活带来了创新性变革,本文以家具行业为例,采集网络销售数据,结合淘宝指数,用共词聚类法对消费者网上购买家具的行为进行了研究,通过聚类分析出消费者的购买倾向,研究这些家具关键词的中心性和派系等。家具行业企业应以消费者的主要的购买需求为依据,大力推广其最理想的家具关键词组合,在质量保障的前提下做好售后,并结合线上和线下,抓住客户的深层欲望,同时提高企业的个性化定制能力,从而提升企业品牌的产品影响力,为企业获取更大的利益。
参考文献:
[1] 赵颖颖,张晗,赵玉虹.基于共词分析的国外转化医学研究热点[J].医学信息学杂志,2015,36(2):51-55.
[2] 曹玲,杨静,夏严.国内竞争情报领域研究论文的共词聚类分析[J].情报科学,2010(6):923-925.
[3] 李晓宇.基于共词聚类的国内物流研究现状分析[J].物流科技, 2016,39(11):13-15.
[4] 柴彦.基于共词聚类分析的科技查新研究述评[J].情报探索, 2017(2):123-128.
[5] 温菊屏,钟勇.图聚类的算法及其在社会关系网络中的应用[J].计算机应用与软件,2012,29(02):161-163+178.
作者简介:
余伟,博士,讲师,现就职于南京林业大学汽车与交通工程学院,主要研究方向为电子商务、物流工程;
刘莲,本科生,南京林业大学汽车与交通工程学院;
陶云杰,本科生,南京林业大学汽车与交通工程学院。