基于词云和关联共现的电商产品命名特征研究
2017-07-05刘玉林
刘玉林
基于词云和关联共现的电商产品命名特征研究
刘玉林
电商产品命名关系到消费者搜索与产品销量,对电商产品命名进行大数据分析能够找出更多特征,帮助电商企业进行产品命名决策。以天猫商城汽车后市场车载充电器为例,对产品名称中文分词,通过词云和关联共现分析,来探索电商产品命名的特征。案例研究表明:词云和关联共现分析在电商产品命名中有着非常良好的运用,可以为相关企业命名提供建议。
电子商务;产品命名;词云;关联共现
电商产品命名是电子商务经营管理的重要环节,产品命名中关键词关系到消费者搜索结果,进而影响消费者选择和成交量。目前,对电商产品命名的研究还很少,例如在中国知网中以“电商”和“命名”(或相近词语)进行检索,发现相关文献稀缺。但是,在电商企业经营实际中,决策者对产品命名关注度非常高,互联网中存在大量关于产品命名的经验贴和交流平台。因此,笔者以天猫商城汽车后市场车载充电器为例,对产品名称中文分词,通过词云和关联共现分析,来探索电商产品命名的特征,帮助电商企业在产品命名方面提供一些决策建议[1]。
一、数据准备
首先在天猫搜索页面中以“车载充电器”为关键词搜索,按照销量进行排名,对排名结果进行爬取[2]。该过程主要爬取店铺名称、产品名称、产品价格和月销量等。数据采集时间为2016年10月31日,月销量为当月总销量。依据天猫车载充电器数据爬取结果,经营车载充电器的天猫店共有1 861家,产品5 991个。需要说明的是,原爬取产品数据量为5 999个,Excel VBA编码对店铺名称、产品名称和价格3项比对去重处理中有8项产品重复,故实际有效产品数据量为5 991个。车载充电器产品价格区间分布为最低12.9元,最高2 888元,经过核对,最低价和最高价无误。月销量最高为6.1万件,最低为1件。对产品名称进行Excel字符数统计函数处理,其中字符数最低为11个,最高为52个(1个汉字为2个字符数)。进一步描述性统计表明平均字符数为33.3个,中位数为32,众数为32,方差为12.4,数据基本符合正态分布。
二、分词处理
将产品命名文本化后,导入ROST中文分词软件进行处理,得到产品命名后总词频、分词断句结果等[3]。部分车载充电器产品名称中文分词结果见表1,部分车载充电器产品名称中文分词后总词频见表2。
表1 部分车载充电器产品名称中文分词结果
表2 部分车载充电器产品名称中文分词后总词频
三、总词频词云分析
词云是对文本中出现频率较高的“关键词”给予视觉上的突出,形成“关键词云层”(或称为“关键词渲染”),从而过滤掉大量的文本信息,使读者能够很快领略文本的主旨。在车载充电器产品命名中,对中文分析后总词频进行词云分析,能够迅速呈现出产品命名的特点[4]。在频率指标方面设定经验阈值,来代表词频较高。本次研究中经验阈值设定为200次。为了使词云更加形象,关键词组图时采用汽车模型。车载充电器产品分词后高频词词云(汽车模型)分析结果如图1。
图1 车载充电器产品分词后高频词词云(汽车模型)
图1显示,车载充电器产品命名往往具有多个特征,具体包括以下4个方面:
(一)产品用途命名
图1词云显示,车载充电器产品命名和“点烟器”“充电器”或“手机充电器”等联系在一起,用于“汽车”“手机”,作为“车载”“充电(车充)”“电源”等用途。通过词云充分说明:车载充电器的购买用途主要用于汽车点烟器、手机电源充电器等,在产品命名中出现上述关键词有利于电商企业产品定位和消费者搜索购买。
(二)产品功能命名
图1词云中“一拖二或一拖三”“一分二或一分三”“多功能”与“通用型”等关键词充分体现车载充电器的功能用途,即车载充电器如果具备更多的功能,能够通用更多的设备将有利于销售。因此,电商企业在产品命名时要考虑功能命名对消费者的吸引力。
(三)产品形式命名
在图1中,“USB”和“插头”等体现车载充电器产品形式命名,是消费者诉求产品的形式体现,这也是营销学中产品核心概念中的形式部分。因此,电商企业应考虑产品命名中加入产品形式命名关键词。
(四)自带品牌命名
图1中,部分产品带有“英才星”“三星”“小米”“品胜”“先科”等自有品牌命名,进一步体现出品牌在产品命名中的应用。品牌宣传和推广有利于企业销售和消费者识别,因此电商企业产品命名可以运用自有品牌名称。
四、产品命名关键词共现分析
车载充电器通过词云分析,得出产品命名的部分规律,即用途命名、功能命名、形式命名和自带品牌命名。但是,产品命名中关键词之间的关系仍然缺乏深入研究,因此选择关联共现分析关键词,从而揭示产品命名的关联共现规律。
(一)关键词布尔型矩阵
通过Excel VBA中关键词查找功能和通配符进行编程,从而得出每个产品命名与中文分析后高频关键词的布尔型矩阵[5],如表3所示。
表3 产品命名关键词布尔型矩阵(部分)
(二)Spss modeler关联分析
在IBM SPSS Modeler 14.1中对布尔型矩阵进行分析,建立关联规则Apriori建模流处理,其中最低条件支持度为40%,最小规则置信度为80%,最大前项数为5项,该数值设置均为多次测试后的经验阈值,其结果在后续数据决策方面也有很好的运用。车载充电器产品命名Apriori建模分析结果见表4。
表4 车载充电器产品命名Apriori建模分析结果表
(三)启示
通过表4关联共现分析,车载充电器与汽车、车充、点烟器、一拖、手机、USB等有明显的高频共现现象。因此,车载充电器命名也体现以下关键词搭配特点[6]。
1.车载充电器搭配车充、点烟器和一拖的功能搭配命名
表4数据显示,车载充电器搭配车充、点烟器、一拖等均超过40%的支持度,部分达到50%以上,说明这些关键词形成了较好的共现现象,其置信度均超过80%,甚至部分超过90%。数据进一步说明:车载充电器被用于车充和点烟器,具备一拖二或者一拖三的功能,已经成为消费者需求的共性特点。通过产品功能进行搭配命名,从而提高搜索率,对电商企业经营有更好的效果。
2.车载充电器搭配车充、手机、USB的用途搭配命名
表4数据进一步显示:车载充电器与手机、USB等关键词共现支持度较好,甚至达到70%以上,说明消费者在手机充电和具备USB接口方面的产品需求更多,进一步促使产品命名中带有手机和USB等关键词出现。
四、结论
本次研究通过以天猫商城车载充电器为例,采用中文分析后词云和关联共现分析,研究电商产品命名的特征状况。研究发现车载充电器命名具有功能、用途、形式和自有品牌命名的特点,同时比较了关键消费者需求,呈现功能和用途等关键词搭配命名现象。研究表明:词云和关联共现分析在电商产品命名中有着非常良好的运用,可以为相关企业命名提供建议。
[1]PANG-NING TAN,MICHAEL S,VIPIN K.数据挖掘导论[M].范明,范宏建,等译.北京:人民邮电出版社,2006.
[2]卢杨,李华康,孙国梓.一种基于P2P技术的分布式微博爬虫系统[J].江苏大学学报(自然科学版),2016(3).
[3]张璐,吴菲菲,黄鲁成.基于用户网络评论信息的产品创新研究[J].软科学,2015(5).
[4]袁在成.可视化工具“词云”在英语教学中的应用研究[J].中国教育学刊,2016(S1).
[5]刘玉林.基于关联规则的电商产品组合销售热点研究[J].浙江理工大学学报(社会科学版),2016(6).
[6]黄天龙,罗永泰.电商化转型零售商的品牌权益提升机制与路径研究:基于双渠道品牌形象驱动的视角[J].商业经济与管理,2014(4).
(编辑:唐龙)
F724.6
:A
:1673-1999(2017)06-0036-03
刘玉林(1984—),男,硕士,安徽商贸职业技术学院经济贸易系讲师,研究方向为数据挖掘与数据化决策。
2017-04-26
2016年安徽省省级大学生创客实验室建设计划项目“互联网+数据创客”(2016ckjh087);2016年安徽商贸职业技术学院院级课题“汽车后市场电商数据商业价值开发”(2016KYR11)。