APP下载

基于京东电商平台热水器的消费者需求及产品数据挖掘分析

2019-08-10林璐

电脑知识与技术 2019年17期
关键词:词云反馈

林璐

摘要:本文以京东六大品牌热水器交易评论数据为研究基础,利用文本数据挖掘技术从文本预处理、词频统计、情感分析等几个方面进行了分析,并分析各品牌间的差异,最后给商家提出建议,为电子商务的后期研究打下基础。

关键词 :文本数据;词频统计;词云;个性化需求;赞点;抱怨点;反馈

中图分类号:TP311    文献标识码:A

文章编号:1009-3044(2019)17-0303-02

开放科学(资源服务)标识码(OSID):

1 概述

近些年来,中国乃至全球的电子商务市场规模都在不断发展壮大!网民在电商平台上浏览、购买商品以及收到商品后的反馈评论构成了众多学者在电子商务市场下研究消费者市场的重要信息。本文主要研究如何从海量的碎片化、非结构化的文本数据中提取出有价值的信息。考慮到各大电商平台的差异性,本文以京东的六大热水器品牌(AO史密斯、海尔、美的、万家乐、万和和格兰仕)为研究对象,通过对京东电商数据中文本数据的收集、数据整合的“多维度的特征”,提出文本挖掘在电商平台分析方法,最终得到关键的决策性支持信息,提升企业的竞争力方面的优势。

2 研究过程与方法

本文总体研究流程如图1所示,具体步骤为:

1)样本数据的抽取。本文数据来源为京东平台上六大品牌不同型号间顾客对于热水器的评论数据,不同品牌的不同型号之间热水器的容量数据;

2)样本数据的预处理。数据预处理包括处理水军和随意发表的评论数据,处理无关的评论,去除标点符号、多余空白,去除停词;

3)分词、词性标注。本文采用了中国科学院计算技术研究所开发研制的汉语分词系统ICTCLAS对产品评论进行分词和词性的标注;

4)统计词频、画词云;

5)总结用户的个性化需求。使用R软件分别对六大品牌型评论数据进行词频统计,同时通过京东网站查询各型号的参数放入表格型号对应属性一列进行分析;

6)总结客户的抱怨点和赞点。通过画出词云(R语言)和二元词组的词频和转移概率(NLPIR大数据搜索与挖掘平台软件)分析用户的赞点和抱怨点。

3 结果分析

对京东六大品牌热水器个性化需求和用户赞点、抱怨点的分析结果表明,美的与海尔这两大畅销品牌最受欢迎的,销量占据总销量的百分之六七十;在六大品牌的容量需求上,40升、50升销量最高的;而在控制方式上,机械控制和电脑控制是主要选择;在加热方式上,双管加热、半胆整胆加热是选择热水器的主要因素;售后服务特别是热水器的安装是客户主要关心和反馈的问题;另外,价格、加热速度、保温性这些也是客户反馈的重点。

本文的分析基于六大品牌的,主要是想挖掘出各品牌间的差异。分析结果表明,海尔、美的与其他各品牌间的最大差异是增加3D动态加热和高温抑菌,同时控制方式的选择也更加多样化,安装等售后服务比较到位;万家乐、万和、格兰仕加热方式均为单管加热,这无法满足现在客户对于加热快的需求;AO、美的、万家乐、格兰仕四大品牌均有客户反应安装费用高;美的、万和、格兰仕的售后服务有待改进。

4 结论

通过文本挖掘,本文总结京东六大品牌的卖点和不足点。建议AO、万家乐、万和、格兰仕四大品牌商家研究更加快速的加热方式,特别是后三大品牌均为单管加热,加热方式比较落后。AO、美的、万家乐、格兰仕四大品牌应该提高售后服务质量,合理收取安装费用。

参考文献:

[1] 佘珍芝.中文网络产品评论的情感分析关键技术研究[Z]. 杭州电子科技大学,2011.

[2] 张倩.用于网络评论文本挖掘的主题模型研究[D].北京交通大学,2014.

[3] 唐守忠.文本挖掘关键技术研究[D].北京林业大学,2013.

[4] 刘涛.中文评论文本情感分析研究[D].安徽大学,2014.

[5] Das SR,Chen M.Yahoo! for Amazon:sentiment extraction from small talk on the web. Proc.of the 8~ (th) Asia Pacific Finance Association Annual Conf , 2001

【通联编辑:闻翔军】

猜你喜欢

词云反馈
对“未来教室”的初步探索
妙用“表扬”和“忽视”
媒介融合背景下的分众传播与受众反馈
面向跨语言词云可视化的拓扑保持布局算法研究