APP下载

电商环境下基于用户评论的松木家具质量研究①

2018-09-10孙伟玥王超李欢欢王恰

中国商论 2018年23期
关键词:电商平台

孙伟玥 王超 李欢欢 王恰

摘 要:本文基于大数据和数据挖掘技术提出了消费者在线评论质量评价的方法,利用此方法研究了松木家具用户在线评论的质量。首先,通过抓取电商平台的买家在线评论得到商品评价;其次经过筛选测算分析数据,得到产品质量合格情况与消费者更关注的质量特性;最后,比较用户感知评价结果与国家质量监督抽检结果之间的差异。

关键词:松木家具 电商平台 评论质量 感知合格率

中图分类号:F724.6 文献标识码:A 文章编号:2096-0298(2018)08(b)-162-02

1 绪论

1.1 研究意义

随着国内电商平台的蓬勃发展,消费者在进行购买活动之后可以对商品进行在线评价。而在线评论的质量在一定程度上也能反映商品的质量,因此对评论质量的研究引起了国内外学者的广泛重视。国内外学者把研究目标大多聚集在在线评价概括汇总和垃圾评论检测这两个部分,而缺乏对某个具体商品进行在线质量测评。因此,本文在理论与实践方面都具有重要的意义。在理论方面,本文的研究可以为“产品质量监督”方面的研究提供新的方向,而在實践方面,此方法可有效避免“抽检成本高、样品数量少以及较难发现的未知异常情况”等问题,还可以与传统的随机抽检方案相配合,有效维护消费者的合法权益与人身安全。

1.2 国内外的研究发展情况

通过现有文献的来看,国内外学者已经围绕信息本身(即评论的质量、数量和时效性),信息源(即发布的电商平台、发布者),和信息接收者(即消费者知识、消费者的参与程度)对在线评论的因素和影响进行了广泛的研究。评论质量的评估越来越受到重视。文献[1]在评价Amazon产品的买家评论质量中,对各种特征及词典句法进行SVM回归实验。最终发现评论的单位,长度和产品评级是影响评价在线评论质量的主要特征。文献[2]提供了一种根据评论有用性自动排列评论的算法,并对Amazon的图书展开研究。利用一般评价和最好评价之间的差异来比较评价的质量。文献[3]提出一种运用复杂网络的评论有用性理论分析,通过研究评论文本的语义关联,分析评论的有用程度和用户需求之间的关系,最终确定了其能够清晰地描述用户评论中的需求并能准确的,高覆盖率的获取用户的需求。

2 研究的技术路线与方法

整个过程包括采集数据、数据预处理、质量属性提取、扩充特征属性、情感极性分析以及文本量化6个关键步骤。

2.1 采集数据及处理

通过把京东商城的松木家具按照销量顺序排列,在京东商城销量排名前30的松木家具中随机抽取11款松木家具,提取了买家在线评论共计63969条作为总数据源,然后对采集的评论数据进行数据预处理。将数据预处理分为三个过程:首先,利用Excel将数据去重,就是指在采集到的京东买家评论里查找并删除重复的数据,只保留唯一的买家评论。其次,利用中文分词器GOOSEEKER过滤掉数据中所有停用词,并对数据进行分词以及词性标注处理。最后,从所有分词中进行筛选所需要的与产品质量相关的词语。最终得到了精炼的买家评论9294条。

2.2 扩充特征属性

利用预处理好的买家评论数据,用Excel把数据按照一列中选定的分词出现的次数多少进行排序,可得到每个选定分词在整个数据中出现的频率,筛选出频率大于9的名词与动词,把这些词按照语义分为6个特征属性集,对产品特征属性词进行扩充,通过网络上查询同义词完成。在特征属性词扩充之后,还需标注情感倾向在特征属性集中的每个词中,并作出每个词的极性分析(1-正向情绪,0-中性情绪,-1-负向情绪),构建出松木家具的特征词典。

2.3 文本的量化

表1中f1~f6分别代表了松木家具的外表、尺寸、材料、残留溶剂、物理性质和功能性这6个质量属性。采用文本量化的分析方法,统计出量化数据,并将文本数据转化为数字数据,最终利用买家评论数据对松木家具的产品质量进行评价。本文中精炼的买家评论一共有9294条,通过量化后得出有7989条评论认为松木家具的质量是合格的,有1305条评论认为松木家具的质量是不合格的。由此得出,松木家具的质量合格率为85.96%,与国家质量监督抽查合格率90.9%相对比,大约低了5个百分点。

3 分析结果与讨论

本研究中通过上述方法研究,对于松木家具的产品质量有几点认识。

讨论1:抽查合格率和感知合格率两者之间是有可比性的。

抽查合格率是国家及地方各级人民政府, 依照GB/T3324-2008《木家具通用技术条件》,GB18584-2001《室内装饰装修材料 木家具中有害物质限量》,《木家具质量检验及质量评定》[6]等标准、对产品规范地进行程序化的检测,从而得到产品质量的合格率。感知合格率是消费者购买并使用了某产品,对于该产品的质量好坏作出主观的评价程度。为了更好的分析感知合格率与抽查合格率之间的关系,研究两者的可比性。本文中将把消费者评论中的对产品质量的主观评价与政府的最终抽检结果进行对比,将用户感知的6个松木家具的质量特性合格情况与国家标准用语的进行比对,最终可得知用户感知的松木家具主观评价标准与国家质量安全标准对产品合格率的判定较为接近,由此得出抽查合格率和感知合格率两者之间是有可比性的。表2为用户评价的6个松木家具的质量特性合格情况与国家标准用语的对照。

由表2对比可知, 用户评价的6个松木家具的质量特性合格情况与国家标准用语相接近,可以利用买家的在线评价来推测松木家具的质量。

讨论2:用户的感知合格率和国家的抽查合格率的相似关联度为99.81%。

根据《2017年木制家具产品质量监督抽查报告》中所示的木质家具质量随机检测结果,结果中显示产品的“产品总合格率”“外表”“物理性质”“残留溶剂”“尺寸”的合格率分别为90.9%,98.53%,98.6%,91.23%,100%。通过采集京东商城的买家在线评论评价,进行分析后获得2017年消费者对松木家具产品的每个特征属性下的情感极性,根据情感极性分析的方法,分别可以得到松木家具6个特征属性的合格率,其中“外表”的特征属性合格率为 99.87%,“尺寸”特征属性合格率为96.55%,“材料”特征属性合格率为98.96%,“残留溶剂”的特征属性合格率为“70.48%”,“功能性”的特征属性合格率为99.96%,“物理性质”的特征属性合格率为96.35%,“其他”的特征属性合格情况为 91.03%,“产品总合格率”为85.96%。

通過利用以上所有的共有质量特性以及产品的总合格率,来构建两种判定方法下的空间向量模型。将国家质量监督抽检结果设为X集合,其中X=[0.90,0.98,0.98, 0.91,1],将用户感知评价结果设为Y集合,其中Y=[0.85,0.99,0.96, 0.70,0.96]。

研究把用户的感知评价结果Y作为松木家具质量的评价真值,现在来判断国家质量监督抽检结果与用户的感知评价结果的相似程度与关联度,依据以下公式:

从结果中反映出国家质量监督抽检结果与用户感知评价结果的关联度较高,也有很高的相似程度。

讨论3:消费者感知的特征属性合格情况与国家抽查的产品质量合格情况相对比,受到消费者高度关注而未反映在质量监督报告中的差异属性主要包括“材料属性”和“功能属性”。而在质量监督过程中受到政府的重点检查而消费者并没有密切关注的差异属性主要包括:可迁移重金属。消费者和政府的质量监督抽查共同关注的松木家具质量特性主要包括:“外表”“物理性质”“残留溶剂”“尺寸”。

4 研究结论

通过运用“采集数据、数据预处理、质量属性提取、扩充特征属性、情感极性分析以及文本量化”的方式对产品质量进行评价,计算得到松木家具的质量合格率为85.96%。

经过讨论分析,本文得到以下几点结论。

(1)对于松木家具产品质量特征属性,消费者更集中关注在外表、材料、物理性质、残留溶剂、尺寸、功能性等6个方面。

(2)国家抽检产品质量合格率90.9%和消费者的感知合格率85.96%存在差异性。研究得出国家抽检合格率要高于用户感知合格率,大约相差5个百分点。

(3)通过对比国家抽检合格情况与用户评价的质量特性合格情况,可以得到两种不同指标判定情况下的4种共有质量特性即“外表”“物理性质”“残留溶剂”“尺寸”。

(4)国家质量监督抽检结果与用户感知评价结果的相似关联度为99.81%,国家质量监督抽检结果与用户感知评价结果的关联度较高,也有很高的相似程度。

参考文献

[1] Kim S M, Pantel P, Chklovski T, et al. Automatically assessing reviewhelpfulness[A].Proceedings of the 2006 Confer- ence on empirical methods in natural language processing[C].Association for Computational Linguistics,2006.

[2] Tsur O,Rappoport A. RevRank: A Fully Unsupervised Algo-rithm for Selecting the Most Helpful Book Reviews[C]./IC- WSM,2009.

[3] 姜巍,张莉,戴翼,等.面向用户需求获取的在线评论有用性分析[J].计算机学报,2013,36(1).

①基金项目:北京物资学院大学生科学研究与创业行动计划项目。

作者简介:孙伟玥(1996-),女,山东-城人,质量管理工程专业;王超(1981-),男,河北省香河县人,主要从事商品质量检验与管理方面的研究(通讯作者)。

猜你喜欢

电商平台
第三方物流行业发展现状及发展趋势
基于以电商平台为核心的互联网金融研究
互联网+冷链物流运营模式研究
基于电商平台的特色农产品营销策略探究
基于电商平台的大学生互联网创业经济研究
基于用户体验的电商平台界面管理影响因素研究
我国跨境电商发展研究的文献综述
试论电商平台主导的供应链融资
全渠道建设