基于文本情感分析的电商在线评论数据挖掘
2018-12-17,
,
(1.南京航空航天大学 经济与管理学院,江苏 南京 211106;2.安徽商贸职业技术学院 经济贸易系,安徽 芜湖 241002)
一、引言
电商在线评论是指电子商务销售平台中顾客购买商品收货后,在评论系统中使用文字或者分值给予商家或者产品的评价。其中,文字评论既体现了顾客购后情感的表达,也成为计划购物顾客的购前决策参考,因此越来越多的电商商家和顾客关注电商在线评论。通过对电商在线评论进行自然语言处理,基于文本情感分析判断情感倾向,建立情感指数,并以店铺、时间等维度进行分析,以此来评估顾客的情感倾向和商家的经营管理状况,可以更好地帮助商家改进自身不足和提升服务质量,借此吸引更多的顾客购买。
二、文献综述
(一)电商在线评论研究
在线评论作为一种评价和反馈方式,近年来受到了越来越多的学者关注。在国外,探讨在线平台顾客评论对企业经营管理业务的影响已有多年的研究历程,例如Murphy等人(2007)研究了在线平台评论对潜在旅行者和酒店经营管理人员的影响。Vermeulen等人(2009)的研究认为,消极评论比正面评价更具影响力。Victor Ho 2017年研究在线评论时认为,管理人员对在线评论的响应总共有三个必须采取的行动:承认问题、表达感情和感谢评论者[1]。在国内,早在2011年翟丽孔在研究在线评论对消费者购买意愿的影响时,发现在线评论数量越多,在线评论强度越大,对消费者购买意愿的影响也越大,同时负面评论的影响力大于正面评论的影响力等[2]。2012—2014年期间不同学者分别以理论或者实证的方式开展研究,得出很多有价值的结论。例如肖玲针对消费者网购过程中感知风险,通过对在线评论问卷调查所获得的数据,利用SPSS17.0软件进行实证分析,得出感知风险的中介作用[3]。马艳丽等通过定性研究在线评论的矛盾性影响因素和形成机理,认为在矛盾性情景下,消费者购买决策往往受到购买欲望、产品价格、商家是否支持退货等因素的影响[4]。当然,王君珺等人也通过比较研究不同热度搜索型产品的在线评论对销量的影响,得出了对于搜索型产品,热门品牌的评论长度、评论及时度对非热门品牌的产品销量均有显著影响等结论[5]。2015年之后,每年相关研究数量均在100篇以上,呈现井喷式发展,此时利用大数据手段和方法进行研究,已渐成为一种趋势,例如李雨洁等在研究商家的操纵评论行为对在线评论真实性的影响时,基于大量数据通过模型计算得出反映商品真实质量的得分,并经数据拟合获得了反映卖家操纵评论行为概率的曲线方程[6]。赵丽娜(2015)通过BP神经网络研究了在线评论效用的影响因素。
(二)文本情感分析研究
文本情感分析是利用自然语言处理(简称NLP)、数据挖掘算法等对文本语言进行情感判断,从而把握文本意见观点、态度的计算研究。近年来网络在线评论数量与日剧增,依托人工进行的评论整理无法满足现实需求,因此文本情感分析吸引了众多国内外学者对其进行研究。
传统的文本情感分析方法利用情感字典,模拟人的判断思维,进行情感判断。例如在国外,V Hatzivassiloglou等人1997年尝试建立词汇级情感字典,并在此基础上进行文本情感分析,使判断结果准确率达到82%[7]。Wiebe 等人(2001)区分主观性和客观性文本,针对主观性文本开展情感分析。Pang 等人(2002)引入数据挖掘算法中朴素贝叶斯(Naive Bayes)、最大熵模型(The Maximum Entropy Principle)和支持向量机( Support Vector Machine,SVM) 模型对电影评论进行文本情感分析。
在国内,樊娜等人(2009)开始评估文本中语义概念的概括和归纳能力,采用条件随机场模型,选取情感倾向特征和转移词特征训练模型,从文本主题句集合中提取情感主题句。赵妍妍等人(2010)对文本情感分析进行综述研究,详述了文本情感分析的国内外发展情况。张成功等(2012)将极性词与修饰词组合成极性短语作为极性计算的基本单元,提出了一种基于极性词典的文本情感分析方法。唐晓波等2013年基于支持向量机改进了文本情感分析中效率较低、文本表达维度高等问题[8]。黄磊等在2017年引入神经网络开展文本情感分析的研究,其中以词向量作为基本输入单元,保留原文中语义组合,从而克服了传统文本分类方法的缺点[9]。
(三)基于文本情感分析的电商在线评论研究
近年来,部分学者将文本情感分析引入电商在线评论研究,取得了一定成绩。例如Subhasis Dasgupta等2016年在研究三星手机时利用文本挖掘分析顾客评论,以此了解顾客利用不同的词语表达手机的特性[10]。庞海杰等人(2012)利用中文分词处理文本后,进行词性标注,最后基于规则研究商品评价信息。刘甲学等人2017年通过对用户满意度影响因素的分析,帮助商家挖据用户需求,提升用户满意度,达到提高商品销量的目的[11]。李涵昱等2017年利用提取与过滤算法和情感词判别算法等,自动提取用户关注的商品属性和评价观点,以此进行文本情感倾向性分析[12]。
综上所述,电商在线评论的研究如火如荼,文本情感分析也有很大程度的发展,电商在线评论引入文本情感分析后也有了新的研究进展。但是,基于文本情感分析的电商在线评论研究依然存在一些问题:首先,文本情感分析中缺少电商领域的情感词典研究,使电商情感判断时过度依赖通用情感词典,降低了情感判断的准确率;其次,文本情感分析结果仅停留在解读上,没有相关研究对结果进一步开发,比如引入情感指数分析;最后,文本情感分析对电商在线评论的研究还停留在理论层面,尚没有企业的应用报告,对其实际效果的评测还有待实证分析。
因此,本文选取天猫网站碧根果产品在线评论,对文本情感分析传统模型进行改进,建立电商食品领域级情感词典,在算法上引入NLP中2元语法加强情感结果判断,并利用结果开发情感指数,用于直观反映电商商家的经营管理效果,最后提出改进建议。
三、研究方法
如图1所示,对选取的电商在线评论进行Python爬虫设计和抓取。因涉及到多个店铺不同月份数据,故数据合并后进行数据清洗,而数据清洗含去重、提取目标文本、创建特征数据等。将准备好的在线评论文本数据引入文本情感分析模型中进行分析,该模型为文本情感分析传统模型改进型,在其中引用电商领域情感字典和2元语法,对于以短评论为主的电商在线评论明显提升准确率。对文本情感分析结果建立指数分析表达式,计算出相关指数,并按照店铺、月等维度分别计算。通过指数变化和比较,深入挖掘电商在线评论中的情感表达,剖析电商商家的经营管理问题,并给出对策与建议。需要说明的是,整个文本情感分析模型和指数分析均通过Python编程实现。
图1 电商在线评论文本情感分析流程图
四、实证分析
(一)数据来源
选取天猫网站碧根果销量排名前十的店铺,以每个店铺销量最好的碧根果首款产品为研究对象,通过Python设计爬虫程序收集顾客购买后的在线评价,筛选2016年9—12月份中有追加评价的在线评论进入分析环节。表1为经过去重处理后的数据情况。
表1 天猫碧根果前十店铺首款产品在线评论数据源表
表1显示共获取17 144条有效在线评论数据,数据分布与店铺首款产品的销量基本对应,即明星店铺高销量产品有着高在线评论量。同时,在爬取数据时共获取到电商在线评论的店铺名称、初次评论文本、追加评论文本、两次评论间隔时间(后文简称“间隔时间”)、评论月份。当然,通过特征指标构造,又加入初次评论字数、追加评论字数等指标,并且通过对间隔时间、月份等数据预处理,部分数据如表2所示。
表2 天猫碧根果产品在线评论数据表
(二)描述性分析
基于Python中pandas功能进行数据描述性分析,结果见表3(结果不保留小数,采用四舍五入方式)。表3显示初次评论字数平均值为23个,标准差为46,其中75%的数据落入0~25字之间,0为初次没有评论内容,表明在线评论中初次评论基本为短评论文本。同时,追加评论字数75%数据也落入1~34字之间,同样基本为短评论文本,但追加评论字数平均值、各分位点数值均比初次评论字数高,也表明追加评论有了更多的评论信息量,即顾客在追加评论中往往进行了更多情感表达。
表3 在线评论数据描述性分析表
从间隔时间看,数据中0天表示当天在初次评论基础上进行了追加评论,间隔时间平均值为11天,50%数据落入0~2天,25%数据在14~179天,说明追加评论呈现两头趋势,一方面半数顾客短时间内追加了评论,积极参与产品情况的反馈;另一方面部分顾客在产品用后较长时间才有所反馈。
(三)基于NLP的在线评论文本情感判断
NLP是指Natural Language Processing,即自然语言处理。在线评论是一种自然语言文本,属于主观句表达,往往带有强烈的个人情感,通过文本情感分析(传统模型)、贝叶斯、神经网络等算法,可以实现文本情感判断。上述在线评论描述性分析表明,初次评论和追加评论均为短文本,适合采用文本情感分析(传统模型)进行判断,本文对文本情感分析(传统模型)进行了改进,使其更适合进行电商在线评论的文本情感判断。
1.电商在线评论文本情感判断(传统模型)。文本情感判断(传统模型)是相对于贝叶斯、神经网络、SVM等人工智能算法而言,采用NLP中自然语言切分、依靠情感字典进行文本情感判断的方法。上述描述性分析表明,电商在线评论为短文本,而短文本采用文本情感判断(传统模型)具有更高的准确率。如图2所示,本文研究中采用jieba分词对电商在线评论进行自然语言切分,建立电商食品领域情感字典,引入NLP研究领域n元语法中2元语法进行词组搭配后,依托后中心词情感基本判断、依托前影响词情感方向和程度影响进行判断。
图2 文本情感判断(传统模型)改进模型图
2.情感倾向分析。本文对电商在线评论情感文本情感分析结果采用三级分类,即积极、消极和中性[13]。根据上述文本情感判断(传统模型)中情感值p值与0比较情况,做出判别,即p>0为积极、p=0为中性、p<0为消极,其中“此用户没有填写评论!”人为判定为中性,表示无法获取在线评论的情感倾向。采用Python实现图2模型,得到2016年9—12月份电商在线评论情感判断的结果(如表4,仅列举部分)。
表4 2016年9—12月份电商在线评论情感判断(部分)
针对电商在线评论情感判断的准确率,进行十折交叉验证:首先从17 144条有效在线评论数据中随机抽取1 000条样本,然后对1 000条样本进行文本情感倾向人工标注;其次编写Python十折交叉验证程序,利用该程序对1 000条样本进行十折交叉验证,得到文本情感判断(传统模型)改进模型准确率为91.3%,F值为90.4%。
(四)电商在线评论情感指数分析
1.情感分类统计分析。表5显示初次评论情感中性数值最大,为8 509,进一步审视原始数据,发现“此用户没有填写评论!”的类型占到8 482,去除后中性仅有27条。此外初次情感中较多的为积极类型,基本为消极类型评论条数的2.4倍。在追加评论情感中,积极类型占比62.62%,是绝对多数,消极类型占比为36.97%也是不小的比率,说明近37%的顾客表达了不满意的评论。
表5 情感倾向分类统计表
2.情感指数分析。在情感指数分析时,首先需要构建情感指数计算模型。本次情感指数计算模型以美国密歇根大学SRC指数编制法和上海财经大学上海市消费者信心指数编制法为基础,计算模型如下:
其中,X积极表示对某类对象持积极看法的数量;X消极表示对某类对象持消极看法的数量;X表示最终得分;基数设定为100,乘以1/2使取值范围在0~100之间。
(1)情感指数总体分析。在表5统计分析的基础上,初次评论和追加评论指数总体分析的结果表明,初次评价的情感指数为70.4,到追加评论时降低至62.9,总体上初次评论和追加评论的情感指数并不高,而且从初次评论到追加评论呈现出不满意度增高的情况。
(2)情感指数店铺维度分析。在Python中调用pandas包以店铺维度进行指数分析,并制作出数据结论雷达图,具体如图3所示。图3显示出店铺维度的几个特点:第一,对于初次评价或追加评价,没有店铺出现高满意指数(大于85分为高满意指数),但追加评论中出现的最低指数为45.7,低于情感指数60的店铺达到4家,整体追加评论的顾客满意情况不容乐观;第二,整体上,初次评论情感指数大于追加评论情感指数,说明追加评论中反映了更多的顾客问题,值得电商商家关注和思考。在初次评论情感指数与追加评论情感指数差值方面,最小差值为2.3,最大差值为17.6,差值均值9.3,说明从初次评论情感指数到追加评论情感指数跌幅较大,顾客不满意程度显著上升。
图3 情感指数店铺维度分析图
(3)情感指数月维度分析。在Python中调用pandas包以月维度进行指数分析,并制作出数据结论折线图,如图4所示。图4显示,从9月到12月,初次评论呈现稳定趋势,追加评论波动较大,11月份处于最低谷。需要指出的是,11月正值每年电商双11狂欢节,在此重大活动节点上,追加评论情感指数呈现最低值,反应出顾客对活动评价的不满意度较大。
图4 情感指数月维度分析图
(4)情感指数店铺月列联分析。在Python中调用pandas包对追加评论以店铺和月两个维度进行交叉列联分析,并制作折线图,如图5所示。图5显示,就追加评论情感指数值而言,9—10月份每个店铺均有不同程度波动,但其中良品铺子在追加评论中的情感指数较其他店铺要好,处于折线图上方位置;口口福、三只松鼠、百草味三个店铺9—10月份情感指数总体表现稳定,处于较上方位置;其他店铺情感指数数据有高有低,呈现出明显的波动,例如老街口店铺9—12月份情感指数较高点为65,低点接近35,二者相差近30。因此,可以按照追加评论的情感指数将店铺分为三档:第一档为良品铺子,为顾客情感好感区;第二档包含口口福、三只松鼠、百草味,为顾客情感认同区;第三档为其他店铺,为顾客情感波动区。
通过上述分析,发现在以电商在线评论文本情感分析基础上,情感指数可以作为衡量顾客情感情况的一种重要指标。
图5 情感指数店铺-月列联分析图
五、结论与建议
本文通过在电商在线评论中引入文本情感分析,获得了在线评论的情感倾向,并通过建立情感指数达到了解电商在线评论总体情感的目的,同时以店铺、月等维度对情感指数做了比较分析,从中发现情感倾向的程度。以天猫碧根果17 144条在线评论为例的实证分析表明,基于文本情感分析的情感倾向判断和情感指数建立在电商在线评论中有着非常好的应用,能够建立新的电商商家评价方式,动态监测顾客情感变化,及时把握整个电商行业的情感趋势。
(一)建立新的经营评价方式
目前,对电商商家的评价方式很多,包括从商品、物流和顾客等角度。例如赵会芬等(2015)通过建立电商营销过程中的商品评价体系,构建商品评价的消费者网络社交生态圈。梅虎等(2015)通过因子分析和回归分析等探究物流服务质量的关键指标对消费者的影响。王军等建立在线评价的指标,包括结构分布指标、跨类变动指标和内部变动指标等,讨论了动态评价指标体系[14]。但是,通过引入文本情感分析的情感倾向判断及其指数构建,来判断在线评论中富含的顾客情感倾向和程度,并作为评价电商商家经营管理的效果和顾客对商家管理服务的认可,本文尚属首例。
(二)监测顾客情感倾向动态
在基于文本情感分析的电商在线评论评价方法中,不但能够通过情感指数判别总体情感倾向程度,同时还可以月为维度分析情感指数指标,在数据分辨率以“天、时”为单位的采集下,还可以天、时为维度分析。因此,电商商家的经营管理完全可以做到对在线评论中蕴含的顾客情感进行动态监测。动态监测由在线评论数据采集时时间跨度的因素决定,以时为单位的数据采集,将时进行分辨率提升后,可以做到时维度分析、天维度分析、旬维度分析、月维度分析和年维度分析等。上述对在线评论中的动态监测可以使电商商家时刻了解顾客的情感倾向变化,做好经营管理服务和改善。
(三)把握整个行业的情感趋势
在基于文本情感分析的电商在线评论评价方法中,以店铺为维度的分析,能够准确把握每个电商商家的顾客情感倾向和程度,反映出商家的服务满意情况。店铺与月维度的交叉列联分析[15],可以进一步帮助商家了解自身的顾客情感变化,把握服务的发展趋势。对情感指数总体进行分析,又能看出整个行业的顾客情感倾向和程度,以月等时间维度可以使电商平台和商家把握整个行业的顾客情感程度和趋势。
综上所述,基于文本情感分析的电商在线评论情感倾向判断和情感指数的建立,是一种新的电商商家经营评价方式,能够动态地检测顾客情感变化,让电商平台和商家准确把握整个行业的情感趋势。