基于在线评论与VIKOR法的卷烟品牌规格引入方法研究
2021-07-19李迎辉焦通
李迎辉 焦通
中国烟草总公司辽宁省公司 辽宁 沈阳 110062
引言
近年来,随着Web2.0的快速发展,消费者开始更多地倾向于在网络上表达他们的产品使用感受。相对而言,消费者评论能更好地传递消费者的声音,它能够更真实反映某个产品令人满意的一面与令人不满意的一面[1]。由于消费者是基于切身感受而自愿书写评论的,因此,从消费者评论中获取的信息更加可靠。
随着电子商务的发展,少数国内外学者已经开始关注基于在线评论的产品评价方法的研究。多准则妥协解排序法(VIKOR)是多属性决策中的折中优化方法。卷烟品牌规格引入是一个复杂的多属性决策问题。鉴于VIKOR法还未应用于卷烟品牌规格引入中,本文将VIKOR法引入基于在线评论的卷烟品牌规格引入决策中,以探索该方法在卷烟品牌规格引入中的应用价值,为烟草商业企业品牌规格优选与评价提供一种新的思路。
1 情感分析及VlKOR法原理
1.1 情感分析
情感分析(Sentiment Analysis)是指通过自动分析商品、服务、人物等研究对象的相关评论文本内容,发现评论者对该研究对象的褒贬态度和意见[2-3]。
目前在网络用户情感分析领域进行的研究主要以三个层面中的一种来实现,即:文档层面、语句层面和属性层面。作为一个新兴的研究领域,情感分析正逐渐受到计算机科学、经济学、管理学、情报学等相关学科研究者的关注。相关研究已经在词语级、句子级、篇章级情感分析方面进行了有益探索,并尝试将其应用于市场预测、舆情监测、竞争情报获取等多种任务中。
1.2 VIKOR法原理
VIKOR(Vise Kriterijumsa Optimizacija I Kompromisno Resenje)方法是Opricovic等[4-5]提出的一种复杂系统多属性优化决策的方法。目前已被广泛应用于如供应商选择、项目管理等多属性决策问题(MCDM)。VIKOR法的核心内容是在确定正、负理想品牌规格的基础上,通过计算最大群体效益值、最小个体遗憾值和利益比率值,比较各备选品牌规格与理想品牌规格之间的距离,最终对品牌规格的优劣进行排序。VIKOR法得到的折中选择是带有优先级的,更逼近于理想品牌规格。
2 基于在线评论的卷烟品牌规格引入决策方法
2.1 卷烟品牌规格初筛
从众多的卷烟品牌规格中选择需要引入的品规,首先要根据卷烟类型和烟支形式等不同条件对卷烟品牌规格进行初步筛选,以使其具有可比性。经过筛选得到符合筛选条件的备选卷烟品规。
2.2 评论数据的收集与预处理
2.2.1 收集评论。首先从网站上收集相关卷烟品规的在线评论,然后剔除在线评论中质量较低的评论,利用ROST内容挖掘系统进行分词。
2.2.2 构建属性词典和情感词词典。根据以上收集的评论构建属性词典和情感词词典。属性词典包含了卷烟产品共有的重要属性。在构建情感词词典过程中,首先对情感词进行提取并分类,然后根据情感词所表达情感强度的不同将情感词赋予不同的数值。
2.2.3 构建代表评论者观点的关键词向量。参照上述构建的两本词典,将评论文档转化为代表消费者观点的关键词向量。在评论文档中,如果属性和情感词出现在同一句中,那么该句评论则被视为消费者观点,则赋予该属性相应的评价值。
2.3 情感水平分析
2.3.1 度量各属性的评价值。首先对所有在线评论进行逐条挖掘,得到各评论中所有属性的评价值。然后将各评论中的所有属性的评价值进行线性组合。本文用在线评论中的属性评价值总和来度量消费者对每个属性的情感水平,度量如下:
2.3.2 度量各属性的权重。本文采用了基于词频的加权方式对各属性的权重进行度量。词频和属性权重的计算关系式如下:
对在线评论的属性评价值求和并确定各属性的权重后,再对属性的评价值标准化,使其值介于0和1之间。
2.4 卷烟品牌规格排序与引入选择
不妨设有m个备选卷烟品牌规格表示为a1、a2,…,am,对于备选品规ai,第j个属性评价值用fij表示,也就是说fij是备选品规ai第j个属性的评价值,n是属性的数量。VIKOR方法计算步骤如下:
2.4.2 计算各待选卷烟品规最大群体效益值和最小个体遗憾值(i=1,2,3...m)的值:
2.4.4 根据S,R,Q的值从小到大进行排序,并依据排序结果择优确定引入品规。
3 实例应用
为验证所提方法的有效性,本文基于烟悦网(https://www.yanyue.cn)中卷烟在线评论信息,进行了卷烟品牌规格引入的实例分析,具体过程如下。
3.1 备选卷烟品牌规格筛选
本文按照零售指导价220-230元/条的条件进行了筛选,经过筛选得到6种细支卷烟品规,分别是南京(金陵十二钗)、双喜(硬祥云好日子)、泰山(好客细支)、贵烟(跨越)、利群(西湖恋)、云烟(84mm细支祥瑞)(记作:~)。
3.2 评论数据的收集与预处理
3.2.1 收集评论。利用爬虫软件从烟悦网上收集相应品规的在线评论,并进行整理,共收集337条关于以上6种卷烟品规的评论。
3.2.2 构建属性词典和情感词词典。经分析获得口感、味道、性价比、吸阻、价格、包装、烟气、香气、劲道等9种卷烟产品的重要属性(记作:~)。在情感词词典构建过程中,形成了积极极性词典、消极极性词典、程度级别词词典和否定词词典。
3.2.3 构建代表评论者观点的关键词向量。基于以上构建的属性词典和情感词词典,利用评论分析工具(基于Python语言),分别对6种卷烟产品的9种属性评价值进行计算。
3.3 情感水平分析
对各属性的评价值进行标准化,使其值介于0和1之间,同时,将评论中的属性词频转化为属性权重。
3.4 卷烟品牌规格引入优选
根据公式(5)~(6)计算各待选卷烟品规最大群体效益S值和最小个体遗憾值R。
依据公式(7)计算各待选卷烟品规的利益比率值Q。然后根据S、R、Q值从小到大进行排序。
3.5 结果分析
根据排序结果可知,当取不同的决策系数值时,得到的排序结果也不尽相同,如决策系数v=0.2时,以最小化遗憾原则进行卷烟品规排序的结果是:P1>P3>P5>P6>P4>P2;决策系数v=0.5时,以兼顾群体效益最大化和个体遗憾最小化的均衡折中原则进行卷烟品规排序的结果是:P1>P6>P3>P5>P4>P2;决策系数v=0.8时,以最大化群体效益原则进行卷烟品规排序的结果是:P6>P1>P5>P3>P4>P2。同时,本文进行灵敏度分析,结果如图1所示。不难看出,无论决策系数v取何值,受决策系数v值变化的影响较小且始终排在前列,因此,卷烟品牌规格引入优选结果为。
图1 灵敏度分析
4 结束语
本文基于在线评论和VIKOR法对卷烟品牌规格进行了优选,在赋予不同决策系数的情况下,最终优选结果为,说明本文所提出的方法在进行卷烟品牌规格引入决策时是可行和有效的。本文所提出的方法弥补了基于消费者评论数据的卷烟品牌规格引入决策的空白,同时,提高了烟草商业企业卷烟品规引入的效率和科学性。