垃圾评论识别研究综述

2019-11-29李耀鹏徐德华

科技与创新 2019年4期

李耀鹏，徐德华

（同济大学经济与管理学院，上海 201804）

在Web2.0的时代，人们越来越多地使用电子商务和舆论共享网站，因此，产生了海量的商品在线评论。由于在线商品评论对于消费者的购买意愿有较为显著的影响，部分不良商家采用垃圾评论攻击行为，通过发表虚假评论和评分试图误导消费者。垃圾评论的存在严重影响了在线评论应有作用的发挥，所以识别垃圾评论是一个紧急且重要的问题。目前，有许多关于垃圾评论识别的研究，按照识别对象，可分为识别垃圾评论发表者、识别垃圾评论发表者团体和直接识别垃圾评论。本文从识别对象的角度对垃圾评论检测的研究现状进行分析，以期能对相关工作的开展提供借鉴。

1 识别垃圾评论发表者

一些研究人员通过关注垃圾评论发表者来研究如何识别垃圾评论，他们在垃圾评论发表者方面进行了许多研究。垃圾评论发表者的检测是以评论者为中心的，相比于直接检测垃圾评论，垃圾评论发表者的检测更加简单、有效，因为一条评论能获取的信息有限，比如评论文本、评分、发表时间等，但是一个评论人则可能发表多条评论，涉及多个产品，除了评论本身之外，还可以对其行为模式进行研究。

Lim等人[1]对垃圾评论发表者的行为特征进行建模并用于检测垃圾评论发表者。他们使用垃圾评论行为的线性加权因子组合来计算评论者的整体垃圾评论分数。他们提出了基于打分行为的垃圾评论发表者的四种主要行为模式：针对某一个产品进行评分；针对某一类产品进行评分；总体偏差；早期偏差。

Jindal等人[2]发现了评论者的一些行为很可疑，比如一般正常的评论者所发表的评论往往包括积极的、中性的和消极的评论，但是有一部分评论者发表的评论全部是积极的或者全部是消极的。经过试验发现这些行为特征与评论造假的关联性很高。

Wang等人[3]提出了一种基于评论图模型，利用评论者，评论和商铺之间的影响来检测垃圾评论发表者的迭代方法。该技术通过节点之间的相互关系计算评论者的可信度、评论的真实性以及商店的可靠性。

Fayazbakhsh等人[4]提出了一个类似的方法，也使用了一个评论图模型。该方法再次对节点进行评分，然后使用迭代算法更新分数。这项研究所用的分数构成和初始化方法不同于Wang等人的研究。徐小婷等人[5]也采用了类似的方法，不同之处在于其采用了一种基于PageRank的评论者互评估可信度模型来检测垃圾评论者。结果表明其模型在识别垃圾评论者方面是有效的，并且解决了仅有一条评论的评论者难以识别的问题。

Fei等人[6]使用核密度估计技术来建立了一种检测特定产品的评论中的突发模式的算法。他们使用垃圾评论发表者的五个行为特征作为垃圾评论发表者检测的指标，然后作者使用马尔可夫随机场（MRFs）来对突发模式中的评论者进行建模。他们的技术的精确度为83.7%，与以前的工作相比得出了更准确的结果。然而，Fei等人使用的最有效的特征是“亚马逊验证购买比例”；在任何检测技术中使用这个特征都会极大地优化该方法的准确性。它将用户限制为真实的客户，因为它代表了评论者必须已经购买了产品。但这个特征不能应用于其他数据集，不具备通用性。

2 检测垃圾评论发表者团体

某些情况下，垃圾评论活动可被视为群体性事件，即可能存在多个垃圾评论发表者被雇佣来发表评论，以达到一定的目的的情况。手动标记训练数据以检测垃圾评论发表者群体并不像垃圾评检测中的其他任务那么困难，因为成员的垃圾评论行为是清晰的。来自垃圾评论发表者团体的第一个标记数据集是Mukherjee等人[7]创建的。

Mukherjee等人[8]使用频繁模式挖掘技术来检测垃圾评论发表者团体，通过上述特征对每个团体进行“Spamicity”打分，然后提出了GRank关系模型对垃圾评论发表团体进行排序，将评论者团体区分为垃圾评论或非垃圾评论团体。

3 识别垃圾评论

实际中，创建不同内容的多个垃圾评论是很耗费时间和精力的，垃圾评论发表者不会自己撰写大量内容独特的垃圾评论，他们倾向于复制现有的垃圾评论的文本。因此，查找类似的评论是检测垃圾评论的关键部分。Jindal等人[9]提出了第一种垃圾评论检测技术。他们发现，垃圾评论发表者通常会创建少量评论作为模板，并通过更改产品名称将其复制到不同产品下面。因此，可以通过识别包含重复文本的评论来检测垃圾评论。

Lai等人[10]提出了一个概率语言模型计算两个评论之间的相似度分数。该模型使用Kullback-Leibler散度比较一些评论以衡量其内容相似度。

除了内容重复之外，评论的概念可能会出现重复。Algur等人[11]提出了一种度量概念相似度的技术，用于解决垃圾评论检测问题。该技术被用来衡量被评论的产品其特征的相似性。作者利用传统的余弦函数来度量概念特征相似度以检测垃圾评论，从评论中提取的产品特征被用来构建评论矩阵。他们的方法的精确度是43.6%，效果不是很理想。

Ott等人[12]采用三种策略来处理垃圾评论检测问题：①类型识别。Rayson等人[13]在计算语言学中的研究表明，文本的类型影响文本中词性（POS）的分布。②心理语言检测。心理语言学检测赋予文本中使用的关键词以心理语言学意义。语言查询和字数统计（LIWC）软件是著名的文本分析工具，它将80个心理语言学意义赋予给了4 500个关键词。③文本分类。使用n-gram特征集，模拟评论的内容和上下文。结果显示，使用LIWC和BIGRAMS在区分虚假垃圾评论方面的准确率达到了80%以上。该研究也被用来估计6个著名的在线评论社区的欺骗行为[14]。这两项研究都使用从评论网站收集到的真实评论作为数据集。Banerjee等人[15]提出的另一种方法使用相同数据集，在文献综述的基础上，作者假设欺骗性评论和真实性评论的可读性（复杂性和阅读难度），评论类型和评论写作风格是不同的。