一种融合行为与结构特征推理的造假群组检测算法*

2021-05-18张怡睿宸李云峰顾旭阳纪淑娟

计算机工程与科学 2021年5期

张怡睿宸，李云峰，顾旭阳，纪淑娟

(1.山东科技大学山东省智慧矿山信息技术重点实验室，山东青岛 266590;2.中国银保监会衡水监管分局，河北衡水 053000)

1 引言

在过去的十几年里，随着互联网的飞速发展，网络购物也变得越来越普遍。人们在购买商品或服务之前都会先浏览一下商品或服务的相关评论。如果多为积极评论，则消费者会购买该商品；如果多为消极评论，则消费者购买该商品的机率会大大降低[1]。正是因为积极的评论会给商家带来更大的利润[1]，因此很多商家会雇佣水军群组给自己刷好评或者给竞争对手刷差评。商家的这种造假行为误导了消费者，严重扰乱了市场秩序，因此越来越多的研究人员关注虚假信息检测问题。

现有少部分共谋群组检测算法使用监督学习方法实现。然而，因为手工标签在现实生活中获取困难、需要花费大量时间，且适用的领域比较单一，因此，现有研究方法大多基于无监督方法。已有无监督方法可以根据生成候选群组方式不同分为基于频繁项挖掘FIM(Frequent Item Mining)的方法[2 - 4]和基于图的方法[5 - 8]。基于频繁项挖掘产生候选群组的典型研究主要有：Mukherjee等人[2]利用FIM产生候选群组后提出了GSRank(Group-Spam Rank)算法;Xu等人[3]通过FIM得到候选群组后使用基于改进KNN的方法判定虚假群组。基于图方法产生候选群组的研究主要有：Ye等人[8]提出2-Hop子图,用GroupStrainer方法判定共谋群组;Xu等人[4]提出CG(Colluder Graph)图来检测共谋群组;Wang等人[9]提出了基于二部图投影的虚假评论人候选群组的生成算法，以产生候选群组，然后结合群组指标判断是否为造假群组。现有虚假群组检测研究中，有的只使用行为指标来检测群组，而忽略了网络结构中成员之间的联系，有的只使用网络结构来检测群组，而忽略了群组特征、个体特征和语言特征带来的群组可疑问题。怎样将评论者的行为指标和评论者之间的拓扑结构更好地结合起来检测虚假群组，以提高检测准确度，是目前的主要挑战。据本文调研发现，只有文献[9]同时使用了网络拓扑结构和行为模式来判断群组造假。然而，该工作还存在一个问题，即直接通过计算群组结构特征和行为特征的指标得分来判断是否为造假群组，而没有进行更准确的结构推理，这使得检测的准确度不是很高。

针对上述群组研究中的问题和挑战，本文提出了一种融合行为特征与结构特征的虚假群组检测算法。该算法包含2部分：第1部分首先利用频繁项挖掘方法产生候选群组，然后基于行为指标计算群组中每个成员协同造假可疑度，将该可疑度看作先验概率；第2部分首先给每个群组建立加权评论者-商品二部图，然后使用循环信念传播算法LBP(Loopy Belief Propagation)来进行后验概率的推理，将推理后得到的后验概率值作为该成员的最终协同造假可疑度，最后用熵值法判断每个群组是否为共谋群组。

对比已有共谋群组检测算法，本文工作有如下创新：(1)在用行为指标计算协同造假可疑度时，所选指标体现的是群组成员的共谋性特征，考虑了群组成员之间的联系。(2)给出一种带权二部图的构建方法，并将LBP算法应用于带权重的二部图上进行推理，使得计算的协同造假可疑度更准确。(3)使用香农熵判断每个群组中所有成员的协同造假可疑度的混乱度，自动为群组标注标签。

2 相关工作

根据检测对象的不同，现有关于虚假信息检测的研究可分为以下3类：虚假评论文本检测、虚假评论者检测、虚假评论群组检测[10]。虚假评论文本检测主要针对评论的文本信息进行分类和过滤。该问题最早是由Jindal等人[11]于2008年提出的。他们将虚假评论分为3种类型，即虚假评论、品牌评论和无关评论。他们给出了一种监督学习方法来判断某一评论是否为虚假评论。Ott等人[12]通过结合评论的语言特征和研究心理学时用的一些特征来对评论文本进行分类，从而检测虚假评论。

虚假评论者的检测研究可以分为基于行为特征的检测方法和基于关系特征(图)的检测方法2大类。Lim等人[13]根据评论者评分的行为特征来检测虚假评论者。Bondielli等人[14]通过调研和总结前人的文献写了一篇关于虚假新闻和可疑评论者的综述。Wang等人[15]给出了一种基于评论者、评论和商店构成的评论图的方法来计算评论者的可信度。Akoglu等人[16]提出了一种检测虚假评论者的FraudEagle框架。该框架首先基于评论者和商品建立二部图，然后分析评论者对商品的情感，最后使用信念传播方法检测虚假评论者。Rayana等人[17]在FraudEagle框架的基础上提出了SPEagle框架。该框架首先用评论、评论者和商品3种类型的节点建立网络结构，然后同时利用网络结构特征和元数据特征来识别造假者。

最近两年，对虚假群组的研究越来越多[3,6,8,9]。这是因为大量有组织、有策略的虚假评论和评价者对电子商务信誉评价系统和推荐系统的攻击效果比单个的虚假评论和评价者更明显。然而，虚假群组的检测与过滤面临着一个普遍公认的挑战，即带标签的共谋群组数据集很难获取。因此，现有研究大都是运用无监督的方法来判断挖掘出的群组是否为共谋组。根据产生候选群组的方式不同，可将现有的无监督算法分为2类：一类基于频繁项挖掘来产生候选群组，另一类基于图的方法来产生候选群组。

Mukherjee等人[2]最先提出基于频繁项挖掘FIM的方法来产生候选群组。他们描述的共谋群组是一群说假话的人通过合作来共同造假，换句话说，这些造假者一起为多件商品写多条虚假评论。为了检测出共谋群组，他们首先使用频繁项挖掘生成候选群组，约定群组中的任意2个人至少共同评论过3件商品；然后，给出了一个排序模型(称为GSRank算法)，根据群组、商品、评论者之间的关系建立模型，计算群组可疑得分；最后，根据群组可疑得分排序来判断群组是否为共谋群组。很多研究者扩展了Mukherjee等人的工作，他们也使用FIM方法生成候选群组，然后使用其他的方法来判定共谋群组。例如，Xu等人[4]用FIM来产生候选群组，使用文本特征和评论者的特征计算评论者之间的相似度，然后用改进的KNN算法预测单个评论者为造假者或非造假者，并将其标注为造假者或非造假者。然而，这些评论者必须来自至少一个FIM产生的候选作弊群组。再如，Xu等人[3]用频繁项挖掘的方法产生候选群组后还提出了使用统计学模型和EM(Expectation Maximum)算法进行虚假群组的检测。这些算法通过使用更多的特征和方法来判断群组共谋，提高了算法的准确度。但是，这些算法依然存在将偶然购买者错误地划入造假群组和忽略群组成员之间的网络结构等问题。

基于图的虚假群组识别方法一般根据评论者或者评论和商品的关系建立一个网络图，然后基于得到的图使用各种算法检测共谋群组。例如，Ye等人[8]使用群组网络结构来研究虚假群组检测。他们基于2-Hop 子图发现评论者作为群组成员的反常行为并运用层次聚类方法GroupStrainer 检测虚假评论群组。在构建群组网络结构时使用了节点和网络的自相似性和相邻节点多样性这2个特征对评论者进行了网络足迹的分析。再如，Li等人[6]提出基于共爆发来检测共谋群组，共爆发是指群组内评论者在评论商品时发布的评分是有波峰的，而且群组中的评论者会集中在很短的一段时间里完成评论任务。Xu等人[4]基于图分类思想使用双马尔科夫网络提出欺诈图模型CG。首先将评论者作为节点构成网络，将关联性强的评论者作为相邻节点，然后将问题转化为运用概论图模型来进行共谋群组的判断。Wang等人[7]提出一个从上而下的计算框架GGSpam(Graph-based Group Spam)，先建立商品-评论者二部图,然后投影为评论者图，使用分而治之的策略来进行共谋群组的检测。Do等人[5]提出使用一种模糊k-Means的方法来检测共谋群组。首先建立由商品、评论者和评论组成的评论图，然后计算3种类型节点的可疑分数，最后使用模糊k-Means聚类方法来检测共谋群组。使用基于图的方法来检测共谋群组的优点是可以很好地利用群组内成员之间的关系，更好地检测造假群组。缺点是忽略群组的行为特征和语言特征，且在实验阶段耗费时间长。

综上所述，现有大多数研究在群组虚假检测时要么使用频繁项挖掘的方法来产生候选群组，然后使用评论者的行为模式来建模；要么使用基于图的方法来产生候选群组，然后使用评论者之间的网络结构关系来建模。频繁项挖掘产生候选群组要求至少2人共同评论过3件商品，使用频繁项挖掘产生候选群组后没有考虑评论者之间的网络关系，这样降低了虚假群组检测的准确度。此外，现有频繁项挖掘方法都没有考虑语言特征。对应地，基于图的方式产生候选群组时只考虑评论者之间的关系，没有考虑行为特征和语言特征，因此虚假群组检测的准确度较低。

3 融合行为与结构特征推理的造假群组检测模型框架

为了解决频繁项挖掘在产生候选群组时因忽略评论者之间的网络结构而导致群组挖掘和发现的准确度下降问题，本文融合了基于频繁项挖掘和基于图方法的优点，提出融合行为与结构特征推理的造假群组检测算法B&SR(Behavior and Structural feature Reasoning algorithm)，其基本框架如图1所示。

Figure 1 Framework of the proposed algorithm图1 算法的框架图

实现该框架需要如下5步：第1步，用频繁项挖掘产生候选群组；第2步，实现基于行为特征的候选群组中协同造假可疑度计算；第3步，基于候选群组中的每个评论者和被评论商品构建二部图；第4步，实现基于结构特征的候选群组中协同造假可疑度推理；第5步，基于信息熵实现群组分类。其中，第1步利用频繁项挖掘方法产生候选群组直接借鉴了Mukherjee等人[2]的方法。具体细节因篇幅关系不再赘述。本文重点介绍该框架中第2步到第5步的实现细节。表1列出了B&SR中用到的所有符号以及它们所表示的含义。

Table 1 Symbols and their meanings表1 符号及其意义

4 融合行为与结构特征推理的造假群组检测算法

4.1 基于行为特征的协同造假可疑度计算方法

本节旨在给出一种基于行为特征的协同造假可疑度计算方法。与其他文献[6,8,9]选用个体行为特征不同，考虑群组成员之间的联系，本节选用了个体间协同行为特征，旨在揭示群组成员协同造假(即共谋)可疑程度。同时，将该值作为基于结构特征推理的先验概率值。计算候选群组中协同造假可疑度时，主要参考的协同行为特征如下：

定义1(共评论比例CR(Common comment Ratio )[3])CR指的是群组中每个成员同群组其余成员共同评论过的商品数量占群组成员评论过商品总数量的比例。共谋者群组中成员共评论的比例会更容易偏高。计算公式如式(1)所示：

(1)

其中，a为候选群组中的某个成员，sa为成员a评论商品的集合，sga为群组g中除去成员a之外其余成员评论商品的集合，sg为群组成员评论商品的集合。

定义2(共评论商品评分方差RD(Rating Deviation )[3])RD指的是在群组成员共评论的商品中，每个成员的评分与群组内其他成员评分的方差，在共评论的商品中选出方差波动最大的。当选出的方差值在该成员共评论商品中最大时仍然不大，则很大程度上说明该成员可能是共谋者。

(2)

其中，Ra,p为成员a在第p个商品上为所评论商品中的方差值，g为候选共谋群组，P为每个成员评论过的商品集合。

定义3(共评论商品评论发布时间方差TD(Time Deviation )[3])TD指的是在共评论商品中，评论者发布评论的时间与组内其余成员发布评论的时间波动的方差。函数var是求得群组成员a对第i个产品发布评论时间与群组内其余成员发布评论时间的方差。max函数可选择出在群组成员a评论过的商品中方差值波动最大的那个。因为当方差TD(a)的值仍然不大时，则很大程度上说明该成员可能是共谋者。

(3)

其中，Ta,p为成员a在第p个商品上发布评论时间的方差值，g为候选共谋群组，P为每个成员评论过的商品集合。

在共评论商品评分方差(RD)和共评论商品评论发布时间方差(TD)中，要把所得值统一到[0,1]内，rank为评分等级。转换公式如下所示：

(4)

(5)

定义4基于以上3种行为特征，群组中每个评论者个体的协同造假可疑度计算公式如式(6)所示：

(6)

根据上述行为指标，计算群组中成员的协同造假可疑度。为每个候选共谋群组进行计算的详细过程如算法1所示。

算法1基于行为特征的协同造假可疑度计算

输入：频繁项挖掘算法FIM得到的候选共谋群组。

输出:带有协同造假可疑度的候选共谋群组。

1.G=FIMCreateGroup(reviewers);

2.FOReach groupginGDO

3.FOReach reviewerringDO

4.CR(r)=ComputedCommonRatio(r)/*依据式(1)*/

5.RD(r)=ComputedCommonRatingDeviation(r);/*依据式(2)*/

6.TD(r)=ComputedCommonTimeDeviation(r);/*依据式(3)*/

7.SC(r)=ComputedSum(CR(r),RD(r),TD(r))/*依据式(4)～式(6)*/

8.ENDFOR

9.ENDFOR

经过算法1可以得到各个群组的成员可疑度。由这些群组组成的集合为最终的候选共谋群组集合G。

4.2 面向候选群组的带权评论者-商品二部图构建算法

实体和群体的能力描述代表了它们执行任务的能力，是进行任务规划的根本依据。能力描述还将组织任务的可完成性判断转化成了描述任务逻辑的定理证明。另外，群体中成员的变更，可能导致组织能力的变化，能力描述也能将这种变化自然地表现出来。

经过算法1的处理得到最终候选群组，本节旨在为每个候选群组构建一个带权评论者-产品的二部图。接下来介绍详细定义及过程。

定义5(带权评论者-商品二部图) 带权评论者-商品二部图Net={V,E,W}，其中V表示节点集合，包含2种类型，分别是用户节点和商品节点；E是连接用户节点和商品节点的边集合，表示用户对商品发表过的评论；W表示用户节点和商品节点之间的无向边上的权重值集合，由用户对商品评论的行为和内容所决定。

定义6(权值) 本文取用户对商品的评分作为权重值，将用户的等级评分转换为[0，1]内的数值。

(7)

其中，wui,pj是代表在二部图中用户ui与商品pj边上的权值，Rui,pj是用户ui对商品pj的评分，rank为评分等级(常见的等级有5级，3级，2级等)。

算法2面向候选群组的带权评论者-商品二部图构建算法

输入：候选群组、商品、候选群组成员对商品的评论。

输出：用户对所评论商品的权重值W集合。

1.FOReach groupginGDO/*对每个候选群组计算*/

2.FOReach revieweruiingDO/*对群组中各个成员计算*/

3.wui,pj=ComputedWeight(ui,pj)/*wui,pj表示用户ui与商品pj的边上的权值*/

4.ENDFOR

5.ENDFOR

4.3 基于带权评论者-商品二部图的候选群组中协同造假可疑度的结构推理

仅考虑评论者的行为特征不足以最终确定评论者的协同造假可疑度，因此，在基于行为特征获得每个候选群组中评论者的协同造假可疑度之后，本文又基于结构特征对每个评论者的协同造假可疑度进行推理。本文将协同造假可疑度看作是一个联合概率分布。为了求解该联合概率分布问题，本文用成对马尔科夫随机场pMRF(pairwise Markov Random Fields)[18]建模基于带权评论者-商品二部图的协同造假可疑度(即联合概率分布)推理问题，得到目标函数。精确推理是一个很好的方法，但众所周知的是精确推理是一个NP难问题。因此，本文采用被称为近似推理的循环信念传播算法LBP[19]进行问题求解。下面详细介绍用成对马尔科夫随机场建模协同造假可疑度(即联合概率分布)推理以及用LBP算法求解的细节。

4.3.1 基于成对马尔科夫随机场的协同造假可疑度推理模型

在pMRF中，判断节点是否为造假者仅取决于其邻居节点，并且独立于图中的所有其他节点。每个节点表示一个或一组变量，节点之间的边表示2个变量之间的依赖关系。本文用势函数(亦称因子)来表示节点之间的依赖关系。通过势函数求得协同造假可疑度的联合概率分布。

(8)

Table 2 Potential function表2 势函数

4.3.2 基于成对马尔科夫随机场的循环信念传播算法

本文在进行结构推理时将使用后验可疑度来更正先验可疑度，将群组中每个成员的后验可疑度作为每个成员的最终可疑度。

定义7(先验可疑度) 根据行为特征对每个群组的成员计算出协同造假可疑度作为该群组成员的先验可疑度。

定义8(基于带权评论者-商品二部图的协同造假可疑度后验可疑度) 后验可疑度的推理可应用LBP算法[17]，推理后得到的每个群组中成员的协同造假可疑度作为后验可疑度。

在带权评论者-商品二部图上的LBP推理算法由3个步骤来实现，首先进行消息的初始化；然后在商品节点和用户节点上进行消息传递，在消息传递过程中对消息进行更新；最后当消息不再变化时计算每个节点的可疑度。

在LBP算法中所用到的公式定义如下：

(1)消息传递公式：

mi→j(yj)=

(9)

其中，mi→j是从节点i到节点j发送的一条消息。V表示带权评论者-产品二部图中的节点集合。Ni为节点i的pMRF一阶邻域，Nij表示节点i的pMRF一阶邻域中排除掉目标节点j的邻域。mki(yi)表示节点i的邻居发送给节点i的消息。

同样从节点j到节点i的消息传递如式(10)所示：

mj→i(yi)=

(10)

信念计算公式如式(11)所示:

(11)

其中，bi(yi)是节点i经过推理后的后验可疑度。α是归一化常数,分别确保每个消息和每组的边缘概率之和为1。

具体算法实现过程如下所示：

算法3基于带权评论者-商品二部图的候选群组中协同造假可疑度的结构推理算法

输入：每个群组的用户-商品二部图，每个群组中成员的先验可疑度，每条边上的权重值集合W。

输出：每个群组中的成员后验可疑度。

1.FOReach groupginGDO/*initialize each bipartite graph*/

2.FORe(yi,yj,w)∈EDO/*initialize each message*/

3.FORi∈VDO

4.mi→j(yj)←1

5.ENDFOR

6.ENDFOR

7.REPEAT/*perform message propagation update

8. messages fromitoj*/

9.FORe(yi,yj,w)∈EDO

10.FORi∈VDO

12.ENDFOR

13.ENDFOR

14. //update messages fromjtoi

15.FORe(yi,yj,w)∈EDO

16.FORi∈UDO

17.ENDFOR

18.ENDFOR

19.UNTILall messages stop changing

20.FORi,j∈VDO

22.ENDFOR

23. /*obtain the suspected degree of collaborative fraud of nodes after inference*/

24.Score(i)=bi(yi);

25.ENDFOR

经过算法3推理后得到每个群组里各个成员的后验可疑度，这样就可以根据熵值法来判断成员是否属于共谋群组。

4.4 基于熵值法的共谋群组分类算法

经过上述步骤的处理得到每个共谋群组中成员的协同造假可疑度，共谋群组中的成员因为共同评论多件商品，协同造假可疑度会较相似。本文使用信息熵的方法来判定成员是否属于共谋群组，信息熵是香农在1984年提出的，解决了对信息的量化度量问题。

一个系统越是有序，信息熵就越低；反之，一个系统越是混乱，信息熵就越高。所以，信息熵也可以说是系统有序化程度的一个度量[20]，因此可以利用这一特点来进行虚假共谋群组的识别，群组成员协同可疑度越接近，则说明群组内成员行为越统一、有序，越有可能为共谋群组；群组成员协同可疑度差异越大，则说明群组内成员行为比较自由、无序，越可能为非共谋群组。本文将群组成员协同可疑度作为信息熵值，来计算整个群组的信息熵值，即整个群组的混乱度。

计算信息熵的公式如式(12)[20]所示：

(12)

其中，τ是类别数，p(xi)是第i类的概率，xi表示随机变量，与之相对应的是所有可能输出的集合，定义为符号集,随机变量的输出用xi表示。

判断候选共谋群组的具体过程如算法4所示。

算法4基于熵值法的共谋群组分类算法

输入:经过算法3后得到的带有后验可疑度的候选共谋群组。

输出：共谋群组。

1.FOReach groupginGDO

3.IFH>βTHEN

4.gis not spam group

5.ELSE

6.gis spam group

7.ENDIF

8.ENDFOR

5 实验设置与结果分析

为了更好地验证本文算法的性能，在真实数据集上实现与5个算法的比较实验。

5.1 数据集和手工标签

同一些文献中使用的数据集相同，本文实验所用到的数据集是不带标签的亚马逊评论数据集。本文先考虑使用1993～2014年的亚马逊书籍评论数据，统计数据信息发现共有22 507 155条评论数据,8 026 324个评论者,2 330 066件商品。由于数据量太大,本文提取2013年的数据作为源数据，先对数据进行处理。把2013年的数据里所有商品评论数据少于3条的商品和发布评论少于3条的评论者删除,然后选取部分数据进行实验。所用到的数据集统计信息如表3所示。

Table 3 Statistic of dataset表3 数据集统计信息

检测虚假共谋群组所用到的数据集基本上都没有标签，这样对于评估提出的模型或者算法具有一定挑战性。基于上述问题，使用人工标注数据集变成了普遍的选择。最先使用人工标注数据集的是Jindal等人[11]在检测个体造假者问题上。同时，Mukherjee等人[2]和 Xu等人[4]首先在检测造假群组时雇佣专家使用8个评论指标来手工标注数据集。

本文提出的算法为无监督算法，在手工标注标签时用到4个个体行为指标，分别是极端评分、虚假文本、平均分异常值和活跃时间。其中，4个行为指标设定的值中最可疑为1分,不可疑为0分,模棱两可为0.5分。当算得的总分大于2时便判定为造假者，当群组成员中造假者数量大于或等于群组成员数量的2/3时便判断该群组为共谋群组。

5.2 实验设置、比较基线和评估方法

本文选取处理过的2013年亚马逊数据集的部分数据进行实验。同时分析算法的性能和本文算法同基线算法的比较。

本文的基线算法共有5个，第1个为Wang等人[15]提出的GSBC(Group Spam detection via Bi-Connected graphs)算法。选用该算法的原因是GSBC算法是无监督算法且是最新的用基于图的方式来检测虚假共谋群组的算法；GSBC算法使用亚马逊数据集来验证实验性能，这样本文算法同GSBC算法进行比较时实验效果会更明显；GSBC算法被很多文献选为比较基线，通过证明本文算法优于GSBC算法可间接证明本文算法优于其他的比较算法。

选用的第2个基线算法为自我比较算法，即仅使用行为特征(B算法(Behavior feature reasoning algorithm))来判定共谋群组。此组实验是为了验证和比较只使用行为特征而不使用网络结构时的差异性。选用的第3个基线算法是自我比较算法，仅使用结构特征(SR算法(Structural feature Reasoning algorithm))来判定共谋群组。此组实验是为了验证只使用网络结构而不使用行为特征作为先验可疑度时的差异性。选用的第4和第5个基线算法为在不加权的评论者-商品二部图上的行为结构算法(B&SR-w算法(unweighted Behavior and Structural feature Reasoning algorithm))和仅使用结构特征的算法(SR-w算法(unweighted Structural feature Reasoning algorithm))。与这2个算法比较是为了验证加权后推理与不加权推理的差异。

同时，因为手工标注数据集，本文用精确度(Precision)、召回率(Recall)和F1值作为衡量标准：

(13)

(14)

(15)

其中，TP(True Positive)指的是正样本被预测为正样本的数量，FP(False Positive) 指的是负样本预测成正样本的样本数，FN(False Negative)指的是正样本预测成负样本的样本数。Precision、Recall和F1值是用宏观平均值来计算的。

5.3 实验结果及分析

图2给出了GSBC算法、B算法、SR算法、B&SR算法、SR-w算法和B&SR-w算法的Precision、Recall和F1值。

Figure 2 Performance comparison of six algorithms 图2 6个算法的性能比较

通过图2a可以看到，在开始阶段GSBC算法的Precision值下降最剧烈，SR算法、B&SR-w算法、SR-w算法的Precision值存在轻微波动，B&SR算法的Precision值在轻微下降后保持上升状态，B算法的Precision值呈现轻微增长趋势且达到曲线最大值，且最大值低于其余算法的Precision值。随着群组数量增加，B&SR算法、B&SR-w算法和GSBC算法的Precision值都保持增长后趋于稳定状态，同时B&SR算法的性能均优于其余算法。SR算法和SR-w算法的Precision值表现为先下降后增长。B算法的Precision值一直呈现下降趋势，最低达到0.2，在6组对比实验中可以看出，B算法表现最差。

关于Precision的实验结果表明，仅使用行为特征推理效果最差(B算法)，这可能是因为群组造假者可以通过改变自己的行为来隐藏造假行为。仅使用结构特征推理(SR算法)比仅使用行为特征推理(B算法)效果好，这可能是在FIM分组后使得群组成员联系得更紧密所致。通过以上分析可以得出以下结论：

(1)同时考虑行为和结构推理的准确率比单独只考虑其中一个因素的准确率高。

(2)带权重的图结构上推理准确率高于不带权重的图结构上的推理准确率。

从图2b中可以看出，B&SR算法、GSBC算法、SR算法、B&SR-w算法和SR-w算法在Recall值上的整体变化情况基本一致，且保持Recall曲线线性增长。B算法的Recall曲线波动比较大，不是明显的线性增长。在群组数量n大约为150时各算法的Recall值相等，小于150时只有B算法的Recall值明显增长，其余算法基本保持一致，大于150时B算法的Recall值出现明显的上升和下降，其余算法基本保持一致波动。

通过对召回率的分析可得，仅使用行为特征进行推理时B算法的曲线波动较大，其余算法波动基本保持一致。仅通过行为特征推理时召回率波动比较大可能和群组成员数量有关，当群组规模比较大时由于群组成员协同性作案，群组造假行为就会表现得比较明显，判断会更准确，召回率上升；群组成员数量少时，群组造假行为可能不明显，召回率下降。其余算法波动基本保持一致，可能是因为用FIM产生候选群组后群组成员联系紧密，进行结构推理后召回率受群组成员数量影响不明显。

综合准确率和召回率得到的F1值如图2c所示。由图2c可以看出，B&SR算法、GSBC算法、SR算法、B&SR-w算法和SR-w算法的F1值都是保持单调增长状态，且B&SR算法的F1值总是对应得分最高。B算法与其他5个算法差距较大，且F1值较低。这说明仅考虑行为特征的检测算法效果最差。

通过实验分析可以得出，使用行为特征和结构特征共同推理时算法性能更好，仅使用行为特征时效果最差。我们由此可以得出如下结论：同时考虑行为推理和结构推理可以更好地检测造假群组；仅使用一种方式推理检测虚假群组效果可能不太理想；构建的带权评论者-商品二部图比不带权的评论者-商品二部图检测结果更准确。

6 结束语

随着电子商务的发展，评论造假问题受到更多关注。同时，群组中成员通过合作的方式来给出高评分和不断刷商家信誉比个体造假者对人们伤害性更大。本文为了检测这种造假群组提出了融合行为与结构特征推理的造假群组检测算法。首先，利用频繁项挖掘方法来产生候选共谋群组，然后根据提出的基于行为特征的协同造假可疑度计算方法来对群组成员计算协同造假可疑度，并将该值作为先验协同造假可疑度。接下来在带权评论者-商品二部图上用循环信念传播算法计算群组成员的后验协同造假可疑度，最后用信息熵的方法来判断是否为共谋群组。在真实数据集上的实验结果表明，本文算法优于比较算法。

尽管本文算法在性能方面优于基线算法，但也有不完善的地方。例如，本文实验所用的数据量偏小，在产生后候选共谋群组时可以选用大数据集，然后采用其他算法来产生候选群组。因为数据量偏小时会导致群组规模太小，这样检测出来的群组可能不够全面。在构建带权评论者-商品二部图时，关于权重的计算方法还可以考虑更多的因素，如文本等使得计算出来的权值更准确。同时在检测群组造假时可以考虑新的检测方法，使用行为指标具有太多的限制，不能通用于各个领域，后续可以从这几个方面继续进行研究。