社交网络机器人检测综述

2022-12-08杨舟

网络安全技术与应用 2022年3期

◆杨舟

社交网络机器人检测综述

◆杨舟

（四川大学网络空间安全学院四川 610065）

随着以微博为代表的社交网络平台的迅速流行，出现了大量社交机器人账号，部分恶意的机器人在社交网络平台上散布不良信息，进行虚假宣传，甚至发布煽动性言论、引发对立情绪。恶意机器人账号的存在对网络空间安全产生了严重威胁，因此，实现社交机器人的有效检测对于净化网络内容、维护真实的舆论环境具有十分重要的意义。目前，主要的社交机器人检测方法包括基于图的检测方法、基于机器学习的检测方法、基于异常的检测方法以及基于众包的检测方法。与此同时，社交机器人检测技术还面临着数据集难以稳定标注、缺乏健壮的特征等挑战。本文归纳和整理了社交机器人检测研究现状，并简要介绍了各项技术及其优缺点。最后，本文总结和展望了当前方法可以进一步改进的方向。

社交网络；机器人账号检测；机器学习；深度学习

随着社交网络平台的迅速流行，出现了一类“特殊”的社交网络账号——它们由计算机算法自动生成和控制，能像普通账号一样长期活跃在社交网络上。这些能够模仿人类在社交网络平台上进行活动的账号被称作社交机器人。

社交机器人的出现对社交网络环境原有的秩序产生了不可忽视的影响，部分恶意的机器人账号有组织地传播广告或钓鱼网站链接，诱导用户点击，以此获利。一些商家则借助社交机器人账号来进行虚假宣传、抹黑竞争对手，造成了社交网络平台的信任缺失和市场秩序的混乱[1-2]。此外，在国外的政治选举活动中，一些候选人利用社交机器人在社交网络上发布大量政治观点，从而达到摇摆选民、操纵公众舆论的目的[3-5]。

恶意社交机器人的存在对网络空间安全产生了严重威胁，因此研究出有效的社交机器人检测方法具有十分重要的意义。

1 面临的挑战

社交机器人检测技术主要采用机器学习、社交关系图分析等方法构建能够表征用户的特征来实现社交网络账号的二分类。目前而言，社交机器人检测问题面临的挑战主要有以下三个方面。

1.1 数据集的标注

由于社交机器人并没有精确的定义，因此研究人员无法使用一个稳定的标记数据集的方法来获取一个绝对真实的数据集。

1.2 特征的选取

社交机器人账号正在快速发展和演化，这会导致如果只改变特征值，将无法有效检测到社交机器人账号。因此，寻找健壮的特征具有十分重要的意义。

1.3 方法的有效性

由于现阶段难以收集到一个能够兼容所有检测类型的数据集，因此研究人员发现比较不同的社交机器人检测方法、验证当前方法的有效性是一项充满了挑战的任务。

2 检测方法

社交机器人检测相关的研究成果在近十年的时间内逐渐兴起，目前的研究方向主要包括了基于图的检测方法、基于机器学习的检测方法、基于异常的检测方法以及基于众包的检测方法。

尽管社交机器人是一个被广泛使用的术语，但目前为止它仍然没有一个明确的定义。文献[6]将机器人定义为在线社交网络中的自动账户。Forelle等人[7]也用类似的方式描述了Twitter上的社交机器人，他们认为由能够自动发布推文或消息、由计算机自动程序生成的账号是社交机器人。此外，Grimme和Preuss等人[8]提出了社交机器人的新定义，即“半自动代理”——这些代理能够通过在线社交网络中的单方或多方沟通行为来实现特定的目的。综上所述，在本文中，我们将社交机器人理解为“自动生成内容且能够在社交网络上与人类互动、试图模仿并可能改变人类行为的计算机算法”。

2.1 基于图的检测方法

图结构广泛应用于社交网络相关的研究中，它可以描述社交网络账号之间直接或间接的关系，例如正在关注关系和关注者关系等。基于图的社交机器人检测方法依赖于社会图的特性来区分机器人账号和普通账号。这类方法的典型做法是先使用图论的相关方法来对账号进行建模，然后利用机器学习方法实现二分类。

Cornelissen等人[9]提出了一种将网络结构度量和无监督机器学习结合的方法来对机器人账号进行检测。他们首先假设K-1图比K-2图更适用于对机器人和人类账号进行区分，然后基于这个假设在Twitter数据集上测试了分类模型，最后的实验结果表明，上述假设不成立。Hurtado等人[10]则推测具有相似行为活动、并且在社交网络结构中高度关联的一组社交账号是社交机器人账号，因此他们使用了时间和网络信息在Reddit平台上对政治类机器人进行了检测。最终，他们在该平台上发现了一个机器人用户群。Yang等人[11]先建立了一个基于用户交互的交互图模型，然后使用了BP神经网络模型对用户进行了分类，实验结果达到了98.6%的准确率。此外，Dorri等人[12]基于社交网络的同质性对用户交互网络进行了建模，然后使用半监督机器学习方法来检测机器人账号。

社交关系是社交网络用户的重要属性之一。基于图的检测方法能够提取出用户的关系网络特征，并基于此对社交账号进行识别。但是由于在现实中社交网络平台对关系数据的采集进行了限制，因此基于图的检测方法往往不能完全达到预想的性能。

2.2 基于机器学习的检测方法

基于机器学习算法的社交机器人检测方法是目前社交机器人检测领域的主流方法。此类检测方法主要分为传统机器学习和深度学习的方法。

（1）基于传统机器学习的检测方法

基于传统机器学习的方法构建了不同的用户特征，然后利用传统机器学习算法来对账号进行分类。

David等人[13]确定了一组在Twitter平台上检测机器人账户的特征。与此同时，他们测量了每个特征的重要性，并应用了5种不同的分类方法进行了实验，最终发现，随机森林分类器的表现最好。Dickerson等人[14]认为人类和非人类用户的情感是不同的，因此他们引入了基于情感分析的特征来检测Twitter平台上的机器人。实验结果证明，引入的情感特征能够将模型的AUC值从0.65提升至0.73。此外，Khaled等人[15]提出了一种基于支持向量机和神经网络的SVM-NN算法，该算法能够在使用较少的特征数量的情况下，得到约98%的检测准确率。

基于传统机器学习的检测需要提取社交账号的各类特征输入机器学习模型中进行分类，然而这种方法需要花费较高的时间成本来进行特征工程，也难以发现某些潜在的检测特征。

（2）基于深度学习的检测方法

随着深度学习技术的发展，基于深度学习的社交机器人检测方法逐渐成为研究热点。深度学习是机器学习的一个重要分支，它以人工神经网络为基础，实现对数据的学习。相比传统机器学习方法，深度学习方法适应性良好，在数据量大的情景下表现更好。

Daouadi等人[17]基于他们所提出的一组用户特征，提出了一种名为Deep Forest的深度学习算法，最后训练得到了精度为97.55%的机器人检测模型。利用每个社交账号的社交行为和帖子内容，Cai等人[18]使用了CNN-LSTM模型对其进行建模并进行分类。相比其他方法，该模型实现了用户特征的自动提取，避免了烦琐的特征工作。Alom等人[19]通过深度学习方法提取了账号发布的推文中含有的语义特征，然后将该特征与账号个人档案信息中提取的特征融合之后，输入到推理层进行二分类。该方法相比其他几种基于机器学习和深度学习的方法，性能有较大的提高。

2.3 基于异常的检测方法

基于异常的社交机器人检测方法利用了这样一个假设——即合法的社交网络用户没有任何动机在没有奖励的情况下做出一些奇怪的行为。因此，在某些预先设置的限制下，行为异常的用户很可能是恶意用户。这种方法认为当发现异常的用户群体行为时，应将该群体归类为社交机器人群体。

由于使用这种检测方法时需要事先规定“异常”的意义，因此很难评估规定的合理性。但是，这种方法可以用于收集社交机器人账号样本，以便建立数据集并从中提取特征信息以增强未来的检测方法。

检测出账户行为异常之后并不触发这些账号的方法被称为基于动作的检测。Pan等人在文献[20]中做出了以下假设：1）人类账号的行为将会表现出强烈的异质性；2）相比人类账号，机器人账号的行为并不复杂。因此，他们认为一个社交机器人将有一个相对小的熵。作者利用异常burstiness参数和时间间隔熵值，将新浪微博上的账户分类为人类、人工机器人和自动机器人。最终的实验发现，机器人账号发布的内容并不比人类账号多。

还有一些基于异常的方法依赖于触发社交机器人账户的异常行为并通过它们与研究人员设置的陷阱之间的异常交互来检测它们，这类方法称为基于交互的检测。Lee等人[21]在Twitter上部署了60个蜜罐，历时7个月获取了36000个机器人账号候选者，然后通过分析账号行为、文本、关系等特征进一步筛选得到最终的检测结果。通过合理的评估分析之后，作者发现检测结果能够达到98.26%的精度。

2.4 基于众包的检测方法

众包是一种在线活动，要求许多人手动完成一项任务[22]。当应用于检测社交机器人时，这种方法需要很高的成本和时间。因此，一些研究人员利用这项技术来收集标记的数据集以供进一步研究使用。

这一类方法的代表性研究由Wang等人[23]完成。他们通过社会图灵测试，检查了受信任的在线社交网络用户判断某一账户是否为社交机器人的准确性。然后作者提出了一个系统，首先使用自动算法过滤账户并输出可疑账户，再由选定的众筹工作者进行进一步调查。在这个系统中，众筹工作者的投票被聚集起来，以提高社交机器人检测的准确性。此外，为了建立仿真数据集，Alarifi等人[24]让10名经过挑选和培训的志愿者参与到研究中，这些志愿者作为众包工作者将Twitter账户手动标记为人类、自动机器人和人工机器人。此外，Cresci等人[4]为了测量众包在检测社交机器人方面的准确性进行了一项测试。在测试中，作者从一家众包网站雇佣了众包工作者并要求他们对预先标注的数据集进行分类。测试结果显示，基于众包的检测方法成功地检测到了传统的垃圾邮件机器人和真实的账号，但并没有准确检测到恶意的社交机器人。

3 展望

由于社交网络对人们信息获取和意见形成的影响程度大幅增加，社交机器人被恶意滥用的问题日趋严重，对网络空间安全产生了严重威胁。尽管研究人员建立了强大的模型来检测社交机器人账号，但恶意的社交机器人也在不断地发展进化以逃避检测。

因此，本文分析了社交机器人的定义，并整理和归纳了社交机器人检测的研究现状。结果表明，构建一个健壮的社交机器人检测模型具有挑战性，因为缺乏可信的、全面的且精确标注的数据集，而且机器人的特征正随着社交机器人的发展而改变。当前的方法正在试图克服这些挑战，但还可以做更多的改进，特别是找到并利用机器人账号不容易更改的健壮特性。此外，还需要为Twitter以外的平台构建模型，并需要独立地检测各种类型的社交机器人。更进一步地，还需要探索一些更好的办法，例如使用自然语言处理技术来检测自动或重复的内容。

[1]Wang Z，Gu S，Zhao X，et al. Graph-based review spammer group detection[J]. Knowledge and Information Systems. 2018，55（3）：571-597.

[2]Byun H，Jeong S，Kim C. SC-Com：Spotting Collusive Community in Opinion Spam Detection[J]. Information Processing & Management. 2021，58（4）：102593.

[3]Pastor-Galindo J，Zago M，Nespoli P，et al. Twitter social bots：The 2019 Spanish general election data[J]. Data in Brief. 2020，32：106047.

[4]Cresci S，Di Pietro R，Petrocchi M，et al. The paradigm-shift of social spambots：Evidence，theories，and tools for the arms race[J]. 2017.

[5]Fernquist J，Kaati L，Schroeder R. Political Bots and the Swedish General Election[C]. IEEE，2018.

[6]Morstatter F，Wu L，Nazer T H，et al. A New Approach to Bot Detection：Striking the Balance Between Precision and Recall[C]. 2016.

[7]Forelle M，Howard P，Monroy-Hernández A，et al. Political Bots and the Manipulation of Public Opinion in Venezuela[J]. 2015.

[8]Grimme C，Preuss M，Adam L，et al. Social Bots：Human-Like by Means of Human Control?[J]. Big Data. 2017，5（4）： 279-293.

[9]Cornelissen L，Barnett R，Schoonwinkel P，et al. A network topology approach to bot classification[C]. ACM，2018.

[10]Hurtado S，Ray P，Marculescu R. Bot Detection in Reddit Political Discussion[C]. ACM，2019.

[11]Yang W，Dong G，Wang W，et al. Detecting Bots in Follower Markets[C]. Berlin，Heidelberg：Springer Berlin Heidelberg，2014.

[12]Dorri A，Abadi M，Dadfarnia M. SocialBotHunter：Botnet Detection in Twitter-Like Social Networking Services Using Semi-Supervised Collective Classification[C]. IEEE，2018.

[13]David I，Siordia O S，Moctezuma D. Features combination for the detection of malicious Twitter accounts[C]. IEEE，2016.

[14]Dickerson J P，Kagan V，Subrahmanian V S. Using Sentiment to Detect Bots on Twitter：Are Humans more Opinionated than Bots[C]. 2014.

[15]Khaled S，El-Tazi N，Mokhtar H M O. Detecting Fake Accounts on Social Media[C]. 2018.

[16]Daouadi K E，Rebaï R Z，Amous I. Bot Detection on Online Social Networks Using Deep Forest[C]. Cham：Springer International Publishing，2019.

[17]Cai C，Li L，Zeng D. Detecting Social Bots by Jointly Modeling Deep Behavior and Content Information[C]. 2017.

[18]Alom Z，Carminati B，Ferrari E. A deep learning model for Twitter spam detection[J]. Online Social Networks and Media. 2020.

[19]Pan J，Liu Y，Liu X，et al. Discriminating bot accounts based solely on temporal features of microblog behavior[J]. Physica A：Statistical Mechanics and its Applications. 2016，450：193-204.

[20]Lee K，Eoff B D，Caverlee J. Seven Months with the Devils：A Long-Term Study of Content Polluters on Twitter[C]. 2011.

[21]Estellés-Arolas E，González-Ladrón-De-Guevara F. Towards an integrated crowdsourcing definition[J]. Journal of Information Science. 2012，38（2）：189-200.

[22]Wang G，Mohanlal M，Wilson C，et al. Social Turing Tests： Crowdsourcing Sybil Detection[J]. 2012.

[23]Alarifi A，Alsaleh M，Al-Salman A. Twitter turing test：Identifying social machines[J]. Information Sciences. 2016，372：332-346.