基于潜在类分析的社交机器人语言特征和传播效果研究

2023-03-14王汇森

新闻研究导刊 2023年2期

摘要：社交机器人作为一种活跃于社交媒体的新型传播主体，其依靠算法程序模仿人类用户发布信息，具有目的性、仿真性、交互性的特征，且对于互联网舆情和意见气候的塑造有着重要的作用。以往的研究更多侧重于对社交机器人本身的行为特征加以描述，而对于受众的关照则有所欠缺。文章基于潜在类分析归纳四种典型的语言类型，并依据成熟的技术接受量表设计实验，研究受众对于不同风格的语言的感知程度和不同社交机器人的文本传播效果。研究发现，在推特平台的中国新冠肺炎疫情相关话题下，具有“虚伪和消极”特征的文本在社交机器人发布文本中占比较大，而具有“叙述和消极”特征的语言在传播过程中的效果最佳，呈现情绪性较强、真实性较低的特点。文章旨在通过对社交机器人语言内容及效果的分析，总结特征与经验，为判别虚假消息、维护国际形象、预防信息污染提供策略参考。

关键词：社交机器人；潜在类分析；计算宣传；技术接受；舆情传播

中图分类号：G206 文献标志码：A 文章编号：1674-8883（2023）02-0060-04

课题项目：本论文为2021年度苏州大学校级大学生创新创业训练计划项目“疫情下中外传播平台话语实践与效果分析——基于传统媒体与社交媒体的多维度研究”成果，项目编号：2021xj004

一、问题提出

社交机器人是人工智能发展到一定程度的产物。所谓社交机器人，是指在社交媒体中，由人类操控者设置的、由自动化算法程序操控的社交媒体账号集群。其通常通过模仿人类在社交媒体中的状态和行为，伪装成正常用户，有组织地与正常用户进行交互，以达到依照人类操纵者的意图影响目标受众的目的[1]。社交机器人可以在社交网络中扮演人的身份，拥有不同程度的人格属性，与人类进行互动[2]。美国证券交易委员会报告显示，2014年推特平台上有超过2300万的活跃账户实际上是社交机器人，其已经成为社交媒体中重要的内容生产力与传播动力。

借力海外社交媒体接触海外用户，加强国际传播，提高海外影响力，是中国塑造国家形象、构建对外话语体系的一条便捷而重要的路径。因此，加强对社交机器人功能、作用，其干预舆论的特征及应对措施等的深入研究，具有十分重要的现实意义。

目前，国内大部分有关社交机器人影响的研究都集中于海外社交媒体中国相关议题下社交机器人的分布及特征研究，进而探究中国国际形象的影响因素。从社交机器人的分布情况上来看，通过对不同“能指”，即不同标签下社交机器人的研究发现，对中国的误解、曲解更多来自真正的人类用户，但有关中国的负面舆论会在社交机器人形成的虚假意见气候下获得强化。从一二级传播的影响上来看，社交机器人确实有能力引发人类用户对其发布的文本进行转发，但是这部分转发数量与人类用户之间的转发量相比，频率较低。这说明虽然社交机器人的活跃度非常高，并成功促成了一部分信息的二级传播，但总体上看，其尚不能成为促使专业媒体信息扩散的重要节点。

在前几年的新冠肺炎疫情相关议题下，海外社交媒体的社交机器人在讨论中的作用具有多面性：一方面，由于機器发布新闻具有较强的时效性，其新闻速报的功能对传播全球新冠肺炎疫情相关信息起到了重要作用；另一方面，社交机器人甚少核查所转发的网站信息，所以成了助推低质量信息扩散的始作俑者。对于新冠肺炎疫情相关议题的讨论，有学者研究发现，社交机器人常常会树立“中性化”“理性化”的外部特征，却发布带有明显指向性的负面内容，并且切入点往往以财经和社会事件为主。这一类的社交机器人的传播效果主要依赖于较大粉丝数量的人际传播而非内容传播[3]。

正因如此，本研究旨在从受众角度理解社交机器人发布的文本对人类自身心理状态以及媒介使用行为的影响。基于受众角度，提出以下问题：

第一，社交机器人语言的文本特征如何？

第二，人类对不同风格文本的感知效果表现如何？

二、数据挖掘

（一）数据收集

本文主要选择近几年社交媒体讨论较多的新冠肺炎疫情相关议题进行研究。在推特平台上，在文本中添加话题标签（#）被认为是重要的议事手段，根据推文中的话题标签可以较为准确地定位到相关话题。本研究基于话题标签的功能特性，以“#COVID19 china”（新冠中国）为关键词，查找推特平台上与中国疫情相关的推文。利用Twitter API设计Python脚本，抓取了自2020年4月17日到2020年5月10日的31887条原始推文，其中包含推文、作者名称、作者ID、推文类型、推文点赞数、推文转发数、推文回复数、作者关注数、作者粉丝数、作者推文总量等共计29个原始字段。

（二）社交机器人判定

社交机器人的判别研究一直是学界的研究重点，Botometer是目前学界普遍采用的一种较为成熟和准确的社交机器人鉴别工具。该服务器会将取得的用户特征与系统内的监督机器学习模型中成千上万个已被打上标记的例子进行比对，从而得到一个取值区间为[0，5]的分数，分数显示了目标账号为机器人的可能性，0代表着最不可能为社交机器人，5代表最可能为社交机器人。本研究采用了Botometer v4的轻量版本BotometerLite，得到经过精简的分数区间[0，1]，按照先前研究的经验，超过0.5即从概率上被认为是机器人账号[4]。检验结果显示，31887条推文中，有1353条为机器人数据（约4.2%），30534为人类数据（约95.8%）。本文仅针对社交机器人的推文进行分析，在这1353条推文中，848条为转发类型（占比约62.7%），420条为原创（占比约31%），56条为回复（占比约4.1%），29条为引用（2.1%）。

三、研究设计及结果

（一）文本潜在类分析

本研究借用LIWC软件进行文本分析。在LIWC2015中，除了返回基本的分词、词性信息，还通过其内置的算法给出了4个总结变量，包括文本的分析性、影响力、真实性、情绪性。这四个变量的取值区间均在[0，100]。

“分析性”变量是基于文本使用表示正式、逻辑和分层思维模式的词汇的程度。其中，越低的值代表着更低的分析性，从而更多体现了文本中的叙事思维；更高的值则代表逻辑与分析思维[5]。“影响力”变量反映了人们在社会环境中对相对地位的关注或意识，更高的值代表文本更关心宏观事务，比如政治、经济问题，而更低的值则表示更侧重于描述自身或者微观的心理感受。“真实性”变量反映的是文本所展现出来的真实性或者真诚程度，更高的值代表文本更多以个人化的、谦卑的语言进行流露，反之则意味着文本会给人以欺骗性的感受。“情绪性”变量反映的是文本的语气，更高的值代表更加积极，反之则体现消极的情感[6]。

这四个变量为本研究对后续的文本分类提供了基本参照。笔者将1353条由社交机器人生成的文本全部导入LIWC2015当中，之所以选择全部类型的文本而非仅导入原创内容，是考虑到转发也是社交机器人发布推文的主要形式，转发文本的风格同样应当被视为社交机器人参与话题讨论的重要因素。

在对社交机器人发布的文本进行分析后，为了对文本进行风格分类，利用潜在类分析开发出一种类型学。潜在类分析会根据不同变量之间潜在的联系来进行聚类，从而使得文本通过四个变量之间的差异划分为不同的类别。本研究使用Stata17软件进行潜在类分析建模及其事前评估。

1.参数评估

进行潜在类分析建模中最重要的一步是确定聚类的数量，有助于划定合理的聚类数量，方便后续的实验。本研究比较了3～5个族类的贝叶斯值，发现四个族类的贝叶斯值最小，为45498.43，意味着其相较于三族类（45794.68）、五族类（45534.22），拟合效果更好。分布情况如下图所示。

2.模型分析

“影响力”在上图四个族类中的平均值都比较平衡，均在70左右，所以不将其纳入本研究类型划定的依据。在第一个类别中，相较于其他三个族类，其最显著的特征是“分析性”变量的值很低（約42.6），其次“情绪性”变量也很低（约为29.3），故将其命名为“叙述/消极型语言”。在第二个族类中，其显著特点是具有较高的情绪性（约92.8）和较低的影响力（约12.6），将其命名为“虚伪/积极型语言”。在第三个族类中，表现最为显著的是极低的真实性（约9.2）和情绪性（约18.1），将其命名为“虚伪/消极型语言”。在第四个族类中，其最显著的特征是较高的真实性和较低的情绪性，将其命名为“真诚/消极型语言”。四种类型的语言分别按上述顺序占比约9.8%、15.3%、57%、17.9%。总的来看，社交机器人发布的语言大多具有很强的分析性，但语言的真实性较低。具体而言，“虚伪/消极型语言”在社交机器人发布的文本中占比最高，而“叙述/消极型语言”占比最低，比较显著地体现了中国疫情话题下社交机器人的文本特征。

（二）传播效果实验

基于前文对社交机器人文本类型的划分，本研究从前文文本分析的四种类型的语言中分别找出一条文本作为实验用刺激物，以文本类型为控制变量设计实验。本研究的自变量为这四篇推文所分别对应的四种机器人文本类型，而因变量为受测者对文本的传播效果。四十名被试者分别被随机安排到不同类型的机器人推文进行阅读，并填写问卷。样本来源上，将实验的调查对象确定为本科新闻传播专业大学生，这是考虑到该受试群体专业性强，且在国际交流、资讯获取方面存在技术优势与行业需求。被试者相关信息如表1所示。

（三）问卷设计

1.第一部分：因变量（传播效果）

社交机器人的目的在于传播信息，并依照人类操纵者的意图影响目标受众。本实验的因变量主要分为三个方面：受众的认知、情感和行为。问卷设计以大卫（1989）、格芬（2003）就PU、PEOU、IU以及电子商务信任量表为依据参考，该技术接受模型具有精炼、简洁、跨学科性强等优点，近年来被广泛运用于探讨社交网站如微博、微信、抖音等媒介的受众接受过程。其中，主要两个衡量指标为“感知易用性”和“感知有用性”，结合关于亚马逊网站的接受程度中的“信任倾向”及“行为倾向”，以李克特量表为主结合两道行为倾向单选题，总共构成7道有关于推文可信度、逻辑性、情绪感染力、感知有用性及行为倾向的题目，分别附于每条文本的下方。

2.第二部分：控制变量

主要用于对被试者的性别、学历、学科等方面的控制和筛选，以及对社交机器人认知程度的调查，总共包含三道题目。

（四）实验结果分析

由于本实验有四组被试者，因此使用SPSS对每一个变量分别采用一维组间方差分析的方法。

根据表2的方差分析结果，几组变量的F值清晰可见，同时可信度、逻辑性、感知有用性这三个变量的显著性均小于0.05，因此拒绝原假设。这说明几组变量在对应的四条推文中，都至少有一个和其他三个存在显著区别，也有可能四个都存在显著区别。而情绪感染力和行动倾向的显著性大于0.05，接受原假设，说明这两个变量在四条推文当中没有显著的区别。

而在多重比较实验中（见表3），研究发现当任意一组和其他组的显著性关系小于0.05时，则二者存在显著关系。可信度中的“叙述/消极型语言”和另外三个类别都存在显著区别。根据研究所使用的李克特量表收集的结果，数值越高证明这类特性越明显，而“叙述/消极型语言”的平均值高于其他三个类别。因此可得，“叙述/消极型语言”在可信度方面高于其他几个类别。以此类推，“虚伪/积极型语言”和“虚伪/消极型语言”没有显著差异，和“真诚/消极型语言”存在显著差异。“虚伪/消极型语言”和“真诚/消极型语言”存在显著差异，根据描述性统计可得，“虚伪/积极型语言”和“虚伪/消极型语言”可信度高于“真诚/消极型语言”。

从逻辑性方面来看，“叙述/消极型语言”高于其他三类语言，而“虚伪/积极型语言”“虚伪/消极型语言”“真诚/消极型语言”均不存在显著差异。从情绪感染力方面来看，四种语言都不存在显著差异。从感知有用性方面来看，“叙述/消极型语言”高于其他三类语言，而其他三类语言之间均没有显著差异。从行动倾向方面来看，均不存在显著差异。

四、结语

本文分析研究了在推特平台中有关中国疫情标签下的社交机器人推文的语言风格。总体而言，社交机器人发布的推文内容具有分析性较强、真实性相对较低的特点。同时，根据社交机器人发布推文的不同类型和语言风格分为四个类别，分别是“叙述/消极型语言”“虚伪/积极型语言”“虚伪/消极型语言”和“真诚/消极型语言”。

本研究对这四个不同类别的社交机器人语言风格进行传播效果的比较研究，发现“叙述/消极型语言”在传播效果方面效果最佳，而其他三个类型的传播效果区别并不显著，且被试者对于这三类文本风格的感知度相对较弱，但是“虚伪/积极型语言”还是高于其他两个类型。

对此，应当注意到，中国抗疫话题下的大量消极信息对我国国际形象产生了不良影响，不仅阻碍了合作抗疫的正常进展，也加深了国际舆论间的不信任与对立冲突。专职于发布负面信息的社交机器人的存在，证实了中国国际形象污名化是受到操纵而有意为之。

目前，海外針对中国的舆论斗争呈现长期化、操纵性的特点，需要引起各方面警惕。

一方面，应当加强对社交机器人包括语言特征、账号关系、态度倾向等方面的研究、甄别，尽可能地屏蔽“噪声”污染。在预防、应对海外社交机器人影响方面，首先，应强化研究，鼓励科技人员开发甄别社交机器人的分析算法，根据语言特征与行为倾向将疑似海外社交机器人的社交账号予以筛查标签、自动分类，并利用大数据技术对社交机器人群体行为予以分析研判。其次，需要建立健全海外舆论监管体系，定期向公众进行科普宣传，提前化解信息误差、整合共识，规避社交机器人造成的潜在风险。

另一方面，面向海外、承担外宣任务的新闻工作者应当学习掌握海外接受的话语策略，讲好中国故事，传播好中国声音，以期增进国际舆论的互信理解。在与外界交流过程中，新闻工作者应当关注与防范海外社交机器人虚假信息的影响，并进行有针对性的反击。

当然，本研究依旧存在一定的问题，包括没有考虑受众之间的文本解码能力差异，以及文化背景对特定的文本内容是否存在情感偏差等。针对这些问题，会在之后的研究中加以弥补和完善。