国际社交媒体上中国形象的意见-情感特征与媒介驱动机制
2023-11-09韩瑞霞谭欣仪张佳榕
韩瑞霞,谭欣仪,张佳榕
(上海交通大学 媒体与传播学院,上海 200240)
媒介融合使社交媒体成为人们日常信息交流的主要渠道。不同于权威媒体的意见生成机制,社交媒体因用户生产内容而成为展示公众态度的平台和推测公众意见的数据“传感器”[1]。官方机构、民间组织、公众个体都是社交媒体上国家形象呈现的信息相关者。因此,以数据挖掘的方式探索海外社交媒体上中国形象的信息特征和媒介驱动机制成为理解中国海外形象的必要途径。在五大国际社交媒体上对中国话题及其评论数据进行挖掘编码,并做相关、回归、调节等统计分析,从议程浮现、意见领袖、认知-情感特征、机器账号和平台可供性五个角度分析海外社交媒体上中国形象的主要特征和媒介驱动机制。
一、文献回顾
(一)海外社交媒体上中国形象的议程浮现机制
“新闻媒介影响‘我们头脑中的图像’”,网络社交媒体正逐渐取代传统媒体在公众议程方面的影响力,成为公共意见形成的主要平台[2]。Chaffee和Metzger研究发现,社交媒体将议程设置理论的关键问题从“媒体告诉人们要思考什么”变成“人们告诉媒体他们在思考什么”[3]。Asur等人也指出,社交媒体正在充当媒体内容的过滤器和放大器[4]。同时,公众表达情绪产生的信息“流瀑”正在反作用于主流媒体议程[5]。总体来说,议程设置的根本目标是为了获得更好的传播效果,而社交媒体的多元交互性和灵活性不仅避免了大众媒体议程设置僵化的问题,还间接产生了超越主流媒体的传播效果。Grzywinska和Borden以Facebook“占领华尔街”运动相关报道为例,分析发现社交媒体通过对传统媒体内容的讨论反向影响了主流媒体的观点和报道议程[6]1-19。而Faas等人也发现,数字平台确实降低了传统媒体的把关效力,并潜在地增加了各种行为者塑造议程的能力[7]5-10。因此,分析某一特定主体的形象需要从社交媒体本身特有的议程浮现机制角度进行探讨。
(二)中国形象塑造中的意见领袖作用
信息传播是按照“媒介—意见领袖—受众”模式进行的,意见领袖在影响个体决策方面比媒体的作用更大[8]。对于社交媒体来说,一方面,由于缺乏传统“把关人”的严格检查与监督,其传播的各类冗杂信息导致普通公众甄别信息的压力增加;另一方面,新媒体信息涌现机制利于以意见和情感为集结点、实现基于社会网络和算法属性的人群聚集,这为意见领袖的出现提供了客观基础。社交媒体上意见筛选的“领路人”“牧羊人”大量出现[9]。与此同时,媒介形式的丰富性和个体选择的多样性也客观增加了传统媒体穿透“过滤泡沫”向公众明确传达意见的难度,间接放大了社交媒体中意见领袖的作用。Feezell通过对Facebook平台上政治信息的研究发现,社交媒体可以通过二级传播进行社会过滤,同时附带政治信息,显著影响政治关注度低的人群[10-11]。除此之外,社交媒体还可以通过创建论坛增加用户的暴露信息,借助意见领袖的作用放大意见的影响力。因此,关注社交媒体中意见领袖观点呈现和互动的特征对于了解海外社交媒体上中国形象的形成路径非常必要。
(三)意见挖掘与情感分析在中国形象相关数据中的应用
社交媒体中的信息主要以意见和情感为表现形式,这也是社交媒体意见-情感分析流行的客观原因。社交媒体中的意见挖掘主要通过自然文本分析用户意见,而情感分析则通过社交平台用户表达的情绪信息了解其对议题的情绪涌动及意见互动机制[12]。社交媒体上信息的多样性和丰富性为这种分析方式提供了良好的客观条件。当前的社交媒体情感分析主要包括情感语境分析、情感极性分析和情感强度分析等。肖明、易红发就依此发现,推特上的中国形象表现出政治类议题为主导,经济、社会议题为辅的特征[13]。近年来,国家形象数据挖掘前沿所产生的丰富研究成果也主要采用社交媒体数据分析方法[14]。
(四)社交媒体上国家形象塑造中社交机器人的作用
“社交机器人”的行动者功能是社交媒体不同于传统舆论场的关键所在。社交机器人主要指在社交网络中扮作人类、拥有不同程度人格属性,且与人类用户进行互动的人工智能应用[15]。社交机器人以交流互动的传播者角色混迹于信息场域,通过模仿人类的社交行为、有组织地与人类用户进行互动,最终依照背后操纵者的意图达到影响受众的目的。研究表明,社交机器人占Twitter全部账户的9%~15%[16]。Facebook上的社交机器人对社交关系网的渗透比率达到80%[17]。Boshmaf等人发现,新冠肺炎疫情相关话题的讨论中就存在大量社交机器人,它们切实影响着社交媒体中的议程浮现,这使社交媒体议题呈现的驱动机制和特征更加复杂化。除此之外,社交机器人还可以通过系统的传播行为支持或者抹黑特定主体。目前社交机器人常被用于国际舆论场上的政治角逐,意见传播和声势助推。因此,关注社交媒体机器人在国家形象塑造中扮演的角色显得尤为重要。
(五)基于媒介可供性的平台特征差异分析
不同平台由于算法差异,意见和情感的生成和表达机制也存在细微差别,已有研究主要关注大型平台如Twitter和Facebook上的意见言论,对其他平台关注甚少。因此,综合观察比较中国形象在多平台的形成机制是亟待填补的空白。在这方面,媒介可供性为研究提供了概念基础。“可供性”最初由美国生态心理学家吉布森提出,它揭示了生物与环境之间的协调性。2017年华人学者潘忠党在引入这一概念时指出:在传播学视野中应将“可供性(Affordance)”分为信息生产的可供性(production affordances)、社交可供性(social affordances)和移动可供性(mobile affordances)三个部分[18]。这一梳理为分析不同社交媒体针对特定议题的可供性差异奠定了基础,即关注议题、网络和互动。美国学者Richard和Robert也通过媒介丰富性理论指出,不同媒介传递信息的丰富程度存在差异,因此不同媒介产生的效果也有所不同[19]。在社交媒体呈现各类议题的过程中,大部分学者聚焦于新媒体尤其是社交媒体与传统媒体的区别,少有学者聚焦于社交媒体平台之间的差异[20]。社交媒体具有不同于传统媒体的议程设置功能和影响力,其中的意见领袖尤其是以社交机器人为代表的信息场域行动者尤其值得被关注。不同平台由于信息、关系、 网络可供性差异,对同一议题的表达和塑造存在差别。目前缺乏对中国形象在不同社交媒体平台上的比较研究。本研究将在社交媒体意见-情感数据挖掘与分析的基础上,对中国形象从议程浮现、意见领袖、社交机器人、意见-情感特征及平台差异五个方面进行总体呈现。
二、研究平台、数据与分析方法
(一)研究平台和数据特征
根据社交媒体使用人数和平台差异,本研究将五大社交媒体确定为数据来源,它们是Facebook(脸书),Twitter(推特),YouTube(油管),Instagram(照片墙)和TikTok(抖音海外版)。相对来说,Twitter和Instagram主推社交功能,用户覆盖范围广,政治属性明显;Instagram主推图片分享,网红众多,用户多为青年人;YouTube和TikTok主推视频分享,分别在长、短视频领域称霸。TikTok具有基于算法推送机制的病毒传播特征,而YouTube则全方位涵盖传统媒体、自媒体的多种形式。五个平台各具特点和优势,分析和对比他们在塑造中国形象上的同一性和差异性具有重要意义。
本研究挖掘了2022年3~6月的数据,各平台数据采集方法、标准、时间信息见表1。
表1 五大平台数据构成特征
(二)数据收集和处理方法
首先采用phthyon机器挖掘结合人工编码的方式,以“China”“Chinese”为关键词进行搜索,建立中国话题帖子与评论数据库,采用布尔一级编码、人工二级编码的方式进行数据清洗和梳理。运用词云工具对整合后的帖子和评论进行词频统计,提取每个平台排序前100的高频词作为数据库指标条目。在此基础上,对关键词进行二次提炼和分类,对议题进行领域划分,并对相关帖子点、转、评互动频度指数,情感强度和极性指标进行词频分类赋值。最后运用spss软件对重点变量进行相关、调节和中介作用分析,建立岭回归模型,最终呈现海外社交媒体上中国形象的议题特征、互动机制和平台差异。
三、研究结果
(一)基于词频分析的议程浮现
Twitter,Facebook,Instagram上帖子标题中的高频词集中在新冠、国家等字词上,Youtube 和TikTok则相对较少。与此同时,Facebook与Twitter上的热点议题高度相似,政治和美国议题均备受关注,用户对新冠议题讨论度较高,其他热点也多为严肃议题。Twitter上对国家和国际关系议题的讨论尤为热烈。YouTube上的高频词分布相对较广,既有政治、外交、科技等严肃议题,也有歌曲、电影等文娱议题。TikTok上热点的异质化程度较高,严肃议题较少,猎奇、生活、娱乐议题较多,如学习汉语、中国电视剧、男同性恋、功夫、美食等,详见表2。
表2 五大平台标题中的高频词
选取各平台共性议题即“政治”“新冠”“领土”进行交叉相关分析,结果显示:领土和新冠疫情的议题在Facebook上显著负相关,在Twitter上相关不显著,这表明对两个议题高度关注的人群并不重合;政治和领土议题在YouTube和Twitter上都显著正相关,也就是关注政治话题的人往往将两个议题捆绑讨论;政治和新冠议题的相关性在几大平台间差异显著,二者在Instagram上显著负相关,在Facebook上显著正相关,在Twitter上没有显著相关性,这说明只有Facebook用户讨论中国时,政治和新冠议题才伴随出现,见图1~图3。
图1 政治与新冠议题相关分析
图2 领土与新冠议题相关分析
图3 政治与领土议题相关分析
(二)意见领袖与过滤机制
通过对重复发帖数量来识别对中国议题有影响力的用户。越具有意见领袖潜质的账户,重复发帖数量越多,帖子点击次数越多,其数据也越容易被收录。一级数据分析发现,Facebook上重复发帖账号的最高发帖量达到184次,占Facebook上收录帖子总量的7%,其他平台均少于5%。进一步对各平台重复发帖数量排序前20的账号按照官方媒体、网红(influencer)、新闻工作者、自媒体账号等身份属性分类,发现:YouTube上收集的1 029个视频来自723个不同的账号,但是主要影响力仍然集中在具有明显自媒体属性的ID中,也就是说,在YouTube上讨论中国话题的个人账号占据“数量”优势,而媒体账号占据“流量”优势;TikTok上重复帖数量占统计总量的95.8%;Twitter上发帖较多的个人账号多数是带有鲜明政治立场与倾向的社会热点人物,个人账号帖子被收录率远高于团体账号;Facebook上的官方媒体在其账号类型和发帖频次中占主体,其账号数量占高频发帖排序前20中的14席,发帖频次垄断前10名,显著高于其他类型账号。个人账号中美国前总统特朗普表现出卓越的影响力;Instagram上官方新闻媒体在“#China”议题中表现出较高的互动强度。
进一步研究地缘差异对塑造中国形象的影响,根据使用语言及公开的国籍信息对五大平台用户进行地区分类,结果发现:YouTube上印度账号的视频最热门,英文主流媒体受众更广;TikTok用户中使用英语的账号超过一半;Twitter上美国国籍的账号数量大幅领先其他国籍,位列第一,其次为印度籍和巴西籍;在Instagram上,拉美、西欧和美国的媒体发布的内容互动量较大。总体表现出英语国家和地区的账号在五大平台有关中国形象的议程中具有无可比拟的影响力。
(三)机器账号的作用
由于其他平台对探测功能进行了屏蔽,本研究只分析在Twitter上检测机器账号的结果。使用印第安纳大学开发的综合性工具Botometer检验Twitter上发帖账户的机器属性。采用对外显示数据(0~5)的方式测试社交机器人,参照既有研究,将3分及以上的账号判定为社交机器人。在排除已注销的账号后,609个帖子中有79个来自社交机器人,占全部帖子数量的12.97%。在已收录的64位多次发帖者中有13个账号被判定为社交机器人,其中5个为团体账号,即官媒账号和营销号,其余账号的用户身份为企业家、政治家、媒体从业人员与社会活动家,国籍以印度和美国为主。在社交机器人发布的帖子中,28个与政治相关,23个与国家相关,政治话题提及率为0.65,高于平均政治提及率的0.56。14个与贸易相关,提及率为0.18,高于平均贸易提及率的0.1。数据表明,社交机器人参与的议程设置主要以政治、经济领域为主,对大众的政治信息接收和政治事件判断具有引导作用。
(四)意见挖掘与情感分析
对五大平台中国话题相关数据开展意见-情感关联分析,以Politics(政治)、Covid(新冠病毒)、World(世界)、Territory(领土)、Military(军事)、Economy(经济)、Society(社会)、USA(美国)和Culture(文化)九个议题作为情感分析对象进行相关性分析。结果显示,五大社交平台中意见-情感关联特征存在显著差异。(1)限于篇幅,具体分析结果可与作者联系获得。除Instagram以外,其他四个平台以正向情感相关性为主,Instagram上的政治、美国、新冠肺炎疫情议题与情感极性显著负相关;Facebook,YouTube,Twitter上意见-情感相关性显著,且情感与意见关联广泛;TikTok与Instagram平台上意见-情感相关性较弱,并且TikTok内部正负向情绪与议题关联性小,没有明显情感倾向、平台较为中立。综合分析可知:YouTube和Instagram情感极性强,情感倾向多元。YouTube上的世界、军事、文化话题与情感极性显著正相关,情感极性显著正向,而政治、新冠肺炎疫情、领土等议题与情感极性显著负相关;Instagram上经济、社会、文化话题与情感极性正相关,用户情感积极,而政治、新冠、世界与情感极性显著负相关;Twitter上整体情感极性为负向,世界、人权和美国议题与情感极性显著负相关。综合数据回归分析结果和原始帖子内容发现:Twitter用户对于中美对比和政治冲突话题非常关注,政治党派的对立和对中国人权问题的不信任加剧了负面情绪。TikTok上的意见-情感关联性弱,但总体呈现积极正向趋势;Facebook的数据几乎无情感极向,正负相关持平,说明用户的好恶参半。
(五)多社交媒体平台的属性差异
汇总五个平台所有样本(9 565个),以Youtube平台样本数为基准,对其他平台样本数进行加权(Facebook乘以2,Twitter,TikTok,Instagram乘以6),得到数据分析面板,然后将议题、情感极性和情感强度,以及是否重复发帖作为回归分析中的主要考察变量,将不同的二级编码逐次设为因变量,在多次进行岭回归分析后发现:在平台总体特征上,TikTok呈现出偏离其他平台主要议题及较高正向情感的特征,并且存在最明显的重复发帖现象,符合TikTok作为短视频平台以轻松娱乐信息为主、侧重商业利益和传播效率高的特点;Instagram呈现了较高的正向情感和情感强度,相比政治更关注新冠肺炎疫情、经济和文化议题,在呈现社会文化议程时向公众传达了正向情感,也兼顾了政治、新冠肺炎疫情舆论的导向作用,但是议题消极对抗的程度远不如Twitter明显;Facebook的正向情感和情感强度仅次于Instagram,主要关注领土、军事以及台湾议题,在中国新冠肺炎疫情话题上表现出高关注性和对抗性,表现出较强的舆论引导能力和更强的政治价值利益导向;YouTube的主题呈现两面性,一方面体现了最显著的文化传播特征,一方面又呈现出不依附于军事、领土等纯粹政治议程的特点,与之相应的是最低的情感强度和负面情感倾向;Twitter具有最明显的关注政治、经济、新冠疫情议题的特征,与美国关系密切,情感倾向消极,在中国议题中扮演了政治讨论和社会批判的消极角色,体现出显著的来自政府的消极舆论导向。(2)限于篇幅,具体分析结果可与作者联系获得。
四、结论与讨论
本文以国际著名社交媒体Facebook,Twitter,YouTube,Instagram,TikTok为平台,收集中国议题数据,从议程浮现特征、意见领袖与过滤机制、意见挖掘与情感分析、机器账号与平台差异五个角度分析并呈现了国际公众视角下的中国形象特征。总体来看:(1)议程浮现机制上,不同平台基于自身可供性能力表现出明显差异。YouTube和TikTok的视频社交网站属性导致议题异质性程度高,严肃议题讨论较少;Instagram议题聚焦以热点为中心,呈现多元化趋势;Twitter和Facebook上政治类议题集中,Twitter尤为明显。(2)议程意见聚焦特征上,各平台普遍表现出海外网民对中国境内新冠肺炎疫情的讨论度低于预期,他们更关注与中国相关的国际政治问题。整体上,政治议题仍然是海外社交媒体上中国议程浮现及议题影响发散的中心点。(3)意见领袖与过滤机制方面,不同平台个人-机构账号的分布及发声存在差异。针对中国议题,TikTok上多为个人账号,且大多带有鲜明政治立场;YouTube上主流媒体占据“数量”优势,自媒体占据“流量”优势;在Facebook上,美国前总统特朗普对中国议题拥有显著的个人影响力;Instagram上新闻媒体机构互动强度最显著,表现出权威媒体的强劲影响力。从国际比较视野来看,英语国家和地区在塑造中国形象时仍占据最大话语权。(4)机器账号渗入度上,Twitter上的社交机器人主要对政治、经济领域进行渗透,所涉议题占比高达65%,对大众的政治信息接收和政治事件判断发挥出了强引导作用,但在文化、社会议题上参与度低。(5)意见挖掘与情感分析方面,五大社交媒体平台普遍对新冠议题的讨论与情感相关性较小且强度弱,态度相对中立,负面倾向集中在对中国各类社会议题的讨论中。文化议题在各平台上获得高讨论度和最高正向评价比率,在文化取向型平台(TikTok,Instagram)中最为明显。
本研究的主要缺陷为:数据方面,由于多平台特点及结构不同导致采集数据结构不完全对等,在分析过程中易产生偏差,影响结果的精度;技术方面,平台墙、平台反爬虫、反监测设置加大了对社交机器人探测的难度,因此,在机器账号方面的研究仅针对具有自平台探测设置的Twitter,未实现跨平台对比分析;内容方面,研究结论有待进一步细化和深化。
(致谢:田嘉齐、迪娜·赛力克 、陈天行共同参与了本研究的调查和论文写作工作)