APP下载

基于B站视频评论的内地和香港青年网络互动与国家认同

2022-07-25朱秀凌游赵晗

关键词:乱港词频共同体

朱秀凌,游赵晗

(1.广东外语外贸大学 新闻与传播学院,广东 广州 510006;2.河南科技大学 管理学院,河南 洛阳 471000)

当今社会,青年们开始在网络空间占据主场,社交媒体为他们进行话题讨论提供了新的空间和场域,媒介技术赋予了他们自我诉求表达与情感宣泄的话语权。即时、互动的在线讨论,共时性地留存评论,营造出虚拟“在场”情境,极易唤起情感共鸣,强化“共同在场”的情感想象,建构起跨越面对面形式的“想象共同体”,国族构建的方式随之发生了巨大变化。那么,作为香港和内地联结重要桥梁纽带的内地青年,在他们眼中,香港青年是什么样的?他们对香港青年持有何种情感态度?他们如何在社交媒体进行家国情怀的情感叙事?由于他们在社交媒体的情绪表达与意见倾向,直接影响着香港青年对于内地的态度看法,乃至国家认同构建,影响香港和内地关系的未来,决定着两地深度融合大潮的奔流方向,理应引起充分重视。但令人遗憾的是,已有研究大多聚焦香港传统媒体[1]和社交媒体[2]的内地形象建构;内地传统媒体的香港形象呈现,[3]鲜有关注内地社交平台上年轻一代对于香港的印象看法,忽略了内地青年的情感倾向对于香港青年国家认同建构的影响。

一、研究缘起、文献回顾与研究设计

(一)研究缘起

法国政治学者多米尼克·莫伊西指出:“在全球化时代,如果想理解我们所生存世界的错综复杂,情感因素不可缺乏。”[4]情感是社会“黏合剂”,是一种重要的社会驱动力;它作为一种群体共同性所在,能够促使群体成员产生共同的关注焦点和共同的情感情绪,[5]进而引发情感共鸣,促使群体成员团结起来,形成一种群体社会力量,推动其成员做出某种行动。我们利用网络情感信息,可以预测社会舆情涨落,揭示情绪氛围与社会系统之间关系。[6]

因此,本研究聚焦青年在bilibili(以下简称B站,内地最大的年轻世代聚集的文化社区和视频平台,也是香港青年登录最多的内地社交媒体平台,是他们了解内地的窗口)话语空间里,如何依托“香港青年”视频评论(与弹幕相比,评论文本大多在观看视频之后发生,表达的是对整个事件的看法,因此内容更趋于理性,信息价值大且完整、丰富,更能准确反映用户的真实态度和想法,而非一时冲动)进行互动,唤起情感共同体之想象,进行群体间的情感分享,形成情绪感染和情感共振,从而形塑国族身份,增强国家认同感,试图回答以下问题:1.内地青年对香港青年的印象如何,是倾向于积极还是消极?2.评论文本表达了他们的何种情绪、情感?这些情感是如何在评论文本中被表达的?3.有关国家认同的情感话语和叙事是如何建构?隐喻了何种情感意识形态?对于上述问题的回答,能够高效地挖掘当代青年对于香港问题的情感倾向性,了解他们的态度和看法,对于网络舆情预警和舆论引导,消融内地与香港之间的认知偏差,促进内地青年与香港青年的良性互动,亦具有重要的理论价值和现实意义。

(二)文献回顾

本研究以情感共同体为理论基础,以B站视频评论文本为例,应用NLP情感分析技术探讨内地与香港青年的网络互动与国家认同问题。

1.情感共同体研究

情感已经成为诸多学科研究的焦点问题。自20世纪70年代“情感社会学”发生转向之后,“情感共同体”概念日益凸显。“情感共同体”指的是信奉共同的情感表达规范,且重视或者贬低共同的或者相近的情感情绪的群体。[7]它是人们在共同情感需求基础之上,在群体中建构符合情感需求,满足情感期待、深层供给的良好互动关系,能够激发个体做出合乎预期的言语与行为。

目前情感共同体研究还处于起步阶段,已有研究主要聚焦:小说中情感在共同体构建与分解过程中的凝聚与分裂作用[8];中国留学生报道中情感共同体的媒介构建[9];师生、学生之间情感共同体的构建[10];粉丝社群情感共同体何以可能[11];香港“修例风波”中情感共同体与协同行动的关联[12],而鲜有关注B站内地青年的情感共同体构建。

2.NLP情感分析研究

情感分析(sentiment analysis),又称倾向性分析、观点(意见)挖掘等,是自然语言处理(natural language processing,NLP)的一个最活跃研究领域,指的是对隐含情感色彩的文本进行情感计算,以便更好地进行观点挖掘、情绪识别和态度分析等,进而判别了解某一主体对特定议题的情感倾向,分析其意图和行为趋势。[13]

情感分析研究最早可追溯到20世纪 70 年代末到 80 年代初,到了 21 世纪初,学者才开始关注文本隐含的情绪、情感,情感分析研究逐渐增多。情感分析按文本粒度划分,分为词语、短语、句子、篇章、多篇章级等研究层级。[14]从研究过程来讲,涵盖数据爬取、数据预处理、情感语料库和词库构建、情感分析等流程。[15]就技术逻辑而言,主要包括词典规则法、机器学习法和深度学习法三种算法。[16]与国外日臻成熟的研究相比,国内情感分析研究尚处于起步阶段,主要聚焦网络舆情信息[17]、电影评论[18]、新闻报道[19]、微博文本[20]等文本信息的情感分析,鲜有聚焦视频评论文本的情感分析。

(三)研究设计

本研究以B站发布的“香港青年”相关视频的评论文本作为研究对象,探究内地青年眼中香港青年的情感特质与话语表征。这是因为根据2021年第三季度财务报告显示,B站月均活跃用户为2.67亿,日均活跃用户7200万,日均使用时长高达88分钟;其中30岁以下用户占比为53%。[21]由此可见,B站在90后、00后青年群体中具有相当大的影响力(包括香港青年)。

具体研究方法为,首先在 B 站平台上以“香港青年”为关键词搜索相关视频,按播放量进行排序,选择播放量最多的10 0个视频;其次,运用Python爬取这100个视频下方的评论文本,共采集出72261条评论文本。再次,在正式分析之前,对视频评论文本进行数据清洗、分词、去停用词(参考中文停用词库、哈工大停用词表、四川大学停用词表、百度停用词表)等数据预处理工作;表情符号也转换为文本再进行情感得分计算。最后,本研究采用“关键词分析”和“词频统计”两种方式。采用文本特征项加权算法——TF-IDF(term frequency-inverse document frequency,词频-逆文本概率)抽取、计算出特征词的权重(目前最常用的一种用于提取主题词的词频加权算法),其中词频是指关键词在语料库中出现的频次,逆文本概率是关键词在多条评论中的共现情况,基于两项指标算法来匹配每个关键词的权重并进行排序,从而判断该词是否为关键词。[22]为直观呈现出焦点和主题,通过图像处理库PIL、图像展示库、pyplot绘制词云图实现可视化呈现,形成了如图1所示的排序前100名高频词的词云图。

图 1 评论文本高频词的词云分析

二、研究内容

本研究从情感共同体理论出发,通过对B站上72261条“香港青年”视频评论文本的内容分析,运用了NLP情感分析方法,分析了青年们国家认同之情感共同体的建立,结果显示:

(一)情感特征:对香港青年关切中彰显国家情怀

在B站视频评论话语中,内地青年在对“香港青年”殷殷的关切中,凸显“国家”核心主体地位;具体表述为:“香港”(词频6886)、“中国”(词频5778)、“国家”(词频2074) 、“祖国”(词频950) 等;面向国家主体表达了“热爱”(如“爱国”,词频930;“爱”,词频1220);面向爱国、有为香港青年表达了“喜欢”(“支持”,词频1757;“喜欢”,词频1103);同时还描述了对破坏“一个中国”乱港青年的谴责、愤怒之情 (如“废青”,词频2177;“垃圾”,词频 861;“暴徒”,词频553)。

由此可以看出,内地青年对“香港青年”视频的评论话语表达聚焦于宏观话题,主要围绕着国家主体进行情感表达,积极表达具有国家情怀的情感体验;与此同时,聚焦日常生活视角,叙说着香港青年个体经历与祖国的情感联结。

(二)情感类型:积极情感为主,消极情感次之

本研究运用python 中专门为中文文本设计的SnowNLP情感分析系统,利用朴素贝叶斯(Nave Bayes)模型(见图2)[23]41-46,对B站上100个“香港青年”视频评论文本进行情感得分计算(得分越接近0,表示情感越消极;越接近1,表示情感越积极),以期系统化分析内地青年对于“香港青年”视频评论文本的总体情感倾向,挖掘评论文本背后所包含的情感特征和隐藏的社会情绪。

图2 朴素贝叶斯模型

按照情感得分将所有的评论文本分为三类,0-0.40区间为消极情感,0.40-0.60区间分为中立情感,0.60-1为积极情感[24];统计结果显示,72261条评论数据中,积极情感的评论条,占比(51.66%)最高,消极情感评论条,(32.22%)次之,中立情感的评论条,(16.11%)最少。

从中可以看出,青年们在评论互动过程中,情感色彩鲜明,积极情感占据主导地位(51.66%),对爱国、有为香港青年生发出赞扬、支持、喜欢和感动,抒发对国族(同胞)认同和祖国的爱和自豪感等。但也会表露出某些消极情感状态,如因乱港青年行为而产生不满、愤怒、质疑或谴责情绪。

(三)情感主题:七个核心话题

为了进一步探究评论文本背后隐藏的话语结构,本研究对评论文本进行主题模型(Topic Model)的聚类分析。作为一种基于机器学习的文本内容分析技术,主题模型是一种使用概率数学模型来挖掘文本主题的方法。它能够高效地挖掘出大量文本中所包含的主题分布信息,呈现用户在线观点。主题模型的典型代表——潜在狄利克雷分布(LDA,Latent Dirichlet Allocation)是一种三层(词、主题、文档)贝叶斯概率模型,是近年广泛认可的一种成熟提取潜在主题的建模方法。[25]

因此,本研究在理解评论话语情感特质的基础上,基于语料库中的词对集合来关联B站视频评论文本背后的话题,运用LDA主题模型,以机器聚类的方法实现对海量数据中隐藏话题的区分、提取,挖掘词对、文本与话题之间的隐含关系,提炼文本的隐藏语义特征。LDA模型析出结果显示,“香港青年”视频评论文本主要集中于7个核心话题(topic),根据这7个主题的情感和对应评论,分别命名得到如下主题。

表1 评论文本 LDA话题模型建构

1.对爱国、有为港青的赞扬、支持、喜欢和感动

面对(1)爱国、有为港青驳斥乱港青年行为:视频“酣畅淋漓!香港青年怒斥:‘井底之蛙说的就是你们这批人!’”、“香港爱国青年与‘港独’媒体论辩评论区一边倒青年人如何独立思考”;“香港青年自发清洁暴徒涂鸦,警察:多谢你们”;(2)香港青年演唱爱国歌曲、升国旗等爱国举动:视频“【礼赞70年】在香港街头起舞《我和我的祖国》”、“香港青少年宣读五四宣言!港青:升国旗是人生美好体验”;(3)香港青年在内地的学习、生活、参加抗疫经历:视频“香港女生来内地学习:作为中国人有必要了解自己的国家”、“港生北上内地学医加入抗疫第一线:这段经历我一辈子自豪!”、“香港青年西藏旅游17天一个人坐55小时火车香港→拉萨挑战自我一次说走就走的旅行”,青年们在视频评论区用“支持”(1757次)、“喜欢”(1103次)“点赞”(595次)、“赞”(402次)、“感动”(229次)等词汇表达着他们的赞扬、支持、喜欢和感动。“香港小哥轮番怒斥黑衣人:你们不搞事就不会死人!”视频,描绘了港铁上香港社会小哥对“乱港”青年的教育,收获了青年232.1万播放量和4168条评论。视频“全程高能!香港青年条理清晰舌战‘港独’怼得其语无伦次当场开溜”,得到了青年们218.2万点击量和2007条评论。“哭了!这才是香港国际机场、香港青年该有的样子”视频,描述了香港青少年管弦乐团在香港机场的快闪演出,《踏雪寻梅》《男儿当自强》《狮子山下》《东方之珠》等中国经典歌曲回荡在香港机场,使许多现场中国观众热泪盈眶,引发了评论区青年们强烈的情感共鸣,点燃了他们共同的爱国情怀,获得了307万点击量和6017条评论。这些积极事件所产生的积极情感话语动员,不仅激励着青年们去体验这种情感,而且促进了群体成员的团结一致。

2.对香港国族同胞的认同和对祖国的爱

与国家有关的词汇高频出现:“中国”(5778次)、“爱”(1220次)、“祖国”(950次)、“爱国”(930次)、“加油”(844次),形成了一种强烈的情感暗示,民族国家是一种情感主体和血缘纽带。从对爱国、有为港青的赞赏上升到对国族同胞认同和对国家的热爱之情,青年们的爱国情感得以升华,民族自豪感得以构建。他们以国家为荣耀,因中国人的身份而感到自豪。青年们这种对祖国的大“爱”,在对香港青年的互动评论中,勾连起他们的爱国主义记忆和行动,在想象和现实的双重隐喻印证之中,因经验的真实性和想象的情感相似性,将对祖国之爱的记忆、现实与想象关联,形成了庞大的情感蕴涵网络。

3.对乱港青年行为的谴责、厌恶

情感具有道德力,规范着个体行为,有助于集体道德感的形成,也在凝聚和重塑群体认同方面发挥着积极作用。青年们的视频评论文本中,用“废青”(2177次)、“垃圾”(861次)、“暴徒”(553次)、“骂”(694次)、“抠鼻”(547次)、“恶心”(424次)、“谴责”(417次)等包含“否定”意味的词语,表达了对乱港青年行为的谴责、厌恶情绪。这种对于内部破坏性“他者”的嫌恶、排斥情感,不断划清“我者”和“他者”的边界,塑造青年的情感包容边界,营造青年群体的国家认同氛围,推动着情感共同体的构建。值得一提的是,这种边界是泾渭分明的,在视频“别给所有香港青年打上废青标签!”的评论区,面对香港青年的担心忧虑,内地青年理智地回复了他们所厌恶、谴责的对象并不是所有的香港青年。

4.对乱港青年行为的气愤

视频评论文本中青年的愤怒源于令人义愤填膺的事件,如“多人在香港地铁挡车门”、“港独在日本造谣抹黑港警”、“香港极端示威者在法院外暴力袭击警车”、“没人性!香港国际机场多人围攻老人!”等。通过对于内部破坏性“他者”感同身受的愤怒,青年们在评论区宣泄着他们的满腔义愤,因此“生气”(604次)、“怒”(134次)“愤怒”(90次)等表达愤怒情绪的词汇反复出现。这种对于罪恶“他者”的愤怒情绪,拓展了情感的道德力,强化了内地青年和香港青年的群体认同感,使他们团结一致,直面恐惧,思考对策。

5.对乱港青年行为感到可怕

“可怕”(561次)等涉及该情感的词汇在视频评论文本中出现较为频繁,说明了青年们对乱港青年行为感到害怕,产生了一定的焦虑感。这种恐惧感反而表明了青年们与国家命运息息相关的国家情怀。

6.对乱港青年行为的无语、难过与反思

视频评论文本中“大哭”(516次)、“捂脸”(371次)、“思考”(181次)、“难受”(102次)、“难过”(45次)、“无语”(31次)等话语,表达了青年们对乱港青年行为的无语、难过,暗含着无力和心酸;他们通过香港的相关事件,开始反省和深思香港问题症结所在。

7.对乱港青年行为的震惊

诸如“惊讶”(55次)、“震惊”(20次)、“吃惊”(18次)等词汇在视频评论文本中的出现频率,虽远远不及“好”“乐”“恶”情绪的词汇多,但是传递了青年们对于乱港青年行为义愤填膺中的震惊。

三、结论与讨论

本研究聚焦青年们在B站话语空间里依托“香港青年”视频评论进行互动,建立情感共同体,进行群际间的情感分享,形成情绪感染和情感共振,从而形塑国族身份,增强国家认同感,结论如下:

(一)爱国、有为的港青同胞:内地青年对香港青年的情感偏向于积极

与传统媒体相比,社交媒体更易以丰富而强烈的情绪表达影响年轻用户的认知判断,进而影响其刻板印象。本研究发现,在B站上,虽然内地青年对香港青年的情感类型包含积极、消极、中立性情感,褒贬不一,但是积极情感占比更高,达到51.66%;消极情感评论(32.22%)次之,中立情感的评论占比16.11%。这说明内地青年对香港青年的情感倾向偏向于积极,在他们眼中香港青年的形象比较正面。前100个高频词中,“支持”(1757次)、“爱”(1220次)、“喜欢”(1103次)、“点赞”(595次)等,表达了青年对爱国、有为香港青年的喜欢、支持和对于国族同胞的强烈认可。

(二)七个核心话题:型塑青年们情感共同体,建构国家认同

本研究发现,青年们对B站“香港青年”视频评论文本,主要可分为七个情感核心主题,型塑着青年们情感共同体之想象,建构起国家认同。

情感共同体是基于集体共同情感,在互动交流中得以构建的关系网络。情感的交流互动是建构情感共同体的关键。而社交媒体的互动性易引发情感共鸣,“缺场的在场”特性使用户想象着社会存在方式,寻找所归属群体,表达出对特定群体的认同;民族主义所蕴含的深沉情感,对家园的持久依恋和文化认同感,是“想象共同体”形成的条件。[26]

B站上的“香港青年”视频评论,蕴含情感意识形态,通过共同话题的赞好、响应、分享、互动,创造了想象的时空,建立起彼此之间的情感信任,形成了“想象的情感共同体”。作为话语的评论文本,传达着青年们复杂有层次的情感,形成了多种情感相互交织的蕴涵网络,建构起国家认同的基础。因为认同最初就充满情感的力量,身份认同就是通过情感认知和认同来实现的。情感表达之中的认同不是意志和行为的产物,而是想象与情感的结果。[27]随着想象的真实化,情感认同的逐渐加强,身份认同也逐渐建构起来,情感共同体随之形成。

在B站的评论互动过程中,对爱国、有为香港青年喜爱之情,对香港同胞的认同感和祖国的热爱之情占据主导地位,型塑了青年们对于国家“情感共同体”的认知,极大激发了他们的民族自豪感和自信心。这种情感上协调一致的情感动员,将个体有机地整合到国族集体中来,产生了强烈的情感共鸣和共振,推动着国家认同的不断强化。即使是消极情绪,仍在国家认同情感建构中扮演重要的角色,起到凝聚着国家认同感的作用。在乱港青年暴力袭警、造谣抹黑港警、地铁挡门、袭击老人等事件的B站视频评论中,青年们通过对抗式和否定式话语,隐喻道德和价值判断,表达了厌恶感受,强化“我者”和“他者”区隔,划定国家认同的情感边界;愤怒感会振奋集体情感,产生抗争的行为,更能让青年们同仇敌忾,团结一致,理性维护国家民族利益,强化国家认同感;恐惧情绪使青年们维护“一个中国”意望变强,群体团结得到巩固;震惊情绪表达了青年们对乱港青年行为的震惊,刺痛了他们的爱国之心,激发起国家认同感;此外,哀伤情绪有助于唤起青年们的责任感,和祖国一起反思香港存在的问题,思考应对之策,意识到自己是中华民族一分子,进而激发起其爱国行为,意识到自己在“一国两制”实施过程中的社会责任。正是在这七种情感的社会聚合力下,青年们情感共同体得以构建。

简而言之,青年们在对香港青年视频评论的文本中,形成了以家国情怀等积极情感为主,消极情感为辅助的情感蕴涵网络,体现了以国家为主体的行动网络;这种情感凝聚起内地和香港两地青年,区隔了“自我”和“他者”边界,强化了祖国的中心地位,建构起青年们对祖国的国家认同感;青年在网络空间互动评论之中,凝缩时空,型塑集体记忆;评论文本所传递的话语权力和情感成为一种行动,推动着成员从事维护民族团结的集体行动;在评论的字里行间,通过对香港青年情感和行动的褒贬,在国家立场上想象了一种“情感公民”,构建了情感共同体之想象。

(三)情绪疏导:合理引导内地青年的社会情绪,促进香港和内地青年的良性互动

社交媒体平台的情感信息能够直观呈现舆情民意,是年轻一代的意见倾向和情感情绪的“风向标”。因此,透过社交媒体情感信息,我们可以了解青年们的情感诉求和话语表达,了解他们关注香港问题的关注点,提前洞悉他们社会行动力的诉求,从而为政府决策实施和舆论引导提供把脉参考。

青年们对“香港青年”视频评论的积极情绪主要是对爱国、有为港青的赞扬、支持、喜欢和感动,国族同胞认同和对祖国的爱;这些积极情绪能够发挥积极作用,拉近彼此的心理距离,促进两地青年心灵、情感的碰撞,产生同属一个中国的强烈心理共鸣,构建群体归属感,进而增强其国家认同感;对于消极情感,虽占比不高,也要做到利用与疏导双管齐下。因为已有研究发现,情感作为中介变量,会唤醒人们的觉醒意识和行为;情感的道德力量,还有助于形成集体道德感,在凝聚群体认同方面具有积极影响。[28]内地青年对乱港青年所表达的消极情感,可以激发他们爱国热情,加大对乱港青年的同仇敌忾,凝聚国家认同感。当然,社会负向情绪也有负面作用,容易引发社会情绪危机,使对香港和内地青年之间的误解激化升级。如“废青”(2177次)、“垃圾”(861次)、“港独”(665次)等负面情绪词汇在评论文本中的高频出现,容易形成内地与香港青年之间的群际偏见,加剧情感疏离,乃至造成对立情绪。因此,有针对性地内地青年进行情绪疏导和舆论引导,引导内地青年客观地看待香港问题,理性地表达爱国爱港的意见观点,防止由于情感宣泄引发的负面情绪恶化和极端化,能够有效地引导舆情,优化政府决策,促进香港和内地青年的良性互动。

综上所述,本研究从NLP情感分析视角,通过对B站上72261条评论文本的内容分析和文本分析,研究了内地青年眼中香港青年的情感特质与话语表征,分析了青年们国家认同之“情感共同体”想象。这对于探究内地青年的情感倾向对于香港青年国家认同建构的影响,拓宽香港青年国家认同的研究视野,具有重要理论价值和现实意义。

猜你喜欢

乱港词频共同体
《觉醒》与《大地》中的共同体观照
本期导读
爱的共同体
本期导读
构建和谐共同体 齐抓共管成合力
论《飞越大西洋》中的共同体书写
叶刘淑仪遭“乱港”分子谩骂泼水
词汇习得中的词频效应研究
汉语阅读中词频与注视时间、跳读的关系
词频,一部隐秘的历史