网络舆情对新冠疫情下青少年情感态度的分析
2023-03-11周春梅张华辉
周春梅,冯 林,张华辉
(1. 四川工商学院,四川 成都 611745;2. 四川师范大学,四川 成都 610110)
1 引言
2020年初的一场新型冠状病毒以人传人的方式在全球迅速蔓延。中国政府迅速作出响应,要求群众居家隔离,不参加任何聚集性活动,百姓每天通过各大媒体关注新冠疫情的发展动向。根据官方数据报道,疫情期间,微博平台每天超2亿网友关注最新疫情,阅读量到达7454亿,日均发博同期增长了50%[1]。
青少年群体作为新浪微博主体受众者,在居家隔离期间,深受网络舆情影响,特别是突发性、随机性、待验证性的事件短期内成为热搜,在无法认知的情况下,给青少年群体带来严重的心理负担。数据显示2020年00后搜索“抑郁症治疗”相关内容的热度同比去年上涨59%[2]。青少年抑郁情绪越高,自我污名感会越高,求助意愿越低[3],导致消极情绪引发心理问题和精神障碍疾病升高。同时有数据显示,青少年因心理行为问题和精神障碍引发的刑事或民事案件呈上升状态,2020年青少年罪犯为281860人,比上年增加38585人[4]。为了降低青少年群体的犯罪、自杀、抑郁等现象出现,进一步关注疫情期间青少年的情感状态,对其网络言论进行情感分析,有助于社会各界对青少年关注焦点进行了解以及对青少年心理问题采取积极疏导和预防措施。
2 相关研究回顾
研究发现,突发公共卫生事件对大众的心理造成极大的不良影响。樊富珉提出传染病流行会引起社会上出现心理压力和恐慌情绪[5]。郭鹏飞等人在2020年2月13日到19日以问卷的形式对青少年儿童进行焦虑情绪调查,疫情的传播途径、负面消息以及不实信息对焦虑症状产生较大的影响[6]。曾竞通过对青少年的访谈,了解到新冠疫情引发了青少年群体心理的差异性变化,表现出恐慌下的过渡反应、盲目趋同行为、躲避心态下封闭歧视行为以及放弃奋斗散漫心态[7]。王宁霞采用焦虑障碍量表、应激感受量表、建议应对方式量表对410名高中生进行问卷调查,指出新冠肺炎对未经世事的青少年群体带来了很大的心理压力,410名高中生表现出了各种不同的应激行为[8]。
综上所述,关于青少年心理问题的研究主要通过问卷调查或访谈的方式进行,受试者人数有限,只是青少年群体中的极小一部分或某一区域的青少年,不具有较强的代表性,同时受试青少年在访谈或调查期间有可能因抵触或害羞不能真实的表达情感现状和心理需求,从而导致研究分析的片面性和不真实性。如果对青少年网络匿名评论进行数据分析,避免了面对面的尴尬和害羞,可以分析出该群体的真实心理诉求和情绪发泄内容。本文基于计算机技术、人工智能技术,采用文本分析方法对微博平台评论进行情感分析,挖掘青少年疫情期间的关注焦点和情感态度,为后续心理问题预防、干预措施提供参考。
3 研究思路和研究方法
本研究以抓取青少年微博评论为研究样本,研究框架分为三个部分,数据采集层、数据处理层、数据分析层,如图1。
数据采集层构建爬虫平台,使用微博手机版网页,微博提供接口地址和API地址,采用python中的基于urllib的开源协议库requests请求访问,爬取新冠疫情以来,主流媒体例如“人民日报”、“央视新闻”等发布新冠疫情新闻,特别是国内部分地区出现了本土病例后,青少年群体对该事件的评论作为数据集,返回标准json数据进行保存。
图1 研究思路框图
数据处理层利用python中的jiaba包进行分词,引入去停用词库去除停用词,采用TF-IDF算法对新冠疫情的评论进行词频统计和权重计算,降低情感词向量空间维度,简化青少年对此事件的态度的情感词汇分析。
数据分析层将提取关键词运用Wordcloud库生成可视化云图,运用LDA模型聚类情感主题词,最后利用SnowNLP进行情感分类并产生情感饼图。
TF-IDF由Salton等提出,中心思想是“如果某一个词以较高的频率出现在一篇文章中,且在其它文章中出现的频率较低,则说明这个词对前者核心内容作用较大,权重较高”[9]。该算法主要由TF (Term Frequency)和 IDF (Inverse Document Frequency)两部分的乘积构成,TF-IDF的计算方法如式(1)。
(1)
其中,ni,j表示词i在文档j中出现的次数,∑knk,j表示文档j中所有词出现次数的总和,N为语料库中文档总数,di表示语料库中包含词i的文档数,加1操作是防止分母为零的情况。TFi,j是词i在文档j中的词频归一化后的结果,IDFi是词i对于文档j区分能力的度量,它同时也是对TFi,j权值的调整,抑制在所有文档中普遍频率较高的词,如“的”、“和”等。
词频统计后,利用SnowNLP进行情感分析,引入自定义的“积极”、“消极”的情感主题词词袋,训练青少年对该事件的情感程度判断其是否是积极、消极或中性。
利用LDA(Latent Dirichlet Allocation)模型对分词后的关键词进行主题聚类,挖掘语义关系,采用困惑度低的概率模型分布预测青少年评论主题并进行分析。
信息论中的困惑度(perplexity)用来评判一个概率模型或概率预测样本的好坏程度。低困惑度的概率模型分布能更好地预测样本[10]。计算公式为:
(2)
p(ω)=∑p(z│d)*p(w|z)
(3)
其中,p(ω)是指测试集中出现的每一个词的概率;N表示测试集中出现的所有词,即测试集的总长度,不排重;z表示训练过的主题;d表示测试集中的各篇文档。
LDA模型的主要思想是将每篇文章看作所有主题的一个混合概率分布,而将其中的每个主题看作在单词上的一个概率分布。在一篇文档中的第i个单词的概率可以表示为:
(4)
在LDA模型中,参数z代表主题,参数ω代表单词,式(4)中p(zi=j)表示的是从文档中取出一个单词属于主题j的概率,而p(ωi|zi=j)代表的是当取出单词属于主题j时该单词为i的概率[11]。
4 结果与讨论
4.1 实验环境
本实验采用python语言,Inter CoreI5-9400F CPU
2.9Ghz,内存8G,操作系统为win10环境下进行实验。选取新浪微博评论为数据来源,分别爬取2020年1月-2020年3月(下文描述为疫情前期)和2021年1月10日-2021年2月28日(下文描述为疫情中期)“人民日报”、“央视新闻”等官方微博下的评论,重点选取逆行者医护人员、全国各省份确诊新冠病例报道、职能部门为民服务等三个主题事件。根据研究需求,筛选15-29岁青少年网友的评论做数据集,疫情前期数据共18731条评论,疫情中期数据为23145条评论。
4.2 实验和结果分析
4.2.1 语义特征分析
网络评论的关键词可作为青少年对该新闻核心内容的浓缩提炼,能够反映出青少年的情感态度。经过对2020年1-3月和2021年1-2月关于青少年疫情评论数据爬取,分别对评论进行分词处理,分词后共116486个和143942个词汇,分词效果如表1。
表1 用户评论分词预处理效果
导入包含7227个词语的停用词表,采用TextRank算法对数据集进行关键词提取,经过词频统计选择排序前20的词语,详见表2。
表2 词频统计结果排序前20个高频词汇
表2词频统计结果表明,2020年疫情初期,青少年关注最多是“武汉”,出现了10216次,紧随其后的是“加油”出现8825次,“病毒”出现4957次,“疫情”出现3259次,“蝙蝠”出现3029次“中国”、“问题”、“标准”也以较高的频率出现,“野味”、“人类”、“物资”、“希望”词排列靠后。2021年疫情中期,“加油”出现的词频最高,达到16321次,其后的是“中国”、“希望”、“口罩”、“病毒”等词汇,出现频率在2000次以上,表现出青少年朋友的爱国情怀,带好口罩,远离病例,迎接希望,“医院”、“疫情”、“物资”等与疫情相关的词也以较高的频率出现,词云中还出现了“感谢”、“相信”、“国家”、“英雄”等词,反应了青少年对抗疫的决心与信心以及对最美逆行者的敬佩。
4.2.2 词频可视化呈现
利用Wordcloud生成可视化图形,分布选择2020年和2021年舆情词汇排列前25个词汇生成云图,云图中字体越大,表明词频越高。如图2和图3,图2为2020年疫情初期舆情词云,图3为2021年疫情中期舆情词云。
结合图2和图3返回评论查看可知,2020年在疫情初期青少年群体对“武汉”、“蝙蝠”、“病毒”、“疫情”等新闻感到恐慌、焦虑,同时部分为民服务部门工作人员的工作失误,起着舆情负性作用,青少年群体受舆情影响很大,产生较强的消极情感态度,2021年疫情中期更多是“加油”和“希望”以及对英雄的“感谢”。整个疫情期间,青少年群体中积极情感占主导地位。青少年在疫情两个阶段关注点有明显差异,但“加油”这一词汇在两个阶段的高频词中占据第一第二的位置,展示着青少年群体有一种积极向上乐观精神和浇不灭的民族态度在持续。“希望”词频从排序第十九上升到了第三,体现了青少年的心理资本有所提高;2021年青少年关注整个中国的抗疫精神和在党国领导下的团结一心;“口罩”、“病毒”仍旧以较高的频率出现在两年的高频词汇里,表明青少年群体对待病毒的仍旧担心、焦虑。
图2 2020年疫情初期舆情词云
图3 2021年疫情中期舆情词云
4.2.3 情感态度分析
云图能反应青少年疫情期间的关注焦点,但不能反应情感态度。根据2020年和2021年疫情期间主要事件不同情感倾向舆情数据分析,如表3所示,可以看出正面舆情的占比中,关于医护人员的事件占比最高,负面舆情占比中,职能部门初期探索未呈现良好结果情感度最高,总体而言,医护人员以最美逆行者的身份给青少年以最强的积极情感。
表3 2020-2021不同事件舆情情感倾向统计
情感态度能够有效的反应青少年心理状态,研究以知网的HowNet情感词表为基础引入疫情舆情分析的情感词汇,采用情感分析工具SnowNLP进一步将评论内容与情感分类词表进行情感匹配分词,情感分析结果是在【0,1】区间上的一个值,情感系数小于0.5的定为消极情感态度,大于0.5的定为积极情感态度,其余为中性态度。根据对网友2020年和2021年评论的情感分析,得到2020年和2021年疫情舆情情感饼图,饼图的占比越大,说明人数越多,如图4和图5。
图4 2020年疫情初期舆情情感饼图
图4显示在疫情初期,青少年持积极情感态度的人最多,占总人数的67.9%,其次是31.2%的青少年持消极态度,最少是情感中立的人群,这部分只占总评论人数的0.9%。图5疫情中期舆情情感饼图中,持积极情感态度的青少年上升到了77.9%,持消极情感态度的下降到19.5%,中性态度的占评论人数的2.6%。
图5 2021年疫情中期舆情情感饼图
在2020年疫情爆发初期,“武汉”成为疫情重灾区被封锁,大部分青少年的关注点在“人传人”、“无有效药”、“封城”、“就医难”等话题上,加上疫情防控初期的误判,防疫预案的不完整以及“红会”人员的工作失误等事件广泛传播,各种待证实的消息扑面而来,青少年这一特殊群体知、信、行的水平较差,容易被煽动、感化,消极情绪持续升高。随后在党中央的领导下,倡导“全国一盘棋”,各省份的医护工作者陆续驰援武汉,确诊标准落地,新冠确诊新增人数从每天1万多下降到几十等新闻事件带来了积极的情感响应。面对突发性事件,一半以上的青少年网友能够秉承积极向上的态度,相信党国,相信国人上下一心共度难关,同时对医护人员表示敬意,给疫区人民送出祝福与期盼,表现出积极的情感态度。少部分青少年群体对疫情持中性情感,可能这部分青少年对该事件持回避态度。
2021年,面对国内出现小范围的疫情爆发,关注点在“源头”、“严防死守”、“志愿者辛苦”等话题上,青少年群体经过2020年的突发事件心理应激建设和抗疫精神的渲染、抗疫知识的学习,大部分青少年网友表现出了面对疫情的信心和良好的心理素养,持乐观积极态度;也有一部分青少年网友害怕病毒从国外引入,经过变异后传播能力更大,影响范围更广,持悲观态度。持中立态度的青少年网友上升到了2.7%,可能该部分青少年对疫情新闻持麻木心态。
4.2.4 主题词演化分析
主题词反应了事件的发酵和受众群体关注焦点,通过主题词掌握青少年的关注话题,对维护社会和谐、培养良好的社会适应心理素养有重要意义,结合2020年和2021年疫情爆发不同阶段的评论进行困惑度计算,结果如图6所示,当主题数为4时,困惑度最低。
从困惑度的角度分析,聚类主题个数K=4时效果最佳,LDA聚类训练后,根据确定的最优主题数,选择每个聚类前十个主题词,如表4所示。
图6 困惑度计算结果
表4 LDA聚类团簇表
聚类簇1根据主题词的特征,围绕“疫情”、“春节”展开分析,带回评论发现青少年群体最多的评论是“回家过年”、“不一样的春节”、“响应领导政策”、“感谢国家,感谢领导”等,体现青少年传承着中国的传统价值观“集体主义”,舍小家为大家,同时也体现出青少年对孙武的“上下同欲者胜”的传统思想的认知。
聚类簇2的主题词中褒贬不一,积极词占主要成分,该主题围绕“英雄”、“抗疫”展开,评论中不少出现“向抗疫英雄致敬”、“中华民族是英雄民族”等评论,体现青少年群体中不少人怀揣着英雄梦。在世界公共卫生突发情况下,提倡顾炎武的“保天下者,皮肤之贱,与有责焉耳”的理念,党国提倡时势造英雄,百姓响应号召共同抗疫,不为自己的私利,饱含义无反顾的勇气,世人皆英雄。
聚类簇3的核心关键词“道歉”。该聚类把“隔离”人员需要“物资”,“志愿者”、“配送”不及时,“政府”、“人员”新闻发布会“道歉”体现出来,从侧面可以发现该部分评论者对此表现出愤怒、恐慌、焦虑等情绪。可以把该类归纳为“安全感缺失”。安全感作为青少年心理最基本的心理需求,缺失安全感会导致青少年形成负性认知以及情绪不稳定,严重出现强迫症、焦虑症等心理障碍。
聚类簇4围绕“加油”、“致敬”、“感动”展开分析,该类可以归纳为“乐观精神”,抗疫志愿者在一线辛苦,新闻媒体报道英雄的事迹,全国观众除了“致敬”还有“感动”,在各大平台送出祝福,相互加油,这也解释了“加油”、“致敬”等词在关键词中以高词频出现的原因。青少年的每一份“加油”,体现了他们秉承着中华民族打不倒的乐观精神,每一份“致敬”,体现了他们对英雄的敬意以及对生命的敬畏。
5 结论与建议
5.1 结论
1)整个疫情期间,青少年群体面对突发事件产生出不同的应激心理和情绪,有的愤怒、焦虑、恐慌、抑郁,表现出消极状态,大部分青少年拥有感动、信任、感谢、致敬的积极情感。
2)2021年面对疫情持积极态度的青少年比2020年持积极态度青少年上升了10%,持消极态度的青少年下降了11.7%。
3)英雄事迹给青少年以正面情感最高,主要体现在对医务工作者、志愿者、一线的英雄的致敬,服务部门工作失误给人以负面情绪最高。
4)疫情中期,大部分青少年保持乐观积极的情感态度,能够有较好的心理资本应对突发事件,但是近五分之一的青少年持消极情感态度,表现出悲观、愤怒、无助、无望的情绪,这一部分青少年的心理健康和情绪状态值得关注,同时还有2.6%持的中性态度的青少年,有可能这部分群体有回避或情感麻木症状,只是短暂的缓解疫情对心理冲击,对该部分青少年的心理健康也要持续关注。
5.2 建议
1)助力舆情监测过渡到情绪监测
社会情绪对青少年的集体行为影响极大。舆情内容发酵到一定程度演变成社会情绪,社会情绪支配着社会群体行动,美国学者sademan提出,社会危害与群众愤怒演变成社会风险。加强舆情检测,利用人工智能、数据挖掘技术对青少年群体进行情绪、情感挖掘,追踪青少年情绪变化趋势,避免青少年群体负面情绪群体化现象,助推负面舆情的传播。
2)加强科学认知,强化危机意识
认知-情境理论与情绪安全感理论具有互补性。社会情境的威胁影响着青少年情绪,当威胁性越高,青少年的消极情绪越高,加强青少年科学的认知,减弱威胁对青少年负面情绪的影响,避免青少年的报复和失调行为。同时强化青少年危机意识,注入志存高远理想信念和砥砺前行的奋斗精神,铸就正确的价值观,提升青少年群体面对风险和威胁的心理素养和行为能力。
3)重视舆情疏导,优化舆情传播环境
官方媒体重视意见领袖的话语权,拥有丰富的信息资源,加强真实正面信息的报道,减少不实信息报道与发酵,以正能量积极引导青少年群体,对不良的社会心态进行疏导,对非官方媒体,进一步加强媒介素养的提升,打造积极的舆情传播环境,减少小范围负面舆情群体化现象。