基于数据挖掘的高校网络舆情热点话题分析及引导策略研究
2023-04-29赵好好
赵好好
摘要:在网络时代,社交媒介平台已成为高校学生获得信息、沟通交流、表达情感的主要载体,同时也为高校网络舆情管理带来了新的挑战。在分析高校网络舆情热点话题特征基础上,采用数据挖掘技术,以河南工业贸易职业学院百度贴吧网帖文本内容为例开展高校网络舆情热点话题发现并进行情感分析,从而提出高效、科学和更具针对性的舆情引导策略。这对高校舆情管理和引导具有一定的实用价值和探索意义,有助于构建安全稳定、和谐积极的高校舆论环境。
关键词:数据挖掘;高校网络舆情;热点话题分析;引导策略
一、前言
据统计,截止到2021年底,我国网民规模已达10.32亿,如此庞大的网民规模,势必给网络舆情管理带来巨大挑战,尤其是高校网络舆情占比影响力居高不下,网络舆情的监管难度也大幅提升。
由于高校学生的人生观、世界观、价值观的尚未成熟稳定,缺乏是非辨别能力,思想和观念很容易受网络舆情影响,也更容易产生偏激的言论或行为,形成负面舆情。因此,如何有效监管和分析高校网络舆情,及时发现、引导并制止错误偏激的舆论导向尤为重要。
二、研究现状
到目前为止,国内外对于高校网络舆情的研究普遍集中在以下几个方面[1]:
(1)高校网络舆情传播特征研究。舆情的传播特征及形成机制对舆情的发展动向产生了很大的影响。因此,高校网络舆论的传播特征已成为 当前学者关注的焦点,特别是在早期的研究中。
(2)高校网络舆情监控机制研究。完善的舆论监督机制,是治理高校网络舆情,避免舆论危机和群体突发事件的一种有效途径。目前,大多数高校对网上舆论的监督机制并不局限于制度建设,在专业人才队伍建设方面也存在缺陷。
(3)高校网络舆情引导机制研究。高校网络舆情引导机制包括舆情预警、干预、引导、危机处理等过程。舆情预警重点在于舆情系统的建立;舆情干预和引导过程重视权威信息发布、网络谣言澄清和“意见领袖”引导作用;危机处理过程注重增强网络道德教育、网络安全教育等。
(4)高校网络舆情突发事件应对策略研究。互联网是舆情传播过程中的一个主要媒体,对高校突发事件的产生起到推波助澜的作用。高校网络舆情突发事件的研究现阶段主要集中在网络环境下如何解决和处理高校突发事件。
(5)网络思想政治教育研究。随着网络环境的发展,网络思想政治教育的研究更倾向于采取比较研究、逻辑分析、实证分析等手段,在新媒体和大数据的研究背景下,深入探讨网络环境特有的特性、内在机制及发展趋势。
但这些研究方法和研究成果并没有从根本层面上来对高校网络舆情热点的形成和演变过程进行分析,也就无法确切的形成有效的监督机制和引导机制。近年来,一些学者尝试通过数据挖掘技术来进行热点话题发现,以期能够更好地对网络舆情进行分析、监控、引导和应对。
三、高校网络舆情热点话题特征分析
高校网络舆情热点话题往往是能引起高校大学生群体普遍关注并易形成某些具有特定指向性态度的事件。考虑高校大学生这一特殊群体与社会上其他团体在角色、年龄、生活地域等各方面特征的不同,其形成的话题也往往具备其特殊的表现形式:
(1)热点话题通常会在某一时间段内频繁出现,更容易引起话题关注者在思想或行动上的呼应。
(2)热点话题一般拥有较多的评论、回复信息,经过媒介的传播,获取较多评论、回复后,形成热点话题。
(3)在线上社交平台上形成的热点话题在线下也将成为线下舆论交流的热点。
(4)在社交平台上所形成的热点话题内容会在某个时间段周期性复现。
从舆情的传播特征出发,归纳出高校网络舆情三个重要特征:内容多元性与分散性、主体的特殊性、形成过程的迅捷性。从参与主体的特征出发,对高校网络舆情进行分析,总结出其具备现实性、冲突性和情感性等主要特征。从高校本身的特征来看,高校网络舆情又有其特有的特征:传播主体的集中性、学生群体的自主性等。此外,高校的安全稳定性、群体性和舆情的突发性也是高校网络舆情特征分析中不可忽略的一个重要因素。
四、高校网络舆情热点话题分析
本文构建了热点话题分析模型,主要由数据采集、数据处理和热点话题分析三个部分组成。其中网络文本预处理、文本分词、文本向量化可归纳为数据处理,词频统计、词云分析、情感倾向性分析可归纳为热点话题分析。
(一)数据采集
本文利用 python的开源框架Scrapy和Beautiful Soup开发的主题爬虫,爬取了百度贴吧中“河南工业贸易职业学院吧”和“河南工贸吧”中的舆情数据,选取时间自2019年1月1日至2022年5月1日期间贴吧数据。贴吧帖子总计2880条,评论、回复贴超过28405条,。贴吧发帖内容属于短文本,且具有表达形式多样、语序逻辑要求不强的特点。
(二)数据处理
计算机能够直接处理结构化的数据,然而一般数据采集能够采集到的文本数据往往是非结构化的,因此需要对文本进行处理从而使计算机能够有效的识别和处理。文本处理技术包括网络文本预处理、文本分词和文本向量化表示三个基本过程。
1.网络文本预处理
为确保数据的可用性和高效性,要对网络文本中无效的、不规范的异常数据进行过滤和清洗。比如爬取贴吧数据每页中的第一条数据一般为置顶的空贴,主要进行删除;在同一时间同一用户发表的相同主题内容帖子,判定为重复数据,要进行删除;主题和内容同时为空的帖子,判定为空数据,要进行删除;广告营销类发帖也要进行删除等等。
2.文本分词
舆情信息在经过预处理后必须进行分词才可以用于舆情分析,并且分词结果直接影响文本处理的效果。本文主要选用jieba分词来对贴吧文本数据进行分词,同时将一些专业名词作为自定义词典补充进去,如“河南工贸”“专升本”“单招”等,以提高分词的准确率。
中文分词后会过滤掉一些对表示主题没有意义或者贡献比较小的词,比如“白”“了”“呢”等,即去除停用词,以降低维度、提高搜索效率。本文使用的停用词表是在哈工大停用词的基础上扩展了四川大学机器智能实验室停用词库、百度停用词后得到的1986个停用词。
3.文本向量化
本文采用word2vec词嵌入算法模型,将分词T{t1,t2,t3,....tn}映射到空间向量Z{z1,z2,z3,...zn}中,确保每个分词都能对应一个实数向量,可以使文本的挖掘更加精确。
(三)热点话题分析
热点话题分析主要侧重于高校学生对于热点事件或话题的关注度以及情感态度,包括词频统计、词云分析、情感倾向性分析三个方面。
1.词频统计及词云图分析
将数据处理后的文本数据进行词频统计,并按照词频显示词语[3]。通过绘制词频和主题词云图,可以更加直观地了解高校学生关心的热点话题情况,如图1和图2所示。
由图1和图2可以看出学校、学长、学姐、专业、工贸、新生、单招、校区、学妹等主题词在贴吧中出现的频次比较高,说明在贴吧社交平台中舆情主体更为关注学校、专业、单招考试、升学等情况,学校管理者应关注学生的日常学习和生活需求,结合贴吧反馈热点话题内容,及时给学生提供咨询和帮助。
2.情感倾向性分析
本文选用基于词典和规则的方法来对热点话题进行情感倾向性分析。情感分析可概括为积极性和消极性,数值越接近1为积极性,越接近0为消极性。对河南工业贸易职业学院贴吧热点话题(共5048条)进行情感倾向性分析后,发现其中2581条表达积极情绪,1746条表达消极情绪,1081条保持中立,情感倾向性取值区间为[0.005421,0.999995],如图3所示。整体来看,河南工业贸易职业学院贴吧主题发帖中中立情绪表达比较集中,占比21.4%,积极情绪更为明显,占比51.1%。
五、高校网络舆情引导策略
根据热点话题分析结果,结合高校网络舆情热点话题的特征,提出合理化的舆情引导策略,总结为以下几点:
第一,加强制度建设,建立联动机制,协同管理。增进体制建设是强化和改进高校舆情危机应对能力的基石。成立由校党委领导牵头,组织部、宣传统战部、学生工作部、保卫处、各二级学院、现代教育技术中心、思政部门协同作用的领导小组,形成舆情研判、应对、处理工作全局协同管理机制[4]。
第二,建立舆情预警系统,完善舆情研判预警机制,强化舆情控制能力。有效监控各个自媒体社交平台,及时把握舆情动态。高校舆情引导中,需要基于完善的检测体系准确研判潜伏期[5],借助大数据让网络舆情信息能够进行实时统计与分析,筛选出有意义和有价值的舆情信息,以此做出合理分析,为高校舆情引导提供帮助。
第三,培育新型主流媒体,加强阵地建设,优先抢占话语主导权。建立融媒体中心,汇聚全校宣传合力,打造积极主动的正能量舆论场,通过不断输出优质内容,提升学校官方媒体宣传公信力。做好舆情应急准备,设置舆情处置预案,第一时间做出快速响应,及时应对,力求将高校舆情遏制在萌芽阶段,防止事态蔓延,以便高校掌握主导权。
第四,建立健全舆情引导方法,提升舆情处理成效。建立素质全面的舆情工作队伍是强化学校对网络舆情引导能力的最有效方式之一。在网络舆情管理队伍建设中,需要注重管理人员、教师、学生在网络舆论引导中三位一体的作用[6]。强化校内思政工作者舆情意识和专业素养,有效疏导学生情绪,引导其正确认识各类舆情及意识形态风险,降低网络舆情爆发风险。
六、结语
网络技术更新迭代,社交媒体层出不穷,高校网络舆情的复杂性、敏感性、多发性等自身特点,为高校网络舆情的控制带来了新的挑战。本文采用数据挖掘技术,通过对本校百度贴吧主题帖进行挖掘分析,发现高校学生群体在网络平台上关注的热点话题,并进行情感分析,进而提出符合高校网络舆情特征的舆情引导策略。但受数据源的影响,本文的分析存在一定局限性,未能完全概括高校网络舆情热点话题及其情感趋势。接下来,将扩大研究数据范围,更进一步研究高校网络舆情预判及学生行为特点,为高校舆情提供更具实际参考意义的引导策略。H
参考文献
[1]黄钦,关鹏,裴敏俊,等.国内高校网络舆情研究热点及趋势分析[J].高校辅导员学刊,2018,10(05):76-82.
[2]张卓琳.探讨网络舆情热点话题的传播模式[J].传媒论坛,2018,1(11):96+98.
[3]杨单,程键,姚怡琦,等.基于文本挖掘的高校网络舆情用户情感分析研究[J].武汉纺织大学学报,2020,33(05):74-80.
[4]杜嘉庆.新时代高校网络舆情的特征、风险和对策[J].北京教育(高教),2022(06):48-50.
[5]朱宝华,胡成旭.新媒体背景下高校网络舆情分析与引导对策研究[J].中国地市报人,2022,(05):107-109.
[6]隗玮.新媒体背景下高校网络舆情特征与引导策略[J].新闻研究导刊,2021,12(06):43-44.
基金项目:河南省高校人文社会科学研究一般项目,项目名称:基于数据挖掘的高校网络舆情热点话题分析及引导策略研究(项目编号:2022-ZZJH-132)