面向视频弹幕的网络舆情事件监测研究*
2022-03-07黄立赫石映昕
黄立赫 石映昕
(1.西北工业大学马克思主义学院 西安 710129;2.华北水利水电大学马克思主义学院 河南 郑州 450046)
伴随着社会性网络的快速发展,用户生成内容(User Generated Content,UGC)已成为众多社交平台的显著特征[1]。以哔哩哔哩,优酷等为代表的视频分享平台逐渐演化成资源共享、情感表达、社交分享的信息载体。视频弹幕作为一种日渐流行的在线评论形式,包含大量的视频标签语义信息[2]。不同于以娱乐化标引为主要特征的主题类型视频弹幕,网络舆情事件的视频弹幕往往包含大量的社会标引(Social tagging),网民通过发布、评论等行为,表达针对社会热点事件的情感倾向。基于社会标引的视频弹幕不仅成为网民在线吐槽的欲望传感器,更成为视频观众情感波动的前哨站。与通用的普通短文本分析不同的是,视频弹幕所具有的实时交互性与临场在线性等特点,使得面向视频弹幕的文本分析能够精准捕捉用户的交互行为与情感倾向在时间分布上的显著差异,动态追踪视频弹幕中的话题迁移,感知事件漂移的舆情走向,对预警网络舆情危机,绘制可视化的事理图谱等具有重要的研究价值。
网络舆情事件的发展在时间维上具有平滑性,表现为旧话题的消亡或新话题的产生或抑制。类似地,用户的评论情感也会随之演化,产生情感极性与情感强度的调整。本文在视频弹幕情感计算的基础上,引入弹幕迁移指数,旨在量化网络舆情事件的预警监测指标,通过计算不同时间序列下话题权重与情感强度变化,绘制迁移指数动态曲线,实现网络舆情事件监测的路径分析。
1 相关理论研究
目前针对网络舆情事件的文本主题建模主要可分为聚类分析和主题分析两类。聚类分析模型通过计算文档间的相似距离,实现文档主题的识别,主要包括聚类算法[3]、TF-IDF算法[4]、关联规则挖掘[5]等。主题模型(Topic Model)主要通过识别文本集合潜在的语义结构,抽取文本主题。LDA(Latent Dirichlet Allocation)主题模型[6]基于词袋原理,将文本的语义表示从高维词空间降到低维主题空间,建立基于概率模型的三层贝叶斯网络,已成为最受瞩目的研究理论。然而,LDA主题模型的性能受文本长度的影响,且未充分考虑词之间的位置关系,因而无法有效抽取短文本主题。为此,Yan[7]提出BTM(Biterm Topic Model)双词主题模型,该模型通过抽取文档中的双词,建立主题混合分布,改善了因文档过短而出现的特征矩阵稀疏的问题。
文本情感分析依据情感的粒度信息,可分为词语级、句子级、篇章级。词语级的情感分析是文本情感分析的基础,该类研究主要可分为基于无监督的情感词典方法以及基于有监督的机器学习方法。句子级的情感分析通常在词语级分析的基础上,增加文档上下文关联、情感位置判断、句法分析等要素,实现主观句情感分类。篇章级通常将文档视为单一评论对象,忽略不同对象间的情感评论差异,因而整体情感识别精度较低。此外,依据研究内容的不同,文本情感分析也可分为主客观分类[8]、情感极性分析[9]以及多情感分类[10]。
综上所述,当前学者对于网络舆情事件的话题漂移研究,多集中于事件的主题识别与情感的演化分析,缺乏能够量化的方法识别网络舆情事件的情感变化关键时间窗口。此外,研究多侧重网络舆情事件的文本分析,利用视频弹幕进行用户情感分析尚不多见。因此,本文针对以上不足,研究了视频弹幕社区中用户情感在时间维上的演化特征,通过引入弹幕迁移指数概念,从话题内容与用户情感的角度,实现了话题与情感的协同分析。模型研究思路如图1所示。
图1 视频弹幕监测分析模型
2 视频弹幕主题与情感建模
2.1弹幕主题识别本文采用BTM主题模型进行主题识别,该模型假设词对间的语义相关性与其在相同文本中共现的次数成正比,通过构建主题混合分布,实现“双词对-主题-语料文本”三层Bayes概率建模。若网络舆情事件的视频文本数为M,包含的主题数为K,词对数为|B|,BTM模型假设视频文本话题词的先验分布为Dirichlet分布,即θz=Dirichlet(α),φw|z=Dirichlet(β),语料库的生成过程描述如下:a.抽取主题z下的词分布;b.抽取文档i的主题分布;c.抽取主题z~Multi(θ),并从主题z中抽取共现词对b=(wi,wj),wi,wj~Multi(φz)。重复上述过程,最终构建完整的视频弹幕语料库。BTM模型参数具体含义见表1。
表1 BTM主题模型的参数
2.2弹幕情感计算弹幕文本中的情感计算需要在情感极性判断的基础上,实现句子级的多粒度情感分析。本文借鉴郑飏飏等[10]创建弹幕情感词典的思想,以7分类情感指标作为情感维度,将弹幕文本的情感粒度分为乐、好、怒、哀、惧、恶、惊等细分维度。此外,针对弹幕语言的特点,首先建立弹幕颜文字词典,再基于情感词汇本体库[11]、常用副词表[12]以及否定词表[13],建立多维情感词典,最后计算弹幕语句的综合情感强度。
2.2.1 颜文字词典的构建 视频弹幕作为一种融合用户在线评论文本的新型视频形式,包含大量观众对视频内容的观点评价与情感倾向[14]。颜文字作为一种新的网络热词形式,在多语言符号的基础上逐渐演化成包含多种字符与图案集的亚文化语言,广泛存在于各大视频弹幕网站中。颜文字词典构建过程如下:a.首先经分词、去停用词、词性标注等预处理后,从实验数据集中,随机抽取一定数量的颜文字,进行人工情感标注,建立颜文字种子情感分类表,并参照文献[15]建立情感分类树,进行情感强度标注,结果如表2所示。b.利用公式1依次计算新的颜文字与表2中的种子词之间的互信息值,选取最大互信息值所含有的种子情感,作为其最终的情感类别。
表2 颜文字种子情感分类表(部分)
(1)
其中,P(wnew,wseed)表示wnew与wseed同时出现在文本D中的概率;P(wnew),P(wseed)分别表示wnew,wseed单独出现的概率。通过动态遍历情感分类树中包含新颜文字的语句情感强度,综合判断句子级的情感值。假设颜文字词典的正向情感集合为Wpos(包含“乐”“好”等情感维度),负向情感集合为Wneg(包含“怒”“哀”“惧”“恶”“惊”等情感维度),则含有新颜文字wnew的句子综合情感强度Semoji(wi),计算如公式2所示。
(2)
其中,|Wpos|与|Wneg|分别表示正向情感集合与负向情感集合所含的颜文字数。
2.2.2 多维情感词典的构建 将颜文字词典与情感词典相结合,能够实现多元化的情感发现。本文依据大连理工大学构建的情感词汇本体库,抽取弹幕语句的情感词,并结合否定词表与程度副词表,构建面向视频弹幕文本的多维情感词典,具体流程如下:首先通过标注弹幕文本的词性,筛选出具有情感信息的形容词、叹词和动词,并将抽取出的情感词归类到七元情感维度中,并确定否定词对弹幕情感迁移的影响,情感分类映射关系如表3所示。经否定词修饰后的弹幕本文情感值计算,如公式3所示,其中n表示否定词的个数。
表3 含有否定词的情感分类映射关系表
注:正向情感(好,乐)经过奇数次修饰后,情感态势转变成负向情感,其中强度较高的乐(0.4-0.5),好(0.4-0.5)映射成“怒”情感。负向情感“惧”“衰”“惊”经过修饰后,表现为无情感,其中“怒”“恶”则转换成不同程度的“好”情感
(3)
文本的情感识别还需要考虑程度副词对情感强度的影响,为此,将经过程度副词修饰的情感强度定义为公式4所示,其中,|adv|表示程度副词的修饰强度。
Sadv(wi)=|adv|*s(wi)
(4)
同一条弹幕的情感值由其所包含的所有颜文字以及情感词共同决定,通过对不同类别的情感维度进行线性求和,最终得到弹幕的综合情感值,计算如公式5所示。当某类情感维度取得最大值时,可将其视为某条弹幕主题的情感。
(5)
其中,Semoji(wi)表示弹幕文本的颜文字情感强度,S(wi)表示经过否定词与程度副词修饰后的情感强度,k表示一条弹幕中属于相同情感维度的颜文字与情感词的总数。
3 弹幕迁移指数构建
新媒体环境下,部分网络舆情事件在演变成热点事件之前,首先是以视频的形式在自媒体中广泛传播[16]。研究如何及时有效地感知事件的主题变化,准确预测舆情的演化走向,对提高网络生态环境的预警与监控能力具有重要的现实意义。视频弹幕作为二次元时代流行的视频互动模式,包含大量的用户评论以及情感评价信息。弹幕迁移指数作为监控视频弹幕事态变化的重要指标,能够动态感知网络舆情事件的舆情危机,绘制事件的生命周期节点,达到动态感知情感变化的目的。本文认为弹幕迁移指数不仅要体现话题内容的语义改变,更要突出话题情感的动态变化。因此,弹幕迁移指数由话题迁移指数与情感迁移指数两个分指标共同决定。
3.1话题迁移指数话题迁移指数主要从话题内容的关键词权重以及视频兴趣热度的变化角度,刻画网络舆情事件话题迁移,具体构建过程如下:首先由BTM主题模型得到主题-词分布以及文档-主题分布,再基于TF-IDF算法计算不同关键词的权重,同时结合视频弹幕热度分析,通过点击量,弹幕量,播放量等信息,计算时间序列下弹幕的热度指数。最后,综合上述指数特征分量,得到能够反映弹幕话题迁移特征的指数信息。
3.1.1 最优话题数与话题关键词权重计算 话题迁移指数通过对比相邻时间片内的主题变化,并结合话题特征词权重与话题兴趣热度特征,实现话题迁移的路径表示。不同时间序列下的最优话题数是影响话题权重总和的关键参数。困惑度(Perplexity)是用来衡量BTM模型最优话题数的重要指标,困惑度越小,模型的性能越优,相应的主题数取到最优值[17]。
依据“二八原则”,从每个数据集中随机抽取80%的数据作为训练集,20%数据作为测试集,经过多次迭代测试。实际操作发现,不同测试集的实验数据对模型困惑度取值的影响较大。因此,最终采用十折交叉验证法,将数据集随机分成十份,其中九份作为训练集,一份作为测试集,进行十次交叉测试,选取十次操作的平均值作为最终结果(如图2所示)。由图2可知,当话题数K为25时,曲线出现较为明显的拐点,且话题数量逐渐收敛。
图2 十折交叉后的模型困惑度曲线图
为了进一步描述话题的内在语义信息,探究情感极性与情感强度的内在联系。本文采用TF-IDF模型计算话题的特征词权重,建立话题特征词的词频权重矩阵,刻画不同特征词对话题的重要程度。假设t时刻视频弹幕含有s个话题,则此时其话题权重可用公式6计算。其中,tfidfij表示t时刻第i个话题所含的第j个特征词的tfidf值,s为话题数,p为话题所含的特征词数。
(6)
3.1.2 兴趣热度计算 兴趣热度体现了网络舆情事件的传播速度与传播走向,能够为预测其是否会转化成网络热点事件提供必要的数据参考。因此,本文通过获取视频弹幕的点赞数、收藏数、分享量、弹幕数以及播放量,建立多指标的视频兴趣热度评价模型,具体流程如下:首先,对上述指标进行归一化和百分化处理,再通过层次分析法确定不同指标的权重,使用1-9标度方法确定判断矩阵的元素aij,然后采用合积法求解判断矩阵的特征值与特征向量,构建指标体系。为了确定指标分配权重的合理性,需要进行判断矩阵的一致性检验,具体过程如下:a.分别计算一致性指标CI与随机一致性指标RI,再得到一致性比率CR。当CR<0.10时,认为判断矩阵的一致性是合理的,否则需要修正判断矩阵;b.将通过一致性检验的判断矩阵进行层次加权,最终得到如表4所示的兴趣热度指标权重表。
(7)
表4 兴趣热度指标权重分配表
3.1.3 话题迁移指数构建 话题迁移指数(Topic Drift Index, TDI)结合话题的关键词权重与视频兴趣热度指数,依据不同时间测度下网络舆情事件的话题tf-idf词频权重与兴趣热度的变化量,从话题内容角度判断网络舆情事件是否存在主题漂移倾向。话题迁移指数计算如公式8所示。
(8)
3.2情感迁移指数情感迁移指数(Sentiment Drift Index, SDI)主要依据时间维下不同主题的情感值变化,体现网络舆情事件在不同生命周期内的情感波动,从情感变化的角度实现网络舆情的测度分析。基于2.2节的论述,情感迁移指数计算如公式9所示。其中,S(w)t1,S(w)t2分别表示t1,t2时视频弹幕的综合情感值。
(9)
3.3弹幕迁移指数弹幕迁移指数作为监测网络舆情事件的重要指标,能够较为准确地感知引起网络舆情动态变化的重要话题与时间窗口信息。本文综合考虑网络舆情事件的两个核心要素:话题特征与情感特征,联合建模话题迁移指数与情感迁移指数,最终得到弹幕迁移指数(Bullet-screen Drift Index),计算如公式10所示。其中,δ1,δ2分别表示话题迁移指数、情感迁移指数在弹幕迁移指数中的比重。若情感迁移指数为负数,则表示其情感转为负向情感,此时将其绝对值代入公式10,并标注该弹幕迁移指数为负值。
BDI=δ1TDI+δ2SDI
(10)
4 实验结果与分析
4.1数据来源与预处理本文以“章莹颖事件”作为研究对象,使用八爪鱼爬取bilibili和爱奇艺视频网站的视频弹幕数据,验证网络舆情事件的弹幕迁移指数在舆情分析中的合理性。考虑到视频时间跨度较长且弹幕密度与时间段存在较大关联,事件范围设定在2017年6月13日-2020年10月28日,并设置时间窗口为6个月,将数据集划分成6个子集,采集字段包括视频发布日期、视频数、点赞数、收藏数、分享量、弹幕数、播放量等,共获取有效弹幕文本2 702 243条,采集结果如表5所示。
表5 视频弹幕数据分布
为了验证弹幕迁移指数对网络舆情事件的预测效果,依据百度指数,以“章莹颖案”为搜索关键词,绘制热度指数曲线,如图3所示。由图3可知,该事件的舆情传播呈现“双峰”特征,依据贾亚敏[18]提出的舆情周期划分方法对“章莹颖案”进行划分,首次爆发时间段为2017.6.5-7.24,爆发主因是章莹颖案情公布,涉事方就其下落展开激烈讨论;首次衰退期为2017.7.25-2017.8.18,该时期随着案情的持续,警方陆续发布案件信息,基本锁定嫌疑人;扩散期为2017.8.19-2019.6.24,该时期以案件定性,受害家属情感慰藉以及寻找章莹颖为主线;增长期为2019.6.25-2019.8.20,起因是案件进入审判程序,遗体位置以及美国死刑制度引发热议。
图3 “章莹颖案”百度热度指数曲线
4.2参数分析话题迁移指数由主题权重值与兴趣热度值决定,需要确定调节参数α,β的取值。以5号窗口所含的弹幕为实验对象,实验过程如下:首先依据困惑度,计算该窗口下视频弹幕所含的最优主题数,并分别计算该视频的兴趣热度。然后将所含主题数相近的视频归为一类,观测其兴趣热度的变化情况。经比较得出:“章莹颖事件”中主题数较少的视频弹幕,往往倾向于描述该事件的案件信息、受害方情感等内容,兴趣热度值相对较高。因此,测定得出:当主题数小于5时,该视频的兴趣热度参数β=0.75,α=0.25,此时,话题迁移指数较能客观反映事件的热点主题变化情况。当主题数不小于5时,该视频的兴趣热度参数β=α=0.5。
弹幕迁移指数主要由话题迁移指数与情感迁移指数构成,不同指数间的参数权重会影响最终的实验结果。通常视频弹幕的情感会随着视频主题内容的变化而逐渐演化,在主题内容没有发生变化的条件下,视频观众在相邻时间片内的情感变化程度较小。因此,为确定话题迁移指数参数δ1与情感迁移指数参数δ2的取值,实验过程如下:首先选取包含弹幕数最多的5号窗口文本,以“月”为单位,将其所含的视频划分成6个子窗口文本。然后利用2.1节的弹幕主题识别方法,抽取不同时间窗口下弹幕文本所含的主题。选取主题延续周期较长的主题(至少在3个时间窗口内均存在),并将其加入候选主题集。再依据2.2节弹幕情感计算过程,分别计算上述主题的情感强度,得到如表6所示的主题情感结果。
表6 5号窗口文本的部分主题-情感计算结果(部分)
通过赋值多个情感迁移指数参数δ2,计算候选主题集中每个主题在相邻时间片下弹幕迁移指数间的平均相关系数,实验结果如图4所示。由图4可知,当因子δ2=0.45时,平均相关系数取到最大,对情感迁移指数参数的赋值最合理。
图4 相邻时间片下情感值间的相关系数分析
4.3实验结果分析基于BTM模型进行主题提取,设定关键词数为30,利用TF-IDF算法计算每个主题下的关键词权重,以窗口1中主题权值排名前5的主题为例,结果如表7所示。由表7可知,该时间窗口下存在多个主题共存,主题内容侧重描述事件的不同要素,且不同主题所含的关键词权重具有较大差异,表明不同主题权重在语义层面上具有明显差异。
表7 “章莹颖事件”主题识别结果
采用表4分配的弹幕兴趣热度权重,计算不同时间窗口下视频弹幕的主题兴趣热度,以窗口1中兴趣热度排名前5的视频弹幕为例,计算结果如表8所示。考虑到同一个视频中弹幕文本可能含有多个主题,所以以时间节点为计量周期,将兴趣热度视为该时段内视频弹幕所包含所有主题的热度值。
表8 “章莹颖事件”兴趣热度指数
以窗口1所包含的45个视频弹幕为例,以视频发布的时间作为依据,共划分为5个统计节点(每个时段含有9个视频),结果如表9所示。分析表9可知,在主题权重增加的情况下,话题迁移指数可能会因为兴趣热度的提高,而出现下降的情况(如序号2、3所示)。此外,兴趣热度与话题迁移指数的变化方向基本一致,体现了兴趣热度在监测网络舆情事件的传播偏向方面具有一定的参考意义。
表9 “章莹颖事件”话题迁移指数
基于2.2节构建的多维情感词典,计算视频弹幕的情感类别与情感强度,具体流程如下:首先选取不同阶段中视频弹幕所含权重最大的主题,选取情感强度最大的数值作为该视频的最终情感值,并按照7维情感分类法确定视频弹幕的情感分类,表10是编号为2的视频弹幕中,主题权重最大的主题4的部分弹幕情感识别结果。主题4的主要内容是警方公布审讯嫌疑人的过程,由表10可知,观众表达了针对该主题不同方面的情感诉求,在情感类别与情感强度上均具有显著差异,其中“怒”“恶”两种负面情感在整体上较为突出,且情感强度较高。图5是不同时间窗口内主题权重top3的情感分析结果,图5中仅列出每个主题中情感强度最高的三个情感类别。由图5可知,“章莹颖事件”的主题情感在事件生命周期内整体波动较平稳,情感类别整体以“怒”和“恶”为主线,具体来说,事件发展初期,“恶”和“怒”情感强度达到局部峰值,原因是网民对克里斯滕森坚称无罪的行为,表达了强烈的憎恶与愤怒(TopicⅠ-2、TopicⅠ-3)。在事件爆发阶段,“怒”情感强度达到整个生命周期的最大值,起因是FBI基本确认章莹颖死亡和章莹颖家属表达严惩疑犯的诉求(TopicⅡ-2、TopicⅡ-4),网民的“怒”情感进一步释放。在事件衰退与扩散期,各种不同类型的情感分布比例相对均衡,表现为“怒”“哀”“惊”情感交替出现,网民的整体情感类别强度逐渐平稳且均有不同程度的弱化,网民关注焦点转向寻找尸源、校园安全等事件主题(TopicⅢ-1、TopicⅣ-1),情感强度较弱的原因主要是民众对章莹颖家属表达了同情与支持等正情感,同时对美国校园安全隐患表达了担忧,从而抵消了部分正情感。在二次爆发阶段,“怒”情感强度再次达到局部峰值,起因是案件进入量刑阶段,民众对判决结果表达强烈不满(TopicⅤ-1、TopicⅤ-2),舆情危机再次出现。在事件衰退期,舆情走向再次发生变化,逐渐表现为较低强度的“惧”与“衰”,原因是民众对司法部门无法寻找遗体的失望,以及对海外人生安全问题的担心。
图5 各事件窗口内情感分析结果
表10 视频弹幕2中主题4的弹幕情感识别结果(部分)
计算不同时间窗口下多个视频弹幕的情感值,得到“章莹颖事件”的情感漂移指数,以窗口1为例,按照表9的时间节点划分方法,情感迁移指数结果如表11所示。由表11可知,不同窗口内,伴随着主题的演化,其情感类别与情感强度均发生了明显的变化,情感迁移指数变化幅度较大,最高达到16.3%。
以话题迁移指数与情感迁移指数为基础(表9和表11),计算该事件的弹幕迁移指数,其中参数δ1,δ2分别0.55,0.45,结果如表12所示。由表12可知,该窗口内,弹幕迁移指数整体变动幅度较大,如从序号3到4时,弹幕迁移指数由-5.4%迅速下降到-23.9%,经分析发现,该阶段事件主题由寻找章莹颖转变成警方确定嫌疑人,以及嫌疑人背景介绍,情感迁移指数也急剧下降到-56.3%,舆情转为高强度负向情感,此时应及时提供情绪疏导机制,避免舆情演化成网络暴力。
表11 情感迁移指数
表12 弹幕迁移指数
4.4模型验证为了验证弹幕迁移指数监控网络舆情事件的可行性,本文以图3“章莹颖案”百度热度指数曲线为对照,通过绘制其关键时间节点的热度指数曲线,与视频弹幕指数变化曲线进行对比分析,结果如图6所示。此外,为了探讨视频弹幕指数变化的诱因,在相同时间窗口内绘制情感迁移指数与话题迁移指数的演化曲线,结果如图7所示。
图6 “章莹颖事件”百度热度指数与视频弹幕指数曲线对比
图7 “章莹颖事件”情感迁移指数与话题迁移指数曲线
以视频为传播媒介的网络舆情事件,伴随着其弹幕迁移指数(BDI)的变化,逐渐演变成舆情热点事件。分析图6可知以下结论:a.百度指数与BDI整体走势基本一致,具体表现在二者均出现了两次较大程度的上升,BDI首次上涨时间为2017.6.19-6.25,数值迅速上升至45.1%,而百度指数也在一周之内上升到135,748的峰值水平。BDI二次峰值出现在2019.7.15-7.21(数值为45.4%),以此同时,百度指数达到局部峰值125,518,表明该阶段舆情出现二次爆发。b.在事件生命周期内,BDI的变化拐点先于百度指数,表明BDI对网络热点事件的舆情预警能力较强。
此外,事件在衰退期与扩散期的舆情传播通常较平稳,此阶段可能因新的事件转折点而出现舆情危机复发。BDI能够联合建模情感迁移指数(SDI)与话题迁移指数(TDI),实现话题语义层面的情感分析。由图6,7可知:a.当BDI出现持续的负向漂移时,利用SDI与TDI的演化走势能够进行话题情感追踪,此时SDI与TDI表现为局部的指数漂移。具体来说,若SDI发生负向漂移且TDI没有发生显著变化(如图7中2017.9.9-9.10),网络舆情事件在短期内演化成网络舆情危机的可能性较大,此时网络监管部门应及时介入,控制舆情走向;若TDI发生负向漂移且SDI没有发生显著变化(如图7中2017.10.2-10.8),此时需查明舆情事件的主题权重变化趋势,对于主题权重变化较大的话题内容,其演化成新的热点话题概率较高,此时需要防范复发的话题情感危机。b.SDI与TDI可能同时出现逆向变化,抵消BDI的变化,此时应进一步追踪TDI的兴趣热度,当其在短期内出现大幅度上升时,可能出现以下两种情况:网络热点事件演变成多个子事件,兴趣热度的上升是因为网民关注的话题焦点数的增加;网络热点事件的主题权重变化不大,此时兴趣热度的上升可能是由于网络暴力、网络谣言等外部因素诱导所出现的“舆情失语”,此时需要进行必要的舆情干预,让网络热点事件回归其原有的演化状态。
基于上述实验结果,可以从以下方面改进网络舆情事件的在线管控能力,首先,针对网络舆情的内在演化机理,需要将网络事件的主题特征与网民群体的情感特征相结合,充分发挥多层级网络大V、视频UP主等意见领袖的舆情影响力,把控舆情传播方向。其次,结合网络舆情的外在表现特征,分析弹幕迁移指数,定位舆情演化的重要转折点,通过信息公开,危机研判等手段,构建协同联动的舆情风险的演化机制。此外,为了有效防范网络事件的舆情危机复发,通过绘制舆情事件的路径演化曲线,提高对高强度负面情感的预判分析能力,建立健全负面情感舆情干预机制。
5 总 结
本文通过对视频弹幕进行话题情感识别,把话题迁移指数与情感迁移指数引入网络热点事件的分析中,提出了一种基于弹幕迁移指数的事件监测模型,该模型基于BTM主题模型抽取视频弹幕的话题信息,通过构建包含颜文字的情感词典,实现视频弹幕的情感分析,最终基于话题迁移指数与情感迁移指数实现弹幕迁移指数的构建,实现网络舆情事件的在线监测。实验结果验证了该模型在视频情感分析中具有良好的性能。