突发事件网络舆情的演变机制及其情感性分析研究
2012-04-29金鑫李小腾朱建明
金鑫 李小腾 朱建明
〔摘 要〕为深入研究突发事件网络舆情的演变形式及演变成因,本文以723温州动车追尾事件为例,以事件舆情生命周期为脉络,在利用SVM对各阶段舆情进行情感性分析的基础上,从政府、媒体、意见领袖、网民自身4个维度对网络舆情事件中各角色对网络舆情传播过程的影响及彼此间的相互作用做出了分析,并对舆情的应对提出一些建议。
〔关键词〕网络舆情;SVM;舆情演变;情感性分析
随着互联网的迅猛发展,它已经成为人们信息交流和信息传播的重要途径。尤其是Web20的发展,越来越多民众不再仅仅从网络上获取信息,而是迫切希望参与信息的发布,希望通过网络来表达自己的想法、观点和自己了解的事实等等,于是涌现了大量的网络言论。这种社会民众通过网络所表达的群体性的情绪、态度、意见与要求等言论形成了网络舆情[1]。
网络舆情爆发是针对某一特殊事件产生的涉及民众利益的社会舆情,它在相对短的时间内产生大量信息,由于数乘效应在互联网上掀起更大、更强烈的社会反映,如果事件没有及时正确应对,舆情危机就可能在极短的时间内变成一场包含观点和行动冲突的群体性突发事件[2]。
媒体的传播、政府的回应、意见领袖的推动、网民的反应对网络舆情的传播有很大的影响,他们之间的相互作用可以影响舆情的情感极性,并最终作用于网络舆情演化过程,例如可以避免网络舆情爆发期的出现,直接从成长期过渡到衰退期,从而抑制群体性突发事件的发生,摆脱了网络舆情危机。当今时代,网络舆情已经成为最具影响力的公众意见和评论表达方式,因此,从媒体、政府、意见领袖、网民自身多个维度分析和探讨网络舆情的演变,深入了解舆情演变的内部原因,寻求规避网络舆情危机的策略依据变得尤为紧迫。
1 网络舆情演变的研究现状
随着新技术的不断运用,网络影响力度不断扩展,网民群体更加庞大和多元,网络舆情也越来越成为各部门关注的热点。在网络舆情领域,许多学者做了相关研究。如有些学者对网络舆情传播过程进行了研究,提出了网络舆情过程模型,将网络舆情传播过程划分为潜伏期、成长期、蔓延期、爆发期、衰退期和死亡期[1]。此外还有一部分学者通过研究突发事件网络舆情形成过程及其影响因素,建立突发事件网络舆情演进规律的微分方程模型,确定舆情扩散过程中的3个特征时间点和舆情发展的4个阶段,研究不同时段政府的应对对策,为政府实现对突发事件网络舆情管理提供决策参考[2]。
除了对舆情的传播过程进行研究,部分学者开始研究舆情演变过程中所涉及的其他因素,如王国华等[3]还对突发事件网络舆情中的意见领袖进行了研究。他们从知识背景、社会地位、媒体使用3个维度对意见领袖进行了类型分析,然后以事件舆情生命周期为脉络,具体分析了意见领袖的介入时间,行为方式,最后从事件、媒介、受众等层面研究了意见领袖的影响。此外,方付建等[4]关于突发事件网络舆情片面化呈现的形成机理进行了研究。
现有的研究分别从不同的角度对网络舆情的演变进行了分析,他们都为网络舆情的研究提供了良好的切入点,但是并没有深入探索网络舆情的形成过程及其影响因素,只涉及了网络舆情对政府、意见领袖、网民的影响,而未研究网络舆情在政府、意见领袖、网民、新闻媒体的作用下是如何发生演变的,以及未能结合舆情的情感性来探讨在舆情发展过程中的影响因素和作用机制。
本文的研究中,首先将提出基于情感分析的网络舆情演变过程的研究框架,然后基于723动车事件的案例数据,通过对网络舆情的演变过程中各阶段舆情数据的分析,探讨了网络舆情的影响因素,并结合SVM情感性分析,探讨了网络舆情影响因素的作用机制,从而提出了相关的应对策略。
2012年12月第32卷第12期现?代?情?报Journal of Modern InformationDec,2012Vol32 No122012年12月第32卷第12期突发事件网络舆情的演变机制及其情感性分析研究Dec,2012Vol32 No122 舆情演变研究框架
21 舆情演变过程模型
结合Web20环境下网络舆情的特点,网络舆情的传播过程可以分为潜伏、成长、蔓延、爆发、衰退和死亡6个阶段[5]。如图1所示。
图1 网络舆情过程模型
潜伏期时,舆情危机的起因往往是由于民众对某事或某部门不满;成长期时,由于上述不满,信息传播者为了得到更多网民的关注,开始到各种社交网络上发布信息;蔓延期时,当发布的信息有一定的新闻价值时,或信息发布者有意炒作该事件时,此信息很快就会引起广大网民的关注并引发讨论;爆发期时,事件会被媒体、意见领袖进一步放大;若相关部门在爆发期时能及时控制住舆情,疏导民众的情绪,便会使事件进入衰退期;当网民、媒体等舆情主体积极性降低时,事件关注度便会逐渐衰减,最后成为过去,进入死亡期。
22 基于SVM的情感性分析
情感分析,也被称为观点挖掘、观点分析、主客观分析等。情感分析的目标是从文本中挖掘用户表达的观点以及情感极性。挖掘用户观点意义重大,比如用户的观点能吸引潜在用户,帮助其它用户做决定[10],同时用户的观点还包含了较有价值的反馈[11]。这里所说的情感极性指正、负、中性情感极性。
本文设计了如图2所示的情感分析的算法设计流程图,大体思路如下:首先对采集器所抓取的基于关键字的数据进行统计入库,然后对数据进行预处理(包括特征选择、中文分词处理等),之后训练SVM(支持向量机)分类器来对测试数据进行情感极性分类,输出情感极性标签。
图2 基于SVM情感分析的思路
SVM的主要思想及特点是对于线性可分的数据,可以画出一条直线直接将元组分开。对于非线性不可分的数据,SVM使用一种非线性映射,将原训练数据映射到较高的维。从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能。在新的高维空间上,SVM会基于结构风险最小化理论搜索线性最佳分离超平面,即将一类元组与其他类分离的决策边界。SVM使用支持向量(即基本训练元组)和边缘(由支持向量定义)发现该超平面。
为了对网络舆情进行分类,需要构建一个分类器,即:f(x)=〈w·x〉+b,〈w·x〉,表示w和x的点积,b为偏置。具体的研究步骤如下:
(1)选择特征值
这里采用了开方检验(CHI)的方法来获取特征值。使用开方统计量来描述特征项与类别之间的关联程度,开方统计值大则表示特征项与类别之间的独立性小,对分类的贡献就大。开方检验的计算公式如下:
x(t,c)=AD-BC(A+B)(C+D)
其中A为类c中包含特征项的文档个数;C为类c中不包含特征项的文档个数;B为非类c中包含特征项的文档个数;D为非类c中不包含特征项的文档个数。
(2)数据集预处理
按照LIBSVM软件包[6]所要求的格式准备校验数据和训练数据。并对数据进行归一化处理。
(3)选择核函数
这里考虑选用RBF核函数:K(x,y)=exp{-rx-y2},其实质就是算出SVM分类函数中的点积,即可以求得w和b的值。
(4)采用交叉验证方式对整个训练集进行训练获取支持向量机模型。
(5)利用获取的模型进行测试与预测。
其中,利用SVM进行分类的策略有多种,如是否对句子进行分句处理,就可以分成两种思路。由于本文处理的对象为文本内容很多的帖子,所以采用不分句的策略进行处理。在不分句的基础上我们采用一步分3类的方法,最终形成正向、中立和负向3种类别。
23 基于情感分析的舆情演变研究模型
本文结合上述的网络舆情过程模型和情感分析方法,以723温州动车追尾事件为例,用此事件所收集的数据来实证地分析舆情传播过程中政府、新闻媒体、意见领袖、网民各自的特点和他们对舆情演变的影响。本文的研究模型如图3所示。
本文通过对从互联网上抓取得到的723温州动车事件中民众所发表的观点,对该事件舆情演变过程中的各个阶段结合情感分析,分析其情感极性,从而观察媒介、政府、意见领袖的介入对民众情感的影响,这些影响的出现又使得舆情在接下来的时间里发生了怎样的演变。
图3 舆情演变研究模型
3 网络舆情演变过程的影响因素分析
31 数据准备
本文采用网络爬虫(火车头采集器)结合人工分析的方式来获取分析数据。笔者于2011年12月3日采用火车头采集器对天涯论坛有关温州动车事件的帖子,对网易新闻有关温州动车事件的新闻报道进行了采集。通过去重、去除不相关,共得天涯论坛关于动车事件的帖子325篇,网易新闻800篇。为了使数据更精准,更有效,本次分析采用7月23至8月2日的数据。为了发现舆情演变整个过程中政府、新闻媒介、网民的特点,我们利用收集到的关于723温州动车追尾事件的数据,对其进行统计分析,得到政府、新闻媒体、网民随着舆情演变所展现出来的特征。如图4所示。图4 舆情演变过程中网民、媒体和政府关注度的变化
由观测到的数据所呈现的特点,我们可以看到整个网络舆情的演变呈M-态分布。网民对723动车事件的关注在7月25日帖子量达到最高点,随即有回落趋势,在7月27日又重新上升,之后慢慢趋于平静,舆情演变曲线近似M形。新闻媒体对723动车事件的关注度也呈现M-态分布,但是不同的是,其在7月24日的报道量达到最高点,在7月25日开始回落,随即又开始回升,在7月28日又达到一次高峰点,并在7月30日开始渐渐淡出对723事件的关注。数据显示政府对723的关注度也近似于M-态分布,在7月24日和7月28日分别达到两次关注高峰,并在7月30日起关注度开始趋于零。
32 舆情生命周期的划分
本文参考723温州动车事件发表舆论的频繁度来划分此事件的生命周期。我们根据所有帖子数的变化来划分的。图4中显示了帖子总数的变化曲线呈M形,图中的A、B、C、D、E具有很明显的转折点特征,依据这5个节点将舆情划分为6个阶段,分别对应各舆情演化阶段,如表1所示。表1 723事件的舆情生命周期
阶段时间关注度阶段时间关注度潜伏期7237爆发期725-728621成长期723-724255衰退期728-730144蔓延期724-725127死亡期730-8255
从表1可看出723温州动车事件为突发事件,潜伏期不明显,且此事件影响广泛,所以衰退期和死亡期时间持续较长。
33 新闻媒体的关注度对舆情的影响
通过对网易上从7月23日至8月2日关于723温州动车事件的新闻报道进行抓取,共得到800条新闻,根据图4所展现出的动态,并结合舆情的生命周期理论,我们将得到的数据按照舆情的生命周期阶段进行划分,得到的数据如表2所示。表2 新闻媒体在舆情生命周期各阶段的情况
阶段日期报道量阶段日期报道量潜伏期7230爆发期725-728423成长期723-724198衰退期728-73098蔓延期724-72563死亡期730-8218
结合表2和图4我们可以看到媒体的关注度对舆情的影响是显著的,在成长期时媒体关注度骤然上升,从7月23日的零报道量到7月24日的第一次报道量高峰,使民众的注意力集聚723温州动车事件上,促进舆情进入蔓延期,并继续发展,之后在7月25日至7月28日间持续高密度的报道723事件,使舆情顺势进入爆发期。
我们也可以看到民众的关注度对媒体的报道量也是有影响的,7月23日民众对动车事件开始发表评论,媒体在7月24日便密切关注事件的发展动向,7月28日以后民众的关注度降低,媒体的报道量也随即下降。因此媒体与民众之间相互影响,互为彼此信息的来源,并促使着舆情不断演变。
34 意见领袖在网络舆情演变过程中的作用
“虚拟意见领袖”就是那些在虚拟网络中,热衷于传播消息和表达意见的人,他们或是比同伴更多地接触媒介或消息源,或者同时是某一方面的专家,他们的意见往往左右周围的人。从事件的发展来看,意见领袖几乎推动着每一个网络热点事件的发展。他们的意见左右着民众的意见,并被民众不断传播、放大。从传播信息的角度看,意见领袖形成了一层控制层。意见领袖是在人际传播网络中经常为他人提供信息,同时对他人施加影响的“积极分子”,在民众传播效果形成过程中起着中介或过滤作用[7]。从受众的角度看,网络意见领袖不仅影响网上舆论主题,更影响舆论走向,对于突发事件网上讨论焦点及方式都会产生极大的影响。
网络意见领袖在舆情演变过程中产生着重要作用,研究突发事件网络舆情演变中意见领袖的构成特点能够对实践的变化进行更多、更准确的预测。
以723温州动车追尾事件为例,我们从所有帖子中整理意见领袖的帖子,按舆情的生命周期进行分类,分析各阶段中意见领袖的典型行为特征如表3所示。
表3 领袖意见行为特征
阶 段热议话题时间节点行为特征潜伏期告知“723动车”事件的发生2011723?22:53事实陈述,内容不带情感极性成长期追问事故发生原因2011724焦点单一,情绪宣泄蔓延期事故原因分析,各界对事故的态度及反应2011725焦点扩散,争夺话语权爆发期剖析事故发生原因2011726焦点集中,立场坚定衰退期事故后期处理工作(死伤家属赔偿等)2011729焦点开始分化死亡期事故追忆2011731焦点消散,经验总结
根据我们获取的领袖意见的数据发现,在突发事件网络舆情的潜伏期,主要是新闻媒介作为意见领袖,将事件的发生传向民众,告知民众事件的发生,此时意见领袖一般只陈述事件,并不发表意见。
在突发事件网络舆情的成长期,草根意见领袖成为网络舆情扩散和发展的主要构成,网络版主、VIP用户等通过发帖和转文,将事件进一步传播开来,使受众的规模进一步扩大。在传播过程中,意见领袖为了吸引眼球,对事件的描述主观性的加入自己的感情色彩,从而产生更多的网络舆情。
在突发时间网络舆情的蔓延期,此时突发事件已经受到一定程度的关注,而突发事件新的进展提供了新的讨论话题。在这一阶段除了草根意见领袖,一些专家、明星、学者开始加入到意见领袖中,他们有的利用自己的专业知识从不同角度对事件的发生原因、性质、发展进行剖析。
在突发事件网络舆情的爆发期,舆情受到意见领袖的推动下,关注人群不断增多,网络舆情开始偏向一个或少数几个焦点,舆情走向集中化,明朗化。(如723动车事件,最终民众的舆论焦点都落在动车事故的发生原因上。)
在突发事件网络舆情的衰退期和死亡期,意见领袖的言论减少,随着新的突发事件和热点话题进入公众视野,人们的关注点开始分散,同时由于事件开始得到解决和控制,网络关注度开始下降。相关网络舆情减少,突发事件开始淡出公共视野,网民主要以突发事件造成的影响及总结经验教训为关注点,但是,很多突发事件并不会真正从民众的议论中消失,如723温州动车事件,此类事件一旦有新的波动,有可能会重新成为民众热议的话题。
35 政府关注度对舆情演变的影响
根据上图4所展现出的动态,并结合舆情的生命周期阶段,我们将得到的政府方面回应的数据按照舆情的生命周期阶段进行划分,得到的数据如表4所示。表4 政府在舆情生命周期各阶段的回应情况
阶段日期报道量阶段日期报道量潜伏期7230爆发期725-728106成长期723-72424衰退期728-73019蔓延期724-72513死亡期730-825
结合表4和图4我们可以看到政府的回应对舆情演变的影响。在成长期和蔓延期时政府方面的新闻报道量很少,但在723动车舆情发展到爆发期时,政府开始积极响应,新闻报道量较之前倍增,最终使得舆情得以控制开始步入衰退期,进而进入死亡期。
民众参与舆情的频繁度直接影响到政府的响应程度,当民众的参与演变成大规模的群体性事件时,政府就必须做出回应,而且其出面响应的效果会直接影响舆情的下一步发展,处理不当,将会激起舆情进一步高涨。
4 舆情演变过程中的情感性分析
41 基于SVM的网络舆情的情感性分析
本文通过对采集帖子的内容按照前述第三节内容介绍的思路和流程使用SVM支持向量机进行训练和分类,得出民众舆情的情感极性。我们将搜集到的723温州动车追尾事件的数据作为测试数据,对其进行预处理(去重、去与主题不相关、中文的分词处理、文本的特征表示等[8])后,利用SVM进行了分类训练,用前200个数据作为训练数据,选取了13个特征值。使用matlab进行分类的部分程序如下:
最终的结果如表5中所示,训练数据的精度为Accuracy=815%,测试数据的精度为Accuracy=576%,由于网络语言的复杂、多样性,所以要准确预测情感极性很困难,576%的准确度是可以被采纳的。表5 舆情演变各阶段民众的情感极性分析表
阶段情感极性极性个数比例(%)触发事件潜伏期正面10中立6100负面00网民微博报道动车事件成长期正面1303中立151818负面177879动车事件媒体报道蔓延期正面6784中立142353负面316863报道掩埋动车车头事件爆发期正面141522中立281956负面506522政府公布初步调查报告,称获救女孩为生命奇迹等衰退期正面92105中立101053负面196842相关部门慰问伤亡家属,事故后续安排等死亡期正面1952中立82381负面126627政府承诺给民众事故真相
42 影响因素对舆情情感极性的影响
由于723温州动车事件是一起突发性的灾难事件,舆情的总体情感极性是偏负面的,如表5所示,这里选取正面、中立、负面占各阶段帖子数的比例来研究民众的情感极性,为了清楚表示民众的情感性变化,我们绘制了各阶段民众舆情的情感性变化,如图5所示。
图5 各阶段民众舆情的情感性变化
对比分析图4与图5的信息,由图4我们可以看出在整个舆情生命周期里民众的负面情绪占主导,在潜伏期和成长期时,随着媒体新闻量的增加,意见领袖的介入,中立情绪所占比例不断下降,正、负面情绪逐渐上升,情感极性开始显现,负面情绪在成长期、蔓延期时达到至高点,但随着政府的关注度增加(见图5),负面情绪有所降低,在爆发期后期开始走向低谷,而与此同时正面情绪在衰退期时达到最高点,这说明政府的回应起到一定的作用,在一定程度上抑制了舆情负面情绪的发展态势,后期由于政府部门响应积极性降低,负面情绪又有所回升,但伴随着舆情进入死亡期,也就没有进一步发展下去。数据可以显示网民、媒体、政府之间对舆情的关注度是相互影响的,而且在一定程度上促进舆情向前发展。
5 结 论
通过对突发事件网络舆情的研究,可见政府对待舆情的态度非常重要,随着网络舆情的不断发展,其越来越影响政府的对外形象,所以政府应正视舆情,并尽力处理好舆情所引起的事件。根据上述舆情演变规律,政府应对网络舆情时应该采取如下策略:(1)及时响应,在舆情发生后第一时间发布信息,抢占舆论先机,避免负面舆情占据主导;(2)实事求是,事件发生后不封堵信息,说真话,提供真实的情况是舆论引导的关键,这样才能赢得公众的信任;(3)积极引导,网络舆情通常以个人的观念和信仰为基础,以情绪化形式表现,需要通过引导使舆论向有益的、促进社会和谐的方向发展,尤其对意见领袖的言论,更要关注。
本文在总结前人研究的基础上,以723温州动车事件为例说明舆情的演变受到民众、媒介、政府、意见领袖四个方面的影响,并分别对每一方面按照网络舆情的生命周期,分阶段进行了分析,分析过程中采用了情感分析方法,通过判断民众的情感性偏向,希望能够更全面的对突发事件的网络舆情进行研究。在了解各方面对舆情演变的影响后,我们还针对某些方面提出了一些控制和疏导舆情的策略。但是由于本文列举的事件是个典型的突发事件,可能不能全面覆盖现今出现的各种舆情所展现的特点,而且由于语言自身的易变性、复杂性,本文对民众的情感性分类的精度可能不是很高,不能精确表达受众们的情感极性,所以本文的一些结论还需在后续阶段不断补充和修正。
参考文献
[1]刘毅.网络舆情研究概论[M].天津:天津人民出版社,2007:53.
[2]丁菊玲,勒中坚,王根生.我国网络舆情危机预警研究探讨[J].情报杂志,2010,29(10):5-6.
[3]王国华,张剑,毕帅辉.突发事件网络舆情演变中意见领袖研究[J].情报杂志,2011,30(12):1-4.
[4]方付建,王国华,徐晓林.突发事件网络舆情“片面化呈现”的形成机理——基于网民的视角[J].情报杂志,2010,29(4):26-30.
[5]李纲,董琦.Web20环境下企业网络舆情传播过程的研究及实证分析[J].情报科学,2011,29(12):1180-1184.
[6]Chang C C,Lin C J,LIBSVM..A library for support vector machines[OL].2009.11.
[7]Lazarafeld P F,et al.The People s Choice:How the Votes Makes Up His Mind in a Presidential Election[J].New York:Columbia University Press,1948:151.
[8]朱嫣岚,闵锦,周雅倩,等.基于Hownet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20.
[9]许鑫,章成志.互联网舆情分析及应用研究[J].情报科学,2008,26(8):1194-1200.
[10]MQHu and BLiu.Mining and Summarizing Customer Reviews[C].In ACM SIGKDD,2004:168-177.
[11]Bo Pang and Lillian Lee.Opinion mining and sentiment analysis[J].Foundations and Trends in Information Retrieval,2008,2(1-2):1-135.
(本文责任编辑:马 卓)