基于超网络的舆论领袖识别应用研究*
2012-01-02刘怡君
文/马 宁 刘怡君
中国科学院科技政策与管理科学研究所 北京 100190
中国科学院大学 北京 100049
中国科学院自然与社会交叉科学研究中心 北京 100190
1 引言
1.1 网络舆论领袖识别研究的意义
随着互联网技术的发展和普及,网络逐渐成为具有强大社会影响力和舆论动员力的新媒体。以网络为平台,通过新闻、论坛、微博等载体而表现出来的舆论即网络舆情,其具有传播快速、实时互动等特点[1],这为舆论传播带来了极大的便利,可汇聚对社会发展有益的观点建议,并起到舆论监督的作用;但同时也对社会安全构成了不容忽视的威胁,如网络舆论中充斥的反动、暴力、虚假信息内容,众多谣言的散布,攻击诽谤等行为,若引导不力,必然会影响社会稳定[2]。20世纪40年代,美国哥伦比亚大学的拉扎斯菲尔德、贝雷尔森等人首次提出“舆论领袖”,其对舆论的形成和演化具有重要作用。在网络舆论的形成过程中,网络舆论领袖同样发挥着不可忽视的作用。政府对网络舆情进行有效的引导和干预,化解网络舆论危机,识别其中的舆论领袖尤为重要,因此该研究具有很强的现实意义。
1.2 网络舆论领袖识别研究现状
国外对网络舆论领袖的识别研究较少,并集中在以网络营销为目的的寻找网络舆论领袖[3-7];国内对网络舆论领袖识别和引导的研究论述逐渐增多,但主要为描述性的定性研究,明确的操作性定义和测量方法的定量研究较少,且定量研究都集中在网络中网民节点构成的回复关系网络(即社会网络分析)的探讨,所选择的测量指标主要有入度、出度、中心性、平均路径长度变化等[8-10]。运用社会网络分析方法研究网络舆论,虽然可较好地把握网络的组成结构以及其中各网民的直接回复关系,并直观地识别出入度大的网民节点,且一般认为入度值大的节点即舆论领袖,但却忽略了网民与其发布的网络帖和网络帖所表达的主题关键词之间的关系。例如某一网民有时会发布多个帖子,用社会网络可以表示其他网民与该网民之间的回复关系,但却无法表示到底回复的是哪个帖子,也就无法知道到底哪个帖子才是最有影响力的?某些网民总是能第一时间发布或者跟进那些最受关注的主题关键词,如何找到这样的网民及其发布帖子的关键词?综上,目前对网络舆论领袖的识别研究主要考虑的是人与人之间的回复关系,并没有更深层次考虑到所发布帖子内容和关键词的影响力。
目前国内外尚无将超网络(Supernetwork)分析法应用于网络舆论领袖识别研究,并且国内对超网络测度指标的研究也处于空白。鉴于上述,本文拟采用超网络的思想和方法对网络论坛舆论领袖的识别进行更深层次的研究。
2 舆论领袖识别的超网络模型构建
2.1 舆论领袖识别的超网络模型构成要素
网络舆论超网络模型的构成要素包括:舆论主体、帖子内容和关键词。首先,网络舆论的形成和发展离不开网络中参与讨论的网民,网民是网络舆论形成的主体,这是网络舆论超网络模型的基本构成要素之一;其次,如果所有网民对于某一热点事件仅仅是关注,并不发表任何言论,网络舆论也无法形成,所以网民所发布的任何形式的讨论帖就成为网络舆论超网络模型的另一构成要素;最后,网民发布任何帖子时是带有一定的观点倾向的,这些观点倾向可通过网民发布帖子提取出的主题关键词来确定,这些主题关键词即为网络舆论超网络模型的另一构成要素。
2.2 舆论领袖识别的超网络模型子网络
在确定网络舆论超网络模型的构成要素后,便可构建网络舆论超网络模型子网络,包括社交子网、话题子网和观点子网。
(1)社交子网A(Social Network):以网络舆论中参与讨论的舆论主体即网民为节点,网民之间的回复关系为边,且边是有向的;
(2)话题子网T(Topic Network):以网络舆论中发布的帖子内容为节点,不同的帖子内容代表不同的观点,若不同帖子内容包含相同的关键词,就认为这两条帖子之间存在一条边;
(3)观点子网K(Keyword Network):以所有话题提取出的主题关键词为节点,并根据关键词不同的观点态度倾向分类(正面、中立、负面),若不同关键词属于同一观点倾向,就认为这两个关键词之间存在一条边。
2.3 舆论领袖识别的超网络模型层间映射关系
在网络舆论超网络模型各要素之间,存在着各种类型的关系,其中既包括同质要素之间的不同类型关系(即层内关系),也包括异质要素之间的各种映射关系。首先社交子网到话题子网的映射表示某网民在网络论坛中发布了哪些帖子,这其中即有可能同一人发布多个帖子,也有可能多个人发布同一个帖子(如转帖);话题子网到观点子网的映射表示为某一帖子所包含的所有关键词,一般来说这些关键词的观点倾向是一致的;社交子网到观点子网的映射表示某网民参与讨论的观点倾向,是隐性的映射关系(图1)。
图1 网络舆论超网络模型示意图
网络舆论超网络模型构建完成,并可用G=(V,H)表示,其中V表示超网络节点的集合,即V={Va,Vt,Vk|Vi∩Vj≠ ∅ };H表示超边,任何一个超边由相连的3个不同质节点构成,可形成一个“三角形”,即H∈{(va∈Va,vt∈Vt,vk∈Vk)}。
3 舆论领袖识别的超网络测度指标
为更好地阐述本研究用于识别舆论领袖的超网络指标,首先建立一个具体的网络舆论超网络模型,然后在该超网络模型中实际应用计算超网络指标。建立如下超网络,在社交子网有A1,A2,A33位网民,共在话题子网发布了T1,T2,T3,T44条帖子,所有帖子在观点子网包含K1,K2,K3,K4,K55个关键词,虚线表示层内关系,实线表示层间映射关系(图2(a));将任意一组相互联系的舆论主体、帖子内容和关键词节点转化为“三角形”(即超边)表示,则有A1,T1,K1可组成一个三角形、A1,T2,K3可组成一个三角形等,虚线表示层间关系(图2(b));将层内关系去掉后,简化的超网络示意图如图2(c)所示;将超网络中任意超边转化为“节点”表示,如A1,T2,K3转化为节点 H1表示,A1,T2,K2转化为节点 H2表示等,再将超网络中任意节点转化为“边”表示,则节点H1和节点H2之间通过边A1和T2相连(图2(d))。
3.1 集聚系数
超网络中集聚系数(Clustering coefficient,C)定义为
其中,1个超三角形指由3个不同的顶点和3个不同的超边构成的序列,即形如Ai,Tj,Kk的 3个不同顶点和 Hp,Hq,Hr的3 个不同超边构成的序列,且3个顶点相互相邻;2路指长度为2的路,是由3个不同的顶点和2个不同的超边构成的序列,即形如 Ai,Hp,Tj,Hq,Kk的序列(在路中所有的顶点和超边都不同)[11]。
网络舆论超网络集聚系数值越大意味着超网络中越可能存在舆论领袖(重要主题帖或重点主题关键词)。例如在图2(d)中超三角形的个数为2,分别由 A1,H1,T2,H2,K2,H3和 A1,H2,K2,H3,T1,H4组成;从图2(c)中可以看出2 路的个数为18,H1和H2之间为2个,H1和H3之间为4个,H1和H4之间为4个,H2和H3之间为2个,H2和H4之间为4个,H3和H4之间为2个,其中H1和H2之间的2路分别由 K3,H1,T2,H2,K2和 K3,H1,A1,H2,K2组成。所以图2中简单超网络的集聚系数为C=(6×2)/18=2/3。
3.2 节点超度
图2 (a)网络舆论超网络简单模型示意图
图2 (b)以三角形表示的超网络模型示意图
图2 (c)去掉层内关系的超网络模型示意图
图2 (d)将超边抽象为节点的超网络示意图
对应于单层网络中节点度指标,在超网络中有“节点超度k”指标(vertex hyperdegree),某个节点的节点超度值定义为该节点参与组成的超边数[12]。由于定义任何一个超边由相连的3个不同质节点构成,设各类节点的节点超度平均值分别为 ca,ct,ck,各类节点个数分别为 na,nt,nk,则有 naca=ntct=nkck=m,其中 m表示超网络中的所有超边数。
在网络舆论超网络模型中节点超度值越大的舆论主体(也可能是帖子内容或关键词)的影响力越大。例如在图2(c)中A1共参与组成4个超边,所以A1的节点超度k=4,相应地,A2和A3的节点超度k=1。
3.3 超边重叠度
为定义超边重叠度(或称超边密度,hyperedge density,Dh),首先定义某个节点的连接数z值,即该节点直接相连的其他节点数,既包括同质节点,也包括异质节点。对于给定的任意节点,则相应存在最大连接数zmax和最小连接数zmin。在超网络中超边重叠度定义为[13]
如果超边完全无重叠,则z为最大连接数zmax=2k,此时Dh(k)=0;若超边完全重叠,则z为最小连接数zmin,此时Dh(k)=1。对于任意给定的k,对应可得zmin值,当n(n-1) 超网络中节点间距离(vertex-vertex distance,d)定义为连接任意两个节点的最短路径上的超边数,即两个节点相连所通过的最少超边数。 在超网络模型中,某节点到达其它所有节点的平均距离越小,该节点的影响力越大。例如在图2(c)中K3和K1节点通过两个超边E1和E4连接,则d=2。 识别网络舆论领袖,首先应选取相应的网络论坛,从中提取出某事件的话题参与人的相关讨论记录,对原始数据进行分析,构建超网络模型;然后计算该超网络的集聚系数值,若集聚系数值偏大,则证明在该超网络模型中可能存在舆论领袖;确定存在舆论领袖后,可分别以舆论主体、帖子内容或者主题关键词为研究对象,分别计算其超网络测度指标:节点超度、超边重叠度和平均最短距离,则可识别出网络舆论中的舆论领袖、重要网络帖或重要关键词。 以舆论主体的计算为例,通过计算所有舆论主体的节点超度,可以反映该舆论主体的活跃程度,节点超度值越高,说明该舆论主体或发表帖子数多,或发表帖子包含的受关注主题关键词多,他们是网络舆论中的“活跃人物”;再计算这些“活跃人物”的超边重叠度,超边重叠度越高,说明其发布话题越具有凝聚力,符合舆论领袖的特征,识别出网络舆论中高凝聚力的活跃分子,即网络舆论中的“焦点人物”;最后计算这些“焦点人物”到达其他节点的平均最短距离,平均最短距离越小,说明其影响范围越大,最终确定出网络舆论中的“舆论领袖”。 同样,对帖子内容和关键词的计算可得出该超网络中的重要网络帖或重要关键词,该结果即可作为对识别出的舆论领袖的补充校正,也可作为深层次挖掘出潜在的舆论领袖的重要依据。需要指出,随着研究的深入,可以定义更多的识别舆论领袖的超网络测度指标,使舆论领袖的识别结果更准确和全面(图3)。 2010年12月25日,浙江乐清蒲岐镇寨桥村村主任钱云会被工程车碾压致死,交警勘查判断为一起普通交通肇事案件。钱云会生前因土地纠纷问题曾多次带领村民上访,因此有村民传言这是一起由当地政府精心策划的故意杀人事件,于是引起网民的广泛关注和讨论。 依据方正智思舆情信息监测平台,从凤凰论坛、天涯社区、人民网强国论坛、新浪、网易等收集关于“钱云会事件”的有效网民帖1645条,话题参与者共318人。整个事件的发展存在两个舆论热潮,集中在2010.12.31和2011.01.02两日(图4)。 将收集到的“钱云会事件”的所有舆论数据进行基础分析,提取出超网络的基本构成要素:舆论主体、帖子内容和主题关键词。根据构成要素之间的不同关系构建三层子网络,其中社交子网共包含318个舆论主体,话题子网共包含461条帖子内容,观点子网共包含提取出的30个主题关键词(表1)。 图3 基于超网络的网络舆论领袖识别机制 图4 “钱云会事件”帖子数量趋势图 社交子网、话题子网、观点子网节点是同质的,而整个超网络的节点则是异质的;边的关系有回复关系、包含关系、发布关系等,层内与层间均有边连接;同一个话题参与人可能发布多个帖子,每个帖子又可能包含不同的关键词,不同的关键词又代表不同的观点倾向,因此超网络模型图是错综复杂的。 本案例示意图如图5所示,任意一个舆论主体与其发帖内容和主题关键词可构成一个三角形,即超边;图6将其中名为“弹指逼挥123”和“testant”的舆论主体及其对应发帖内容、帖子内容提取关键词在超网络图中做以简要表示。 以构建完成的“钱云会事件”超网络模型为基础,并以舆论主体为研究对象,首先计算集聚系数值为0.76,说明在该事件中存在舆论领袖,然后计算各个舆论主体的节点超度值。在组成该事件社交子网的318位舆论主体中,绝大多数的节点超度值小于5,表2中列举了节点超度值较大的前20位舆论主体,即该事件中的活跃人物。以“周禄宝”为例,共发布15条帖子内容,其中不同帖又包含不同关键词,致使节点超度值高达27,对该事件舆论形成作用较大,是事件的中的活跃分子。然后计算这些活跃分子的超边重叠度,从20位活跃分子中识别出具有较高凝聚力的舆论主体,表2中列举了超边重叠度较大的前10位舆论主体,即该事件中的焦点人物。以“王雪梅”为例,超边重叠度较高,共发布11条帖子内容,且所发布帖子内容的主题关键词基本一致,得到了其他多数舆论主体的认同和支持,促使该事件舆论出现一边倒的极化现象。最后计算所有焦点人物到达其他舆论主体的平均最短距离,识别出“钱云会事件”中的5位重要舆论领袖,其具体发帖内容和观点倾向如表3所示。 在“钱云会事件”网络舆论形成过程中,5位舆论领袖左右着热点的传播,事件传播过程中的两个舆论热潮分别由舆论领袖“不给力”和“刘逸明”引起,发帖时间均为舆论热潮的前一天,对舆论的发展起到了极大的推动作用(图4);5位舆论领袖中仅“不给力”发布客观帖,其支持率约为30%,另外舆论领袖所发帖子内容均带有明显的负面情绪,支持率均在80%左右,所以整个事件的话题参与者的舆论呈现极端化倾向,并且这种极端化与官方所发布的信息几乎形成对峙局面。无论政府以多么详实的证据来佐证官方的调查结果,网民依然持怀疑和反对态度,出现网络舆论非理性的共鸣;另外舆论领袖stander发布的多条网络帖中包含对国家和政府负面评论的过激语言和敏感词汇,很好地利用了网民的选择性接触心理,对其散布的谣言进行了“正义化”包装,将政治谣言提升到“为民请愿”的道德高度,赋予负面言论以正面价值[14],绝大多数网民在回帖中表达了对作者的支持和崇拜。 表1 “钱云会事件”超网络各个子网络层 图5 “钱云会事件”超网络示意图(A) 图6 “钱云会事件”超网络示意图(B) 各位舆论领袖都发布了多条网络帖,通过对话题子网和观点子网的计算,找到了各个舆论领袖的最具影响力网络帖和主导观点倾向,如表3所示。 “钱云会事件”本身的交通事故对社会的危害性并不严重,但由于谣言在网络和坊间的大肆流传,造成了社会性恐慌,对当地政府和警方也造成了一定负面影响。当地政府在应对该事件网络舆论时态度积极,为政府危机管理提供了新的思路和借鉴手法,如满足公众的信息需求,顺应民意召开新闻发布会,重视第三方力量,成立公民调查团化解官民互不信任困局,提高政府公信力;正确运用新媒体工具,注册微博“平安乐清”与网民沟通;但在一些舆论应对技巧和网络舆情管理上还存在一些不足,未能把握事件处理的最佳时机,未能在第一时间对谣言进行澄清和纠正;以及通过微博“平安乐清”与网民沟通的过程中,仅发布3条信息,折射出政府民意互动意识和能力的缺失。 表2 “钱云会事件”舆论领袖识别结果 表3 舆论领袖及其发帖内容分析 本研究认为,有效的网络舆论干预首先要密切关注网络舆情,建立完善的预警机制,可对论坛、博客、微博等进行全天监控,及时发现问题,例如“钱云会事件”的讨论帖主要发布在凤凰论坛(77%);其次对舆情信息进行研判后要及时发布辟谣消息,与传统观点的“黄金24小时”不同,网络舆论传播快速的特点要求尽快发布权威消息,如黄金4小时,否则流言和谣言就会充斥网络,甚至会引发更大规模的群体性事件;当网络谣言一旦形成,可对负面舆论领袖发布的重要网络帖进行删帖、沉帖操作,例如在本案例中将负面舆论领袖及其发布的影响力大的网络帖去除,将减少社交子网70.5%的舆论主体和72.1%的回复关系,对应的该事件超网络模型将减少60.9%的超边。 本文将超网络分析法运用到网络舆论领袖的识别研究中,首先在对网络舆论传播构成分析的基础上,介绍了网络舆论超网络模型的构成要素:舆论主体、话题内容和观点倾向,在此基础上分别针对以上3种要素建立3层子网络,并根据三者间的映射关系将它们集成为一个完整的网络舆论超网络模型;然后提出了用以识别网络舆论领袖的超网络测度指标,包括节点超度、超边重叠度、集聚系数、平均最短距离,详细介绍了各个测度指标的计算以及用于识别舆论领袖的机制;最后通过实例应用,证明了超网络分析法在网络舆论领袖识别研究中的可靠性和创新性。 1 吴绍忠,李淑华.互联网络舆情预警机制研究.中国人民公安大学学报(自然科学版),2008,(3):38-42. 2 罗引.互联网舆情发现与观点挖掘技术研究.电子科技大学(硕士学位论文),2010. 3 O’Cass A,FenechT.Web retailing adoption:exploring the nature of internet users Web retailing behavior.Journal of Retailing and Consumer Services,2003,10(2):81-94. 4 Tsang A S L,Zhou N.Newsgroup participants as opinion leaders and seekers in online and offline communication environments.Journal of Business Research,2005,58(9):1186-1193. 5 Goldsmith R E,Horowitz D.Measuring motivations for online opinion seeking.Journal of Interactive Advertising,2006,6(2):3-14. 6 Tejavibulya P,Eiamkanchanalai S.The Impacts of Opinion Leaders towards Purchase Decision Engineering under Different Types of Product Involvement.Systems Engineering Procedia,2011,2:12-22. 7 Cho Y,Hwang J,Lee D.Identification of effective opinion leaders in the diffusion of technological innovation:Asocial network approach.Technological Forecasting&Social Change,2012,79(1):97-106. 8 李卓卓,丁子涵.基于社会网络分析的网络舆论领袖发掘——以大学生就业舆情为例.情报杂志,2011,30(11):67-71. 9 余重远,李珊,赵文等.基于SNA的网络舆论领袖确定方法研究.科技信息,2011(12):36-37,39. 10 高俊波,王晓峰.一种新的主题影响力模型研究.计算机工程与应用,2007,43(25):182-185. 11 Ernesto E,Rodriguez-Velázquez J A.Subgraph centrality and clustering in complex hyper-networks.Physica A:Statistical Mechanics and its Applications,2006,364:581-594. 12 Ghoshal G,Zlatic V,Caldarelli G et al.Random hypergraphs and their applications.Physical Review E,2009,79(6):066118. 13 Zlatić V,Ghoshal G,Caldarelli G.Hypergraph topological quantities for tagged social network.Physical Review E,2009,80(3):036118. 14 施爱东.谣言的鸡蛋情绪——钱云会案的造谣、传谣与辟谣.民俗研究,2012(2):105-125.3.4 节点间距离
4 超网络中舆论领袖识别机制
5 研究实例——“钱云会事件”
5.1 事件背景
5.2 “钱云会事件”超网络模型构建
5.3 舆论领袖识别的结果分析
5.4 小结
6 结束语