单、多社区通用的网络舆论突现计算模型
2013-11-26吴渝李强刘洪涛
吴渝,李强,刘洪涛
(重庆邮电大学网络智能研究所,重庆400065)
目前比较著名的舆论演化模型有:基于无界信任的 Sznajd 模型[1]、投票者模型[2]、Galam 多数决定模型[3-4]、Hegselmann-Krause 模型[5]和基于有界信任的Deffuant模型[6]等.其中,Deffuant模型采用信任阈值来控制个体间的交互,能够较为真实地反映现实社会中人们的交互情况,因此受到舆论研究者的青睐.刘常昱等[7]在Deffuant模型的基础上引入个体观点的不确定性以及个体间的信任因子,仿真实验表明,这些因素会极大地影响舆论的最终形态及其形成速度.姚远等[8]对刘常昱等提出的模型中的不对称影响函数进行优化,构建了一种基于小世界网络的网络舆论突现模型,仿真实验表明,改进后的模型能够展现更为丰富的舆论形态.司夏萌等[9]将Deffuant模型应用到多个社区上,仿真发现,除非社团间存在相反的观点领袖,具有社团结构的Deffuant模型给出的最终舆论形态取决于交互阈值,而与社团间的连通性无关.虽然上述改进的Deffuant模型能够在一定程度上模拟真实环境下网络舆论产生的过程,但受特定社区结构的限制而不能在多个社区中通用,且存在个体交互规则复杂、运算量大、考虑因素局限或构建的网络结构与实际不符等缺陷.
此外,舆论是由无数个体的态度聚集在一起形成的一个动态、整体的行为.从这个角度看,舆论亦属于突现计算的研究范畴.突现计算[10]是多个体系统在处理复杂问题时所展现出来的一种思路逻辑,它通过无数个简单行为过程的相互合作来形成更加复杂的行为过程.姚远等[8]从突现的角度对改进的Deffuant模型所描述的舆论行为进行了研究.但其仍然存在问题,即使用了复杂的不对称影响函数,使得算法较复杂;模型仿真得到的各种舆论形态之间的差别不够明显,影响对最终舆论趋势的判断;舆论产生突现的时间较长,模型时间复杂度较大;没有考虑个体的个性特征,不能解释群体中具有某些特性的个体对最终舆论结果的影响.
针对上述问题,结合突现计算的思想,通过构建比较符合实际的随机网络,本文在Deffuant模型的基础上引入了意见领袖、易变个体和网民记忆3个因素,建立了单、多社区通用的网络舆论突现计算模型,并仿真分析了这些改进因素对网络舆论演化过程以及最终舆论趋势的影响,以便为网络舆论研究提供新的思路.
1 相关算法和模型
网络舆论演化与突现的2个要素是其赖以传播的网络和个体观点的演化规则(即舆论演化模型).本文在基于随机网络的社区和Deffuant模型的基础上对网络舆论的演化过程进行了研究.
1.1 基于随机网络的社区构建算法
Erdös和Rényi提出了随机网络的构建算法.该算法规定[11]:初始设定N个孤立的节点,然后不断地在节点之间建立连接关系;每次随机加入1条边,每条边以同样的概率条边中随机选取.
在随机网络的基础上,社区构建的方法为[9]:单社区情况下,任意节点之间以概率 Pin(0<Pin<0.1)建立连接;在多社区构建上,社区内部任意节点之间以内部连通概率 Pin(0<Pin<0.1)建立连接,社区之间任意节点之间以外部连通概率Pout(0<Pout<Pin)建立连接.为了说明问题,这里将2个社区作为多社区进行说明.在此社区构建方法中,每个节点以等同的概率同其他节点建立连接.然而,在实际网络环境中,受兴趣、爱好和个人魅力的影响,不同网民所具有的连接数是不同的.
1.2 基于有限信任的Deffuant模型
在现实社会中,人们对某一问题的看法存在某种程度的肯定或否定,并且人们偏向于同自己观点相近的人进行交流.这种特点使Deffuant模型[5]更加符合真实社会环境中舆论的传播过程.该模型将个体的观点值定义为[0,1]内的某一个随机值,每次随机挑选2个个体i和j进行交互.在t时刻,如果个体间观点x差的绝对值小于等于某一阈值φ(即|xi-xj|≤φ)则进行交互,否则不交互.在t+1时刻,个体观点的变化如式(1):
式中:φ表示个体间可进行交互的最大观点差值,ω表示个体对交互者的信任程度.
2 随机网络构造算法的改进
网民之间的关系网络是根据网民的特性及喜好建立,即考虑网民至少会与一个有较大影响力的网民建立连接.真实网络社区特殊个体的存在,如意见领袖,对网民关系网络的形成有很大影响.分析已有的随机网络构建算法,发现其并未考虑上述因素,即目前的随机网络以相等的概率建立节点之间的连接,并未考虑特殊节点对网络构建的影响.因此,这些算法下构建的随机网络会出现一些孤立的节点和一个节点只与其他社区存在边而与本社区不存在边的情况.这导致构建的网络结构与真实环境下网民关系网不符.
针对上述问题,本文从真实网络的结构特点出发,首先对随机网络模型进行改进,使其更加符合真实情况.
构建的网络结构用表示,G=<V,E>,其中V表示图G 的顶点,E表示边,法 1 和算法 2 分别给出了单社区和多社区的随机网络构建算法.
算法1 单社区随机网络构建算法.
输入:N、Pin;
输出:G;
步骤:
1)任意节点之间以概率Pin建立连接;
2)意见领袖节点随机与n1个节点建立连接;
3)通过加边的方式,保证每一个节点都至少与一个度数为n2的节点有连接.
结束.
算法2 多社区随机网络构建算法.
输入:N、Pin、Pout;
输出:G;
步骤:
1)非意见领袖节点以概率Pin与内部节点建立连接,以概率Pout与外部节点建立连接;
2)意见领袖节点随机与n1个内部节点建立连接,与n3个外部节点建立连接;
3)通过加边的方式,保证每一个节点都至少与一个度数为n2的内部节点有边.
结束.
3 单、多社区网络舆论突现计算模型
3.1 现有问题和本文思路
网民都有各自的个性特点,在交互过程中其观点往往会受以前观点的影响.通过对当前各种改进的Deffuant模型的分析,发现存在以下问题:1)构建的网民关系网络结构不合理;2)没有考虑网民的特性;3)忽略了个体记忆对舆论演化过程的影响;4)忽略了舆论网络传播的跨社区性.
基于不对称人际影响的舆论模型[7]、基于小世界网络的舆论模型[8]、具有社团结构的有界信任舆论涌现模型[9]中,存在个体交互规则复杂,时间复杂度大,不能在多个社区通用的缺陷.
针对上述问题,本文在Deffuant模型的基础上,从突现计算的角度出发,引入意见领袖、易变个体和个体记忆3个因素,合理修改了Deffuant模型的交互规则,来建立更加符合现实的交互规则的网络舆论模型,使其同时适用于单社区和多社区的环境.
3.2 单、多社区通用的网络舆论突现计算模型
建模之前,先给出一些合理的假设.本文在沿用姚远等模型假设[8]的基础上,再做进一步假设.由于真实的环境中某段时间内网络结构的变化是很微弱的,因此网络结构的变化可以忽略.故本文假设网络结构在舆论传播的过程中不发生变化.
本文模型将每个网民抽象成为一个个体,用S=<A,P,f>表示N个个体组成的系统.其中,
式中:vi表示个体Ai的观点值,si表示Ai对自己观点的坚定程度;mi表示个体Ai的记忆值;f为个体i和j之间观点值的交互函数;P={φ|0<φ<1}为系统的参数集合,φ为个体间进行交互的阈值,即个体间进行交互的最大观点差值.在本文中,每个个体只与其观点差值在交互阈值内的个体进行交互,否则不交互.
假设个体 Ai和Aj在t时刻的观点值分别为vi(t)、vj(t),对自己观点的坚定程度值分别为 si、sj,个体当前的记忆值分别为mi(t)、mj(t),则根据交互个体是否为意见领袖和易变个体,t+1时刻Ai与Aj的观点交互规则由式(2)~(6)控制.
若Ai和Aj,一个为意见领袖,另一个为易变个体时(这里假定Ai为意见领袖),则t+1时刻Ai与Aj的观点值分别为:
除上述情况外,t+1时刻个体间的交互规则为:
式中:dij为Ai和Aj的观点差值:
当交互双方一个为意见领袖而另一个为易变个体时,易变个体的观点值修改为意见领袖的观点值,此时意见领袖的观点值不变.因为意见领袖有很强的说服力,而易变个体几乎没有主见,会完全信任意见领袖;否则,当个体间的观点差值大于φ时,个体间不进行交互,此时个体观点值和记忆值都不变,交互规则如式(4)所示;当个体间的观点差值小于等于φ时,个体进行交互,交互规则如式(5)所示.
此外,个体的记忆按照式(7)变化:
从式(7)可以看出,越早的观点对当前记忆的影响越小,从而对当前观点的影响也越小.当t很大时,初始的观点对当前记忆和观点的影响几乎为0,这与现实情况相符.
3.3 基于单、多社区通用的网络舆论模型的演化算法描述
单社区下的网络舆论演化模型以算法3给出.初始时刻,意见领袖观点、易变个体观点、其他个体观点的坚定程度分别为[0.8,1]、[0,0.2]和(0.2,0.8)的随机值.在算法3中,初始化时个体容量为N,个体间的交互次数为C,个体中意见领袖的比例为lp,个体中易变个体的比例为vp,个体间的交互阈值为φ.首先根据3.2节算法1构建随机网络,根据个体对事件的初始认识,随机给个体初始观点赋值,然后个体之间按照既定的规则进行交互.
算法3 单社区下网络舆论模型演化算法.
输入:N,C,lp,vp,φ;
输出:C,v;
步骤:
1)根据输入初始化模型参数以及初始时刻所有个体的观点值、坚定值和记忆值;
2)对于个体Ai,随机选择与其有边的个体Aj;
3)判断2个体是否分别为意见领袖和易变个体,是则根据式(2)~(3)计算个体进行交互后的vi(t+1)、mi(t+1)、vj(t+1)、mj(t+1),执行 6);
4)根据式(6)计算dij的值,确定其观点差异程度;
5)根据式(4)~(5)计算个体进行交互后的vi(t+1)、mi(t+1)、vj(t+1)、mj(t+1);
6)重复2)~5)直到遍历所有个体;
7)重复2)~6)直到满足外部终止条件.
结束.
在多社区情况下,这里以2个社区为例.初始化时,2个社区个体容量分别为N1、N2,个体间交互次数为C,个体中意见领袖的比例分别为lp1、lp2,个体中易变个体的比例分别为vp1、vp2,个体间的交互阈值为φ.模型首先根据算法2构建随机网络,然后根据个体对事件的初始认识,随机给个体初始意见赋值,最后个体之间按照既定的规则进行交互.因存在多社区,考虑社区的非等同性,这里需要对2个社区的个体数目、意见领袖的比例和易变个体的比例分别输入,然后对2个社区分别初始化.除输入与算法3不同外,其他步骤与算法3相同,这里不再重复.
4 模型仿真及对比分析
为了说明随机网络改进算法以及单、多社区通用的舆论模型的合理性和有效性,首先使用网络分析工具Pajek进行网络构建,并与司夏萌等人多社区随机网络构建模型进行对比;然后在MATLAB 2010b平台下,从单社区和多社区2个角度,将本文模型所揭示的舆论演化过程同基于不对称人际影响的舆论模型[7]、基于小世界网络的舆论模型[8]和具有社团结构的有界信任舆论涌现模型模型[9]所揭示的舆论演化过程进行仿真对比分析.
4.1 随机网络模型对比分析
分别采用本文算法1和司夏萌等[9]的方法构建2个社区的随机网络,结果如图1所示.图1中,Pin为 0.02,Pout为 0.001 2,图 1(a)中节点 1~10 与51~60为意见领袖.从图1可以很明显看出本文方法的结果更符合真实网络社区结构.
图1 社区构建结果Fig.1 Results of community construction
4.2 单社区下本文模型仿真结果及对比分析
初始状态下,个体观点值v和个体观点坚定性s均匀随机分布在[0,1]内.设定个体之间交互次数C=400.使用MATLAB对网络舆论的形成过程进行仿真.
表1 单社区下参数设置Table 1 Parameter setting of single community
在表1参数设置下,本文模型所揭示的舆论演化过程如图2所示,其中图2中的标号同表1中的序号相对应.由图2(a)、(b)、(c)可看出,在意见领袖和交互阈值相同的情况下,易变个体越多,舆论的形成速度越慢.这主要是由于易变个体观点具有易变性,时而支持,时而反对,导致与其交互的个体的观点值也随之上下跳动,使得舆论的形成速度变慢.
图2 单社区下本文模型舆论演化过程Fig.2 Evolution of public opinion of the present model within single community
图2(a)、(d)、(e)则表明,在易变个体和阈值相同的情况下,意见领袖越多,群体需要越多的交互次数才可以形成比较稳定的舆论.
从图2(a)、(e)、(f)的对比可以看出,在意见领袖和易变个体相同的情况下,阈值越小形成的舆论数目越多.因为阈值越小,在阈值范围内的个体会形成小的群体,他们只进行内部交互,从而每个小群体都会形成1种舆论,进而整体上形成较多的舆论.
图2(h)、(i)、(j)是极值情况下的仿真结果,从图中不难看出其结果仍然同上述分析一致.图2(h)是群体中不存在意见领袖和易变个体的情况下的仿真结果,从图中可以看出其舆论在极短的时间内形成;图2(i)、(j)分别是群体中全部为易变个体和意见领袖的情况下的仿真结果,可以看出在这些情况下舆论的形成速度非常慢.尤其是图2(i),易变个体对自身观点的不确定性,导致整体的观点值都飘忽不定、上下震荡,极不易形成稳定的舆论.
由于基于小世界网络的舆论模型[8]是不对称人际影响的舆论模型[7]的改进模型.因此,在仿真结果上,本文只与基于小世界网络的舆论模型[8]进行了对比分析,以说明本文模型的改进效果.图3给出了基于小世界网络的舆论模型的实验仿真结果.
图3 基于小世界网络的模型舆论演化过程Fig.3 Evolution of public opinion based on the small-world network
结合图2和图3,通过本文模型与基于小世界网络的舆论模型[8]和基于不对称人际影响的舆论模型[7]的对比分析,可得出如下结论:
1)基于小世界网络的舆论模型[8]和基于不对称人际影响的舆论模型[7]中都需要计算比较复杂的不对称影响函数,而本文中则不需计算此函数,故本文时间复杂度较低.
2)本文模型在一组参数下可以仿真出多种舆论形态,而基于不对称人际影响的舆论模型[7]在一组参数下只能仿真出1种舆论形态;基于小世界网络的舆论模型[8]在一组参数下也可产生多种舆论形态,但其不能分辨相近的舆论是否为同一舆论,而本文模型可以.
3)从图3可看出,基于小世界网络的模型中舆论大致在1 000 s时形成.而本文模型在200 s左右便可形成比较稳定的舆论.这是由于个体的观点受到记忆的影响,因此本文模型时间复杂度更小且更符合现实情况.
4)基于小世界网络的舆论模型[8]只能对舆论的形成过程及结果进行展示,不能说明群体中意见领袖和易变个体的数目对舆论形成的影响,也不能明显地展示阈值大小对舆论形成产生的影响;而从本文模型中则可清晰地看出这些因素对舆论趋势的影响,这对于舆论的监控具有重要的意义.在舆论的监控过程中,可以通过调节意见领袖和易变个体的数目对舆论进行引导.
4.3 多社区下本文模型仿真结果及对比分析
个体观点值v和个体观点坚定性值s初始均匀随机分布在[0,1]内,交互次数C=4 000.为了与具有社团结构的有界信任舆论涌现模型[9]进行对比,这里设定3组参数进行仿真实验.其中参数组1设定阈值为 0.5,社团耦合度为 0.06;参数组 2 设定阈值为 0.2,社团耦合度为0.06;参数组3设定阈值为0.5,社团耦合度为0.000 03.仿真结果分别对应图4~6.具有社团结构的有界信任舆论涌现模型[9]在第1组参数和第2组参数下的仿真结果如图7和图8.
图4 参数组1下本文模型在多社区中舆论演化过程Fig.4 Evolution of public opinion of the present model in multi-communities with the 1st group of parameters
图5 参数组2下本文模型在多社区中舆论演化过程Fig.5 Evolution of public opinion of the present model in multi-communities with the 2nd group of parameters
图6 参数组3下本文模型在多社区中舆论演化过程Fig.6 Evolution of public opinion of the present model in multi-communities with the 3rd group of parameters
图7 参数组1下具有社团结构多社区涌现模型舆论演化过程Fig.7 Public opinion of emergent model with community structure in multi-commnuities with the 1st group of parameters
图8 参数组2下具有社团结构多社区涌现模型舆论演化过程Fig.8 Evolution of public opinion of emergent model with community structure in multi-commnuities with the 2nd group of parameters
图4~6和图7~8的对比表明,与具有社团结构的有界信任舆论涌现模型[9]相比,本文模型能够展现更加丰富的舆论形态.
图4(a)中舆论的突现时间大约在2 000 s左右,而图7(a)中舆论突现的时间大约在2 500 s左右.这说明本文模型舆论形成的速度更快,时间复杂度更低.
图4(a)图与图6对比说明了社区耦合度对舆论的影响.图6中2个社区形成2种不同的舆论趋势,但这2种舆论的差值在阈值的范围内.这主要是因为社区耦合度太小,导致了社区之间的联系几乎为零,从而使得2个社区没有形成统一的观点.这与司夏萌得出的社团连通性差时社团间观点对立,社团连通性好时社团间观点统一的结论大致相符.
图4(a)与图7(b)对比说明了意见领袖对舆论的影响.这2个图都设有意见领袖,但是最终舆论走向却不同.从图7(b)可明显看出,社区整体态度完全由意见领袖所决定,这与实际情况不符,因为意见领袖也会受到社区内其他个体的影响,不可能对其他个体观点无动于衷.而本文模型中,舆论的形成不完全受制于意见领袖,而是由整个群体所决定.
4.4 真实数据下本文模型仿真结果
为说明本文模型的实用性,本文在真实数据下将本文模型的舆论演化过程和实际舆论的演化过程进行了对比分析.由于现实中网络群体存在着异样性,即具有相同喜好的人会形成一个社区,具有不同喜好的人会分布于不同的社区.因此对网络舆论事件的研究就必须要考虑该因素,即在进行舆论研究之前就必须先对参与者进行社区划分.本文从该角度对本文提出的单、多社区通用的网络舆论突现计算模型进行验证.因真实数据无法采集单社区数据,本文以2011年3月11日“日本地震事件”为例进行说明.步骤如下:1)运用爬虫程序抓取天涯论坛所有帖子及回复信息,建立带权重的关系网络;2)运用秦晓等提出的社区划分算法[12]对天涯论坛的所有网民进行社区划分;3)使用PageRank算法[13],获取每个社区的意见领袖;4)提取2011年3月11日至2011年12月31日所有有关日本地震的帖子及回复信息;5)提取所有参与该事件的网民关系网络;6)人工分析每个网民发表的信息,辨别易变个体、观点值及每个网民的观点坚定程度值.
将3月11日的相关数据作为初始数据,对本文模型下舆论的演化过程进行仿真,并与真实结果进行对比.
2011年3月11日至2011年年底网民共发帖301条,11日当天共发帖47条,参与讨论15 727人次,参与者大致被分为2个社区.11日当天,92.5%的网民对日本地震事件感到兴奋,4.3%的网民感到同情,3.2%的网民感到与自己无关.在观点交换的过程中,网民对同情者进行了严厉的批评,导致越来越少的人敢于表现同情,逐渐形成一种对日本地震感到兴奋的舆论.
用本文模型进行仿真,用个体观点值0表示绝对同情,1表示绝对兴奋,中间值表示趋于同情与兴奋之间的某一感情,结果如图9所示.仿真结果表明,初始时刻多数网民对日本地震话题持兴奋感情,到500 s时,观点已经基本稳定,网民整体趋于兴奋感情,少数网民仍旧感到同情.
图9 日本地震舆论传播仿真结果Fig.9 Simulation result of the public opinion about earthquake in Japan
上述分析仿真对比说明,本文建立的模型能够重现多社区网络舆论演化过程,同时验证了本文模型的正确性和可用性.
由于基于小世界网络的舆论模型[8]没有考虑群体的异样性,因此在该事件中并未与其进行对比分析.具有社团结构的有界信任舆论涌现模型[9]网络舆论形成的结果完全由意见领袖所决定.因此,在该事件中该模型会形成极化的舆论形态,即要么绝对兴奋,要么绝对同情,其结果与事实不符.而本文算法简单,模型仿真速度更快,性能更好,且仿真结果较具有社团结构的有界信任舆论涌现模型[9]更合理.
5 结束语
本文给出了较符合现实的随机网络模型构建算法,并提出了单、多社区通用的网络舆论模型.仿真数据下的实验结果表明,本文构建的随机网络结果更符合现实,算法时间复杂度较小,仿真结果更加丰富,能够重现网络事件的传播过程.本文工作表明,社区中意见领袖的数目、易变个体的数目会影响舆论形成的时间、阈值,外部连通概率会影响舆论形成的时间和数目.但是,本文模型未考虑网络群体的异样性以及意见领袖和易变个体的识别方法.由于当前对网络舆论的研究都集中在模型的应用上,本文也未从理论上对模型进行验证,这将是今后工作的重点.
[1]SZNAJD-WERON K,JOZEF S.Opinion evolution in closed community[J].International Journal of Modern Physics C ,2000,11(6):1157-1165.
[2]SOOD V,REDNER S.Voter model on heterogeneous graphs[J].Physical Review Letters,2005,94:178701.
[3]GALAMA S.Minority opinion spreading in random geometry[J].The European Physical Journal B ,2002,25(4):403-406.
[4]LAKOWSKI K K,NAWOJCZYK M.The galam model of minority opinion spreading and the marriage gap[J].International Journal of Modern Physics C ,2008,19(4):611-615.
[5]DEFFUANT G,NEAU D,AMBLARD F,et al.Mixing beliefs among interacting agents[J].Advances in Complex Systems ,2000,3(1/2/3/4):87-98.
[6]HEGSELMANN R,KRAUSE U.Dynamics and bounded confidence models,analysis and simulation[J].Journal of Artificial Societies and Social Simulation,2002,5(3):2.
[7]刘常昱,胡晓峰,罗批,等.基于不对称人际影响的舆论涌现模型研究[J].系统仿真学报,2008,20(4):990-996.LIU Changyu,HU Xiaofeng,LUO Pi,et al.Study on consensus emergency model based on asymmetric personal relationship influence[J].Journal of System Simulation,2008,20(4):990-996.
[8]WU Yu,YAO Yuan,WANG Li.A novel emergence model of public opinion based on small-world network[J].Journal of Key Engineering Materials,2011,474-476:2263-2268.
[9]司夏萌,刘云,丁飞,等.具有社团结构的有界信任舆论涌现模型研究[J].系统仿真学报,2009,23(7):7644-7647.SI Xiameng,LIU Yun,DING Fei,et al.Research on bounded confidence consensus emergency model with community structure[J].Journal of System Simulation,2009,23(7):7644-7647.
[10]吴渝,唐红,刘洪涛.网络群体智能与突现计算[M].北京:科学出版社,2012:1-320.
[11]NEWMAN M E J.The structure and function of complex networks[J].SIAM Review,2003,45(2):167-256.
[12]LIU Hongtao,QIN Xiao,YUN Hongfeng,et al.A community detecting algorithm in directed weighted networks[J].Lecture Notes in Electrical Engineering,2011,2:11-17.
[13]肖宇,许炜,夏霖.网络社区中的意见领袖特征分析[J].计算机工程与科学,2011(33):150-156.XIAO Yu,XU Wei,XIA Lin.A feature analysis of the opinion leader in on-line communities[J].Computer Engineering and Science,2011(33):150-156.