基于元胞自动机的微博舆情传播研究
2014-09-04
(西华大学数学与计算机学院,四川 成都 610039)
从18世纪舆情概念诞生开始,舆情正逐渐成为预测社会运行状态和公众意见管理的重要依据。当今的舆情研究[1]主要集中在2方面:舆情传播模型的研究和数据的采集与分析。前者主要研究舆情的传播规律,包括舆情的产生、传播、发展和消亡;后者侧重于舆情中有效信息的提取、量化,并对其进行数据分析和内容挖掘。
微博,全称为微型博客[2],是一个具有巨大用户数量的互联网社交平台[3-4]。其特点是用户借助计算机或者手机等客户端,随时随地用简短的文字更新自己的博客,方便与更多的用户进行分享和传播。如何认识、引导微博舆情,成为当今微博舆情研究的重点。微博已从一种信息传播工具,转变为一个虚拟的社会空间,而微博舆情在这个虚拟社会空间中有着复杂系统的基本特点[5]。微博舆情产生、传播和更新的机制,社会突发时间对微博舆情的影响,以及对特定事件的微博舆情管控,都是亟待研究的问题。R. Hegselmann等[6]使用元胞自动机技术对网络舆情的传播进行了研究。李保秀[7]使用信息空间模型构建微博舆情的评价空间,对评价指标进行了量化处理,建立了舆情指标体系。刘金荣[8]在危机沟通视角下对微博舆情的演变路径进行了研究。李明德等[9]对微博舆情的模式、表征、趋势和引导进行了研究。陈彦舟等[10]针对微博数据量大的特点,使用hadoop技术设计了一个微博舆情监控系统。姚春华等[11]对微博舆情的管控技术进行了研究。本文采用元胞自动机模型对微博舆情的演化进行研究。
1 应用于微博舆情研究的元胞自动机
1.1 元胞自动机
元胞自动机是具有严格定义的数理模型,它是一个在具有离散、有限状态的元胞组成的元胞空间中,根据演变规则、邻域元胞状态,在抽象、离散的时间维度上进行演化的动力学系统[12]。它的基本构成包含元胞状态、元胞空间、元胞临域选择以及演变规则4部分。作为一种简便易用的研究工具,元胞自动机自产生以来,被广泛地应用到军事、经济、社科、计算机仿真等领域。
在元胞自动机中,所存在的具有有限状态的独立单元,被称作元胞自动机的一个元胞。在抽象的一个确定时刻,元胞空间中每个元胞的状态是唯一、确定的。所有元胞的状态集合是有限和确定的,根据不同的应用场景,可以是{0,1}、{正,反}等二进制形式,也可以是{S1,S2,…,Si} 等有限状态的集合。
元胞空间是指元胞所存在的空间上所有元胞的集合。一般来讲,它是一个有限维数的欧几里得空间,其中的元胞表述为一个大小一致的均匀网格。在实际的研究中,二维网格形式的元胞空间较常见,当然也存在三维以及三维以上的元胞空间,而作为规则划分的抽象表现,一个元胞可以表示为三角形、四方形和六边形等网格形式。
元胞的演变规则是指,指定元胞在某一时刻的状态更新,是由局部条件下领域元胞的状态和确定的规则决定的。指定元胞的领域是指状态更新时所要搜索的空间。如图1所示,作为最常用的元胞自动机,二维元胞自动机的邻域通常有Von Neumann型、Moore型和扩展的Moore型3种形式。
图 1 元胞自动机模型常用邻域
从数学上讲,演化规则可表示为一个由元胞当前的状态及其邻域元胞的状态确定下一时刻该元胞状态的函数[13],简单地讲,就是一个局部状态转移函数,如元胞i的局部演化规则为
(1)
1.2 微博舆情元胞结构
在本文的研究中,每个元胞代表了一个舆情的主体,即微博站点。以新浪微博为例,每个微博站点具有一定数量的粉丝数、收听数和微博发布数量。微博所有者即用户通过所收听微博或者其他途径得知消息后,通过自己的博文发表意见看法,这些意见被传播到粉丝用户中,粉丝通过转、评论或者发布新消息来表达自己的意见观点。微博用户之间观点,意见的相互交流和作用构成了微博舆情的意见演化,而微博中的博文数量、评论数、转发数的动态变化,构成了微博舆情的强度演化[14]。
在微博舆情的意见演化中,每个元胞有3种倾向度。这里的倾向度是指用户对某一特定事件态度的抽象描述,这个状态集是有限的,即A={赞同,中立,反对}。每个元胞的状态在某一特定的时间内是唯一的,它会根据邻域元胞的状态和局部演化规则进行改变。在微博舆情的强度演化中,微博站点对特定的舆情事件讨论的强度被抽象地分为6个层次,每个层次代表元胞的一种状态,这个状态集同样是有限的,即B={无强度,初始,上升,高强度,减弱,低强度}。 这些规则之间的相互转化趋势如图2所示。
图 2 舆情强度状态之间的相互转化
在微博舆情的研究中,元胞空间是对微博网络结构的一种虚拟,在本文中采用二维的网状结构来表示元胞空间,根据具体的研究内容选择不同的网格数。不同的微博在粉丝数上的差别有时候是十分巨大的。对于大部分的普通用户来讲,粉丝的数量大部分是几百个、几十个;对于娱乐明星、体育明星、微博达人等一些颇具影响力的用户,粉丝数量就要以几万、几十万、上百万来计。这样的情况同样存在于收听数量上。邻域在微博舆情的强度演化中实际上表示的是这个站点的粉丝数量,在客观粉丝数量差距比较大的情况下,只采用一种邻域模式无法有效表示真实情况;因此本文按 照一定的概率来产生具有不同邻居的元胞,邻居越多表示该元胞影响力越大。同样在意见演化中,邻域表示的是这个站点的收听数量,邻居数量越多表示收听的数量越多。
微博舆情元胞机的演化采用的是抽象的相同时间步长,这个步长表示了微博用户与邻域用户进行一次相互作用所需的抽象时间。这里,规定t时刻的元胞状态只对t+1时刻的元胞状态构成影响。
2 微博舆情的倾向度演化
(2)
3 仿真实验及讨论
基于Microsoft Visual Studio 2010 平台在Moore型邻域多权重规则下对微博舆情中的倾向度演化进行仿真实验。
实验中元胞空间采取100×100的二维方格,元胞均采用Moore型邻域,公式(2)的演变规则扩展如公式(3)所示。观察在不同分布的坚定系数和影响系数下元胞的倾向度演变。
(3)
从图3—5的实验结果可以看出,初始倾向度值经过短期的震荡作用之后,朝着一定的规律方向发展,具有相同倾向度的元胞聚集在一定区域内,且中立元胞大部分存在于支持元胞和反对元胞之间。同时,由于中立元胞的取值范围较窄,它不可避免的被同化,只剩下一些坚定系数较高的元胞聚集在一起。这反映了在现实中,一个人始终保持客观、中立的态度是很难的,周围人的情绪将不可避免地影响到你。
同时,倾向度的演化对初始的倾向度分布是比较敏感的。从图4(b)可以看出,持支持态度的元胞数目相对多一些(3328,3314),经过50次的迭代之后,支持元胞的数目已经比较明显的大于反对元胞(4919,4188)。同样,从图5(b)可以更加明显地看到,(3410,3244)经过50次的迭代之后,反对元胞的数目明显大于支持元胞(5032,4555)。从图6(b)可以看出,初始的倾向度左右分布是比较平均的,从迭代的过程看,支持和反对元胞的数目差别并不大。这说明,在舆情产生的初期,对舆情进行引导是非常必要的。
从图4和图5的对比可以看出,在坚定系数一定的情况下,较大的影响系数使倾向度具有更快的收敛速度。在实际生活中,加强舆论的宣传,可以达到很好的舆论引导效果。在影响系数一定的情况下,较大的坚定系数使倾向度的收敛速度变得更慢。在舆情引导中,加强政策、行为的透明度,加大宣传的强度,能够增强人的坚定性,从而不容易受到谣言的影响。
(a)初始状态 (b) 第10次
(c) 第20次 (d) 第50次
灰色表示支持倾向度的元胞;黑色表示反对倾向度的元胞;白色表示中立元胞;初始条件为wij=0.5,aij=0.2。
图 3 对Moore型邻域多权重规则的模拟实验
(a)倾向度演化
(b)倾向度的概率密度估计曲线
(a)倾向度演化
(b)倾向度的概率密度估计曲线
(a) 倾向度演化
(b) 倾向度的概率密度估计曲线
4 结束语
本文将元胞自动机引入到微博舆情研究中,对多种情况下的微博舆情倾向度演化以及强度演化进行了研究。
在倾向度演化实验中,微博用户倾向度的演化受到自身坚定性系数、微博邻居的影响系数,以及微博收听范围大小的影响。具有较大坚定性系数分布的情况下,倾向度的收敛更加平缓,而影响系数较大时会使倾向度的收敛变快。同时,具有较大影响力的微博在倾向度的演化中能够起到明显的引导作用。在邻居平均数目更大的情况下,倾向度的收敛速度加快。
微博舆情的传播取决于很多因素,比如事件类型,微博用户的受教育水平、贫富程度,社会的治安状况、经济状况,国家的内部、外部环境等。同时,微博中粉丝、收听数目是动态变化的,一些微博在舆情的传播中成长为影响力较大的点。下一步的微博舆情研究中还应该考虑到这些因素。
[1]胡勇, 张翀斌, 王祯学, 等. 网络舆论形成过程中意见领袖形成模型研究[J].四川大学学报: 自然科学版, 2008, 45(2): 347-351.
[2]张力. 浅析微博的传播形态[J].青年记者, 2010 (8): 80-81.
[3]张力, 唐虹. 微博信息传播机制及其发展困境[J].新闻世界, 2011 (1): 68-70.
[4]Tonkin E, Pfeiffer H D, Tourte G. Twitter, information sharing and the London riots?[J].Bulletin of the American Society for Information Science and Technology, 2012, 38(2): 49-57.
[5]Zeng J, Zhang S, Wu C, et al. Modelling Topic Propagation over the Internet[J].Mathematical and Computer Modelling of Dynamical Systems, 2009, 15(1): 83-93.
[6]Hegselmann R, Flache A. Understanding Complex Social Dynamics: A Plea for Cellular Automata Based Modelling[J].Journal of Artificial Societies and Social Simulation, 1998, 1(3): 1.
[7]李保秀. 微博社交网络舆情监测指标体系构建[J].科技广场, 2012 (4):148-152.
[8]刘金荣. 危机沟通视角下微博舆情演变路径研究[J].情报杂志, 2012 (7):.21-24.
[9]李明德,张宏邦. 微博舆情:模式、表征与趋势[J].情报杂志, 2013 (7):49-53.
[10]陈彦舟 , 曹金璇. 基于Hadoop的微博舆情监控系统[J].计算机系统应用, 2013 (4):18-22.
[11]姚春华 , 王效武 , 曾曦. 基于微博的网络舆情管控技术研究[J].通信技术, 2014, (1):97-101.
[12]贾斌,高自有.基于元胞自动机的交通系统建模与模拟[M].北京:科学出版社,2007:25-56.
[13]Nowak A, Lewenstein M. Modeling social change with cellular automata[M]. Netherlands: Springer, 1996: 249-285.
[14]Moldovan S, Goldenberg J. Cellular automata modeling of resistance to innovations: Effects and solutions[J].Technological Forecasting and Social Change, 2004, 71(5): 425-442.
[15]刘慕仁,邓敏艺,孔令江.舆论传播的元胞自动机模型[J].广西师范大学学报:自然科学版,2002,20(2): 1-3.