社交网络中考虑怀疑机制的谣言传播模型
2021-04-23张明菊仇丽青
张明菊,仇丽青
(山东科技大学计算机科学与工程学院,山东青岛 266590)
0 引言
谣言在信息传播中普遍存在,它的传播对人们生活有着深刻影响[1-3]。随着信息时代的到来,人们越来越容易接触到谣言,谣言的影响力也越来越大。破坏性谣言往往会引起社会恐慌,甚至造成巨大的经济损失[4-6]。因此,研究社交网络中谣言的传播规律,了解谣言信息的传播机理具有重要的现实意义。
谣言传播模型可用来阐述许多现象,如信息传播、病毒式营销、流行病或突发事件引起的恐慌等[7-10]。随着信息技术的发展,在线社交网络规模不断扩大,许多学者基于网络的现实对谣言传播模型进行了研究。Yu 等[11]基于小世界网络建立了谣言传播模型,发现谣言传播存在临界阈值;Hui 等[12]、Wang 等[13]使用随机方法分析了无标度网络上谣言传播的动力学;马宇红等[14]提出了新的SHIR 谣言传播模型,证明谣言传播范围与个体的从众效应相关;瞿倩倩等[15]研究了谣言传播者的信谣程度及感染力度,得出高谣言信度能加快谣言传播的速度;Li 等[16]提出一种带有教育机制的谣言传播模型,发现教育机制影响谣言的传播过程,并提出最优控制方法来优化教育机制;Zhu 等[17]提出一种新的带有强制沉默功能的谣言传播模型,研究减少谣言传播频率的最优控制方法。针对网络上信息传播的时滞特点,Zhu 等[18]在均匀网络和异质网络上建立了I2S2R谣言传播模型,基于复杂网络理论提出有效的谣言传播控制策略;Jain 等[19]对经典的SIR 模型进行扩展,研究了社交网络中考虑传播者影响延迟的谣言传播模型,为进一步研究谣言信息传播提供参考。
尽管上述模型越来越接近谣言传播的本质特征,但却忽略了谣言免疫者本身的属性。随着时间的推移,免疫者会逐渐忘记谣言信息,当再次遇到传播者时,受谣言信息的吸引,免疫者会再次成为传播者。因此,免疫者的遗忘机制应该考虑。此外,由于谣言的吸引力和对最初事实了解的缺陷,谣言传播在初始阶段应该是较高的,然后逐渐下降。Qiu 等[20]在社交网络中研究了考虑传播率变化的谣言传播模型,但忽略了未知者的怀疑特征。因此,本文考虑未知者本身具有的怀疑机制和免疫者的遗忘机制,建立SIR-CM 谣言传播模型,并在WS 和BA 网络中研究了SIRCM 模型的传播过程,同时通过数值仿真分析了怀疑概率和遗忘概率对谣言传播过程和最终规模的影响。
1 SIR-CM 谣言传播模型概述
1.1 SIR-CM 传播谣言过程
本文建立具有怀疑机制的SIR-CM 谣言传播模型。假设一个具有个N个体的社交网络,其中个体表示节点,个体之间的联系表示边,可以得到一个无向图G(V,E),其中V表示节点集合,E表示边集合。本文假设谣言是通过传播节点与其他节点直接接触传播的,将个体分为传播者(S)、未知者(I)和免疫者(R)3 组,分别表示未接受到谣言信息的人、接受并传播谣言信息的人和接收到谣言信息但不散播谣言的人。SIR-CM 模型传播规则及其表达式如图1 所示。
Fig.1 The structure of SIR-CM rumor spreading model图1 SIR-CM 谣言传播模型结构
(1)当未知节点(I)与传播节点(S)接触时,未知节点有3 种行为:①由于受到传播节点的影响,未知节点在不知情的情况以λ的传播概率转化为传播节点;②当传播节点影响较小时,未知节点在接收到谣言信息时会对谣言产生怀疑并以c的怀疑概率转化为传播节点;③当未知节点对接收到的谣言信息不感兴趣时,会以概率σ转化为免疫节点。
(2)当传播节点(S)与免疫节点(R)或其他传播节点接触时,该传播节点会以α的抑制概率转化为免疫节点。
(3)随着时间的推移,免疫节点(R)会逐渐忘记谣言信息,当再次遇到传播节点(S)时免疫节点会以γ的遗忘概率再次转化为传播节点。
1.2 SIR-CM 模型建立
为描述SIR-CM 模型的动力学特性,建立SIR-CM 模型动力学方程。
分别用S(t)、I(t)、R(t)表示t时刻未知节点、传播节点和免疫节点的密度,构建谣言传播模型的平均场方程如下:
其中,k表示网络中所有节点度的平均值。λk和ck表示在两种不同的心理下未知节点遇到传播节点被感染的概率,σk表示未知节点遇到传播节点时成为免疫节点的概率,γk表示免疫节点遇到传播节点被感染的概率,αk表示传播节点遇到免疫节点或其他传播节点时变为免疫节点的概率。由于网络中只存在未知者、传播者、免疫者3 种状态节点,因此三者的密度满足条件:S(t) +I(t) +R(t)=1。
假设在谣言传播的初始阶段网络中只有一个谣言传播节点,因而可以得到SIR-CM 谣言传播模型的初始条件:
为更好地理解传播概率作用,本文引入一个概率函数λ(t)来描述随时间变化的传播率,同时为未知者和免疫者分别建立怀疑参数c和遗忘参数γ。由于谣言本身的吸引力和个体对谣言信息知识领域的匮乏,在谣言传播的初始阶段传播速率较高。随着时间的推移,个体会逐步了解谣言信息的真实状况并进行真伪判断,此时传播率会逐步下降并最终降至零。因此,本文引入传播概率函数来表示这一规律,其函数形式如下:
其中,μ 表示初始传播概率,θ 表示随时间下降的速度,β 表示较高传播率的持续时间。可以看出,当β=0时,λ(t)=μ 为常数。
2 SIR-CM 谣言传播模型分析
谣言的最终规模可用来衡量谣言的影响程度。使用式(1)和式(3)计算谣言的最终规模,即最终接收到谣言信息的个体总数。本文将谣言的最终规模定义为R=limt→T R(T)=R(T),其中T表示谣言消失的最终时间,如R=0.8 表示有80%的个体最终都接收到了谣言信息。
为了确定R,本文将式(3)除以式(1),得到:
对式(5)两边从初始t=0 到最终t=T积分,并利用初始条件可得:
公式(6)可简化为:
对公式(7)两边取e的对数,得到超越方程:
定理1如果φ>1,超越方程R-1+e-φR=0 有两个解:零解和非零解R,其中0<R<1。
证明:显然,R=0 为式(10)的一个解。令f(x)=x-1+e-φx,其中0<x<1,φ>1,可以看出函数f是一个连续可微的函数。对于∀x∈(0,1),可得f’(x)=1-φe-φx。当x0=时,可得f’(x0)=0。将x0代入f(x)可得f(x0)=<0,同时f(1)=e-φ>0。由中值定理可知f(x)=0 有非零解。这意味着对于φ>1,存在一个x*=R使得f(x*)=0,其中0<x0<x*<1。
除此之外,对f求两阶导数可得f’’(x)=φ2e-φx>0。通过观察,函数f在(0,1)之间是一个凹函数。此外,图2 表明存在x0属于(0,1)使得f’(x)<0,此时x∈(0,x0)。同样可以得到当x∈(x0,1)时,f’(x)>0。这表明f’(1)f’(0)<0,即f’(0)f’(1)=(1-φ)(1-φe-φ)<0,最终证明φ>1。
根据定理1 可知,超越方程(8)有零解R=0。与此同时,满足以下条件:
可以看出,公式(8)有其他关于参数α,λ,c和γ 的解,因此可以得出本文所提出的SIR-CM 模型不存在谣言传播阈值。
3 数值仿真
为了研究社交网络中传播、怀疑和遗忘机制对谣言传播的影响,本文分别在BA 网络和WS 网络中对SIR-CM 模型进行仿真实验。实验过程中,WS 网络和BA 网络的节点数N=105,平均度k=6 及随机重连接概率p=0.1。模拟过程中,未知节点的免疫概率σ=0.2,传播节点的抑制概率α=0.4。实验结果均为随机选取不同初始传播节点并进行50次独立模拟的平均值。
3.1 三类节点随时间变化情况
本文设置模型参数:μ=0.5,θ=2,β=5,c=0.3,σ=0.2,α=0.4,γ=0.03,研究WS 和BA 网络中未知节点、传播节点和免疫节点的密度随时间的变化情况。
图2(a)和图2(b)分别显示WS 和BA 网络中未知节点(I)、传播节点(S)和免疫节点(R)随时间的密度变化情况。通过图3 可以看出,未知节点的密度I(t)在初始阶段迅速下降至0,表明谣言在网络中处于快速传播阶段。随着节点开始传播谣言,传播节点的密度S(t)不断增大,当达到最高点后逐步下降至0,这意味着谣言传播的终止。当谣言信息传播值到达顶峰后不会再有新的传播节点,并且之前传播谣言信息的个体也会逐渐停止传播。在整个过程中,免疫节点的密度R(t)不断增大直到稳态。通过比较图2(a)和2(b),发现BA 网络中的传播节点密度高于WS 网络中传播节点密度,BA 网络要早于WS 网络到达峰值。BA 无标度网络优先连接的特性(马太效应)造成了谣言对BA 网络的影响大于WS 网络。
3.2 遗忘概率g 对传播节点免疫节点的影响
假设遗忘概率分别为γ=0.02,γ=0.04,γ=0.06,在这3 种情况下对WS 和BA 网络中传播节点和免疫节点的密度变化情况进行研究。
图3(a)和图3(b)显示了不同遗忘率γ 下的传播节点和免疫节点随时间的密度变化情况,其中:μ=0.5,θ=2,β=5,c=0.3,σ=0.2,α=0.4。由模拟情况可以看出,γ=0.02时传播节点密度最小,γ=0.06 时传播节点密度最大,表明遗忘率γ越大传播节点密度越大,免疫节点转化为传播节点的速度越快,因此遗忘概率对谣言传播的影响不可忽视。图3 同时反映了这样一种现象:遗忘概率越大,谣言受到的关注度就越大,个体很容易忘记谣言信息并转化为传播节点,从而导致谣言传播的时间越久,谣言的峰值越大。
Fig.3 The influence of forgetting probability γ on Spreader(S)and Removed(R)图3 遗忘概率γ 对传播者(S)和免疫者(R)的影响
3.3 传播概率l 对免疫节点的影响
设置传播概率函数λ(t)中的参数分别为μ=0.3,μ=0.5,μ=0.8,θ=2,θ=5,θ=8,β=3,β=5,β=8,研究在这几种情况下WS 和BA 网络中免疫节点的密度变化情况。
为研究传播概率的时间依赖性,本文引入传播概率函数λ(t)。随时间变化的传播概率函数λ(t)=的3 个参数(μ,θ和β)分别表示初始传播概率、随时间下降的速度和维持高传播率的持续时间。图4 给出λ 在不同取值情况下WS 和BA 网络中免疫节点的密度变化情况,其中:c=0.3,σ=0.2,α=0.4,γ=0.03。图4(a)显示免疫节点的密度随着初始传播率μ的增大而增大。初始传播率越大,初始时刻谣言信息的传播速度越快,传播规模就越大;图4(b)显示,免疫节点的密度随着θ的增大而增大,且θ对WS 网络中免疫节点密度的影响要大于BA 网络;由图4(c)可以看出,参数β会对谣言免疫节点的最终密度有影响,β越大谣言最终规模也越大。因此,为了有效地控制谣言传播,应尽早识别谣言源和谣言信息真伪,以降低谣言的初始传播率和传播速度。
Fig.4 The variation curve of Removed(R)of μ,θ,β as time t changes图4 随着μ,θ,β 的不同,免疫者R 随时间t 的变化曲线
3.4 未知节点的怀疑概率c 对传播过程的影响
图5 给出了怀疑概率参数c取不同值时,传播节点和免疫节点在WS 和BA 网络中随时间的变化情况。其中:μ=0.5,θ=2,β=5,σ=0.2,α=0.4,γ=0.03。由图5(a)可以看出,怀疑概率c越小,传播节点的密度越小,免疫节点到达稳态的时间越晚。这表明怀疑概率越小,未知个体对谣言的关注度越低,未知节点成为传播节点的概率越小。网络中的节点越难感染,信息传播就越慢,趋于稳定的时间也越长;图5(b)表明,谣言在BA 无标度网络上的传播速度更快,影响范围更广。因此,如果要控制谣言信息的传播范围,应该考虑如何降低谣言关注度和提高个体安全意识,使谣言信息能够在可控范围内传播。
Fig.5 The influence of skepticism mechanism c on Spreader(S)and Removed(R)图5 怀疑机制c 对传播者(S)和免疫者(R)的影响
3.5 SIR-CM 模型和SIR 模型比较
图6 显示WS 网络和BA 网络中免疫节点的密度变化情况。在谣言传播初始阶段,由于考虑了未知节点的免疫特征,部分未知节点在接触到传播节点后会直接转化为免疫节点,此时SIR-CM 中的免疫节点密度要大于SIR 模型中的免疫节点密度。随着谣言的进一步传播,由于免疫节点遗忘特征的存在,谣言信息传播的范围减小,SIR-CM 模型相比于SIR 模型需要更多的时间达到稳态。事实上,现实社交网络中的部分个体在得知谣言信息后会因为对谣言信息不感兴趣成为免疫者,然而由于不断与其他个体接触和交流,其中一些个体可能会重新成为新的信息分享者。因此,SIR-CM 模型更接近现实情况。
Fig.6 Comparison of SIR-CM model and SIR model图6 SIR-CM 模型和SIR 模型比较
4 结语
本文提出了一种新的SIR-CM 谣言传播模型,模型主要特点如下:①考虑了社交网络中谣言传播概率的时间依赖性,并引入传播概率函数λ(t);②将未知者的怀疑机制整合到SIR-CM 模型中;③引入遗忘概率描述免疫者自身的遗忘机制。通过该研究发现免疫者遗忘概率的变化会对谣言传播的规模产生影响,遗忘概率越大,谣言的传播峰值越大。数值结果还表明:谣言的初始传播概率越大,谣言的最终规模越大。通过对怀疑参数进行实验分析发现,通过减小个体对谣言的关注度可以降低谣言的影响。对SIR-CM 模型进行实验分析,得到模型参数对谣言信息传播峰值和最终规模的影响,从而通过采取各种措施对有效传播进行控制,为决策者提供谣言政策管理建议。