APP下载

一种推荐模式下的谣言传播模型*

2022-08-23吴日铭韩益亮郭凯阳李永斌

网络安全与数据管理 2022年7期
关键词:辟谣谣言阈值

吴日铭,韩益亮,郭凯阳,李永斌

(1.武警工程大学 密码工程学院,陕西 西安 710086;2.中央军委政法委员会,北京 100010)

0 引言

近年来,随着云计算、大数据、物联网等技术的发展,互联网中的数据迎来了爆炸式增长[1]。为帮助用户从众多信息中筛选感兴趣的信息,提升用户体验,目前,电子商务、信息检索、社交网络、位置服务、新闻推送等领域均应用了推荐机制[2]。信息的传播方式已经发生了变化。基于推荐机制的网络谣言扩散方式与经典流行病模型的信息扩散方式有很大不同,信息传播的速度不仅仅依赖于信息发布者传统的社会网络指标,更依赖于所发布信息的吸引力和所能推荐的人群区域人流密度。在这种新的信息传播模式之下,一些涉及敏感议题、政治类不实谣言以及对我国大政方针政策的偏激言论在各个推荐平台中迅速传播和扩散,极大地危害了网络空间中的良好生态,甚至对社会稳定造成不好的影响[3]。因此,对当下这种新的谣言传播方式进行研究具有一定的现实意义。

1 相关工作

谣言传播模型的研究始于20世纪60年代,由于谣言在人际关系网络中的散布与病毒传播、扩散很相似,因此谣言传播模型很多都是在传染病模型的基础上建立起来的。Daley和Kendall全面分析了谣言与流行病的相似性,在20世纪60年代提出了DK模型[4];Maki等[5]后来修改了DK模型并提出了MK模型,其中谣言通过传播者与其他人直接传播。随着复杂网络模型的发展,有学者认为DK和MK模型不适合研究大范围的社会网络中的谣言传播过程,网络也并不都是封闭的均匀网络[6]。Zanette等[7]首先将复杂网络理论应用于谣言传播的研究,在小世界网络上建立谣言传播模型,得出一些包括谣言传播临界值在内的结论;Nekovee等[8]通过将MK模型与SIR模型结合,进一步研究了一般复杂网络的谣言传播。在之后的研究中,许多学者从不同的角度丰富和发展了基于SIR模型的谣言传播模型。Zan等[9]在经典的SIR模型中加入新的反攻群C,建立了SICR谣言传播模型;顾亦然等[10]根据有疾病潜伏期的传染病模型,提出了谣言传播SEIR模型;Zheng等[11]考虑社会加强效应,提出了CSR模型;薛一波[12]引入谣言正向感染和负向感染两个感染状态,提出了谣言传播的SPNR模型;张亚明等[13]构建了具有兴趣衰减效应的ISCR谣言传播模型;朱张祥等[14]将谣言受众对象扩展为无知者、知晓者、信任者、传播者、暂时免疫者、永久免疫者,同时考虑正向社会加强效应建立模型;丁学君等[15]基于传染病动力学及“反沉默螺旋”理论,构建了考虑辟谣行为及网络结构的社交媒体谣言传播模型;张金鑫等[16]考虑多个账号发布谣言情况,提出SInQR网络谣言传播模型;Zhu等[17]考虑到监管资源有限的情况,建立了考虑对谣言扩散的一些综合影响因素的SIS谣言传播模型;王佳佳等[18]考虑到谣言对恐慌情绪诱发的即时性,建立了谣言和恐慌情绪并行传播的双传播模型并给出了平均场方程。到目前为止,对网络信息的传播建模大都是基于社会关系拓扑网络。但是随着自媒体的发展和信息量的快速增长,信息的传播方式发生了变化。Goel等[19]人通过仿真比较了真实信息扩散的传播模式和具有真实感染率的SIR模型。传播模式的差异表明,广泛使用的流行病模型不能再现真实的信息传播。而基于信息推荐机制的谣言传播建模依然是一个空白。基于前人的研究,本文在参考SIR模型的基础上,引入真实信息因素,提出一种基于推荐机制的谣言传播仿真模型,并对谣言的传播过程进行了仿真分析。

本文的工作主要有以下几个方面:一是对推荐平台下的网络用户对信息的接受影响因素进行了调查;二是考虑到推荐机制对人群的分割效应,将网络用户划分在不同的信息传播区域,定义了传播区域中网络用户与信息的交互规则;三是对影响谣言传播的各种因素进行了仿真分析。

2 传播模型构建

2.1 传播域的划分

随着大众媒体和移动终端的兴起,网络信息数量和传播方式、速度发生了巨大的变化。目前,抖音、今日头条等主流网络平台主要采用信息推荐的方式进行内容推送。新闻推荐可以有效缓解新闻信息过载,帮助用户在众多信息中筛选出自己感兴趣的信息。而当平台使用智能推荐算法时,容易产生“过滤气泡”,形成“信息茧房”。在这样的现实情形下,作为信息接收者与消费者的互联网用户会因浏览习惯、观点喜好、自身兴趣等因素之间的巨大差异而使得其在客户端中被推送的话题、观点具有明显的标签和分类,因此,不考虑推荐机制对人群的分割效应,随机选取个体进行动力学模型构建是不符合实际情况的。

表1总结了几种新闻推荐算法所依据的数据类型。

表1 推荐模式使用数据粒度情况表

如表1所示,目前的推荐算法有相当一部分是依据新闻的标题划分的词级进行推荐。因此,本文模型依据信息标题将信息传播划分为不同的区域。每个信息传播区域拥有不同的用户密度。

2.2 模型的基本假设

本文模型作以下几点基本假设:

(1)根据推荐平台的信息传播模式,本文假设平台对信息的识别度为0,即不知道信息的真假,对谣言信息和辟谣信息的推荐机制是一致的。

(2)根据推荐平台用户的行为,如忽视、点击等,参考SIR模型对用户状态进行分类,本文将被推荐谣言信息但未点击信息的用户称为不知情者U;将接触到谣言信息但是没有点击的用户称为忽视者N;将接触到谣言信息并且对信息点击的用户称为谣言相信者B;对谣言信息忽略或者接触到了官方辟谣信息的用户称为谣言免疫者或康复者R。

(3)在信息传播过程中,信息热度越高,得到平台推荐的概率越高。本文使用谣言信息的点击量Bt表示信息的热度,hi表示各个传播域的阈值,一旦Bt>hi时,信息即在该域中进行传播。

(4)将域中的网络用户当成独立节点,域中的独立节点只与域中环境发生交互,域中环境被用户发布的信息所影响。一旦用户发布的信息在域中出现,即认为域中所有用户都有被该信息影响的概率(即信息的接受率),该概率设为p。概率p受信息的固有价值p0的影响。

为了研究在信息推荐机制下网络用户对信息的接受程度,本文对哔哩哔哩平台用户对视频的点击影响因素进行了问卷调查。影响应用界面信息点击的因素主要有以下五个:信息的封面图片、信息的标题、信息的播放量、信息的评论量、信息的发布者。在收到的1 309份调查问卷中,对应五个因素的投票情况如图1所示。

图1 点击影响因素

如图1所示,用户对信息的点击概率主要是由信息本身(封面图片和标题)所决定的,占到全部问卷的70%;而信息的热度(播放量和评价量)只占到10%。因此,在本文模型中,假设针对某一信息,网络用户对信息的点击概率只受信息本身影响。

考虑个体对信息接受程度的多样性,在本模型中,设定网络用户对信息的接受率为:

其中,po为信息的固有价值;Ψ~N(0,σ),为表现用户差异性而添加的噪声。

2.3 域中信息的传播过程

在信息发布初期,信息在最主要的标签域中传播,当信息的热度(点击量)达到一定程度后,信息会进一步扩大传播范围,进入到其他的非主要词条的标签域。信息达到更大热度时,信息传播达到高峰,此时,信息在全平台进行传播,平台中的每一个用户都有可能接收到该信息的推荐。传播过程如图2所示。

图2 推荐机制下的信息传播过程

2.4 构建数学模型

根据上述的交互规则,本文设α为网络域中用户对谣言信息的接受概率,β为网络域中用户对谣言信息忽视概率,μ为辟谣信息的接受概率。谣言在传播过程中,域中用户U以概率α成为谣言相信者B,以概率β成为谣言信息的忽视者N,在加入辟谣信息后,谣言相信者又以概率μ成为康复者R,没有接收到谣言信息的忽视者同样以概率μ成为康复者R。传播结构如图3所示。

图3 谣言传播结构图

由图3可知,α+β=1,μ≤1。

设U(t)、B(t)、N(t)、R(t)为不知情者、谣言相信者、谣言忽视者和康复者在每个传播域中的密度。在辟谣信息加入之前,它们之间满足:U(t)+B(t)+N(t)=1。

模型的平均场方程为:

加入辟谣信息之后,它们之间满足:U(t)+B(t)+N(t)+R(t)=1。

模型的平均场方程为:

3 仿真实验

本实验总共设置六个传播区域,各个区域内网络用户数量为d(100,500,1 000,3 000,4 000,5 000),在整个平台中设置网络用户为13 600个,区域中的网络用户按照每个时间单位1%的比例进入到传播区域。随着传播的扩散,暴露在传播区域中的人数越来越多。每个区域设定一个传播阈值,当信息热度达到阈值时,域中用户按前文说明的交互规则接受谣言信息或者辟谣信息。本次实验主要目的是分析各种参数变化下谣言相信者和谣言免疫者在整个网络中的变化情况。

3.1 谣言传播实验

本次实验对各个域的传播阈值设置为h(0,30,200,700,2 000,4 000),对信息接受率设定为p=0.4,对于网络用户的比例本文设定是用户占全平台中的比例,而不是在每一个域中的比例。

从图4可以看出,信息传播大约在t=250时达到峰值,且随着时间的推移,在不加入官方辟谣信息的情况下,各类人员在平台中的比例会保持不变。这是由推荐机制的特点决定的,信息的传播不再是用户与用户之间的强社会关系,用户只会与平台推荐的信息发生交互。在这种信息传播模式下,与文献[20]中的传染病模型不同,人员不会随着时间的推移全部被感染,而是会在网络中保持一定的比例。

图4 p=0.4各类用户随时间变化情况

3.2 信息接受率对比实验

在本文模型中,信息的接受率代表信息对平台用户的吸引能力,接受率越大,代表着平台中用户对其进行点击、阅读的概率越大,即信息越能够得到传播。

本次实验对各个域的传播阈值与3.1节实验保持不变,分别设置不同的信息接受率进行实验。

如图5所示,当各个传播域中的阈值保持不变时,信息的接受率越高,信息传播的范围越大。当p=0.1或者p=0.3时,信息传播在很短时间就已经达到了最大,说明此类信息得到了很少的推荐,很快被平台所淹没。当信息接受率p=0.1时,谣言相信者的比例在全平台中的比例几乎为0,说明信息只在最小的传播域中传播,而没有再被推荐到其他传播区域中,其传播达到平稳也是最快的。对比p=0.3和p=0.5可以发现,即使信息的接受率已经很接近了,但是传播的范围依然相差很大,说明信息接受率p=0.5的信息热度已经达到了比p=0.3的信息更广的传播区域,所以导致了信息传播范围的差别比较大。由此可以得出,信息能否得到推荐对信息的传播范围影响较大,为了阻止谣言的传播,应该在谣言信息被推荐到更广的传播区域时及时发布辟谣信息或者对谣言信息进行处理。

图5 不同信息接受率下谣言相信者的比例

3.3 信息阈值对比实验

不同的信息发布者对于每个传播域的阈值设置可能不一样,在本实验中,本文以基于用户行为的推荐算法为例,信息发布者之前信息受到的点击越多,该用户发布的信息越容易受到推荐。说明其信息传播域值会比冷门信息发布者的更低。本次实验分别对传播域阈值设置为3.1节中实验传播域阈值的0.5倍,并与3.1节实验结果进行对比。

对比图4和图6可以看出,传播区域阈值越小,越有利于信息的传播。在同样的传播时间内,当传播域阈值保持为h(0,30,200,700,2 000,4 000)时,信息的传播范围仅仅为全平台的12%左右,如图4所示;当把各个传播域的阈值变成h(0,15,100,350,1 000,2 000)时,信息的传播范围在t=250时就已经达到了70%,并且还在进一步扩大,如图6所示。

图6 传播域阈值对比实验

3.4 加入信息真相后对比实验

在本次实验中,各个传播区域网络用户和各个域的阈值设置保持不变,在谣言传播时间t=100,t=200,t=300,t=400时加入官方辟谣信息,观察在辟谣信息加入到信息域中谣言相信者数量的变化情况以及各个时间点加入辟谣信息对谣言传播的影响。

如图7所示,两条曲线分别是在信息接受率p=0.5情况下,未加入辟谣信息和在t=100时加入辟谣信息情况下谣言相信者的数量变化情况。从图中可以看出,在加入辟谣信息300个时间单位后,相信谣言的用户开始减少。

图7 辟谣信息加入对比

在时间大于1 000时,网络平台中相信谣言的用户已经保持比较低的状态。而未加入辟谣信息的情况下,谣言相信者一直保持在较高的数量,如果不及时进行处置,极有可能发生二次传播和谣言的进一步演化,导致舆情恶化。

接下来,本文对不同的信息接受率在t=100,t=200,t=300,t=400时加入辟谣信息进行仿真实验,谣言相信者的数量变化情况如图8所示。

从图8可以看出,在t=100加入辟谣信息时,谣言相信者在平台中的数量均保持在一个较低水平;而在t=200加入辟谣信息时,谣言接受率为p=0.7,p=0.6的谣言在整个平台中相信谣言的数量已经达到了一定的水平。在t=300,t=400加入辟谣信息时,平台中谣言相信者的数量除了在p=0.1,p=0.2情况下之外,都达到了比较高的水平。通过实验得知,对于不同的信息接受率的谣言信息,对辟谣信息要求的时间效应是不一致的,谣言接受率越大的谣言,越需要更早加入辟谣信息,但总体说来都是越早加入辟谣信息越有利于阻止谣言的传播。

图8 不同的信息接受率在不同的时间加入辟谣信息传播情况对比

3.5 实验结论

通过对谣言的传播进行仿真实验发现:(1)在网络推荐平台中,用户接受信息的概率与以往传统的基于强社会关系的模式有所不同,随着个人移动终端的广泛使用和针对性越来越强的推荐算法的出现,人们能否接受网络图文中的信息主要依赖于信息推荐和信息本身的吸引力,而受其他用户的影响则相对较少。(2)由于推荐机制对人的分割效应,在推荐平台中,信息本身带有的标签对信息的传播极为重要。信息标签直接影响了信息传播域中的用户密度,进一步影响了信息的推荐和传播。(3)针对不同接受率的谣言信息,对于辟谣信息的要求是不一样的,接受率越高的谣言信息,则越需要更早地加入辟谣信息,才能更好地起到阻止谣言传播的效果。

4 结论

本文研究了在推荐平台中,弱社会关系下网络用户对网络信息接受概率的影响因素;根据信息推荐机制的特点,考虑到推荐机制对人群的分割效应,将网络用户划分在不同的信息传播区域,赋予了不同传播区域的信息热度阈值,并在此基础上建立了考虑信息热度和传播阈值的谣言传播模型。模型从新的角度研究了推荐平台中谣言信息传播的特点规律。最后对谣言的传播过程进行了模拟,分析了模型的相关参数对谣言传播的影响。本研究为网络推荐平台下的谣言传播和网络舆情治理提供了一定的参考。

但本文提出的基于推荐机制的谣言传播模型仍存在一定的局限性,尚有以下工作需要进一步研究:(1)由于各个平台具体使用的推荐算法还不明确,无法进一步确定推荐算法对人群的分割效应,以及获得平台推荐的信息的各项指标和条件,在下一步的研究中可以针对具体的推荐算法和平台进行更深一步的研究;(2)由于平台数据的私密性及影响因素的复杂性,目前无法使用实际数据对模型进行验证,但从模型的仿真结果来看,与人们的认知具有一致性,这也对网络环境的治理提供了一个新的思路和方法;(3)针对网络用户对信息接受率的确定,本文使用的是相同的概率加上个人特点的噪声,这与实际情况还存在一定的差距,在下一步的研究中,可以考虑用户活跃程度等情况,对人群进行进一步细化。

猜你喜欢

辟谣谣言阈值
中国使馆驳斥荒谬谣言
改进的软硬阈值法及其在地震数据降噪中的研究
土石坝坝体失稳破坏降水阈值的确定方法
基于小波变换阈值去噪算法的改进
不信谣言 科学防“疫”
改进小波阈值对热泵电机振动信号的去噪研究
“最强辟谣101条”引发质疑
你被养生谣言忽悠过吗?
谣言π=4!
真相查清之前别急着辟谣