社交网络中基于信任的社区谣言传播控制方案
2025-02-15李欣欣汤金川
摘 要:针对社交网络中的隐私信息传播问题,改进了传统的信息传播模型,提出了基于信任的社区信息传播控制方案。首先,引入社区结构和信息敏感度两个特征,以更准确地模拟信息传播过程。其次,采用基于信任的真相传播机制,有效地控制了谣言的扩散。仿真实验结果表明,相较于传统模型,社区传播模型达到传播峰值的平均速度提高了31%,更好地模拟了信息传播过程。同时,基于信任的社区谣言控制方案在平均35轮内有效地控制了谣言的传播。此改进对于保护用户隐私和维护社交网络秩序具有重要意义。
关键词:社交网络;信息传播;信任;谣言控制
中图分类号:TP391 文献标志码:A
0 引言(Introduction)
互联网的迅猛发展和广泛渗透,使数字化平台成为人们日常生活和社交不可或缺的一部分,信息传播也已经成为现代社会的核心要素。然而,伴随着庞大的信息潮流,虚假信息、谣言和不良内容频繁涌现,对社区的和谐稳定和公共秩序构成了严重威胁,同时也侵蚀了人与人之间的信任基石。传统的信息传播模型局限于个体之间的简单传播,忽视了社区结构的复杂性在信息传播中的重要影响。为了更全面地理解信息在社区中的传播机制,本文对传统传染病信息传播模型进行了扩展,将社区结构和信息敏感度融入其中,使得模型更贴近真实社会情境;同时,本研究引入了信任作为控制信息传播的关键因素,旨在通过识别社区中信任度较高的用户,并利用基于信任的真相传播机制控制谣言的扩散;在真实社交网络数据集上的验证,进一步证明了该社区信息传播模型及基于信任的控制方案的有效性。
1 相关工作(Relatedwork)
谣言传播常借鉴传染病传播模型,如SHRIVASTAVA等[1]提出了一个虚假信息传播模型,使用了易感-验证-感染-恢复模型,并对其稳定性、平衡性和基本繁殖数进行了分析。DONG等[2]结合传染病理论和人口动态,进一步考虑了在线社交网络的影响。CUI等[3]研究了两层传染病谣言传播模型,考虑了谣言的固有属性和结构特征。XIAO等[4]基于传染病模型提出了基于用户自身意识和进化博弈的信息传播动态模型。目前研究谣言传播模式的方法主要效仿基于动力系统理论的流行模型,但也有学者认为遗忘记忆和犹豫机制对谣言传播有重要影响,提出了相应的传播模型。HUO等[5]提出的模型考虑人们科学知识水平,而YANG等[6]提出的模型适用于异构网络和双语环境。HOSNI等[7]提出了HISB模型,认为个体在面对谣言时会因其背景知识而持有不同态度。深度学习的发展也带来了新的研究方向,如XIAO等[8]提出的基于表征学习和博弈论的社交网络谣言传播方法。LIU等[9]分析了虚假信息传播者与非传播者的差异。然而,这些研究大多聚焦于个人到个人的信息传播,忽视了社区结构在谣言传播中的重要作用。
虚假信息、谣言和不良内容的频繁出现,对社区的和谐共处和公共秩序构成了严峻的威胁,因此有效控制谣言传播显得尤为重要。FAN等[10]研究了一种基于屏蔽谣言节点的方法,旨在识别最小的个体子集作为初始保护者,以减少邻近社区的感染人数。钱榕等[11]提出了一种谣言传播与辟谣模型,进一步考虑了禁言机制。MA等[12]提出引力中心性指数识别影响扩散者,并与其他中心性指标进行比较。此外,有研究者提出了基于屏蔽谣言链接的方法,即通过阻止有限数量的链接来近似解决谣言阻止问题。KHALIL等[13]将流感控制问题抽象为边缘删除问题,设计了具有近似保证的可扩展算法。在探讨散布谣言的正面真相方面,BUDAK等[14]研究了在网络中同时传播的谣言和真相,解决了限制谣言传播的问题,并识别出一部分关键个体来传播真相。文献[15]中研究了谣言阻塞问题,并提出了一种随机近似算法。然而,以上研究未充分考虑信任因素对真相传播的影响。
2 系统模型(Systemmodel)
社交网络中社区的信息传播模型如图1所示,它由多个社区组成,其中模型的节点代表个体。这些节点通过实线表示的连接关系形成一个复杂的网络。此模型以SI(易感-感染)模型为基础,其节点被细分为易感者(S)和感染者(I),两者通过不同的颜色加以区分。这一设定使得模型能够捕捉社交网络中个体状态的变化,并更好地理解信息传播的动态过程。模型考虑了用户之间的相互作用,这种相互作用通过节点之间的连接得以体现。这些连接不仅代表了社交网络的结构,而且还反映了个体之间可能发生的信息传递路径和相互影响关系。实际上,连接的存在直接影响了整个模型的行为和演化。随着社交网络中信息的传播,易感者可能变为感染者,进而通过其连接影响其他个体,推动信息传播的不断演进。
3 社区谣言传播模型(Communityrumordisseminationmodel)
基于社区的信息传播采用了基于传染病模型的信息传播假设,其中一条信息从一个节点传播到其邻居。在这一情境下,个体可以处于两种状态之一:易感(S),表示其尚未接收到特定的信息;感染(I),表示其已知晓并有能力将信息传播给联系人。因此,采用以下易感-感染模型:
其中:λgt;0表示易感染个体和感染个体之间的传播率,而变量t表示时间,且t是连续的。为了在每个时间点测量增加信息的情况,对公式(1)进行离散化处理,将其转换为
I(t)=(1+λNΔ)I(t-1)-λΔ(I(t-1))2, t=1,2,… (2)
其中:λNΔ表示每个时间单位可能被信息传播者感染的易受攻击用户的平均数量;Δ表示单位时间,可以是1h、1d或1a;I(0)表示感染用户的初始数量。
社交网络被抽象成包含M 个社区的结构。在自然界中,网络的密度与社交网络上的信息传播活动呈正相关[16]。为了反映社交网络内信息传播的特定性,采用全局聚类系数调节每个社区对应的βi。其具体描述如下:全局聚类系数用于衡量网络中节点聚类的程度。在社交网络中,使用全局聚类系数衡量每个社区的βi,该系数的计算公式为
βi= En/ni(ni-1) (3)
其中:ni是社区Ci中的用户数量,En表示邻居之间的总链接数。
结合公式(4),假设Δ=1,可以得到在时间t、社区Ci中的
Ii(t)=(1+λini)Ii(t-1)-λi(Ii(t-1))2=(1+αβini)Ii(t-1)-αβi(Ii(t-1))2 (4)
其中,α 表示一条信息敏感度设置范围为[0,1]。
针对敏感度不同的隐私信息,需要传播的程度可能会不同。信息敏感度不仅仅取决于隐私信息本身的重要性,还综合考虑了用户泄露信息可能带来的潜在影响。不同类型的隐私信息,由于其性质、内容以及对个人影响的差异,其敏感度也存在差异。这种敏感度差异基于个人对隐私的主观感受和对隐私泄露风险的认知程度,以及对用户隐私信息敏感度的调查结果[17-18]得以体现。表1按照平均敏感度进行了降序排序,展示了不同类型隐私信息的敏感度排序情况。
在本小节中,通过在实际数据集YouTube和BlogCatalog 上进行仿真实验,旨在验证社区信息谣言传播模型的效果,并进一步验证基于信任的真相传播的有效性。首先,通过仿真分析两个关键参数对传播模型的影响。其次,将社区信息传播模型与传统的SI模型(Susceptible-InfectiousModel)和SIR模型(Susceptible-Infectious-RecoveredModel)进行对比,以深入探讨它们之间的异同。最后,验证基于信任的真相传播模型的效果。这一研究旨在深入了解社区信息传播模型在不同环境下的实际应用效果,并评估基于信任机制的真相传播模型在谣言传播中的作用。
5.1 数据集
本研究选择了两个真实世界的社交网络数据集进行研究。第一个数据集来自YouTube[19],是全球最大的视频分享平台之一;第二个数据集来自BlogCatalog[20],是一个知名的博客分享网站,然而,该数据集缺乏有关社群的信息。为了解决这个问题,采用博主的主题兴趣作为社群标签。数据集的特征和统计结构如表2所示。
5.2 社区谣言传播模型
在两个真实数据集上验证了信息敏感度α 对社区谣言传播模型的影响。从图2中可以观察到,信息敏感度α 值越大,则代表传播的速度越快、传播的人数越多。这表明信息敏感度α 是影响信息传播可能性的重要因素。此外,在两个不同的数据集中,研究人员注意到在相同的初始条件下,即使节点数相同,网络密度的差异也会对信息的传播产生重要影响。
通过仿真不同全局聚类系数βi的情况,进一步研究其对社区谣言传播的影响,全局聚类系数βi对不同社区谣言的传播如图3所示。结果显示,全局聚类系数βi与传播人数呈正相关关系,即βi越大,传播人数越多。这强调了全局聚类系数在影响社区信息传播方面的重要作用。通过这些实验,更全面地理解信息敏感度和全局聚类系数对社区谣言传播模型的影响。
对社区谣言传播模型与传统的流行病传播模型如SI传播模型、SIR传播模型进行了对比,不同传播模型对比结果如图4所示。观察图4可见,社区谣言传播模型呈现出几乎指数级的增长趋势,然后又迅速达到饱和状态。值得注意的是,在谣言传播过程的中间阶段,社区谣言传播模型的传播速度超过了SI 传播模型和SIR传播模型。这是因为社区谣言传播模型不仅考虑了节点与节点之间的传播,而且还全面考虑了社区结构下的相互作用,从而在传播过程中表现出更高的信息传播速度,并更快地达到饱和状态。这些发现强调了社区谣言传播模型在信息传播中的优越性,特别是在考虑到社区结构的情境下。对比传统的流行病传播模型,社区谣言传播模型的高效性使其更适合解释社交网络中信息的传播过程。
5.3 基于信任的谣言传播控制
面对谣言在网络中广泛传播可能带来的严重后果,需要采取相应的措施抑制谣言的传播。本研究选择了基于信任的真相传播方法,在整个网络中利用之前计算的信任值按比例抽取人数,以传播真相、遏制谣言的传播。基于信任的真相传播方案如图5所示。在初始人口占比为0.4%的情况下,随着时间的推移,感染人数在10人左右。需要注意的是,由于YouTube数据集的人口基数较大且网络密度较低,因此信息传播速度相对较慢;而BlogCatalog数据集的节点相对较少,网络密度更大,因此在不同初始人口比例的情况下,感染人数的变化相较于YouTube数据集更为迅速。
图5中的结果表明,基于信任的正向传播方法能够有效抑制谣言的传播。这一方法不仅在场景模拟中表现出良好的效果,而且通过对不同网络数据集的验证,也证明了其在不同条件下的适用性。采用这样的方法有望为应对网络谣言提供一种有力的工具,有助于维护网络信息的可信度和社会稳定。
6 结论(Conclusion)
面对信息技术迅猛发展和社交网络广泛普及所带来的虚假信息、谣言和不良内容等问题,传统信息传播模型在个体传播层面的局限性日益凸显,且往往忽视了社区结构的重要影响。为了深入理解社区中的信息传播机制,本文在传统感染模型的基础上引入社区结构和信息敏感度,提出了一种基于信任的社区信息传播模型控制方案。通过仿真实验,在真实社交网络数据上验证了该方案的有效性。结果显示,在社区谣言传播模型中,信息敏感度和全局聚类系数等因素对传播过程产生了重要影响。同时,采用基于信任的真相传播方案能够有效抑制谣言在网络中的传播。特别是在考虑不同社交网络结构的情况下,该方法展现出了良好的适应性。
参考文献(References)
[1]SHRIVASTAVAG,KUMARP,OJHARP,etal.Defensivemodelingoffakenewsthroughonlinesocialnetworks[J].IEEEtransactionsoncomputationalsocialsystems,2020,7(5):1159-1167.
[2]DONGS,HUANGYC.SISrumorspreadingmodelwithpopulationdynamicsinonlinesocialnetworks[C]∥IEEE.ProceedingsoftheIEEE:2018InternationalConferenceonWirelessCommunications,SignalProcessingandNetworking.Piscataway:IEEE,2018:1-5.
[3]CUIL,XIEG,YUS,etal.Aninherentproperty-basedrumordisseminationmodelinonlinesocialnetworks[J].IEEEnetworkingletters,2020,2(1):43-46.
[4]XIAOYP,HEW K,YANGT,etal.Adynamicinformationdisseminationmodelbasedonuserawarenessandevolutionarygames[J].IEEEtransactionsoncomputationalsocialsystems,2023,10(5):2837-2846.
[5]HUO L A,CHENSJ.Rumorpropagationmodelwithconsiderationofscientificknowledgelevelandsocialreinforcementinheterogeneousnetwork[J].PhysicaA:statisticalmechanicsanditsapplications,2020,559:125063.
[6]YANGS,JIANGHJ,HUC,etal.Dynamicsoftherumorspreadingmodel with hesitation mechanism inheterogenousnetworksandbilingualenvironment[J].Advancesindifferenceequations,2020,2020(1):628.
[7]HOSNIAIE,LIK,AHMEDS.HISBmodel:Arumordiffusionmodelbasedonhumanindividualandsocialbehaviorsinonlinesocialnetworks[M]∥NeuralInformationProcessing.Cham:SpringerInternationalPublishing,2018:14-27.
[8]XIAOYP,YANGQF,SANGCY,etal.Rumordiffusionmodelbasedonrepresentationlearningandanti-rumor[J].IEEEtransactionsonnetworkandservicemanagement,2020,17(3):1910-1923.
[9]LIU Y,WU YB.FNED:adeepnetworkforfakenewsearlydetectiononsocialmedia[J].ACMtransactionsoninformationsystems,2020,38(3):1-33.
[10]FANLD,LUZX,WUWL,etal.Leastcostrumorblockinginsocialnetworks[C]∥IEEE.ProceedingsoftheIEEE:2013IEEE33rdInternationalConferenceonDistributedComputingSystems.Piscataway:IEEE,2013:540-549.
[11]钱榕,李鑫,刘晓豫,等.考虑禁言机制的谣言传播模型[J].计算机工程,2024(8):372-378.
[12]MALL,MAC,ZHANGHF,etal.Identifyinginfluentialspreadersincomplexnetworksbasedongravityformula[J].PhysicaA:statisticalmechanicsanditsapplications,2016,451:205-212.
[13]KHALILEB,DILKINAB,SONGL,etal.Scalablediffusion-awareoptimizationofnetworktopology[C]∥ACM.ProceedingsoftheACM:20thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining.NewYork,USA:ACM,2014:1226-1235.
[14]BUDAKC,AGRAWALD,ElABBADIA,etal.Limitingthespreadofmisinformationinsocialnetworks[C]∥ACM.ProceedingsoftheACM:20thInternationalConferenceonWorld Wide Web.New York,USA:ACM,2011:665-674.
[15]TONGG M,WU W L,GUOL,etal.Anefficientrandomizedalgorithmforrumorblockinginonlinesocialnetworks[J].IEEEtransactionsonnetworkscienceandengineering,2020,7(2):845-854
[16]LUARNP,CHIUYP.Influenceofnetworkdensityoninformationdiffusiononsocialnetworksites:the mediatingeffectsoftransmitteractivity[J].Informationdevelopment,2016,32(3):389-397.
[17]章迪.基于社交圈划分的社交网络隐私保护研究[D].上海:上海交通大学,2019.
[18]宋美良.基于共享习惯的社交网络隐私保护模型研究[D].贵阳:贵州大学,2023.
[19]TANGL,WANGXF,LIUH.Scalablelearningofcollectivebehavior[J].IEEETransactionsonKnowledgeandDataEngineering,2012,24(6):1080-1091.
[20]TANGL,LIU H,TANGL,etal.Relationallearningvialatentsocialdimensions[C]∥ ACM.ProceedingsoftheIEEE:Proceedingsofthe15thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining.Piscataway:ACM,2009:817-826.
作者简介:
李欣欣(1999-),女(汉族),台江,硕士生。研究领域:社交网络,信息传播。
汤金川(1990-),男(汉族),贵阳,教授,博士。研究领域:人工智能,隐私保护和社交网络。