APP下载

基于人工智能方法的信息传播网络重要节点识别

2023-11-27马亮亮张凯伦

科学技术创新 2023年27期
关键词:兔子中心节点

汪 超,马亮亮,张凯伦,王 璐

(1.安徽工程大学 建筑工程学院,安徽 芜湖;2.安徽工业大学 复杂系统多学科管理与控制重点实验室,安徽 马鞍山)

引言

随着信息技术的发展,社会已然演化为一个高度复杂的网络结构。为了有效地进行舆论导向和危机公关, 迫切需要揭示信息在这样错综复杂的社会网络中的传播规律。复杂网络理论为我们提供了一个行之有效的分析工具。通过构建网络拓扑结构、分析节点度分布和聚类系数等统计学特征, 可以实现对网络中的关键节点的识别[1]。这些节点往往起着网络枢纽的作用,是控制信息传播的流量和节奏的关键所在。因此,如何识别信息传播网络中的重要节点具有重要的现实意义。

无标度特性[2]表明不同节点在网络结构和功能中的作用可能有很大不同。事实上,识别某些结构或功能目标相关的重要节点非常重要,这使我们能够更好地控制流行病的爆发,为电子商务产品进行成功的广告,防止灾难性的后果。到目前为止,研究人员提出了许多有效的方法来识别信息传播网络,包括度中心性、介数中心性、特征向量中心性和PageRank 算法等。此外,Xu[3]开发了一种新的节点排名算法来识别信息网络传播中的重要节点。Mekonnen Tulu 等人[4]基于社区结构识别影响力节点加速复杂网络信息传播。Xu 等人[5]利用信息熵的思想,设计了一种基于节点邻接信息熵的方法,并提出了适用于不同类型网络(如无向网络、有向网络和带权网络)的有效算法来识别重要节点。Asgharian Rezaei[6]开发了一个基于机器学习的方法来识别重要节点。Ren 等人[7]采用反向贪婪法来识别信息传播网络中的重要节点。近年来,元启发式算法的兴起为复杂网络重点节点识别提供了新思路。粒子群优化算法[8]、人工蜂群优化算法[9]、飞蛾火焰优化算法[10]和樽海鞘优化算法[11]等智能优化算法相继被提出。尽管智能优化算法在处理复杂网络数据方面有其优势,但随着信息时代的到来,数据量的剧增使得仅依赖智能优化算法已不再能有效地解决问题。为了应对这一挑战,数据驱动方法逐渐被应用。其中,RBF 神经网络(Radial Basis Function Neural Network)模型[12]是基于径向基函数的机器学习模型,用于非线性模式识别和函数逼近问题。

本文首先采用RBF 神经网络驯化LT 传播模型下的数据预测器,然后在该预测器上,采用兔子优化人工智能算法来进行信息传播网络载体的关键节点识别。

1 相关概念及理论基础

1.1 LT 传播模型

LT 传播模型可以被定义为:给定一个信息网络图G(V,E)、初始节点和集合个数,假设初始集合中的节点状态是活跃的。基于一种影响力传播模型机制,从初始集合开始向整个网络传播影响力。目标是找到这些初始节点集合,以使网络中受到影响的节点数量最大化。

1.2 RBF 模型

RBF 模型是一种基于径向基函数的机器学习模型。在RBF 模型中,模型的隐藏层由一系列的径向基函数组成。径向基函数的中心是根据训练数据在输入空间中的分布来确定的。每个基函数具有一个中心和一个半径,它衡量输入数据与基函数中心之间的距离,式(2)为高斯基函数。RBF 模型的输出由隐藏层基函数和其对应的权重线性组合而得到。模型的训练过程包括选择合适的基函数中心,计算基函数的权重,以及确定基函数的半径。

1.3 人工兔子优化算法

人工兔子优化算法(artificial rabbits optimization,ARO)[13]是一种基于兔子在自然界生存的元启发式算法。ARO 算法包括绕道觅食和随机躲藏两种策略。兔子通过绕道觅食策略来迫使其吃掉其他兔子巢附近的草,从而防止它们的巢被掠食者发现。同时,通过随机隐藏策略,兔子能够从它们自己的洞穴中随机选择一个来躲藏,从而减少被敌人捕获的可能性。此外,兔子能够自适应调节能量,从而可以在绕道觅食和随机躲藏之间切换。兔子的能量因子表示如式(4)

式中,A 代表兔子的能量;t 是当前的迭代次数;T 是最大迭代次数;r 是(0,1)的随机数。

兔子绕道觅食和随机躲藏策略的数学形式如式(5)、公式(6):

2 仿真实验及结果分析

首先选取socfb-nips-ego 信息传播网络数据[14]作为载体,然后度中心性(DC)、介数中心性(BC)、Pagerank 值等三个常用中心性度量作为每个样本节点的代表特征,替代节点成为输入变量,同时以指标为输出变量,使用RBF 预测器来挖掘变量之间的潜在关系。步长设为10,迭代次数设为5 万。从图1 可以看出,根据信息网络数据训练出的模型预测精度均达到90%以上。其次,识别目标函数和决策变量,其具体表达式如式(7)。最后,利用人工兔子优化器取得目标函数的近似值。

图1 RBF 预测

式中,N 是社会网络的大小;λ 是平衡参数,φ (S)是在LT 模型中从初始种子S*可以到达的网络上的节点数。

用数据预测器RBF 作为目标中函数变换黑盒,同时采用兔子优化器获得重要节点。其中,兔子优化器的种群规模为100,最大迭代次数为200,获取的优化目标迭代情况如图2 所示,可以看出在25 代左右就达到最优值。表1 反映了优化后获取的10 个重要信息传播节点索引,同时对比了度中心性、介数中心性方法获取的结果,可以看出本文的求解方法具有较强的可行性。

表1 不同算法下的信息传播关键节点索引

图2 优化迭代

3 结论

本文充分发挥了人工智能方法的优越性,提出了一套综合数据预测与元启发式算法的方法,用于挖掘信息传播网络中的关键节点。首先,本文将信息传播网络的拓扑特性与信息传播模型相结合,构建了大量的数据样本,并运用RBF 建立了高效的预测模型。接着,将预测模型与优化算法紧密结合,将节点索引作为变量,以信息传播影响力作为目标,实现了重要节点的准确识别。通过算例验证,本文提出的预测模型拟合精度高,优化结果可靠,具备实际应用价值。

猜你喜欢

兔子中心节点
剪掉和中心无关的
CM节点控制在船舶上的应用
在打造“两个中心”中彰显统战担当作为
Analysis of the characteristics of electronic equipment usage distance for common users
基于AutoCAD的门窗节点图快速构建
兔子
别让托养中心成“死亡中心”
守株待兔
想飞的兔子
抓住人才培养的关键节点