APP下载

无标度网络上的观点动力学研究

2020-09-02刘雪萍尚丽辉李轩宇

软件导刊 2020年8期
关键词:学习能力

刘雪萍 尚丽辉 李轩宇

摘 要:在现实生活中,观点更改与达成共识是社会行为动力学研究的一个重要方面,受到了不同领域研究者的关注。基于演化博弈论建立一致性观点模型,研究了个体学习能力对无标度网络上个体观点演化的影响。依照个体度值,网络中的个体被分为A、B两类,A类表示参与者度值高且学习能力强,B类则与之相反。仿真结果表明,个体学习能力对观点演化行为具有重要影响。当学习系数小于0.001时,参与者倾向于保持自己的观点,使整个网络的观点在有限时步中难以达到一致。当A类所占比例提高时,网络达到一致的时间缩短,但当A类所占比例增加到0.8~1时,网络达到一致的时间几乎保持不变。

关键词:无标度网络;观点动力学;演化博弈论;学习能力;异质性群体

DOI:10. 11907/rjdk. 192608 开放科学(资源服务)标识码(OSID):

中图分类号:TP393文献标识码:A 文章编号:1672-7800(2020)008-0197-05

Abstract: In real life, the change and consistency of peoples opinions is an important aspect of studying social behavior dynamics, which has attracted the attention of researchers in different fields. Consensus opinion model is constructed based on evolutionary game theory. We study the influence of individual learning ability on the opinion dynamics in scale-free network. According to the size of the degree, all of the individuals are divided into class A and class B. Class A has high degree value and strong learning ability, while those in class B has the opposite. The simulation results show that the individual learning ability has an important influence on opinion evolution. When the learning ability coefficient is less than 0.001, individuals tend to maintain their own opinions, making it difficult for the opinions of the whole network to be consistent in the finite time steps. When the proportion of class A increases, the consistent time is shortened. The consistent time between 0.8 and 1 for the proportion of class A is almost equal.

Key Words: scale-free network; opinion dynamics; evolutionary game; learning ability; heterogeneous groups

0 引言

復杂系统无处不在,大量复杂系统都可通过网络加以描述,如神经网络系统[1]、道路交通网络系统[2]、邮件网络系统[3]等复杂系统都可抽象为节点与连边构成的网络进行分析。基于这种思想,可以在演化博弈理论中引入网络拓扑的概念,将个体看作网络中的节点,并且仅与和它有连边的个体进行交互[4-5],其中由于无标度网络(BA网络)能很好地呈现现实社会社交结构,因此运用更为广泛[6]。复杂网络上的演化博弈主要研究策略演化规则对群体合作行为的影响[7-8]以及不同网络拓扑结构[9-10]等对合作演化的影响。近几年,复杂网络研究领域还延拓到大数据和人工智能方向[11-12]。由于博弈中的任意两个个体不可能完全相同[13],即异质性广泛存在,因此相关声誉[14]、记忆[15]和学习能力[16-17]等个体特征受到了研究者们的广泛关注。

由于受到个体间相互交流及个体内在因素等方面影响,人们针对相同的人或事物,不同的人持有不同观点,并且有可能随时间改变[18]。由于观点动力学和演化博弈具有相似性,故可运用博弈论的策略更新规则研究观点动力学的观点演化过程。最新研究是杨涵新[19]在博弈理论基础上提出的一种一致性观点模型,在该模型中,如果个体与其邻居持有的观点相同,则均可获得相同的收益,若相反,均获得一个相同的惩罚,并且发现总存在一个最优惩罚值使得系统达到一致性的时间最短。

基于上述内容,本文在演化博弈论基础上建立一致性观点模型,采用BA网络作为模型的网络结构,将个体学习能力引入到该模型中,进而研究个体学习能力对群体达到一致性的影响。结果表明,当个体学习能力低于0.001时,网络中的观点很难达到一致。随后,将个体分为A、B两类,A类的度较高且具有较强的学习能力,B类则与A类相反。当A类的比例达到0.8~1时,网络达到一致的时间相差无几,表示在网络中如果存在少量学习能力较差的个体时,并不会对网络达到一致的时间产生较大影响。

1 博弈模型

1.1 网络结构模型

BA网络生成规则参考Dorogovtsev等[20]的研究,具体生成规则如下:

(1)首先将期望网络达到的平均度设置为网络初始节点个数m0,并使初始节点互相连接。

(2)在演化的每个步骤中引入一个新节点,并且选择m个已存在的节点,与其进行连边。

(3)新加入节点与之前节点s的连接概率为[Πks=][ks/jkj],其中[ks]表示节点s的度,[jkj]表示当前所有节点的度之和。

重复步骤(2)、(3),直到经过t个步骤后,节点个数符合期望网络尺寸。最终期望网络中共有[m0+mt]个节点,以及[m0m0-12+mt]条连边。

1.2 个体收益

本研究采用离散观点动力学模型,初始网络中有+1和-1两种观点,且二者所占比例相同。在每一时步内,都需要计算每个个体获得的整体收益。对于某一个节点x,观察它及其所有邻居节点所持观点的情况,可得到节点x的整体收益为:

1.3 观点更新过程

观点更新采用异步更新规则[21]。在每一个完整的蒙特卡洛步骤中,每个节点平均有一次机会可以改变自己的策略。节点y学习节点x观点的概率如式(2)所示。

在演化过程中,主要研究网络中所有节点达到一致的时间[Tc],其是衡量整个系统达到稳定状态快慢的重要参数。本次研究中涉及到3个重要的可控参数,分别为惩罚值c、B类参与者学习能力[ωx],以及A类参与者所占比例 。此外,网络平均度、网络中节点个数N、噪声参数κ和幂律指数γ 4个基本参数可以更加完整地描述网络特征,并能更为详细地探究网络结构对系统演化过程的影响。最后,为了避免偶然性情况的发生,也为了使结果更具有说服力,结果中所呈现的值均是进行了1 000次模拟后的平均值。

2 仿真实验

根据上文描述,个体整体收益是由奖励值b与惩罚值c共同决定的。首先令b=1,研究不同惩罚值c对于系统达到一致时间的影响。为了体现在不同外界条件下系统的演化结果,为4个基本参数分别设定了3种情况。在这些情况下,先不讨论[ωx]和 对演化过程的影响,故暂时将[ωx]和 设置为1,具体演化过程如图1所示。初始值设置如下:平均度=6,节点个数N=5000,噪声参数κ=1,幂律指数γ=3(下文若无特别说明,参数设置保持不变)。通过对图1的整体观察,可得到无论在哪种条件下都会存在一个最优的c使得[Tc]达到最短,且c≈1.2。故可得出一个初步结论,无论在何种情况下,总是存在一个最优的惩罚值c使得系统更快地达到一致。此外,在图1(d)中,[Tc]随着γ的变化出现交叉的情况。

为了验证以上结果,本文进行了如下研究,结果如图2所示。在c分别为0.1、1.2和4的3种情况下,研究[Tc]与4种基本参数之间的关系。由图2(a)-图2(c)可得到[Tc]随的增大而降低,随N和κ的增大而增大。在图2(d)中,当c=0.1和 5时,[Tc]随着γ的增大而降低;当c=1.2时,[Tc]随着γ的增大而增大,这就是图1(d)中出现交叉的原因。对图2作整体分析,得出当c=1.2时可以使[Tc]最短。所以在接下来的研究中,均设置c=1.2。

接着考虑个体学习能力对观点演化的影响,令 =1,观察[Tc]与[ωx]以及4种不同参數之间的函数关系,结果如图3所示。可以观察到在4种不同的基本参数下,当[ωx]<0.001时,在有限个时步内网络观点很难达到一致,这是由于过小的[ωx]会使网络中参与者很难学习其邻居的观点,因而保持自己的观点不发生变化。在图4中,[Tc]的变化趋势与图2类似。

BA网络中领导节点对观点演化的影响一直是学者们的研究热点[22]。几乎在所有真实社交网络中都存在领导者,他们凭借着自身的条件使得网络中其他成员在作决定时会学习他们的观点。这里将A类节点作为领导者,研究A类节点所占比例 对系统演化结果的影响。设置A类节点的[ωx]为1,B类节点的[ωx]为0.1。因此,与B类相比,A类是具有更强学习能力的领导者。接下来通过控制参数 研究观点演化过程,结果如图5所示。由图5可知,在每一个基本参数下,[Tc]都随着 的增加呈现越来越缓慢的下降趋势。并且当 =0.8和1时,二者[Tc]的最大差值约为2,两条曲线几乎完全重合。此外在图5(d)中,当2<γ<3时,网络在度分布上的非均匀性较强,即某些中心节点的度较大;当γ>3时,系统会趋向于随机网络。当 =0.2时,则会在γ=3附近使[Tc]最短。

当c取不同值时,[Tc]作为[ωx]或 的函数,结果如图6所示。在图6(a)中, =0.6,在图6(b)中,[ωx=0.1]。由图6可知, 和[ωx]的大小不会影响最优c,只会影响[Tc],并且随着 或[ωx]的增加,[Tc]呈下降趋势。

最后研究领导节点的观点是否对[Tc]造成影响,首先将领导节点的观点设置为+1,结果如图7(a)所示,再将领导节点的观点设置为-1,结果如图7(b)所示。在图7中,  =0.6, [ωx=0.1],其余参数设置保持不变。由图7可知,当领导者节点为设定值时,系统达到一致时的观点状态即为该观点值,并且不会对[Tc]有所影响。

本研究基于博弈论的观点动力学模型,探讨A、B两类参与者的学习能力[ωx]与所占比例 对达到最短一致时间[Tc]的影响。通过在度可调的BA网络上针对不同参数进行仿真,以及对相关数据的研究与分析,发现当系统中所有节点的学习能力[ωx]<0.001时,网络中的观点很难达到一致,但随着[ωx]的不断增加,[Tc]呈线性下降;当A类节点所占比例 增加时,系统达到一致观点的时间更短,并且当 增大到0.8后,[Tc]几乎保持不变。

3 结语

猜你喜欢

学习能力
化学教学中科学探究存在的几个偏差
等待·自主·探究
谈如何培养小学生的数学学习能力
学业导师制对本科生学习能力和素质教育造成的影响