APP下载

自私性移动P2P网络中节点激励策略研究

2017-10-14陈志刚张连明

电子与信息学报 2017年8期
关键词:估价网络系统消息

刘 浩 陈志刚 张连明



自私性移动P2P网络中节点激励策略研究

刘 浩*①陈志刚②张连明③

①(湖南人文科技学院信息学院 娄底 417000)②(中南大学信息科学与工程学院 长沙 410083)③(湖南师范大学物理与信息科学学院 长沙 410081)

该文针对移动P2P网络中节点表现出来的自私性,并结合移动P2P网络的资源受限、自组织以及开放性等特点,提出一种基于不完全信息的双方叫价拍卖模型的节点激励策略—DAIP。该激励策略采用虚拟货币的支付方式,节点根据其拥有的虚拟货币量、自身资源状态和消息属性对每次消息转发进行估价,然后根据估价与博弈策略给出相应报价。通过博弈分析给出了DAIP策略的线性策略贝叶斯纳什均衡解,使各节点为最大化其自身利益而积极参与消息转发合作,从而促进网络系统中消息转发合作的成功。分析与实验结果表明该激励策略能够降低系统的能量消耗,提高整个网络系统的消息转发成功率,提高系统的整体效用。

移动P2P网络;自私性;拍卖模型;虚拟货币;激励策略

1 引言

近年来,无线通信技术得到了快速发展,移动用户的资源共享与协同工作需求日益增长,从而促进了移动P2P网络的广泛应用。当前,移动P2P网络已经得到了网络通信领域产业界和学术界的普遍关注[1]。然而,移动P2P网络的自组织与动态性等特点,一方面使大量的移动用户节点加入到移动P2P网络中,另一方面也使网络中自私性节点普遍存在[2]。自私节点总是尽可能地利用网络系统中的各种资源,如存储资源、计算资源以及文件资源等,却不愿意贡献出自身的资源,这就导致整个网络系统的可用资源存在很大的变数。显然,这与P2P网络实现的基本理念“人人为我,我为人人”是相违背的[3]。相关研究表明,在Gnutella等P2P网络中,存在着60%以上只消费网络资源而不愿意共享自身资源的freerider节点。并且,移动P2P网络中存在着大量不可靠的服务质量和欺诈行为[2]。用户节点的自私行为严重影响了移动P2P网络服务的可用性,降低了系统的整体效用。显然,如何构建有效的激励策略,约束节点的自私行为,激励节点间的相互合作,是移动P2P网络需要解决的关键问题之一[2,3]。

目前,P2P网络中节点的激励策略大致可分为区分服务与虚拟支付两类[3,6]。区分服务类型激励策略的基本思想是,给予积极参与资源共享和协同合作的节点更高级别的服务(如享受优先服务等)。针对P2P网络中节点的搭便车行为,乐光学等人[6]在P2P可信流媒体网络环境下给出了一种以节点的贡献度、信誉度及其收益为评价指标的抑制机制。针对P2P文件共享系统中用户节点的搭便车行为,若仅仅使用奖励等区分服务激励策略是不够的,文献[7]对相应激励策略的公平性进行了评估与改进。基于重复博弈相关理论,文献[8]在P2P网络中建立了对自私节点的惩罚机制,并通过制定相关的行为规则,激励理性节点为使其自身收益最大化而向网络系统贡献相关资源。基于Stackelberg博弈方法,文献[9]给出了一个基于信用的异构对等网络中节点的激励策略,该策略通过偏袒的资源配置机制,根据节点的不同信用值为其提供不同的服务,以激励节点间的相互合作。牛新征等人[10]针对移动P2P网络中移动节点的资源有限和网络拓扑的动态性,基于依据排队理论与可靠性理论,构建了一种移动节点间层次型资源调度模型与资源协作共享方案,通过动态调整节点的队列优先权激励节点参与资源共享。尽管基于区分服务思想的激励策略容易实现,然而在该类型激励策略作用下,网络系统的整体效用与每个节点的自身利益很难同时达到最优,因此,理性的自私节点仍然存在违背协议的动机[3,6];同时,若评价机制不够完善,节点间还可能存在共谋现象。基于虚拟支付激励策略的基本思想是:节点采用虚拟货币来支付所获得的各种网络服务,当为其他节点提供各种网络服务时则能够获得以虚拟货币形式的报酬[11]。基于虚拟支付的激励策略在机会网络、无线网络、P2P网络等领域应用广泛,尤其是与博弈论相结合,将成熟的博弈论思想应用于虚拟支付的激励策略中,能够有效地解决网络系统中节点的自私性问题,提高系统的整体效用。基于虚拟支付和演化博弈理论,文献[12]提出了一种自组织网络中节点间的协同合作激励策略。文献[13]针对机会网络中边缘注入和边缘隐藏攻击等问题,提出了一种MobiCent机制,该机制使用倍减算法来计算报酬,以激励网络系统中节点间的相互合作。为提高移动对等网络数据的可用性,文献[14]提出了一种基于经济激励的经纪方案,激励中继节点作为路由和消息转发的经纪人,以提高对等网络的路由与消息转发效率。为了约束移动P2P网络中节点“搭便车”的行为,提高网络的搜索效率,基于资源拍卖文献[15]给出了一种节点激励策略,系统通过拍卖经济模式激励节点为获得收益而贡献相应的资源,该激励策略能够有效地提高系统的整体效用,达到优化系统性能的目标。针对机会网络中节点的自私性问题,并结合机会网络中节点资源受限等特点,李云等人[16]提出了一种基于买卖模型的节点消息转发激励策略,有效地解决节点盲目合作带来的网络性能退化问题。文献[17]给出了一种基于进化博弈的资源配置模型,将资源配置问题抽象为一种进化博弈,通过策略与收益函数来分析资源配置过程中节点对资源副本的选择行为及其对查询性能的影响;以约束有限理性节点在配置过程中的自私行为,从而提高系统的查询性能。这些激励策略大多数是通过各种规则、策略来激励自私节点进行合作,并没有考虑节点自身资源受限等因素对节点行为的影响。因此,它们并不适用于节点资源受限的移动P2P网络。同时,它们在追求网络系统整体效用最优时,也没有充分考虑理性节点的自私性,即最大化其自身收益。

为了描述方便,本文的分析场景为移动P2P网络中节点间的消息转发合作过程。由于移动P2P网络中节点资源是有限的,假如节点激励策略不考虑资源的使用情况,就会造成节点因能源耗尽而直接退出网络,从而导致整个网络系统性能退化,会造成更大的损失。因此,在综合考虑移动网络中节点的自身状态和消息属性等因素,给出了一种基于不完全信息的双方叫价拍卖模型的节点激励策略—DAIP(Double Auction basedIncentive Protocol)。

2 网络模型

本质上,移动P2P网络是各种移动终端以自组织方式建立在网络层之上的分布式覆盖网络,通过利用移动终端的空闲资源进行资源共享和协作工作[1]。比如,当遇到自然灾害(如地震等)时,现有的基础设施遭到破坏,一般可利用移动设备快速建立移动自组网,这里的移动自组网上覆盖网络就属于移动P2P网络。由于这些移动节点所拥有的能量、缓存等资源都是有限的,并且能量是不可再生的。一方面,移动节点加入网络系统,是以资源共享与协同工作为目的,这就会消耗其自身的资源。另外一方面,移动节点为了保证较长时间的正常工作,就会尽可能地节约其所拥有的资源,那么就会表现出其自私性。并且,对于移动P2P网络中节点的恶意行为,一般来说激励策略没有抑制作用,通常是采用信任机制来达到抑制恶意节点的目标。因此,在网络模型方面,这里先给出一些相关的理论假设。

(1)每个移动节点都是理性的自私节点,若在某次消息转发交易中无法收益时,就不会参与本次消息转发交易。

(2)自私节点都是有限理性的,在自身状态允许的情况下,节点在消息转发交易中都会考虑自身利益的最大化。

(3)理性的自私节点并不是恶意节点,都会根据自身状态和消息属性对每次消息转发交易进行估价。

(4)在约定的观测时间周期内,所有移动节点的能量都不能得到补充,且在运行过程中知晓其能量状态,当能量耗尽时则自动退出网络。

(5)每个移动节点都不会最终接收其他节点的消息,除非它是消息的目的节点。

3 基于不完全信息的双方叫价拍卖模型的节点激励策略

本文给出的基于不完全信息双方叫价拍卖模型的节点激励策略DAIP是一种基于虚拟货币支付的激励策略。与已有工作不同,该激励策略DAIP综合考虑了移动节点的自身状态与消息属性等因素对节点估价的影响。DAIP策略不需要信任第三方来管理交易过程,每个移动节点各自管理自身的虚拟货币、缓存、能量等资源,每次消息转发交易完成后,消息转发请求节点向消息转发服务节点支付虚拟货币作为报酬。因此,DAIP策略适用于移动P2P网络这样的完全分布式系统。

3.1 基本概念与定义

在移动P2P网络中,影响节点进行消息转发合作意愿的因素较多。在此,DAIP策略主要考虑节点的能量、缓存与虚拟货币量以及所需转发消息的属性等一些重要的因素。

消息属性包括消息的大小与消息的剩余生存时间。在其他条件相同的情况下,消息越大,转发信息的时间越长,所消耗的能量越大。消息的剩余生存时间是指从当前时刻到消息过期(生存周期结束)这段时间,消息的剩余生存时间越短,说明该消息越应尽快转发到达目的节点。

定义8 设消息传输的能量消耗与消息大小成正比,其中比例系数为。即每传输1 MB的消息,服务节点将消耗J能量。

3.2 不完全信息的双方叫价拍卖模型

在此,将移动节点间消息转发过程抽象成不完全信息的双方叫价拍卖交易过程。在交易过程中,双方都只知晓自身的状态与消息属性,但并不了解对方的状态等其他情况,也就是说双方在对本次消息转发交易估价时,信息是不完全的。其中,交易的卖方是提供消息转发服务的节点,买方是需要转发消息的请求节点。在交易过程中,买方通过支付虚拟货币来购买卖方的消息转发服务。

3.2.1拍卖交易规则 每次消息转发交易必须满足以下规则:

(1)每次交易开始时,买卖双方各自根据下面的估价函数对本次消息转发交易进行估价。设卖方对本次消息转发交易的(成本)估价为,其中;设买方对本次消息转发交易的(价值)估价为,其中。

3.2.2买方估价函数 在发送消息时,作为买方,消息发送节点需要对本次消息转发进行(价值)估价。买方在估价时,主要会考虑自身的财富状态、缓存与消息的属性。作为理性节点,买方的剩余缓存百分比越小,为了减小缓存压力,节点发送出消息的意愿越强烈;消息需要转发的紧急程度越高,购买消息转发服务的意愿越强烈。并且,若买方越富裕,即其拥有的虚拟货币量越大,则它更愿意出一个相对高的价格来支付本次消息转发服务。那么,买方的估价函数可以表示为

(7)

由于节点剩余缓存的变化是可逆的,而能量是随时间严格递减的,并且,只要两者之一变小,卖方提供消息转发服务的要价就会越高,因此,可采用自适应加权。当剩余带宽百分比小于剩余能量百分比时,前者对卖方出价的影响则大,反之亦然。则有

(9)

3.3消息转发过程

图1 消息转发过程

具体描述如下:

4 博弈分析

不完全信息双方叫价拍卖的动态博弈是有共同利益的两个交易者面临冲突(就某一商品进行谈判报价)时试图达成一致协议的一种博弈过程;利益相关双方都认定自己对该商品的估价(价值或成本)是私人信息,对方是不知晓的,即在不完全信息条件下博弈;并且利益相关双方都希望在本次交易过程中最大化其自身利益。在前面的拍卖交易模型中,约定了规则:当时,本次消息转发交易成功,交易的最终价格为。但是如何才能够保证消息转发服务节点按约定的规则提供转发服务,同时,消息转发请求节点按约定的规则接收转发服务。为解决该问题,这里将节点间的消息转发过程抽象为一个不完全信息双方叫价拍卖的动态博弈,激励理性的博弈双方(节点与节点)为最大化自身利益而积极参与消息转发合作,从而促进消息转发合作的成功。

4.1博弈方及其策略

(1)信息是不完全的,即:卖方只知道本次消息转发交易的(成本)估价,买方只知道本次消息转发交易的(价值)估价为;

4.2博弈均衡分析

本文假设每个移动节点都是理性的自私节点,那么在消息转发博弈过程中,每个移动节点都会考虑自身利益的最大化。下面来分析博弈双方(节点与节点)如何来选择报价策略(,),使其各自的利益最大化,同时达到纳什均衡。

满足式(10),式(11)后,分别有

参考文献[18,19],最优化一阶条件有

解两个一阶条件得到线性策略均衡解为

给出线性策略均衡分析图如图2所示。

从图2可以看出,在线性策略均衡下,

由线性策略均衡解式(12)和拍卖交易规则(3) 可以推出:

图2 线性策略均衡分析图

通过以上对消息转发博弈过程的均衡分析可知,本文将消息转发过程抽象为一个不完全信息双方叫价拍卖的动态博弈,能够激励博弈双方(节点与节点)在追求自身利益最大化的同时积极参与消息转发合作,从而促进消息转发合作的成功。

5 仿真试验与结果分析

为了评价激励策略DAIP的网络性能,我们采用JXTA开发平台来实现网络模型中的相关机制与协议,其中以按需路由协议AODV作为仿真实验中的路由协议。

实验场景参数设置:500个移动节点(无线终端)随机分布在4000 m×3000 m的区域内,每个节点使用IEEE802.11无线网络接口,节点移动速度为0~20 m/s,节点通信半径为100 m,移动方式遵循Random Waypoint 移动模型。每个节点的初始能量为1000 J,发射功率为1 W,缓存空间初始值为30 MB,并假设节点只有在参与消息转发合作时才会消耗能量,其中每次消息转发请求与响应等过程消耗能量1 J,消息传输的能量消耗比例系数为,即1 MB的消息传输消耗2 J能量。模拟时间为4 h,其中最初的5 min为热身时间,网络系统每1 min随机地产生500个大小服从[0.5,1] MB均匀分布的消息。设,,,,。

实验 1 设文献[16]给出的基于买卖模型节点激励策略简称为BIP,该激励策略借鉴了双向叫价的拍卖交易模型,并通过单一价格策略均衡来激励机会网络中自私性节点的合作。分别在网络系统中采用DAIP策略、BIP策略和不采用任何激励策略Nature状态的3种情况下,当网络系统中自私节点的比例增大时,考察整个网络系统中消息转发的平均成功率,其实验结果如图3所示。

从图3可知,当网络系统中自私节点的比例增大时,在不采用任何激励策略的Nature状态下,系统的消息转发平均成功率快速下降,极端情况网络系统性能严重退化;采用BIP激励策略,系统的消息转发平均成功率缓慢下降;采用DAIP激励策略,系统的消息转发平均成功率基本保持不变。原因是在不采用任何激励策略的Nature状态下,理性的自私节点可能不会参与消息转发合作,这就会降低消息转发的成功率。并且,DAIP激励策略比BIP激励策略更能够提高系统的消息转发成功率。

实验2 设网络系统中的移动节点都是理性的自私节点,分别在网络系统中采用DAIP策略、BIP策略和不采用任何激励策略Nature状态的3种情况下,当网络系统中消息转发成功的次数增加时,考察所有节点的平均剩余能量,其实验结果如图4所示。

从图4可以看出,当网络系统中消息转发成功的次数增加时,在不采用任何激励策略的Nature状态下,网络系统中所有节点的平均剩余能量减少的较快;若采用BIP激励策略,网络系统中所有节点的平均剩余能量减少得较慢;采用DAIP激励策略,则平均剩余能量减少得最慢。原因是不采用任何激励策略,由于节点的自私性,可能不会参与消息转发合作,那么在达到相同消息成功转发的次数时,会增大消息转发请求与响应等过程的次数,从而加大了能量消耗。并且,相对于BIP激励策略,采用DAIP激励策略的系统整体效用更高。

在不完全信息的双方叫价拍卖动态博弈中,主要有单一价格策略均衡和线性策略均衡。相关研究结果[18,19]表明,从最大化交易比例来说,线性策略均衡优于单一价格策略均衡,或者说线性策略均衡的效率是最高的。因此,理论分析与仿真实验结果一致表明DAIP激励策略要优于BIP激励策略。

综上所述,采用DAIP激励策略能够有效地提高整个网络系统的消息转发成功率,降低系统的能量消耗,提高系统的整体效用,达到了预期的设计目标。

6 结束语

通过借鉴双方叫价拍卖模型、博弈论的基本原理,本文给出了一种自私性移动P2P网络环境下节点间消息转发过程中的激励策略DAIP。该策略通过虚拟货币支付方式,有效地激励自私节点进行合作,给自私性移动P2P网络中节点激励策略等相关研究提供了一种新的研究思路。尽管DAIP策略不失为一种有效的节点激励策略,但是并没有考虑如何保证节点进行真实报价或者说如何约束节点进行虚假报价的行为,也没有研究如何约束节点因自身的富裕性出现的偏好自私性问题。因此,我们未来将重点围绕这些相关工作进行研究。

图3 3种情况下平均交互成功率的比较图

图4 3种情况下平均剩余能量的比较图

[1] 张国印, 李军. 移动对等网络覆盖网[J]. 软件学报, 2013, 24(1): 139-152. doi: 10.3724/SP.J.1001.2013.04332.

ZHANG G Y and Li J. Overlays in mobile P2P networks[J]., 2013, 24(1): 139-152. doi: 10.3724/SP.J. 1001.2013.04332.

[2] COURCOUBETIS C and WEBER R. Incentives for large peer-to-peer systems[J]., 2006, 24(5): 1034-1050.

[3] 曲大鹏, 王兴伟, 黄敏. 移动对等网络中自私节点的检测和激励策略[J]. 软件学报, 2013, 24(4): 887-899. doi: 10.3724/SP. J.1001.2013.04290.

QU D P, WAND X W, and HUANG M. Selfish node detection and incentive mechanism in mobile P2P networks [J]., 2013, 24(4): 887-899.doi: 10.3724/ SP.J.1001.2013.04290.

[4] SAFIRIYU E and DAUDA A. A novel decurity protocol for P2P incentive schemes[J]., 2015, 5(2): 1046-1051.

[5] FELDMAN M, PAPADIMITRIOU C, and CHUANG J. Free-riding and whitewashing in peer-to-peer systems[J]., 2006, 24(5): 1010-1019.

[6] 乐光学, 李仁发, 陈志, 等. P2P网络中搭便车行为分析与抑制机制建模[J]. 计算机研究与发展, 2011, 48(3): 382-397.

LE X G, LI R F, CHEN Z,. Analysis of Free-riding behaviors and modeling restrain mechanisms for peer-to-peer networks[J]., 2011, 48(3): 382-397.

[7] LI Y Z, GRUENBACHER D, andSCOGLIO C. Reward only is not enough: Evaluating and improving the fairness policy of the P2P file sharing network eMule/eDonkey[J].--, 2012, 5(1): 40-57.

[8] CHEN H W, XU H, and CHEN L. Incentive mechanisms for P2P network nodes based on repeated game[J]., 2012, 7(2): 385-392.

[9] KANG X and WU Y D. Incentive mechanism design for heterogeneous peer-to-peer networks: A stackelberg game approach[J]., 2015, 14(5): 1-13.

[10] 牛新征, 周明天, 佘堃. 一种应用于移动P2P网络的资源协作共享策略[J]. 电子学报, 2010, 38(1): 18-24.

NIU X Z, ZHOU M T, and SHE K. A cooperative sharing scheme for resources in mobile P2P networks[J]., 2010, 38(1): 18-24.

[11] TAN G and JARVIS S A. A payment-based incentive and service differentiation scheme for peer-to-peer streaming broadcast[J]., 2008, 19(7): 940-954.

[12] YANG Y,LIU B, and SHI Y. Design and simulation of the cooperation incentive mechanism in ad hoc network based on evolutionary game[J]., 2015, 9(10): 2827-2834.

[13] CHENG G, SONG M, ZHANG Y,. Routing protocol based on social characteristics for opportunistic networks[J]., 2014, 21(1): 67-73.

[14] PADHARIYA N, MONDAL A, MADRIA S K,. Economic incentive-based brokerage schemes for improving data availability in mobile-P2P networks[J]., 2013, 36(2): 861-874.

[15] DING H and PEI J M. The research of resource auction incentive mechanism in mobile P2P[C]. International Conference on Wireless Communications, Networking & Mobile Computing, Beijing, China, 2010: 1-3.

[16] 李云, 于季弘, 尤肖虎. 资源受限的机会网络节点激励策略研究[J]. 计算机学报,2013, 35(5): 947-956. doi: 10.3724/SP.J. 1016.2013.00947.

LI Y, YU J H, and YOU X H. An incentive protocol for opportunistic networks with resources constraint[J].,2013, 35(5): 947-956.doi: 10.3724/ SP.J.1016.2013.00947.

[17] 周经亚, 宋爱波, 罗军舟.P2P 网络中一种基于进化博弈的资源配置模型[J]. 软件学报,2013, 24(3): 526-539. doi:10.3724/ SP.J.1001.2013.04229.

ZHOU J Y, SONG A B, and LUO J Z. Evolutionary game theoretical resource deployment model for P2P networks[J]., 2013, 24(3): 526-539. doi:10.3724/SP.J. 1001.2013.04229.

[18] 李帮义, 王玉燕. 博弈论与信息经济学[M]. 北京: 科学出版社, 2016: 253-260.

LI B Y and WANG Y Y. Game Theory and Information Economics[M]. Beijing: China, Science Press, 2016: 253-260.

[19] TADELIS S. Game Theory: An Introduction[M]. Princeton, US: Princeton University Press, 2012: 428-432.

Research on Node Incentive Protocol in Selfish Mobile Peer-to-peer Network

LIU Hao①CHEN Zhigang②ZHANG Lianming③

①(,,,417000,)②(,,410083,)③(,,410081,)

In view of the selfishness of nodes in mobile Peer-to-Peer (P2P) network, combined with its features of the resource-constrained, self-organization and opening, this paper proposes a novel Incentive Protocol DAIP of mobile P2P network based on Double Auction model of incomplete information on both sides. The incentive mechanism adopts virtual currency payment method. The node calculates the evaluation of a message forwarding based on the virtual currency, resource state of it and the property of message, then gives the corresponding price according to the evaluation and game strategy. Through the game analysis, the linear strategy Bayes Nash equilibrium solution of DAIP strategy is given, which makes each node to maximize its own benefits, encourages them to cooperate with the message forwarding, and then improves the success rate of message forwarding in the network system. Analysis and simulation show that this incentive mechanism is able to effectively reduce the system's energy consumption, improve the success rate of message forwarding in the whole network system, and improve the overall effectiveness of the system.

Mobile Peer-to-Peer (P2P) network; Selfishness; Auction model; Virtual currency; Incentive protocol

TP393

A

1009-5896(2017)08-1986-07

10.11999/JEIT161335

2016-12-08;

改回日期:2017-05-19;

2017-06-14

刘浩 lhkd0407@126.com

国家自然科学基金(61572191, 61571188 ),湖南省自然科学基金(2017JJ2124),湖南省教育厅优秀青年科研项目 (15B125),湖南省计算机应用技术重点建设学科资助项目

The National Natural Science Foundation of China (61572191, 61571188), The Natural Science Foundation of Hunan Province (2017JJ2124), The Outstanding Youth Scientific Research Foundation of Department of Education, Hunan Province (15B125),The Key Construction Course of Computer Application Technology in Hunan Province

刘 浩: 男,1977年生,副教授,研究方向为并行计算、P2P网络.

陈志刚: 男,1964年生,教授,研究方向为计算机网络与分布式系统.

张连明: 男,1972年生,教授,研究方向为复杂网络与网络演算.

猜你喜欢

估价网络系统消息
房地产估价中房地价值分配探讨
房地产估价与房地产成交价格的关联因素分析
一张图看5G消息
基于DEMATEL-ISM的军事通信网络系统结构分析
8《富春山居图》:估价500亿的名画如何颠沛流离600年?
高速公路网络系统配置浅析
时滞复杂网络系统的保性能控制
GB/T 18508—2014《城镇土地估价规程》标准更正启事
消息
消息