移动对等网合作激励机制研究

2018-04-02陆国军

韶关学院学报 2018年3期

霍英，刘蕙，陆国军

（1.韶关学院信息科学与工程学院，广东韶关512005；2.密苏里州立大学计算机科学系，美国密苏里斯普林菲尔德65897；3.联邦大学工程与信息技术学院，澳大利亚维多利亚吉普斯兰3841）

移动对等网络广泛应用于文件共享、即时通信、流媒体传输等领域.随着网络和无线通信技术的迅速发展，移动应用越来越广.第40次《中国互联网络发展状况统计报告》显示，截至2017年6月，中国网民规模达7.51亿，其中手机网民规模达7.24亿，手机上网的网民比例为96.3%，手机作为第一大上网终端设备的地位更加巩固，移动终端的使用率快速增长［1］.相对于传统对等网络而言，移动对等网络具有大规模、自组织、高度动态、异构、低关联度、拓扑动态多变、链接速率不稳定和易失效性、网络和节点资源受限、环境复杂、终端操作系统不统一等特点.

对等网络的成功很大程度上取决于用户之间的共享与协作，但在对等网络中大量同时存在的自私节点却严重影响了网络的性能，例如在Gnutella网络中就存在70%的节点不共享任何资源，90%的节点不响应其他节点发送的请求，而网络中25%的节点却承担了整个P2P系统99%的负载.设计良好可行的激励机制，激励所有成员共同参与、相互合作是对等网系统关注的核心内容之一［2-6］.尤其移动对等网络中的节点多为手机、PDA、小型PC等移动设备，这些设备本身的资源（如存储空间、计算处理能力及电池功率）与PC相比存在很大差距，其自身的资源限制使它不能长期担当服务器角色，并且还必须考虑贡献资源、转发数据过程中还有信令本身消耗的电池能量，节点资源的局限性进一步助长了自私行为.这种自私行为一方面打击了贡献资源节点的积极性，另一方面也使得网络中节点越来越不愿意贡献自己所拥有的资源，从而造成网络中可使用的有效资源越来越少，这样网络中的协作交互行为将日益减少，而这将进一步限制移动对等网络的应用.这些都对移动对等网中节点的合作激励机制提出了更高的要求.如何合理高效地使用移动节点提供的网络资源、约束这些不合作行为，促进移动节点有效、自觉地进行合作，减少网络延时、节省带宽消耗、防止网络拥塞，对高度动态、异构、低关联度的移动对等网络至关重要.

1 主要合作激励机制

目前已有很多研究人员分别针对传统对等网络、无线自组网等分布式系统中的合作激励机制开展了专门的研究，并取得了一系列成绩［7-10］.在激励机制方面的研究主要集中在4个方面：基于货币的激励机制、基于互惠的激励机制、基于声誉的激励机制和基于博弈论的激励机制［11］.

1.1 基于货币的激励机制

基于货币的激励机制中，用户必须支付相应虚拟货币才能从系统中享受到服务，如果节点提供服务，则可以通过中央服务器收取相应的虚拟货币，如果节点需要享受服务，也必须支付相应的虚拟货币给中央服务器，虚拟货币的存在促使节点要想获取更多资源，必须有相应的付出，使得节点有积极性去参与合作，而虚拟货币拥有量的多少也反映出了节点对系统贡献的情况［12-13］.典型系统包括如ARA、PPAY和KARMA.文献［14］提出了积分奖励的策略，当节点为其他用户提供资源时，系统将为该节点奖励一定的积分，当节点需要使用其他用户提供的资源时，则需要支付一定的积分，同时，节点拥有的积分值越高，则其享受到的资源越多，服务也越好；文献［15］则利用百分比来模拟货币机制，根据节点贡献资源的多少，系统对其赋予不同的百分比，百分比越高，意味着该节点在系统中的贡献越多，百分比越低，意味着该节点可能是自私节点；百分比高的节点在获得连接与选择方面的机会也越多，从而走上富者愈富的道路；文献［16］提出了一种动态的报酬支付机制，即节点获得的报酬不仅与其提供的资源数量有关，还与其提供的资源价值或传播热度密切相关.

基于货币的激励机制实现相对简单且公平性强，但应用于移动对等网络时面临许多局限性：首先，基于货币的机制需要一个中央服务器来开展各种认证，这会带来服务器瓶颈问题；其次，基于货币的机制中，每个节点都必须有一个明确的身份标识，且在一定时期内保持不变，而移动节点天生的动态性与匿名性不太容易满足这一要求；再次，对于节点提供的服务如何进行统一定价问题，在移动环境下由于节点的高度动态、异构、低关联度，使得定价机制比传统的P2P网络更难统一标准.

1.2 基于互惠的激励机制

基于互惠的激励机制中，节点会将与它有过交易记录的节点信息及贡献情况记录下来，并定义为一系列的数值，也即贡献度.在之后的交易过程中，节点将根据贡献度给予其他节点不同程度的回报.典型系统包括BitTorrent和eMule.互惠机制包括直接互惠和间接互惠.文献［17］在P2P拓扑构造过程中，提出优先在具有互惠能力的节点之间建立拓扑连接，从而减少节点的自私行为及恶意行为对拓扑构造的负面影响.

文献［18］提出了一种以货易货交换环的方法来抑制P2P中的不合作行为.但基于互惠机制的激励机制在移动环境下进行应用，也存在待解决的问题：首先，如何评价其他结点的贡献度，难以有一个统一的标准；其次，如何保证贡献度的可靠性及可信性问题.毕竟贡献度是由节点提供的，在这个过程中，是否存在节点的共谋与串通，是否存在恶意节点的攻击，都需要进一步验证.再次，节点的身份标识问题，互惠机制中节点贡献度与其身份标识一一对应，而移动环境下节点的动态性加剧，如何保障节点再次加入系统时其身份的不变性，才能使得其之前的贡献度继续有效；另一方面，对于恶意节点而言，还要防范如何避免其利用移动环境的动态与低关联度来更容易的达到洗白的目的.最后，在P2P网络中两个节点在长时间内不断进行交易的可能性本身就小，加之在移动环境下，用户在业务形态、应用内容、使用习惯、兴趣偏好方面的差异性进一步增大，这使得基于互惠的激励机制的应用范围进一步变小.

1.3 基于信誉的激励机制

基于信誉的激励机制在传统P2P网络中应用最广，又分为采用局部信誉和采用全局信誉信息两种方法，其核心是通过记录节点的行为，综合直接观察结果和第三方信息形成对节点合作性的判断，形成一个信誉值，在之后的节点交互过程中，信誉好的节点将获得更好的服务.这一类的典型应用包括KaZaA和e-Bay等.采用局部信誉的激励机制中，节点的信誉值分布式地存储在其他节点的历史记录中，不需要集中式存储器或控制器来保存和维护全局视图，这类机制的扩展性较强.基于信誉的激励机制可以使非合作节点的甄别速度大幅提高，因为在这种系统中，信誉值高的节点更容易吸引其他节点，逐渐形成特定的拓扑结构或区域自治系统，逐渐的将信誉值低的节点排除在外，使得系统中的节点逐渐走上合作之路.

文献［19］根据节点的历史交易记录和贡献水平，将整个网络中的用户划分为多个声誉层次，以此抑制节点搭便车行为和恶意文件的传播.文献［20］也提出了一种利用社团构建的思想来达到激励节点贡献资源的目的，其主要思想是加入某个社团的节点可以拥有特殊的权力，但节点加入社团需要一定的准入机制，节点为了获取这种特权则会主动作出贡献，达到合作激励的目的.

在移动环境下采用基于信誉的激励机制有几个问题需要解决：首先是通信开销问题，由于这类机制中需要借助于第三方获取共享交易记录与信誉信息，会产生额外的通信开销，移动环境的高度动态、链接速率不稳定和易失效性、网络和节点资源受限等问题，使得这额外增加的通信开销问题尤为明显；其次是移动环境进一步加剧了信息的可靠性保障问题的难度，尤其如何保障移动环境下第三方信息；最后还是身份标识问题，移动环境的高度动态性使得如何确认节点的永久、唯一身份变得更加困难，也给不合作节点更多可乘之机，尤其在匿名系统中，使得基于信誉的激励机制无法有效开展.

1.4 基于博弈论的激励机制

近年来，越来越多的研究者关注应用博弈论来解决合作激励问题.基于博弈论的激励机制主要是通过设计节点的行为策略来制约节点的不合作倾向［21］.在基于博弈论的方法中，网络中的节点就是参与者，节点采取的行为方式即策略，而节点得到的回报值即为效用.节点在博弈过程中，将依据自己的直接观察结果和第三方信息来综合判断其它节点的合作情况，并通过比较采取不同策略为自己带来的效用，选择自身的行为策略.目前使用博弈论进行激励机制研究主要包括两大方面内容：一方面主要研究博弈模型的建立，分析是否存在纯纳什均衡策略，证明如何在多项式时间内达到纯纳什均衡策略；另一方面主要是进行机制设计，保证节点能够真实地汇报信息，通过优化最终达到一个帕累托最优.

文献［22］采用非合作博弈理论对无线网络路由中因自私节点的存在而带来的问题进行了分析和研究.文献［23］则采用了博弈论的VCG（Vickrey-Clarke-groves）算法来优化对等网络中的带宽分配和计费方案，同时在服务开销和用户收益两个方面达到了近似最优和用户激励的目标.文献［24］采用非合作重复博弈方法构造了一种名为PETrust的激励机制，该机制将节点的行为区分为诚实合作、偶尔偏离、摇摆投机及恶意行为4种方式，依据不同行为方式系统采取相应的奖励及惩罚策略，引导节点行为朝着有利于系统期望的方式采取行动.文献［25］利用转发困境博弈模型提出了一种应用于无线自组网的激励机制，网络中的节点在路由过程中通过混合策略中的概率转发策略，达到整个系统的混合策略纳什均衡.文献［26］针对网络中节点基于对惩罚的威慑，及节点对于未来收益的重视，采用一种重复博弈策略建立了一个无线自组网络环境下的激励机制，使网络中的节点自愿进行协作.文献［27］根据节点类型（善意节点和恶意节点）、节点策略（合作和不合作）以及节点信息形成不同的节点组合策略，分别采取不同的博弈策略.针对网络中节点一般只拥有局部信息的现状，文献［28］利用了一种非完全信息非合作博弈方法来构建移动P2P覆盖网，并通过启发式算法得到了一个相对稳定的覆盖网拓扑结构.

传统博弈论大都是基于行为主体是理性的假设，演化博弈论与传统博弈论最大的区别在于对行为主体采取的是有限理性假设，在演化博弈过程中，每一个参与人并不是“全能全知”的，采取的策略也不是在瞬间获得最优效用的，是被假设为程序化地采用某一既定策略，它对于某种成功策略的认识是在演化过程中不断进行修正和改进的，从而逐渐得到一些新的修正策略来作为后续行动的准则［29］.在这些修正策略下，参与人将逐渐获得最优效用，这更接近现实世界的情况.演化博弈论能够比传统的博弈论更好的分析和解决管理学问题，并对合作行为提出了一些可行的机制［30］.文献［31］从经济学角度系统介绍了进化博弈5种不同的研究方法与框架，并对决策机制的研究趋势进行了展望.文献［32］提出用演化博弈理论建模移动自组网非协作路由问题，在证明了博弈的Nash均衡和无环的有效路径之间一一对应之后，提出了基于演化博弈的路由算法.文献［33］介绍了小世界、无标度等复杂网络上演化博弈的研究情况及结论.

2 行为经济学应用在激励机制研究的可能性

在激励机制研究中，研究者大多假设节点是理性或有限理性的，在大多数情况下这种假设是合理的，但是对于网络中存在一些非理性行为时却不能有很好的解释，尤其在现实世界这种假设通常得不到保证.现实社会中人本身就不是完全理性的，也很难保证人在各个决策阶段都保持理性.网络世界中的很多行为实际是人在现实社会中行为的折射，现实社会中人的大量非理性行为也会反映到网络世界中并导致非理性行为.

传统经济学假设个体成员间具有偏好一致性，即个体行为及偏好具有同质性，同时每个个体成员都是自利的，都以追求自身效用的最大化为目标.当每个个体成员实现了自身效用最大化的时候，也就达到了整个系统的均衡状态.但实际上，现实世界中每个个体在业务形态、应用内容、使用习惯、兴趣偏好等方面均存在明显差别，每个个体成员在竞争资源的能力方面也存在差异，很多个体成员并不能真正实现自身效用的最大化，也就很难达到整个系统的均衡状态，即个体成员间存在很大的异质性［34］.尤其在移动对等网络中，个体成员的异质性表现更为明显.在设计节点的合作激励时，不能忽视个体成员异质性带来的影响.

行为经济学是将行为分析学、心理学与和经济学有机结合起来的一个产物，它以现实为基础构造理论，直接对传统经济学的几个关键假设进行了修正，可以较好的解释传统选择理论中一些无法解释的现象［35-37］.如摆脱了传统理论中关于人是理性或有限理性的假设，考察各种非理性行为及其产生的原因；摆脱了现实世界很难得到的完全信息的假设；摆脱了个体成员自利和追求效用最大化的假设，以更符合现实世界的情况；摆脱了偏好一致性的假设，指出了个体行为的“异质性”本质.

移动对等网络中节点之间的合作关系与现实社会中人与人之间的合作具有相似性，应用行为经济学，充分考虑移动对等网中成员的异质性及非理性行为的存在，就能进一步结合实际状况来解释和解决移动对等网络中的合作问题，应用行为经济学中的相关理论来研究移动对等网络中节点的合作激励机制是今后的一个研究方向.

3 结语

随着移动应用环境的日渐成熟，移动对等网络的应用日渐宽广.目前对于移动对等网络节点非合作行为的相关激励机制方面的研究取得了一定的成果，但对于合作行为的本质和真正内在机理，还有很广阔的研究空间.尤其在考虑到现实中成员异质性及非理性行为存在的前提下，研究移动对等网的节点激励机制还有很多尚待解决的问题，具有很好的研究前景.

［1］中国互联网络信息中心.第 40 次《中国互联网络发展状况统计报告》［EB/OL］.（2017-8-4）［2017-10-10］.http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201708/P020170807351923262153.pdf.

［2］余一娇，金海.对等网络中搭便车行为分析与抑制机制综述［J］.计算机学报，2008，31（1）：1-15.

［3］Lu H C，Liao W J.Cooperative Strategies in Wireless Relay Networks［J］.IEEE Journal on Selected Areas in Communications，2012，30（2）：323-330.

［4］乐光学，李仁发，陈志，等.P2P 网络中搭便车行为分析与抑制机制建模［J］.计算机研究与发展，2011，48（3）：382-397.

［5］Xiong L X，Libman L，Mao G Q.Uncoordinated Cooperative Communications in Highly Dynamic Wireless Networks［J］.IEEE Journal on Selected Areas in Communications.2012，30（2）：280-288.

［6］欧中洪，宋美娜，战晓苏，等.移动对等网络关键技术［J］.软件学报，2008，19（2）：404-418.

［7］Syue S J，Wang C L，Aguilar T，et al.Cooperative Geographic Routing with Radio Coverage Extension for SER-Constrained Wireless Relay Networks［J］.IEEE Journal on Selected Areas in Communications，2012，30（2）：271-279.

［8］Altman E，Nain P，Shwartz A，et al.Predicting the impact of measures against P2P networks on the transient behaviors.INFOCOM 2011［C］.Shanghai：IEEE INFOCOM，2011：1440-1448.

［9］Xiao X，Zhang Q，Shi Y C，et al.How Much to Share：A Repeated Game Model for Peer-to-Peer Streaming under Service Differentiation Incentives［J］.IEEE Transactions on Parallel and Distributed Systems，2012，23（2）：288-295.

［10］Wang M Z，Shao C Y.Special knowledge sharing incentive mechanism for two clients with complementary knowledge：A principal-agent perspective［J］.Expert Systems with Applications，2012，39（3）：3153-3161.

［11］刘佳琦.移动P2P覆盖网拓扑结构及节点合作保障机制研究［D］.长沙：中南大学，2012.

［12］Zhang X Y，Li B C.On the Market Power of Network Coding in P2P Content Distribution Systems［J］.IEEE Transactions on Parallel and Distributed Systems，2011，22（12）：2063-2070.

［13］Aperjis C，Johari R.A peer-to-peer system as an exchange economy.Workshop on Game Theory for communications and networks.2010［C］.Elsevier，2010.

［14］Golle P.Incentives for sharing in peer-to-peer networks.Proc.EC’01，2001［C］.Los Alamitos，CA：IEEE Computer Society Press，2001.

［15］Ahsan H.Incentives mechanisms for peer-to-peer media streaming.International Workshop on Quality of Service（IWQoS），2004［C］.Los Alamitos，CA：IEEE Computer Society Press，2004.

［16］Palomar E，Alcaide A，Ribagorda， et al.The Peer's Dilemma： A general framework to examine cooperation in pure peer-topeer systems［J］.Computer Networks，2012，56（17）：3756-3766.

［17］田慧蓉，邹仕洪，王文东，等.激励一致的自适应 P2P 拓扑构造［J］.软件学报，2006，17（4）：845-853.

［18］Zhang K，Antonopoulos N.A novel bartering exchange ring based incentive mechanism for peer-to-peer systems［J］.Future Generation Computer Systems，2013，29（1）：361-369.

［19］Tseng Y M，Chen R G.A free-rider aware reputation system for peer-to-peer file-sharing networks［J］.Expert Systems with Applications，2011，38（3）：2432-2440.

［20］Lui S M.Participation incentive mechanisms in peer-to-peer subscription systems.Proc 5th HISS.2002［C］.Los Alamitos，CA：IEEE Computer Society Press，2002.

［21］李云，于季弘，尤肖虎.资源受限的机会网络节点激励策略研究［J］.计算机学报，2013，36（5）：947-956.

［22］汪洋，林闯，李泉林，等.基于非合作博弈的无线网络路由机制研究［J］.计算机学报，2009，32（1）：54-68.

［23］黄冠尧，洪佩琳，李津生.P2P-VCG：一种基于博弈论的带宽分配方案［J］.计算机研究与发展，2007，44（1）：78-84.

［24］桂春梅，蹇强，王怀民，等.虚拟计算环境中基于重复博弈的惩罚激励机制［J］.软件学报，2010，21（12）：3042-3055.

［25］Jaramillo J J，Srikant R.A game theory based reputation mechanism to incentivize cooperation in wireless ad-hoc networks［J］.Ad Hoe Networks，2010，8（4）：416-429.

［26］陆音，石进，谢立.基于重复博弈的无线自组网络协作增强模型［J］.软件学报，2008，19（3）：755-768.

［27］王浩云，张顺颐，孙雁飞，等.P2P 网络路由节点组合策略博弈模型［J］.应用科学学报，2009，27（1）：12-18.

［28］Afzal M，Hossam H，Xiang Y Z.Peer-to-Peer overlay topology control for mobile ad hoc networks［J］.Pervasive and Mobile Computing，2011，7（4）：467-478.

［29］瞿泽辉.复杂网络及其在信息领域中的应用［D］.成都：电子科技大学，2011.

［30］许力，陈志德，黄川.博弈理论在无线网络中的应用［M］.北京：科学出版社，2012.

［31］刘伟兵，王先甲.进化博弈决策机制设计综述［J］.运筹与管理，2008，17（1）：84-87.

［32］韩露，魏蛟龙，周曼丽，等.基于演化博弈的 MANET 路由算法［J］.华中科技大学学报，2006，34（12）：30-32.

［33］王龙，伏锋，陈小杰，等.复杂网络上的演化博弈［J］.智能系统学报.2007，2（2）：1-10.

［34］罗军舟，吴文甲，杨明.移动互联网：终端、网络与服务［J］.计算机学报，2011，34（11）：2029-2051.

［35］尼克·威尔金森.行为经济学［M］.北京：中国人民大学出版社，2012.

［36］艾瑞里·丹.怪诞行为学：可预测的非理性［M］.北京：中信出版社，2010.

［37］Diamond P,Vartiainen H.行为经济学及其应用［M］.北京：中国人民大学出版社，2013.