C2C电子商务平台下的用户投票激励算法*
2010-06-11杨波威宋广华
杨波威 ,宋广华 ,郑 耀
(1.浙江大学工程与科学计算中心 杭州310027;2.浙江大学计算机学院 杭州310027;3.浙江大学航空航天学院 杭州310027)
1 引言
C2C电子商务平台下没有特定的资源提供主体或资源消费主体,任何用户均可既担任资源提供者,亦担任资源消费者,具有完全的自主性和平等的地位,使得C2C电子商务平台具有灵活、自组织、可扩展性强以及对用户有很强的吸引性等特点,越来越受到学术界和工业界的关注。
随着国内最大的C2C电子商务平台淘宝网的大力发展,2009年上半年淘宝网完成营业额809亿元人民币,注册会员1.45亿人,占中国网民总数的43%,同时网购用户数量同比年增长101%,已经远远超出了零售巨头沃尔玛在华销售额。伴随着淘宝网成立之初所引入的简单的“好评、中评、差评”评价体系亦无法承受如此庞大而快速的用户数量增长,信誉评价体系的参考价值由于空投票、刷信誉、店家的线下威胁用户等原因而逐渐失去其应有的意义。因此,淘宝网在保持了原有的最简单的“好评、中评、差评”评价体系的同时,亦发展了“宝贝与描述相符”、“卖家的服务态度”、“卖家的发货速度”等三项评价指标,同时也引入了同行业的平均排名以供用户参考,在一定程度上给予了用户更全面、更精确且更直观的参考评估。但是,淘宝网上依旧存在着大量的“评价方未及时做出评价,系统默认好评!”、“本店恕不接受中评、差评”等情况。无意义的空投票与被卖家胁迫的假投票严重地影响到了淘宝网信誉系统的良好运行。
同时,由于相比C2C平台具有更高的开放性,P2P领域亦有较多的研究人员在研究与C2C类似的信誉[1]与激励模型[2],希望通过附加计算组件规范各结点的行为。本文就鼓励买家进行合理、准确的投票展开研究,引入了目前P2P领域研究较多的可信计算理论与技术,以期通过附加一些计算与要求,协助C2C平台建立一个更加完善、合理且值得用户信任的信誉系统。
2 基于用户投票激励模型的信誉系统
现实生活中,信誉广泛存在于各种市场行为中,信誉系统使万千买家与卖家受惠:卖家通过信誉系统在买家中建立良好的商家信誉,因此带来更多的买家;买家通过信誉系统获知信誉良好的商家,获取更加优质的服务。自计算机网络引入商品交易以来,大量的数据存储与快速访问变成了可能,买家不仅能够通过熟识的朋友获取卖家相应的信誉,还能够借助于海量的非熟识朋友的经验来协助他们进行交易。
但是,信誉系统显然并没有对海量信誉数据与快速访问这一巨大变化进行较为合理的优化,大量的空评价和欺骗性评价以及卖家胁迫下的假评价充斥着C2C交易平台,以致大量信誉看似良好的卖家却依旧在销售着他们的劣质产品。
现实生活中运行良好的信誉系统之所以在迁移至互联网时没有利用到其海量数据存储和快速访问的优势,反被大量的垃圾信誉所害的主要原因在于:实体市场中的信誉往往通过朋友等关系进行传播,在信誉传播过程中有额外的附加责任,信誉传播者通常对其传播行为负责,信誉传播呈现小而精的态势;电子市场中的买家与买家并不熟识,信誉传播过程相对较随意,出于对打“差评”可能带来的卖家纠缠的忧虑或懒于评价,电子市场记录了大批的“无用的好评信誉记录”。
本文将实体市场中有责任的信誉传播机制引入C2C电子交易市场,使用户在放弃评价与滥评价时承担一定的责任,以期鼓励用户进行主动、客观的评价。实验表明在设计良好的信誉系统下,C2C平台可以较大限度地提高用户的主动评价率,遏制虚假评价。
3 用户投票激励算法
激励信誉系统由完全独立于平台的各种表征用户性质的数值组成,本文将定义如下4个激励信誉系统的重要概念。
Vr:买家评价,单次事务中,买家对卖家的商品及服务的评价。
Rr:卖家累积信誉,即卖家从过去的买家评价中所获取的累积分值的指征。
Pu:买家累积信誉积分,即信誉系统评估买家历次的Vr,系统累积计算出来反映其准确程度的指征。
Rp:商品信誉价格,即卖家为调节商品可用程度,屏蔽部分低Pu买家的工具。
较之传统的信誉系统,本文中所述的激励信誉系统引入了Pu与Rp两个重要概念:Pu指标衡量买家评价的准确程度,Rp指标由卖家针对商品进行自主调控,主要目的是在引入Pu信誉积分的前提下,卖家有权力自主选择合适的买家进行消费,进一步限制恶意买家对优质资源的影响。
具体到一个交易事务,Rr与Rp在交易开始之前展现给买家,若买家对于该卖家的Rr与资源的Rp及资源的其他描述满意,则交易开始:
·从买家Pu账号上减去Rp的分值,如买家Pu账号余额不足,则禁止交易;
·买家与卖家完成交易事务;
·若买家不对资源进行评价,则系统无动作,买家Pu账号变动为ΔPu=-Rp;若买家对资源进行评价,则系统依据Vr的准确程度,反馈 X(0 · 若买家对资源进行评价,系统将Vr纳入ΔRr计算,改变资源的Rr积分。 由上述交易场景可知:由于买家在交易前即已获知卖家的Rr与资源的Rp,而且自动化的信誉系统并没有其他的评估卖家Rr的途径,所以ΔRr与ΔPu的所有评估因子均来源于历次买家的Vr。作为一个单纯的信誉系统,Rr必须具有对买家一定的参考意义,协助买家进行进一步的决定;作为一个单纯的激励系统,Rr不能泄漏重要计算因子给后续买家,以免后续买家可以反推最佳Vr,以获取高额的ΔPu。 在进行计算算法设计之前,本文提出以下两条主要用于简化用户偏好所带来的资源计算偏差的假设条件: (1)为了简化C2C平台下与激励核心算法无关的因素,用户对于资源的偏好程度被忽略,即所有的用户在资源偏好上是不存在偏差的; (2)在假设(1)的约束下,一个负责任的用户针对某个资源所给出的评价与其他负责任的用户针对该资源所给出的评价应当是大致近似的。 在如上两个假设条件下,本文设计如下算法,分别计算 ΔRr与 ΔPu: 式(1)中,N为前期卖家所拥有的投票数,S为大于0的恒量缩放因子;式(2)中,pdf为标准正态概率密度函数,其中,μ为前期卖家所拥有的全部投票的平均值,σ为前期卖家所拥有的全部投票的标准差。 由以上ΔRr与ΔPu的公式可知,卖家信誉指数增量ΔRr当且仅当在Vr大于0.5时为正,且Vr越大,ΔRr越大,因此卖家信誉指数Rr随着他所获得的大于0.5的Vr的数量与Vr的分值的增加而升高;另一方面,买家信誉指数增量ΔPu则正比于Vr与前期卖家所拥有的全部投票的平均值μ,反比于前期卖家所拥有的全部投票的标准差σ。 如图1所示,Rc对Rr造成的变化并不受到此前评价的用户的影响,一定的Rc即对应于一定的ΔRr。 图2描述了3位卖家在初始Rr均为0,分别经历过2、4、4轮买家评价后Rr最终达到同一数值的情况,则他们的第3、5、5位买家面对的卖家由系统所给出来的提示Rr均相同,但是由于各卖家的前期买家对资源的评价完全不同,所以后续买家在给出相应的Vr时,系统将依据前期买家对资源给出的评价作出如图3所示的ΔPu反馈。 (1)(a)号资源的前期买家对资源作出了较高的μ与较低的σ的评价,使(a)号资源仅仅经过较少的买家评价即已经达到了一定的资源信誉,说明(a)号资源得到了一定数量的达到共识的买家的高度评价,因此图3中代表该资源后续买家得分分布的实线曲线相对较窄而且偏向右边的高分区。 (2)(b)号资源的与(a)号资源所展示给后续买家的 Rr完全一致,但是(b)号资源是经历过相对较多轮数的买家评价达到目前的资源信誉的,说明(b)号资源得到了较多买家的一般认可,由于广泛买家的认可,一般资源的质量也是相对较高的,因此图3中代表该资源后续买家得分分布的虚线曲线与实线曲线相比偏向中间分值区。 (3)(c)号资源相比于(a)、(b)号资源,前期买家的评价分歧较大,所以系统认为该资源可能存在不稳定情况,因此图3中代表该资源后续买家得分分布的点划线曲线的得分区间宽度明显放大。 因此,由图2、图3可知,在引入Pu激励机制后,可以合理地引导买家进行评价,从一定程度上防止空投票和乱投票现象,提高了Rr对于后续买家的参考价值;同时,引入Rp机制亦保证了卖家可以针对自身资源的情况选择买家,一定程度上遏制了恶意买家的交易与评价行为。 本节对上述算法作出模拟实验以仿真真实的C2C平台用户交易,实验条件如下: (1)共计30个常规资源及1个不受不负责任买家评价的参照资源和1个受不负责任买家评价但不受激励机制限制的参照资源被部署在C2C平台里,它们的期望用户平均评价分值均为质量一般0.4的; (2)包括 300名(20%)不负责任的买家在内的共计1 500名买家随机选择以上30个卖家资源进行评价; (3)不负责任的买家在进行评价时,总是选择“1.0”的评价,而普通用户的投票行为在本实验中设定为符合以资源的期望用户平均评价分值为均值,0.3为方差的正态分布。 如图4所示,本次测试后从全部30个常规资源中选出了一个资源为受不负责任买家评价影响且受激励机制限制的代表,其Rr变化曲线绘制如图4中的(a)号曲线;(b)号曲线反映的是不受不负责任买家评价影响的理想情况下的参照资源的Rr变化曲线;(c)号曲线反映的是受不负责任买家评价影响且不受激励机制限制的现实情况下的参照资源的Rr变化典型线。 从图4中可以明显地看到在有大量的不负责任买家的评价且没有激励机制限制下的(c)号曲线的走势明显偏高,走向了0.9的评价好评度,这种情况正是目前大部分C2C平台提供商所面临的主要问题:大量普通或劣质资源由于用户评价管理的松散性而使得其参考指标Rr明显高于正常范围。而在有激励机制发生作用、有限制的常规资源(a)的曲线走势则更贴近理想走势的(b)号曲线。 另外,图4中以深线灰色 标识的曲线则反映了同期被禁止交易的买家数量变化示意图,明显的是,在经历过 500个交易周期后,约有 67%(200/300)的不负责任买家被禁止交易,而仅约有5.8%(70/1 200)的常规买家被禁止交易。 经过实验表明,本激励算法在限制不负责任买家的评价行为、提高资源评价的参考指标质量上均有比较大的作用,同时,并没有对负责任的买家造成较大的影响。 目前,信誉系统在分布式环境中获得了较多的科研人员的关注,Kamvar S D等[3]和Xiong L等[4]分别提出了两个全局信誉系统:EigenTrust和PeerTrust。与此同时,我们也就分布式的信誉系统展开过相关的研究[5]。但是,以上精确的信誉模型研究均假定了主动的用户评价,并未涉及激励机制,因此依然会造成大量的空白或无用评价。 Antoniadis P[6]和Papaioannou T G等[7]则提出了一个简单的激励模型:买家的评价直接与最近的前一位买家的评价进行比较,如果一致,则认为两位买家的评价真实有效,否则认为两位买家至少有一方是不负责任的,系统判定两次分值均无效。这种超轻量级的计算策略非常灵活、简单,但是它并不能真正区分哪一位买家在进行不负责任的评价行为,无辜的人经常被不负责任的人牵连,而且系统没有自我学习与适应功能。 Yang Mao[8]等人则在激励与信誉机制方面将目前国内外研究的重点内容结合起来应用在Maze系统中。然而,参考文献[8]主要注重信誉机制的融合,对于相应的激励机制的描述相对简单,激励机制仅仅作为信誉机制的一种简单的附加设施,面对各种各样的恶意或滥用行为缺乏较完善的考量。Chang Junsheng[9]、Jin Yu[10]和 Li Haihua[11]等人主要针对P2P网络中假投票或者伪投票的侦测与识别展开了相关研究,其均假设结点拥有充足的投票数,且没有对激励展开相关的研究。另外,Srivatsa等人在TrustGuard[12]中提出了信誉分值的时效性问题,也没有涉及激励机制。 本文提出了一个用于分布式电子商务环境下的新型的用户投票激励算法模型。该模型对系统有较小的侵入性,能在不增加用户负担、不改变系统结构的情况下,为信誉系统增加针对用户的激励功能,鼓励买家进行真实、有效的评价活动。该模型的引入在一定程度上提高了买家的责任心,提高了买家评价的准确性和可用性,从而进一步提高了信誉系统的可用性。 针对真实环境的模拟实验表明,本算法对买家的评价有较好的识别能力,可以自动高效地判定买家类别,并自动过滤买家的不负责任的投票,使对卖家的评价更加接近真实。 1 Cohen B.Incentives build robustness in bitTorrent.In:The 1st Workshop on Economics of Peer-to-Peer Systems,Berkeley, CA,USA,2003 2 Freedman M J,Aperjis C,Johari R.Prices are right:managing resources and incentives in peer-assisted content distribution.In:The 7th International Workshop on Peer-to-Peer Systems,Toronto,Canada,2008 3 Kamvar S D,Schlosser M T,Molina H G.The eigen trust algorithm for reputation management in P2P networks.In:The 12th InternationalWorld Wide Web Conference(WWW),Budapest,Hungary,2003 4 Xiong L,Liu L.Peertrust:supporting reputation-based trust for peer-to-peer electronic communities. In: IEEE Trans on Knowledge and Data Engineering,2004(16) 5 Yang B W,Song G H,Zheng Y.Resourcedog:a trusted resource discovery and automatic invocation P2P framework.In:The 5th IFIP International Conference on Network and Parallel Computing,Shanghai,China,2008 6 Antoniadis P,Courcoubetis C,Mason R,Papaioannou T G,et al.Results of peer-to-peer market models,project IST MMAPPS,http://www.mmapps.org 7 Papaioannou T G,Stamoulis G D.An incentives’mechanism promoting truthful feedback in peer-to-peer systems.In:The 5th IEEE International Symposium on Cluster Computing and the Grid,Cardiff,UK,2005 8 Yang Mao,Feng Qinyuan,DaiYafei,Zhang Zheng.A multi-dimensional reputation system combined with trust and incentive mechanisms in P2P file sharing systems.In:The 27th InternationalConference on Distributed Computing Systems(ICDCS),Toronto,Ontario,Canada,2007 9 Chang Junsheng,Wang Huaimin,Yin Gang,Tang Yangbin.A new reputation mechanism against dishonest recommendations in P2P systems.In:The 8th International Conference on Web Information Systems Engineering(WISE),Nancy,France,2007 10 JinYu,GuZhimin,GuJinguang,ZhaoHongwu.A new reputation-based trustmanagementmechanism againstfalse feedbacks in peer-to-peer systems.In:The 8th International Conference on Web Information Systems Engineering(WISE),Nancy,France,2007 11 Li Haihua,Du Xiaoyong,Tian Xuan.A review-based reputation evaluation approach forweb services.JournalofComputer Science and Technology,2009 12 Srivatsa M,Xiong L,Liu L.Trustguard:countering vulnerabilities in reputation management for decentralized overlay networks.In:The 14th International World Wide Web Conference(WWW),Chiba,Japan,20054 实验与分析
5 相关工作
6 结束语