APP下载

虚拟社区知识共享的“囚徒困境”博弈分析*
——基于完全信息静态与重复博弈

2019-02-15卢艳强

图书馆 2019年2期
关键词:囚徒困境虚拟社区囚徒

李 钢 卢艳强

(北京邮电大学经济管理学院 北京 100876)

1 引言

虚拟社区的概念由H. Rheingold 提出[1],其认为虚拟社区是社会的集合体,源于众多参与者在网上的公开讨论,加上充分的人类情感在赛博空间(Cyberspace)里所形成的人际关系网络[2]。在虚拟社区中,知识共享是反映社区活力的重要指标之一,是社区存在的基础,也是判定一个虚拟社区成功与否的关键[3]。虽然知乎、微博、Facebook等虚拟社区蓬勃发展,但影响社区知识共享的因素与存在的问题也较多。例如,从虚拟社区成员之间关系的角度发现合作、竞争、同化、冲突、适应会影响虚拟社区的知识共享水平[4]。再如,虚拟社区参与个人的内在驱动、外在动力与情感纽带对知识共享的影响[5]。又如,有学者提出虚拟社区知识共享面临三大问题:如何激励个体从自利到主动分享知识给他人[6];如何避免搭便车问题,个人获得所需知识的情况下,却不主动共享自己的知识给他人[7];如何提高知识的利用效率[8]。

这些难题受到国内外学者的广泛关注。从文献上来看,知识获取与共享之间的博弈研究,在未引入激励因素前的博弈结果显示,知识共享不能通过命令的方式来实现,要采取有效的激励机制支持进行实施。通过物质的或者非物质的激励均极大地促进个人将其宝贵的知识贡献出来与他人分享[9]。然而,实际情况是虚拟社区知识共享参与人往往乐于获取他人的知识,却不愿向他人提供自己所拥有的知识[10]。正因此,用户在虚拟社区知识共享过程中存在囚徒困境的博弈问题。

文章引入知识付费解释变量,利用完全信息静态博弈和重复博弈方法建立了完全静态模型。通过该模型分析了不同变量对知识共享结果的影响,期望对知识付费社区的建设有一定的指导意义。

2 文献回顾

博弈论的两大分支是合作博弈(Cooperative Game)和非合作博弈论(Non-cooperative Game)。20世纪中期,合作博弈论快速发展,与此同时非合作博弈论也开始创立。其中,囚徒困境博弈(Prisoner’s Dilemma, PD)、鹰鸽博弈(Haw-Dove, HD)、猎鹿博弈(Stag Hunt, SH)模型是被广泛应用于研究的三大模型。然而,囚徒困境博弈最难实现博弈双方合作[11]。囚徒困境(PD)由Flood与Drescher两位学者于1950年共同提出[12],同年Tucker又对囚徒困境进行了界定[13]。下表1是囚徒困境博弈的收益矩阵。

表1 囚徒困境博弈的收益矩阵

两个博弈者均有两个策略(合作为C,非合作为D)。若博弈双方采用合作策略,双方各得收益R。相反,若博弈双方选择非合作策略时,双方各得收益P。若双方选取不同策略时,选择合作的一方会获得收益为S,而选择不合作的一方会获得收益为T。所提到的四种收益满足2R>T+S与T>R>P>S,最优策略(收益最大化)是不合作策略。自己不合作而对方合作时,博弈者获得最大收益为T。然而,双方博弈均不合作,其总收益值2P<2R(双方合作的总收益值),这正是博弈的囚徒困境。

囚徒困境是博弈论领域中被学者讨论最频繁的范式[14]。通过囚徒困境研究参与双方合作博弈更具有普遍意义。纳什均衡和纳什重复博弈给出了最优策略[15],使得每个参与人的策略是对其他参与人策略的最优反应,其属于完全信息静态博弈。因此,完全信息静态博弈和完全信息重复博弈,能更好的解决具体情景下的囚徒困境。为了能准确解释文章情景下的博弈问题,有必要明确完全信息博弈和不完全信息博弈、动态博弈与静态博弈。在博弈论中,完全信息(Complete Information)是指一个参与人对其他参与人的行动选择有准确的了解,在完全信息下的博弈称之为完全信息博弈[16]。而不完全信息(Incomplete Information)是指博弈参与双方对彼此的支付函数(Common Knowledge, 共同知识)并不完全的了解[17]。在不完全信息下的博弈称之为不完全信息博弈。按照参与人行动的先后顺序又将博弈论划分成静态博弈与动态博弈。所谓静态博弈是指参与人同时或虽非同时选择行动,但后者并不知道前者采取了什么行动。对于动态博弈是指参与人的行动有先后顺序,而且后者能够观察到前者所选择的行动[18]。

基于囚徒困境作为博弈论研究的重要范式,同时虚拟社区知识共享也具有囚徒困境的问题。李雪松(2008)提出虚拟社区成员之间使用隐性合同、显性合同、改变成员间的偏好和进行重复博弈四种办法解决囚徒困境[10];李钢(2009)采用完全静态博弈构建出互联网用户与政府监管方的博弈模型[19];彭小晶(2015)以无限重复博弈为基础,提出激励知识共享双方采取共享会避免囚徒困境发生[4]。此外,张敏(2016)运用静态博弈,发现成员之间的信任关系在一定程度上缓解静态博中的囚徒困境[20]。文章基于前人研究成果以及虚拟社区知识共享具体情景,对社区知识共享的角色定义、模型假设与建模等方面进行分析。

3 虚拟社区知识共享博弈研究

3.1 虚拟社区知识共享的角色

图1是对知识提供者、知识获取者与虚拟社区平台进行介绍。知识提供者以参与人1表示,知识获取者以参与人2表示,一般包含多个知识获取者。

知识提供者,即知识生产方,持续生产高质量的知识内容,将隐性知识显性化、抽象知识具体化以及将知识内容产品化。能为知识获取者提供所需要的知识内容。

知识获取者,即知识消费方,根据自身的需要和目的,为所需要的知识付费。知识获取者获得所需要的知识要投入时间成本或机会成本,有时即使花费大量的时间和精力,也难以获得所需要的知识内容或搜寻时间成本较高而效率较低。虚拟社区知识共享平台则为知识获取者提供机会和技术基础。

图1 参与人1与参与人2描述

虚拟社区平台是知识提供者和知识获取者知识共享平台的技术提供方,具有监督与制定规则的职责。目前,一些虚拟社区平台的知识共享形式不尽相同。虚拟社区所扮演的角色不仅仅局限于监督和制定规则,还充当知识提供者的角色,例如“得到”App。

3.2 虚拟社区知识共享的囚徒困境

虚拟社区知识共享参与者的囚徒困境是博弈论中的经典问题。知识共享角色主体包括知识提供者与知识获取者,其在决定自己是否选择共享策略上构成囚徒困境。在虚拟社区中,对囚徒困境描述如下:参与人1和参与人2的策略是“共享,共享”,双方各自的收益都是S>0。参与人1共享以及参与人2不共享时,参与人2的收益为T,参与人2得到额外收益D>0,反之亦然。倘若参与人1和参与人2均不选择分享时,支付是0。见表2。

表2 虚拟社区知识共享的囚徒困境

“不共享,不共享”是静态博弈下参与双方唯一的均衡策略。参与人1和参与人2彼此均共享策略下比不共享时的收益高。然而,实际情况是彼此均不共享。下文将对如何破解囚徒困境进行分析论述。

3.3 完全信息静态博弈模型

文章是以囚徒困境模型为起点,引入外部奖励机制——知识付费变量,从而形成知识提供者与知识获取者间的决策。既往虚拟社区知识分享中,参与者是主动分享者又是获取知识者角色,“你中有我、我中有你”,没有严格的区分。然而,实际上主动分享知识与获取知识的参与者,其比例是基本固定的。这样可以将共享中的角色分成主动分享知识者(被称为知识提供者)、获取知识者(被称为知识获取者)。例如,“知乎Live”其实是为知乎社区的高质量回答问题的用户提供一种创造利益的新途径。

此外,虚拟社区知识共享研究中,利用某些激励方式与方法来促进知识分享,例如徽章、评级等非物质方法激励参与者分享知识,但是筛选与促进作用并不明显,需要长期激励,并且要不断改变激励策略与方式。因此,本部分旨在明确虚拟社区知识共享参与者间的知识付费方式,有效避免激励无效与知识分享比例低等问题,并采用完全信息静态博弈方法对提出的假设和构建出的新模型进行验证分析。

3.3.1 模型的假设提出

虚拟社区参与者的知识共享是一种积极主动的行为,参与用户具有典型格局“90—9—1”,即全部用户的1%是知识提供者[21],而90%的用户在虚拟社区里被动搜寻信息,在虚拟社区里属于沉默的一群,对虚拟社区的贡献有限,只有当角色发生变化,或把自己浏览、整理的信息、知识分享给其他用户时,才作为潜在的贡献者,这类用户可称之为“浏览者/潜伏者”[22]。此外,虚拟社区是网络社会的一部分,知识共享参与者人员组成多样,获取或分享知识难以衡量分享知识的质量或吸取知识水平。因此,基于虚拟社区实际情况提出如下假设。

假设1:参与人1,即知识提供者始终为知识生产方。参与人2,即知识获取者始终为知识消费方,参与双方角色在相当长时间内不会交替。虚拟社区提供技术支持和内容提供者筛选,即绝大部分知识符合知识获取者的需求。

假设2:虚拟社区知识共享有两个参与人进行博弈,即参与人1和参与人2。参与人1和参与人2均是理性的,知识共享的目的就是获得个人期望效益的最大化。参与人2由多个知识获取者组成,设为N,并指导参与人1提供知识,其是作为知识付费的参与人。

假设3:参与人1的收益U1,与参与人2知识获取者付费分享获取知识的人数相关;参与人2的收益U2是知识吸收能力ζ(0≤ζ≤1)和知识质量Q(0≤Q≤1),得到ζK,则ζ知识获取者在共享他人知识后获得的收益。

假设4:参与人2,即知识获取者的知识收益U2,支付知识费用A2;社区管理者获取参与人2的支付知识费用的比例为R;参与人1,即知识提供者的知识收益为U1,获取参与人2的支付的知识费用A1,即A2(1-R);知识提供者的其他成本C1(投入精力和时间等);知识获取者的其他成本为C2(投入精力和时间等)。

假设5:参与人1和参与人2信息是完全的,虚拟社区提供技术支持,也包括认证、信誉排名以及用户评论。参与人2,也就是知识获取者,通过虚拟社区平台任何评论,对知识提供者的知识内容产出质量Q,以及根据既往知识内容质量Q推知生产的知识内容是确定的;参与人1知道自己所生产的知识内容的消费方的需要。参与者1和2均有两个策略可以选择: 其一,知识提供者是知识的生产方,其分享知识内容或不分享知识内容;其二,知识获取者是知识的消费方,结合自身的需要选择来付费获取所需要知识,或不选择付费获取知识,也可选择免费知识。

在虚拟社区知识共享平台中,对参与人1的声誉、信誉、能力等评价,主要来源于两个方面:其一,虚拟社区组织的评价;其二,知识付费参与者的评价。本研究假定参与人1和参与人2彼此是信息完全的,所以对不完全信息的静态博弈和不完全信息的动态博弈暂时不进行讨论。在完全信息的条件下,参与人1与参与人2的完全信息静态博弈模型如下。

表3 完全信息静态博弈模型中知识共享成员收益矩阵

3.3.2 模型分析

(1)参与人1的分析

参与人1,在U1+N(A1- C1)>U2-NQ(A2- C2+ζK)和U1+N(A1- C1)>U1时,其最优策略是“提供知识,付费”。在虚拟社区知识共享平台下,参与人提供知识到虚拟社区平台,经过虚拟社区评价,或者知识获取者评价,使知识获取者有意愿和行动为获取对有能力的知识提供者所提供的知识内容付费,并且知识获取参与者数量与支付金额的乘积,即总收入大于知识提供者生产知识所花费的成本。

若 U1+N(A1- C1) < U2-NQ(A2- C2+ζK) 和U1+N(A1- C1)>U1(A1< C2)时,则最优策略是“提供知识,不付费”,这是目前虚拟社区的状况,知识提供者付出时间与精力,而参与人2获取知识内容后,没有支付任何酬劳服务的结果。

(2)参与人2的分析

参与人2,在U1+N(A1- C1)<U2-NQ(A2- C2+ζK),U2-NQ(A2- C2+ζK)>U2+ NQζK时,最优策略是“提供知识,付费”。参与人2,要想获得高质量和持续不断的知识内容,则需要为知识内容付费,而知识内容费用包括满足自身需求的成本以及参与人1提供知识内容的成本。这种正向的激励会增加参与人生产知识内容的动力,降低因有其他机会收益而放弃在这个已提供知识服务的虚拟社区知识共享行为。

若U1+N(A1- C1)<U2-NQ(A2- C2+ζK)和U2-NQ(A2- C2+ζK)<U2+ NQζK时,则最优策略是“不提供知识,付费”,这种情况是参与者1没有意愿生产高质量满足参与人2的知识内容,而参与者2有意愿付费获得所需要的知识内容,有可能是因参与者2为了节省搜寻信息的时间成本而支付费用。

若U1+N(A1- C1)>U2-NQ(A2- C2+ζK),U2-NQ(A2- C2+ζK)>U2+ NQζK时,则最优策略是“不提供知识,不付费”。虚拟社区知识共享的囚徒困境,因为参与人1和参与人2是负反馈,所以虚拟社区无法持续发展共享知识内容,以满足知识获取者的需要。

3.4 完全信息的重复博弈

虚拟社区知识共享参与者之间可以多次重复博弈。参与者1,所提供的知识内容并非永久不变,是可以优化提高质量的,后续参与者2支付获取优化后的知识形成正反馈;参与人2,获取参与者1的知识内容后,会提高对虚拟社区的满意度和忠诚度,持续将参与者1的知识内容分享给更多的参与者,从而实现付费后获取知识。最终,正反馈或负反馈均影响参与人1和参与人2的持续共享。

3.4.1 博弈只进行一次

在具体的知识共享场景中,例如,在问答社区中,是通过虚拟社区第三方技术建立的声誉排名机制或物质奖赏来激励主动在虚拟社区分享知识的行为,但这些奖励很难达到预期的效果[23]。在博弈只进行一次时,知识消费方对知识生产方所提供的知识内容不满意,则最优策略为“提供知识,不付费/付费”。如果参与人1所生产的知识质量Q远小于平均水平,参与人2不会为知识内容付费,虚拟社区平台评价功能会删除类似的知识内容,表明“提供知识/不提供知识,不付费”为最优策略。

3.4.2 博弈只重复有限次

有限重复博弈导致知识供给方不断提升所生产的知识内容,有助于满足更多的个人的需要,其最优策略是“知识提供,付费”,但随着知识分享内容质量Q逐渐降低,分享的次数减少,若没有虚拟社区第三方的监督与管理,知识提供和付费无法保持最优策略,从而转变成有生产的知识却无人付费。

4 讨论

文章引入知识付费变量,建立虚拟社区知识共享全信息静态与重复博弈模型,结果发现:①明确引入知识付费因素,有利于降低虚拟社区知识共享的囚徒困境发生。知识提供者与知识获取者更会选择“提供知识,付费”策略,进行日常的知识共享活动。②生产高质量的知识内容来持续满足知识获取者。知识内容提供者与知识内容获取者,在完全信息静态博弈下的有限重复博弈,要求虚拟社区第三方参与制定规则,保持知识提供者知识内容的质量,以及持续输出高质量知识内容。在此基础上,知识获取者在满足自身需求的前提下对知识内容付费。③知识付费金额设置。知识提供者U1,知识获取者U0和U2。金额范围(P0,PA),知识提供者与知识获取者在不同区间内,知识提供者提供知识一次或重复,知识获取者提供知识一次或重复。当重复N=0次,无论费用多少,都不会付费;当U≥C(参与人付出的总成本),无论费用多少都会共享。此外,合理设置知识付费水平,同时动态定价或标准定价符合知识提供者与知识获取者的价格预期。④知识提供者与知识获取者的强弱关系转变。知识内容提供者(用户或用户所在平台)、知识内容获取者之间的关系是弱关系,没有虚拟社区平台的激励与强化知识提供内在动机的动作,知识共享难以持续进行。然而,知识获取者参与到虚拟社区知识共享的过程也要满足自身需求,倘若未达到知识获取者的预期,知识获取者转换成知识提供者的可能性较低。若引入知识内容付费激励因素,主动分享知识的提供者(用户或平台)的知识内容质量将会筛选出愿意为知识内容付费(满足自身需求)的知识获取者,以致知识提供者与知识获取者之间从弱关系转变成强关系。

(来稿时间:2018年5月)

猜你喜欢

囚徒困境虚拟社区囚徒
浅析关于虚拟社区信息共享研究现状
浅析关于虚拟社区信息共享研究现状
虚拟社区对青少年思想政治教育的影响
机智的囚徒
囚徒
“囚徒困境”在贿赂犯罪审讯中的运用
关于公共品博弈的文献综述
重复博弈现象分析
被释放的囚徒
列宁:沙皇专政的囚徒