用博弈论的方法分析解决图书馆数字信息资源共享问题

2017-04-27王净尚顶洪

电脑知识与技术 2016年29期

王净　尚顶洪

摘要：从解析博弈论经典模型——“囚徒困境”着手，对博弈论进行简要介绍。利用矩阵图工具对数字资源共享的静态博弈和动态博弈过程进行分析，并针对动态博弈中无限次重复博弈和有限次重复博弈两种情况进行讨论。提出通过在图书馆之间建立信任机制、监督机制、保障机制等方法措施，从而有效推动图书馆数字资源共享合作的持久、稳定发展。

关键词：博弈论图书馆数字资源资源共享

中图分类号：G251 文献标识码：A 文章编号：1009-3044（2016）29-0017-03

随着大数据时代的到来，信息的互联互通成为提高信息服务能力的重要前提，任何一个图书馆都难以同时满足不同学科专业、不同层次用户的信息需求，也不可能实现对所有资源的收集和管理，数字信息资源共享就是为了解决个体图书馆信息资源的有限性和信息需求无限性的矛盾而采取的图书馆间合作建设与发展的策略。现阶段，我国文献信息资源共享的理论研究主要集中在文献资源的布局和配比方面，因此多将信息资源共享效率低下的症结归于管理体制的不完善、技术手段的落后和宏观调控的缺乏。信息资源共享是追求自身效用最大化的过程，是一种分析投入成本和产出收益的博弈过程，通过借鉴博弈论的研究方法，从图书馆个体利益和共享集体利益的关系出发进行研究，可以进一步认识阻碍数字信息资源共享的因素，并找到解决这些问题的方法和措施。

1博弈论概述

1.1博弈论的涵义

博弈论，也称对策论，英文为Game Theory，是根据信息分析及能力判断，研究多个决策主体之间行为的相互影响作用，以取得收益或效用最大化的一种对策理论。其中的“博弈”是指个人、队伍或组织，在一定的环境条件及规则下，同时或先后、一次或多次，根据环境和竞争对手的情况变化，从各自允许的行为或策略中进行选择、加以实施，并从中取得相应结果的过程。中国早在几千年以前就已存在博弈思想，田忌赛马的故事就是较好的博弈论案例。自20世纪80年代，博弈论得到了广泛的应用，尤其对信息经济学的发展做出了重要的贡献。

1.2博弈论“囚徒困境”经典模型分析

博弈论经典模型囚徒困境建立在一个假设之上，即甲、乙两人被怀疑是合伙的偷盗犯，警方虽逮捕了他们但没有掌握充分证明两人犯罪行为的证据，警方将其分开单独审问，双方不能进行信息的交流。警方对这两个嫌疑犯的量刑原则是：如果一方坦白，另一方不坦白，则坦白者从宽处理，判刑1年；不坦白者从重处理，判刑7年。如果两人都坦白，则每人判5年刑。如果两人都不坦白，则警方由Tile据不足，只能对每个人各判刑2年。表格1中的框图体现了这个博弈的分析过程，左方是甲的可选择策略，上方是乙的可选择，双方均可做出坦白和不坦白两种选择。其中包含数字的格对应甲乙的一个策略组合，每格第一个数字代表甲的报酬，第二个数代表乙的报酬。比如第二个数字格是指当甲坦白，乙采取不坦白的策略时，甲的报酬为-1，乙的报酬也是-7。图中的报酬均为负数，以表示判刑的年数。

在警方交待了量刑原则以后，会从自身利益出发进行分析，选择坦白或不坦白的策略，此时双方展开了博弈的过程。首先分析甲的思考过程，当甲进行决策选择的时候一定会先考虑乙的想法。根据图表1的矩阵图可见，当囚犯乙选择了坦白的策略时，囚犯甲坦白则获刑5年，不坦白获刑7年。由此，当乙选择坦白时，甲必然选择坦白（因为5<7，我们在-5下划横线，表示甲的占优策略）。当乙做出不坦白的决定，那么当甲坦白时获刑1年，不坦白则获刑2年。那么当乙不坦白的时候甲同样还是会选择坦白的策略（因为1<2，-1下也划横线）。可见不管乙做出坦白和不坦白中怎样的选择，甲最终都会选择坦白。用同样的方法分析乙的选择，会得出同样的结果。最后，矩阵中唯一的两个数字都被划上横线的那一格报酬组合是（-5，-5），其对应的（坦白，坦白）策略为囚徒困境模型的最终结论。

如果仔细分析囚徒困境报酬矩阵，甲乙双方若都作出不坦白的决定，会得到更好地结果，即各判刑2年。可是因为没办法进行信息沟通，每一方都会担心对方坦白但自己不坦白时会受到重判（即对方坦白获刑1年，自己不坦白则被判7年）。因此，每个囚犯都會从个人利益出发考，最终的结果都会选择坦白坦白，（坦白，坦白）便是囚徒困境博弈模型必然的均衡结果。

囚徒困境的结论折射出的道理发人深省，从个体的视角思考做出的占优策略决定（-5，-5），显然劣于做出合作策略的选择（-2，-2）。换句话说，从单个个体的角度出发得出的占优策略，从整体而言得出的却是最不理想的结局。囚徒困境最终达到的策略均衡，体现出了个人理性和集体理性的矛盾冲突。目前，图书馆在数字信息资源共享问题上也存在着类似的矛盾，我们将“囚徒困境”的博弈分析方法运用到资源共享问题上，也可以解释合作的不稳定性及相关问题。

2图书馆数字信息资源共享的博弈分析

2.1数字信息资源共享的静态博弈

数字信息资源共享一直是图书情报界关注的重大课题，每个图书馆都有资源共享的愿望，图书馆信息资源的共享，可以实现整体效用的最大化。假定参与共享合作博弈的图书馆为A、B两个，分析图2矩阵可以发现，如果A、B馆都选择合作策略，每个参与者均可获得收益为10，总报酬最大为20；如果A、B两者中有一方选择合作，而另一方选择不合作，参与者报酬分另4为6、12，总报酬为18；倘若A、B两馆都做出不合作的选择，那么各馆报酬都是8，总报酬16是最小值。可见（合作，合作）策略是团体利益最大的策略选择（20>16）。

事实上，一些图书馆为了自身的利益，往往从个人理性角度出发，最终与团体利益冲突，陷入“囚徒困境”。类似于囚徒甲、乙的决策过程，A馆会根据B馆的决策选择策略，当B选择合作策略时，A若选择合作可得10，A若选择不合作，既省去了共享资源需付出的成本，又无偿享受了B馆提供的信息资源，报酬是12。因此，A必然不会合作（显然12>10）。同理可推得，B做出了不合作的选择时，A仍然会选择不合作策略（因为8>6）。显而易见，无论B做出合作或者不合作的选择，A都会采取不合作策略。同样的分析结果对B馆也是适用的，最后的博弈结果为（不合作，不合作），这时总报酬16，小于最优策略的总报酬20。

这一博弈矩阵可以看出，大家最初都希望达到（合作，合作）总报酬为20的结果，但是通过报酬矩阵分析可见，即便已经签订合作协议，各自馆也会抱有“搭便车”的心理，就是如果你合作我不合作，我就可以占到便宜（12>10），于是各自违背共享约定，形成了图书馆资源共享博弈的（不合作，不合作）结果。

上述两种博弈均为一次性博弈，参与博弈者都只能进行一次选择决定，另外博弈参加者在做出自己决定的时候并不清楚对方的决定，大家都是同时决定自己的一次性策略选择。处在这样的前提之下，参与者都做出了自己的策略选择时便已完成了一个完整的博弈过程，并得出了最终结论，这种博弈称为静态博弈。在静态博弈中，出于个人理性的策略选择往往导致了从整体而言的最坏结果。一方面，在达成合作协议以后，参与者都会有投机的心理，并从自身利益出发暗地选择了不合作的做法。另一方面，对于一次性的博弈，只要参与者做出了最终决定便完成了博弈过程，对于违反约定的行为没有补救和惩罚的有效措施，无法通过后续的博弈进行调整和制约。

2.2数字信息资源共享的动态博弈

实际上，博弈通常为一系列重复进行的运动，即相对静态博弈而言的动态博弈，在连续进行的动态博弈中，上面结果会有所不同。

2.2.1数字信息资源共享的无限次重复博弈

无限次重复博弈是指相同结构的博弈可以无限次地重复进行下去。如果设定在数字资源共享的无限次重复博弈中，不管哪一方图书馆在其中的一轮合作博弈中采取了不合作的行动，在以后的博弈中便会遭到其他馆“不合作”的报复策略，而且这一不合作策略会在未来的所有博弈中重复下去，长此以往，首先违约的一方便永远失去了与另一方合作的机会。因为在无限次重复博弈中，存在着对欺骗和违约行为报复的机会，因此参与合作的各方会担心采取不合作策略给自己带来的长期损失，不会主动选择不合作的策略，使得数字信息资源共享合作得以维持。

继续用图2加以说明，对于图书馆A，各馆如果一直处于合作的状态，便可以长期获得报酬10，累积起来為10+10+10+…，但如果抱有机会主义的想法，打破约定选择了不合作的策略，他的确获得了一次性的利益，得到报酬为12，但在以后的无限次重复博弈中，均会受到对方不合作的报复行动，收益只能为8。为了一次性的好处，使得日后的收益从原来合作策略时的10+10+10+…下降为不合作策略时的8+8+8+…。显然，任何一个图书馆在数字信息资源的无限重复博弈中，为防止被报复而丧失长期的经济效益，都会遵守协议，采取合作的策略。

2.2.2数字信息资源共享的有限次重复博弈

在有限次重复博弈中，假设事先约定只合作5次，用逆推法进行分析，各方均知道第5轮博弈是最后一轮博弈，因此这一轮博弈便同静态博弈无异。根据前面的分析，这一轮的违约不可能在以后受到惩罚和损失，那么，每个图书馆出于个人理性出发选择的占优策略就是不合作的结果。逆推到第4轮，因为大家都可以推算出第5轮不合作的结果，因此第4轮博弈也会采取不合作的策略。由此类推直到第1轮，都可以得到同样的结果。显然，在有限次重复博弈中，图书馆数字信息资源的共建合作是不稳定的，博弈的最终均衡策略为（不合作，不合作）。

3用博弈论的思想解决数字信息资源共享问题

在现实生活中，参与博弈的各方合伙的机会必然是有期限的，信息组织间的合作共享是否根本无法实现呢？显然在现实生活中是存在着长期合作的共同体。事实上，无限次重复博弈的主要界定标准在于参加者均不清楚哪一轮博弈会是最后一轮，合作各方担心违约会遭到日后的“报复”便会把合作策略坚持下去。在有限次的重复博弈中，如果合作双方不确定哪一轮是最后一轮，参与者会认为日后还要继续打交道、博弈状态会继续维持，这便同无限次重复博弈无异。所以，在不能确定终止期的有限次重复博弈的图书馆数字信息资源共享博弈中，合作解是可以存在的。当然，为了维护合作模型的稳定性，更好的实现团体利益的最大化，必须配合以必要的措施。

3.1建立信任机制

图书馆信息资源共建共享机制的成功建立，取决于成员间的相互信任和对于联盟内部规则的遵守程度，能够取得收益同时实现持续的发展，其中成员馆之间的信任是至关重要的。成员间除了应相互理解对方的行为和立场，尊重对方的观点，还应加强组织内的交流，达成对某些问题的认识。另外，信任评审机制的建立也十分必要，通过建立完备的综合性、长期性评估测试标准系统，对成员的联盟策略及行动影响因素进行持续地跟踪测评，通过完善细致公平的执行制度，形成稳定可靠的运行机制。

3.2建立监督机制

对于合作中的各馆，都希望采取最优于自己的策略，以期得到最好的结果，因此为了达到合作团体利益的最大化，应该对各成员进行有效监督，维护合作协议的顺利执行。要在建立领导协调组织和健全监督机制上下工夫，在明确各成员权利义务的基础上，监督各成员的行为。对于损人利己的倾向和行为，及时采取措施，必要时对违反合作协议的成员进行制裁，甚至终止合作。

3.3建立保障机制

因为各图书馆之间的规模与发展水平不均等，建设规模大、信息丰富的图书馆往往很难与信息量相对较少的图书馆实现资源共建共享，另外数字信息资源共建共享经常发生“搭便车”的问题，这些都需要通过建立保障机制加以制约。在内部评估制度规范的基础上，对贡献大的图书馆要采用奖励的办法进行收益补偿，同时针对慵懒的图书馆，通过采取惩罚的方式实现督促作用。

在具体的实施上，以惩罚措施为例，在成员馆签订共享协议时，规定不合作的一方会受到经济制裁，报酬减3，在矩阵图2的基础上可以得到新的报酬矩阵（见图3）。按“囚徒困境”的分析思路，如果A馆选择共享，B馆选择了不共享，B得报酬为9而不是原来的12，因为B馆不共享受到了事后的经济制裁（12-3=9），小于（共享，共享）中的报酬10，可见，B怕受到惩罚得不偿失必然选择共享。对于A的分析也是如此，最后的博弈均衡状态一定是（共享，共享），克服了欺骗或违约行为，达到了信息资源共享的目的。

在保障机制的建立原则上，采取的经济措施目的是为了实现个体利益与团体利益的一致，如果个人利益违背了团体利益，通过对个体的报酬加以调控，改变个体的决策选择，保障团体利益的最大化，同时也保障了遵守承诺的个体的利益。

通过博弈分析，并用博弈论的方法调控数字信息资源共享行为，可以有效地解决资源的闲置和不适当利用问题。在一些利益矛盾中，改善管理机制和提高技术手段的同时，要善于发挥经济杠杆的作用，避免效率损失，优化资源配置，达到组织间“双赢”乃至“多赢”的结果，使得信息资源共享合作更稳固更持久。