信号博弈视角下保研与考研决策研究

2019-02-11张钰丽

青年与社会 2019年34期

关键词：考研

张钰丽

摘要：文章通过信号博弈模型和精炼贝叶斯均衡分析大学生保研与考研背后的信号博弈，指出“保研”和“考研”的博弈关键在哪一个博弈方能够专注于把一件事做好，有更高的效率，同时得出任何包括科研、竞赛等的训练和经历都要求精而不要求多，一个做事认真细致、有高效率且能做出杰出成果的竞争者才能在人才市场上脱颖而出。

关键词：考研;保研;信号博弈模型;精炼贝叶斯均衡

一、信号博弈模型及贝叶斯均衡综述

信号博弈，即信号的发送方和接收方先后各选择一次行为，并且信息接收方具有不完全信息。假定用S表示信息的发送方，并定义S的类型空间为T={t1，t2，，tI}，且S的行为空间为M={m1，m2，，mJ};同时，用R表示信息的接收方，定义R的行为空间为A={a1，a2，，aK}，用us和uR分别表示S和R的收益。

现有博弈方0（自然）根据{p（t1），p（tI）}的概率分布为S选择类型，并让S知道。假定S以p（ti）的概率为ti，于是S选择行为为mj，R注意到mj后必须进行有关于S类型的判断，得到S是每种类型ti的概率分布为，其中，。在这里假定所有博弈方均是理性人，因此R根据判断做出的行为a*（mj）必然使R的期望得益最大，即R的行为必须是的解，此时S的选择m*（tj）必须是使S利润最大化的最优解，即必为满足条件的解。

二、是否保研背后的信号博弈

由于每个人不能同时选择两种人生方向，即每个人的选择满足独立性要求，因此为研究保研与考研背后的信号博弈，可以剔除其他人生方向而假定F大学某群大学生毕业之后有两种选择，一种是保研，一种是考研。根据F大学要求，只要求毕业（考研）所需创新学分为6学分但无积点分要求，而保研所需创新学分为20学分且积点分必须名列前茅。现已知创新学分可以通过参加科研竞赛（必须获奖）获得，积点分高低可以通过努力学习获得，保研名额远远少于选择保研的总人数。但由于经常参加科研竞赛会分散部分学习的精力，因此保研与考研冲突。

假定有博弈方A和博弈方B，已知A和B均是理性人，且如果选择考研A和B希望进入读研的大学相同。设：

t1=保研;

t2=考研;

m1=常参加科研竞赛且努力学习;

m2=常参加科研竞赛但不努力学习;

m3=不常参加科研竞赛但保证科研竞赛的质量，努力学习;

m4=不常参加科研竞赛但保证科研竞赛的质量，且不努力学习;

则A的类型空间为T={t1，t2}，A的行为空间为M={m1，m2，m3，m4}。

a1=努力学习并常参加科研竞赛准备保研;

a2=努力学习准备考研;

则B的行为空间为G={a1，a2}。

通过观察，B发现A学习刻苦，因此可以简化A的行为空间为M={m1，m3}。同时假设：

两人均选择通过常参加科研竞赛且努力学习来保研或均选择考研时，由于名额限制两人获得收益需要消耗较多的机会成本，因此两方收益为2;

当一方通过选择常参加科研竞赛且努力学习来保研，另一方选择考研时，由于竞争减少，因此两方收益为3;

当一方通过选择不常参加科研竞赛但保证科研竞赛质量且努力学习来保研时，由于竞争减少，且在科研竞赛上花费时间减少，因此选择不常参加科研竞赛但保证科研竞赛质量且努力学习来保研的一方收益为4，而另一方选择考研时收益为3，选择努力学习并常参加科研竞赛准备保研时收益为-1;

当一方通过选择常参加科研竞赛且努力学习来考研时，由于精力分散较多，竞争力降低，因此收益为1，但是尽管如此，当两人同时选择保研时仍存在竞争，因而另一方需付出的机会成本仍然较大，因此受益为2。

具体信号博弈模型如下图所示：

其中，博弈方0（N）以p（t1）=0.7的概率为A选择类型t1，以p（t2）=0.3的概率为A选择类型t2。B推断A在m3条件下t1的概率为：

在m3条件下t2的概率为：

假设B的收益函数为uB，因此，B根据生成的推断，使通过行为a*（mj）可以获得期望的最大收益，有如下：

比较（1）（2）可得使B获得最大受益的行为

。

在此条件下，A的选择m*（ti）必须是使A利润最大化的最优解，即满足：

对于T={t1，t2}，当mj=m1时，有：

m1（t1）=uA[t1，m1，a*（mj）]=3;

m1（t2）=uA[t2，m1，a*（mj）]=1;

当mj=m3时，有：

m3（t1）=uA[t1，m3，a*（mj）]=4;

m3（t2）=uA[t2，m3，a*（mj）]=2;

则uA[t1，m3，a*（mj）]>uA[t1，m1，a*（mj）];

uA[t2，m3，a*（mj）]>uA[t2，m1，a*（mj）];

因此A的最优行为选择为，且A服从混同均衡。（m3，m3）构成均衡信号战略，同时（a1，a2）构成了B的均衡行动战略。

根据均衡信号（m3，m3），图左侧B的信息集处于非均衡路径上，设：

q=p（t1|m1），1-q=p（t2|m1）;

则B选择行动a1的期望收益为q*2+（1-q）*3=-q+3;

B选择行动a2的期望收益为q*3+（1-q）*2=q+2;

由于a*（m1）=a1，应有-q+3>q+2，即q<0.5，1-q≥0.5。因此可以求该信号博弈的精炼贝叶斯均衡：

（一）均衡战略

均衡信号战略——m*（t1）=m3，m*（t2）=m3;

均衡行动战略——a*（m1）=a1，a*（m3）=a2。

（二）均衡推断

处于均衡路径之上——p（t1|m3）=0.7，p（t2|m3）=0.3;

處于非均衡路径之上——p（t1|m1）<0.5，p（t2|m1）≥0.5。

综上所述，可以得到该保研与考研背后的信号博弈中的精炼贝叶斯均衡为：（m3，m3），（a1，a2），p=0.7，q<0.5。

三、结语

通过以上分析我们不难发现，当A选择不常参加科研竞赛但保证科研竞赛质量且努力学习来达到保研目的时，B的行为立刻转向a2即专心考研，只有当A虽然常参加科研竞赛并努力学习但是其目的有50%以上的可能性是考研时，B才会选择a1即努力学习并常参加科研竞赛准备保研。并且，A选择经常参加科研竞赛并努力学习来达到保研目的的概率在50%以下，说明真正有能力的人在大学期间不会常常做科研。

因此，是选择“保研”还是“考研”关键在于清楚自己是否能够专注于把一件事做好，同时要想方设法锻炼自己的能力，提高做事效率。任何包括科研、竞赛等的训练和经历都要求精而不要求多，“精”指的是有态度，有高效率，有突出成就，它们背后体现出的能力水平才是在竞争中胜出的关键要素。

参考文献

[1] 谢识予.经济博弈论（第四版）[M].上海：复旦大学出版社，2017：225-227.