基于囚徒困境理论的素质教育改革研究

2017-03-02陈秋怡

山东行政学院学报 2017年1期

关键词：囚徒博弈论参与者

陈秋怡

（华东师范大学教育学部，上海 200062）

基于囚徒困境理论的素质教育改革研究

陈秋怡

（华东师范大学教育学部，上海 200062）

20世纪80年代中期以来，我国大力推进素质教育改革，但收效并不显著。素质教育改革是一场博弈，作为博弈论经典案例的囚徒困境，可以解释和说明推行素质教育改革之艰难。素质教育的囚徒困境，是在当前教育体制、高考招生、大学生毕业就业、国家和社会选人用人等方面存在诸多问题的前提下，素质教育博弈过程中各个参与者基于个体理性所选最优策略的结果。只有提高个体参与者的理性水平，改变博弈活动内部收益，建立健全相应选择性激励制度，尤其是借鉴国外先进经验，革新高考招生与高校学生毕业就业制度，并配以国家和社会在人才招聘和使用等方面的根本性变革，才能打破素质教育的囚徒困境。

素质教育改革；囚徒困境；博弈论

一、研究现状

20世纪80年代中期以来，我国大力推进素质教育改革。1993年2月，中共中央、国务院颁布了《中国教育改革和发展纲要》，提出中小学要从“应试教育”转向全面提高国民素质的轨道。1994年8月，中共中央颁布了《中共中央关于进一步加强和改进学校德育工作的若干意见》，首次在中央文件中提出素质教育。1998年10月，国家教委颁布了《关于当前积极推进中小学实施素质教育的若干意见》，提出了实施素质教育的若干措施。1999年6月，中共中央、国务院颁布了《关于深化教育改革全面推进素质教育的决定》，集中阐述了素质教育的思想，把素质教育上升到事关国家发展大局的重要位置。2001年5月，国务院颁布了《国务院关于基础教育改革与发展的决定》，强调扎实推进素质教育。2003年10月，党的十六届三中全会通过了《中共中央关于完善社会主义市场经济体制若干问题的决定》，提出建设学习型社会，全面推进素质教育。2006年6月，第十届全国人民代表大会第二十二次会议修改通过了《中华人民共和国义务教育法（2006年修订）》，将素质教育纳入依法推进的轨道，由法律保障实施。2010年7月，中共中央、国务院颁布了《国家中长期教育改革和发展规划纲要》，提出坚持以人为本、全面实施素质教育的战略主题。2014年9月，国务院颁布了《关于深化考试招生制度改革的实施意见》，将综合素质评价作为深入推进素质教育的一项重要举措。

虽然从上世纪80年代中期至今，我国一直在推进素质教育改革，关于素质教育的政策也层出不穷，但收效并不显著。素质教育改革搞得轰轰烈烈，应试教育实践更抓得扎扎实实，素质教育的政策导向和应试教育的现实制度相冲突。与应试教育相比，素质教育更关注一个人的全面发展和终身学习，是未来教育发展的大方向，但在实际操作中，却敌不过应试教育。针对于此，国内学者做了大量研究，相关研究主要集中在如何切实做好素质教育改革，多主张从两方面着手。

一是课程改革。张福生（2001）提出，若要推进素质教育改革，首先要深化课程教材改革，并对上海市中小学课程教材改革实践进行了评析；［1］郭启华（2008）也认为，素质教育的内容是由课程教材决定的，若要实施素质教育，就必须对我国现行的中小学课程体系和教材内容进行改革；［2］熊昌萍（2015）提出，素质教育与课程改革二者相辅相成，课程改革是为了更好地推进素质教育改革，是素质教育推行的关键所在。［3］二是高考改革。唐滢（2004）提出，在我国全面实施素质教育的形势下，高考如何改革，将对中学教学和大学人才选拔的质量产生重要影响，在一定意义上，招生考试的改革甚至比中学教学内容与方法的改革更为重要；［4］韩民（2006）提出，高考改革是推进素质教育过程中的重要切入点，要实现素质教育的愿望就必须进行高考改革；［5］余莎（2016）也说，高考是以分数论高低，中小学教育就难免会走入应试教育的怪圈。［6］

既有研究多基于课程改革和高考改革提出对策，但课程改革和高考改革已经推行了十几年，应试教育局面改观依然不大，素质教育仍未得到有效落实。政府官员、学者、教师、家长都已认识到应试教育对学生的伤害，学生“负担过重”，影响学生身心发展。可是，尽管“教育减负”成为全社会的呼声，中小学生学习负担不减反增，片面追求分数的应试教育仍居强势地位。基于经济人假设和经济学思维的囚徒困境理论有助于分析其问题根源并找到化解之策。

二、博弈论中的囚徒困境

博弈论（Game Theory）又称对策论，研究决策主体的行为发生相互作用时的决策及其均衡问题，参与者（Players）、策略（Strategies）和收益（Payoffs）是一个博弈活动最基本的三个要素。1928年，冯·诺依曼（Von Neumann J）证明了博弈论的基本原理，宣告博弈论正式诞生。1944年，冯·诺依曼（Von Neumann J）和摩根斯特恩（Morgenstern O）出版了博弈论的开篇之作《博弈论与经济行为》（Theory of Games and Economic Behavior），奠定了其基础和理论体系。此后，越来越多的学者投身于博弈论研究中，为其发展做出了重大贡献。如今，博弈论已发展成为人们决策时的重要分析工具，在政治、经济、军事、社会、教育和管理等领域应用广泛。

在博弈论中，囚徒困境（Prisoner’s Dilemma）是最经典案例。1950年，梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）提出相关困境理论。同年，艾伯特·塔克（Albert Tucker）以囚徒困境予以阐述。它反映了个人决策时为追求自身利益最大化而选择的最优策略，并非是整体的最优策略，会导致双方都获得不利结果，陷入困境之中。囚徒困境包含参与者（Players）、策略（Strategies）和收益（Payoffs）这三个基本要素。

囚徒困境讲述的是警方逮捕了甲、乙两名囚徒，将其分开审问并提供了几种选择（如表一所示）：若一人坦白、一人不坦白，则坦白者将当场释放，不坦白者将被判刑10年；若两人都不坦白，则缺乏证据，各判刑1年；若两人都坦白，则各判刑5年。甲、乙两人应该如何选择，才能获得最短刑期呢？

表1 囚徒困境

由于甲、乙两人是分开审问的，所以不知道对方的选择，出于理性经济人的考虑，他们各自都会基于自身利益最大化做出选择，即坦白罪行。因为如果对方不坦白，自己坦白就可以获得当场释放，不坦白还要判刑1年；如果对方坦白，自己坦白可以获得5年的较低刑期，不坦白就要被判刑10年。所以无论对方采取何种策略，个人最优策略均是“坦白”。但这并不是整体最优策略，就整体利益而言，甲、乙都不坦白才是最优策略，这就形成了个人最优策略并非整体最优策略的困境。

三、素质教育面临的囚徒困境

（一）素质教育博弈的三要素

1.参与者

参与者是指参与博弈活动并独立决策的个人或组织。在一场博弈活动中，至少要有两位或两位以上的参与者。目前，我国素质教育改革举步维艰，国家为推行素质教育投入了大量人力、物力和财力，中共中央、国务院也出台了许多关于推行素质教育的政策文件，但收效都不显著。这很大程度上就因为学生、家长、教师、学校、各级各地教育管理部门和国家政府等参与者陷入了博弈困境。

2.策略

策略是指参与者在博弈活动过程中，为追求自身利益最大化而选择的行动方案。参与者至少面临两种或两种以上的策略，所有策略合称为策略空间。作为素质教育改革这场博弈活动参与者的学生、家长、教师、学校、各地区教育管理部门和国家政府，其策略空间是支持或反对实施素质教育或应试教育，他们都会为追求自身利益最大化持定某一态度。

3.收益

收益是指参与者可以从其选择的策略中获得的利益或损失，一位参与者的收益也受到其他参与者所选取策略的影响。在素质教育改革的博弈中，参与者的收益包括：学生能否获得优异成绩，升入好的学校；家长能否为孩子提供更好的学习条件，投入更多的时间和金钱；教师能否实现家长和学校的期望，提高自己的待遇；学校能否提高升学率和社会声誉，获得更好的生源；各地区教育管理部门能否提高本地区的高考升学率，获得更多的教育资源；国家政府能否提高国民整体素质，建设学习型社会；等等。

（二）素质教育的囚徒困境

虽然素质教育推行至今已有20余年，国家为此投入了大量人力、物力和财力，中共中央、国务院等出台了许多关于推行素质教育的政策文件，教育管理部门明确提出为学生“减负”，减少作业量，禁止补课加课行为，但收效都不显著。呆板僵化的应试教育增加了学生的学业负担，扼杀了学生的想象力和创造力。但如果个别学生、个别家长、个别教师、个别学校或个别地区单独选择素质教育，都会在应试教育的大环境下得难偿失，由此陷入囚徒困境。

素质教育的囚徒困境是由于当前我国教育资源短缺和分数至上招生制度造成的一种社会现象，是素质教育博弈过程的各个参与者所选策略的结果。作为素质教育改革这场博弈活动参与者的学生及其家长，正如囚徒困境中的囚徒一样，学生与学生之间、家长与家长之间不可能相互充分交流，所以存在信息不对称。尽管如此，都知道对方的选择，都会按照自身利益最大化来选择最优策略（如表二所示）。当然，与囚徒困境经典案例不同在于，不再只是甲乙两人，学生和家长就数以亿计。但这不是关键所在，仍然可以用甲乙来代表数以亿计的学生和家长（甲指某一对特定学生及其家长，乙代指其余学生及其家长）。每一对学生和家长在做出选择之前都会这样想：如果其他人选择应试教育，增加作业，天天补课，增加升学的优势，那么自己（学生）或自己的小孩（家长）也必须选择应试教育，否则考试成绩就会落后，升不到好的学校，找工作时也就处于劣势地位；如果其他人选择素质教育，自己（学生）或自己的小孩（家长）也应该选择应试教育，因为这样考试就会领先，进入好的学校，找工作时更有优势。因此，无论其他人选择什么策略，特定的某一对学生和家长都会选择“应试教育”这个对自己最优的策略。

表2 素质教育的囚徒困境

学生和家长在教育活动的博弈过程中选择应试教育是个人利益最大化的表现，但从博弈的结局来看，并没有实现利益最大化，个人的最优策略并不是整体的最优策略。当每个人都做出基于自身利益最大化的选择时，全社会就陷入了素质教育实施受阻的囚徒困境之中。大家都选择应试教育，增加作业和练习，尽量多补课，但却因为都这样做，所以每个人在升学中都难以藉此占优。同时，又因为整天都忙于应付考试，加课补课，被书本教材和考试所束缚，导致没有时间参与课外活动，个人无法取得全面均衡发展。可见，此情之下，个人最优策略却是整体的最不利策略；个体追求自身利益最大化的微观抉择，导致了利益最小化的宏观恶果，学生加大了学习强度，却没有获得升学优势，还失去了全面发展的机会。

前述是学生之间、家长之间的博弈。与之类似，各级地方教育管理部门之间、不同学校之间及教师之间，也会因为狠抓应试教育升学率带来的种种好处，而进行同样的选择，从而使教育活动整体陷入囚徒困境之中。值得一提的是，不管是对学生和家长，还是对各级地方教育管理部门，亦或是对各地学校和教师，在国家没有设计出一套切实可行的、尤其是可以量化的素质教育指标考试之前（与此相应，还必须有大学教育的根本性改革，以及整个国家与社会在人才选拔和使用方面的根本性变革），国家最终只能维持目前的应试教育（当然，如果国家针对素质教育，设计出相应考试指标，那也是一种应试教育，不过是更好的一种应试教育，是重在考核素质的应试教育）。否则，好大学将彻底向“素质低”的下层家庭孩子关闭。而所有学生和家长，各级地方教育管理部门，以及各地学校和教师，在推行目前应试教育的前提下，谁都会把应对应试教育作为重心，也都知道其他人如此，谁都无力改变这种不利局面，也都只能处于这种囚徒困境之中。

四、打破素质教育囚徒困境的途径

（一）提高个体参与者的理性水平

素质教育改革中的囚徒困境，实质上是个体理性与集体理性的冲突。博弈活动的每个参与者都从追求自身利益最大化的个体理性角度出发，只顾自身利益，不考虑他人利益，彼此缺乏合作沟通，最终两败俱伤，整体和个人都没有获得最大利益。素质教育改革这场博弈活动的每位参与者，都选择以应试教育为重心，短期而言似乎获得了个人最大利益，但长远看，既损害了国家整体利益，也不利于每个个体发展。要打破素质教育改革的囚徒困境，首先要提高个体参与者的理性水平，处理好个人利益和集体利益、眼前利益和长远利益的关系。

1.提高信息流通量

如果博弈活动参与者之间不存在信息不对称，大家都拥有充足的信息，彼此信息流通顺畅，有充分沟通和交流，就有助于化解囚徒困境。因为参与者在得知彼此的选择后，会预测博弈结局即整体的策略结果，从而重新作出选择。还可以降低考试、升学等的注码（stake），引导教育活动的参与者了解考试、升学等的性质、联系、意义等，让其明白考试对升学和前途的影响将会越来越小，从而减少导致困境产生的机会。但提高信息流通量不一定能完全打破囚徒困境，因为参与者还会因为个人偏好、感知等的不同而导致困境产生。不过，提高信息流通量，保证充足的信息，有助于打破囚徒困境。

2.转变传统观念

转变传统观念，不仅是要克服已有观念的阻碍，还要培养新的认知和观念，并寻找新的方法。学生和家长要改变分数至上的观念，着眼于长远发展而非眼前利益，着力提升学生综合能力；教师要意识到，全面发展的学生才会在未来大放光彩；学校则要努力营造素质教育文化氛围和办学特色，向世界一流学校看齐；各地区教育管理部门要积极响应国家的素质教育政策，加强对本地学校素质教育开展情况的督查和促进；国家政府要大力推行素质教育，引进其他国家在促进学生全面发展方面的先进经验。

（二）改变博弈活动的内部收益

改变素质教育博弈活动的内部收益（Payoffs），也就是改变现有利益格局的分配，参与者（Players）就会选择不一样的策略（Strategies）。比如改变应试教育对升学的主导性作用，使得即使增加作业，参加补课，取得很高的考试成绩，也不能增加升学优势。在如此改变内部收益后，参与者就会倾向于选择“素质教育”这个对自己最优的策略（如表三所示）。因为如果其他人选择应试教育，增加作业，天天补课，最终却没有升学优势；而尽管自己选择素质教育，同样也没有升学优势，但取得了全面发展。如果其他人选择素质教育，自己也会选择素质教育，否则不仅没有得到全面发展，还要接受这么大的学习强度，升学也不占优势。此时的个人最优策略也是整体最优策略，自身利益最大化的微观抉择，同样促成了利益最大化的宏观结果，个体理性与集体理性相一致，囚徒困境被打破。

表3 改变收益后的素质教育改革

但以上这种改变博弈内部收益的方法只是一种尝试和解释，实际操作起来比较难，因为内部收益的改变，既会导致既得利益群体的回击，又需要制定出一个公平的替代规则。把应试教育与升学相分离，不仅会触碰到某些群体的利益，而且本身也可能会造成新的不公平。可是，任何收益规则的改变和制度的创新都会损害一部分人的利益，都会存在利益角逐，不会得到所有人支持。我们所应做的，就是努力制定出考虑绝大部分人的利益，维护每个人的权益，且有利于国家和每个人未来发展的一种规则和制度。

改变博弈内部收益的思路是，应改变片面追求升学率的现象，或是将升学率同样也与素质教育相挂钩。可以参照美国招生制度的经验：学生升入大学不是唯SAT或ACT等分数决定，还包括课外活动、社会公益活动、推荐信、面试表现等综合素质的考核，尽量避免高分低素质的现象。我国如果也能制定出类似的招生制度，打破目前“高考指挥棒”的局面，那么素质教育改革就不会如此艰难，由分数片面决定的应试教育现象也会得到遏制，每位参与者都会意识到素质教育在这场博弈活动中所占有的高收益注码（stake），从而做出不一样的策略，打破囚徒困境。

（三）制定选择性激励制度

1971年，曼瑟尔·奥尔森（Mancur Lloyd Olson）在其著作《集体行动的逻辑：公共事物的治理之道》（TheLogicofCollectiveAction：Public Goods and the Theory of Groups）中提出了选择性激励制度。其基本理论是：对集体中的每个成员赏罚分明，有选择性地进行激励，可以降低搭便车的风险，提高每个人的积极性。

在素质教育改革中，同样也可制定选择性激励制度，选择性激励那些积极实施素质教育的各地区教育管理部门、学校、教师、家长和学生等，给予他们额外奖励，比如荣誉称号、奖金、加分等。甚至可制定倾斜性政策，保障实施素质教育学校的升学率，根据实施素质教育的先后和力度来保障升学率的高低。比如对第一批大力实施素质教育的学校，保证其“一本”的升学率不低于实施素质教育前五年升学率的平均数；第二批大力实施素质教育的学校，保证其“二本”的升学率不低于实施素质教育前五年升学率的平均数；第三批大力实施素质教育的学校，保证其“三本”的升学率不低于实施素质教育前五年升学率的平均数；若实施力度稍弱一点，则升学率各往后降一个水平（如表四所示）。在制定激励制度的同时，也制定处罚制度，取消受到激励却暗自违背素质教育改革的个体和组织的奖励优惠政策，并予以处罚。

表4 实施素质教育学校的升学率

五、小结

本文概述了素质教育改革的历史与现状，以及素质教育的政策导向和应试教育的现实运作之间的张力。介绍了博弈论的经典案例——囚徒困境，运用其基本理论分析素质教育改革问题，并探讨从提高个体参与者的理性水平、改变博弈活动内部收益以及完善选择性激励制度等方面，去打破素质教育的囚徒困境。

素质教育改革难免存在阻碍和困难。只要不改变目前由分数片面决定的应试教育，无论如何推进素质教育，无论如何改革，都还是会形成囚徒困境。我国一直以考试为升学基础，必须变革目前招生制度，并配以国家和社会在选人和用人方面的根本变革，否则永远只是换汤不换药，无论何种教育改革，最终都会形成特定囚徒困境。

［1］张福生.深化课程教材改革积极推进素质教育——上海市中小学课程教材改革的实践与认识［J］.课程.教材.教法，2001（11）.

［2］郭启华.素质教育与课程改革［J］.黑龙江教育学院学报，2008（02）.

［3］熊昌萍.再论素质教育与课程改革［J］.魅力中国，2015（42）.

［4］唐滢.素质教育视野中的高考改革——兼论高考内容改革从知识立意到能力、素质立意的演进［J］.教育发展研究，2004（z1）.

［5］韩民.素质教育与高考改革［J］.湖北招生考试，2006（20）.

［6］余莎.高考改革下素质教育探究［J］.俪人：教师，2016（14）.

［7］［美］奥尔森著，陈郁译.集体行动的逻辑：公共事物的治理之道［M］.上海：上海三联书店，1995：42.

［8］张维迎.博弈论与信息经济学［M］.上海：上海人民出版社，1996：3.

［9］谢识予.经济博弈论（第三版）［M］.上海：复旦大学出版社，2006：5

［10］柯政.课程改革中的囚徒困境：存在与消解［J］.全球教育展望，2005（10）.

［11］张振华.博弈论视野中的素质教育［J］.辽宁大学学报，2007（05）.

［12］文雪，扈中平.从博弈论的角度看“教育减负”［J］.中国教育学刊，2007（01）.

［13］李斌辉.博弈论视野中的基础教育课程改革困境［J］.教育理论与实践，2008（10）.

［14］王艳，杨洪.基于博弈论的素质教育分析［J］.忻州师范学院学报，2008（01）.

［15］霍秉坤，许颂声.中国学生学习增负减负的博奕：囚徒困局的视角［J］.全球教育展望，2013（04）.

［16］陈翠荣.从博弈论视角看素质教育实施之困境［J］.教育研究与实验，2014（01）.

［17］Olson M.The logic of collective action：public goods and the theory of groups［M］.Harvard University Press，1971，45.

［18］Von Neumann J，Morgenstern O.Theory of games andeconomicbehavior［M］.PrincetonUniversityPress，1980，23.

［19］Rapoport A.Optimal Policies for the Prisoner’s Dilemma［M］.Experimental Studies of Interactive Decisions. Springer Netherlands，1990：136-148.

［20］Howard J V.Cooperation in the Prisoner's Dilemma［J］.Theory&Decision，1988，24（3）：203-213.

［21］WongR.ThePrisoner'sDilemma［J］.Antidote，1993，66（73）：págs.306-309.

［22］Nowak M，Sigmund K.A strategy of win-stay，lose-shiftthatoutperformstit-for-tatinthePrisoner's Dilemma game［J］.Nature，1993，364（6432）：56-58.

［23］ClarkK，SeftonM.TheSequentialPrisoner's Dilemma：Evidence on Reciprocation.［J］.Economic Journal，2001，111（468）：51-68.

［24］Fahim M，Parsazadeh H.The Dilemma of the Dilemma：Getting Education Issues out of Their Dilemmas［J］.Policy Futures in Education，2015（1）：13-26.

编辑：李学迎

F224.32

2095-7238（2017）01-0087-06

10.3969/J.ISSN.2095-7238.2017.01.015

2016-03-22

本文为国家自然科学基金项目“教育管理政策与现实制度不相容性理论与机制研究”（71373082）的阶段性成果。

猜你喜欢

海外侨领愿做“金丝带”“参与者”和“连心桥”