基于演化博弈模型的良性导学关系构建研究
2022-04-30王媛媛傅江浩
王媛媛,傅江浩
(1.武汉科技大学 团委,湖北 武汉 430081;2.武汉科技大学 马克思主义学院,湖北 武汉 430081)
一、引 言
近期,几起研究生自杀事件涉及到的研究生导学关系问题引发媒体关注,引起社会讨论。导师制在14世纪起源于牛津大学与剑桥大学,是由学有专长的教师或研究人员对研究生进行教学与辅导的制度[1]。导学关系是导师制下导师与研究生的关系,既包含学业与科研的指导与学习,也包括人生观价值观的指导与学习。导师和研究生是研究生教育中联系最为密切的两个主体,能够相互影响、相互促进,导学关系决定着研究生培养的质量[2]。和谐导学关系下,导师愿意投入更多的时间和精力培养研究生,研究生也愿意积极主动与导师沟通,产出高质量科研成果。恶劣导学关系下,研究生与导师矛盾不断爆发,科研攻关、学生学业甚至师生身心健康都会出现问题,不仅影响研究生的人才培养,而且成为研究生教育的系统性风险之一[3]。
党的十九大以来,中共中央、国务院印发了《关于全面深化新时代教师队伍建设改革的意见》,教育部印发了《关于全面落实研究生导师立德树人职责的意见》《新时代高校教师职业行为十项准则》《关于高校教师师德失范行为处理的指导意见》《关于加强和改进新时代师德师风建设的意见》《关于加强博士生导师岗位管理的若干意见》《研究生导师指导行为准则》等一系列文件,为全面提升研究生培养质量,切实加强导师队伍建设,聚焦导师指导环节,构建和谐导学关系提供了制度保障。
本文采用演化博弈工具,对研究生导学关系进行定量分析,期待找到研究生导学关系中导师和研究生群体做出策略选择的深层机理,为提升研究生培养质量,构建和谐导学关系提供理论参考。
二、预备知识
(一)演化博弈理论
演化博弈理论起源于生态学领域,1961年,演化博弈理论被Lewontin用于描述生态现象,随后被广泛应用于生态学、社会学及经济学等领域,用来研究群体行为的演化过程及其结果[4]。1973年,Maynard Smith结合生物演化论与经典博弈理论在研究生态演化现象的基础上,提出了演化博弈理论的基本均衡概念:演化稳定策略,这对演化博弈理论的发展起到了重要作用[5]。随后,Taylor、Jonker以及Selten等人将已发展的演化生物学概念应用于约束理性人行为,并将经典博弈理论与动态系统相结合,从而进一步发展了演化博弈理论。演化博弈理论分析了博弈双方随时间变化的情况,在一定程度上弥补了完全理性假设与现实生活不完全相符的不足,为博弈论的发展以及经济学研究提供了新的思路[6,7]。
演化博弈理论是以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入模型之中,并以系统论的观点来考察群体行为的演化趋势。理论可以简单描述为:对于群体博弈,博弈方通常会学习参考以往博弈中对手博弈方的策略以及策略带来的收益,从而调整选择新一轮的策略。调整策略的机制有多种,最常用的有复制动态决策机制和最优反应动态机制。本文根据导学关系的实际情况,选择复制动态决策机制进行策略调整。
(二)复制动态模型
复制动态决策机制的关键为复制动态模型,复制动态模型可以用以下微分方程表示:
(1)
三、导学关系的演化博弈分析
(一)导学关系博弈的合理性分析
导师是研究生培养的第一责任人,肩负着培养高层次创新人才的崇高使命。人们通常认为导师应该对研究生进行严格管理,以提高人才培养质量。然而,严格管理意味着导师需要投入更多的时间精力,所获收益即研究生产出的科研成果,却不只与导师的投入相关,还与研究生是否专注学术研究的选择策略相关。
随着现代化进程不断深入及社会经济的不断发展,部分研究生心态也日益浮躁,求学带有外在功利化目的,不再以追求真理和培养创造精神为追求,而是为文凭而学,为找到一份好工作而学,就业的不确定性和世俗诱惑使得学习成效大打折扣。与此同时,多半研究生有社会兼职经验[8],兼职的目的多与获取经济收入和储备就业能力有关,而与所学专业及研究方向关系不大或者没有关系。
在构建博弈模型之前,对导学关系博弈作一些基本假设,如下:
(1)假设师生都是理性人,即导师、研究生双方都追求自身利益最大化。
(2)假设导师“放养”式管理意味着对研究生学习的要求较低,即对研究生科学研究成果的要求较低,通常是达到学校毕业最低要求即可;严格管理意味着对研究生学习的要求较高,即对研究生科学研究成果的要求较高,通常在成果数量及质量上都比“放养式”管理的导师有更高要求。
(3)假设研究生专注学术研究意味着自愿在科学研究中投入的时间、精力较多;功利化就读意味着自愿在科学研究中投入的时间、精力较少。
(4)研究生收入为科学研究成果带来的精神满足、物质奖励及由此带来的更好工作机会等;研究生成本为参与科学研究的时间精力等投入,可以由该时间精力用于社会兼职等带来的收入量化。
在基本假设条件下,进一步采用扩展式方式描述导学关系博弈的各个要素:
(1)参与人:研究生导师与研究生。
(2)策略:导师的策略为严格管理和“放养”式管理;研究生的策略为专注学术研究和功利化就读。
(3)参数假设:严格管理的导师对研究生学术成果的要求为mh,导师自愿投入的时间精力为th;“放养”式管理的导师对研究生学术成果的要求为ml,一般与学校研究生毕业最低要求相同,导师自愿投入的时间精力为tl。研究生专注学术研究时自愿投入的时间精力为sh,研究生功利化就读时自愿投入的时间精力为sl。
(4)收益函数:研究生的综合收益函数为
P(m)-C(s),
(2)
其中P(m)表示研究生学术成果为m时取得的收入;C(s)表示研究生投入的时间精力为s时的综合成本,都是单调递增函数。
导师的综合收益函数为
Q(m)-D(t),
(3)
其中Q(m)表示所指导研究生学术成果为m时取得的收入;D(t)表示指导研究生时间精力投入为t时投入的综合成本,也都是单调递增函数。
在实际导学关系博弈中,导师相对固定且信息较为公开;而研究生流动性强,且每届学生各不相同,有时面试表现与实际学习工作存在一定偏差。因此师生对彼此信息的了解是不对称的,导学关系博弈为不完全信息博弈。
(二)不完全信息下的导学关系博弈模型
在不完全信息条件下,研究生的策略选择和导师的策略选择相互影响,双方的收益函数也息息相关。首先考虑研究生收益:专注学术研究的研究生,无论导师作何决策,自愿投入的时间精力均为sh,在严格管理导师的指导下,完成导师要求的学术成果mh;在“放养”式管理导师的管理下,相比于功利化就读研究生,往往能产生更多科研成果λml,其中λ(1≤λ≤mh/ml)为收益系数。功利化就读的研究生,总是希望投入尽量少的时间精力,因此在“放养”式管理导师的指导下,自愿投入的时间精力为sl,达到导师要求的学术成果ml;在严格管理导师的指导下,为了达到更高要求的科研成果,不得不投入更多时间精力λsl,其中λ(λ≥sh/sl)为研究生成本系数。
再来研究导师收益:严格管理的导师对研究生学术成果的要求为mh,其中专注学术研究的研究生可以达成目标,导师投入的时间精力为th;而功利化就读的研究生,因其学习动力不足,导师为使其达到预期培养目标,需要投入更多的时间精力βth,其中β(β≥1)为导师成本系数。“放养”式管理的导师希望投入较少的时间精力,指导功利化就读研究生时投入的时间精力为tl,指导专注学术研究的研究生,学生取得的学术成果为λml,导师投入的时间精力也会相应增加,为αtl,其中α(α>1)为导师成本系数。综上,可以建立起不完全信息下导学关系博弈模型如表1。
表1 不完全信息下导学关系博弈模型
对上述模型进行简单的占优分析可知,策略组合(功利化就读,“放养”型管理)将会是该博弈的纯策略纳什均衡,这说明在没有外界因素的监督下,导学关系博弈的结果为研究生选择功利化就读,导师选择“放养”式管理,这严重影响研究生培养质量。显然,策略组合(功利化就读,“放养”型管理)不是帕累托最优状态。另外,策略组合(专注学术研究,严格管理)也是该博弈的纯策略纳什均衡,但由于“共谋”现象的存在,该策略组合并不稳定。
(三)导学关系演化博弈模型与演化均衡
=[P(mh)-P(λml)]x(t)+P(λml)-C(sh),
=[P(mh)-C(λsl)-P(ml)+C(sl)]x(t)+P(ml)-C(sl),
=[P(mh)-C(λsl)-P(ml)+C(sl)]x(t)+[P(λml)-C(sh)-P(ml)+C(sl)]y(t)+[-P(λml)+C(λsl)+P(ml)-C(sl)]x(t)y(t)+P(ml)-C(sl),
依据复制动态原理,收益较小的博弈方会改变当前的策略,模仿群体中收益较高的博弈方策略。从而,群体中选择不同策略的人数比例将发生变化。下面用复制动态方程表示研究生博弈系统的变化过程:
={[-P(λml)+C(λsl)+P(ml)-C(sl)]x(t)+[P(λml)-C(sh)-P(ml)+C(sl)]}y(t)(1-y(t)),
=[-C(th)+D(βth)]y(t)+Q(mh)-D(βth),
=[Q(λml)-D(αtl)-Q(ml)+D(tl)]y(t)+Q(ml)-D(tl),
=[Q(mh)-D(βth)-Q(ml)+D(tl)]x(t)+[Q(λml)-D(αtl)-Q(ml)+D(tl)]y(t)+[-D(th)+D(βth)-Q(λml)+D(αtl)+Q(ml)-D(tl)]x(t)y(t)+Q(ml)-D(tl),
下面用复制动态方程表示导师博弈系统的变化过程:
={[-D(th)+D(βth)-Q(λml)+D(αtl)+Q(ml)-D(tl)]y(t)+[Q(mh)-D(βth)-Q(ml)+D(tl)]}x(t)(1-x(t)),
下文从演化路径的角度来分析均衡点在导学关系相互作用下的稳定性。
四、导学关系均衡的演化路径分析
为分析导师和研究生相互作用下导学关系策略选择的变化,分别对研究生和导师群体的均衡演化路径进行分析,然后综合分析其相互作用下的均衡演化相位图。
(一)导学关系中导师群体的均衡演化路径分析
再看均衡点y*,因为:0≤y*≤1,根据不等式性质可知:y*与“放养”式管理的导师指导功利化就读研究生的收益Q(ml)-D(tl)、“放养”式管理的导师指导专注学术研究生的收益Q(λml)-D(αtl)成正比,与严格管理的导师指导功利化就读研究生的收益Q(mh)-D(βth)、严格管理的导师分别指导功利化就读研究生和专注学术研究生的投入之差D(βth)-D(th)成反比。
因为0≤x(t)≤1,不难看出,dx/dt的符号只由y(t)决定。当y(t)>y*时,dx/dt>0,导师群体为追求利益最大化,选择严格管理的导师群体比例会增加;当y(t) 再看均衡点x*,因为:0≤x*≤1,根据不等式性质可知:x*与在“放养”式管理导师指导下功利化就读的研究生收益P(ml)-C(sl)、在“放养”式管理导师指导下专注学术的研究生投入C(sh)成正比,与在严格管理导师指导下功利化就读的研究生投入C(λsl)、在“放养”式管理导师指导下专注学术的研究生收入P(λml)成反比。 因为0≤y(t)≤1,dy/dt的符号只由x(t)决定。当x(t)>x*时,dy/dt>0,研究生群体为追求利益最大化,选择专注学术研究的研究生群体比例会增加;当x(t) 根据上述分析,以非平凡均衡点为界,将导学关系中导师与研究生的博弈演化过程分为4个不同的动态演化区域,其演化路径如图1所示。 图1 导学关系演化路径相位图 区域Ⅲ中的任意一点,由于专注学术研究的研究生比例和严格管理的导师比例均超过了均衡点(x*,y*),因此有dx/dt>0,dy/dt>0,即x,y均单调上升,导学关系系统将朝(1,1)点良性均衡演化,即使施加一些来自导师或者研究生方面的微小扰动,依然会演化至(1,1)点。 同理,区域Ⅰ中的任意一点,由于专注学术研究的研究生比例和严格管理的导师比例均低于均衡点,导学关系系统将超(0,0)点恶性均衡演化,即使施加一些来自导师或者研究生方面的微小扰动,依然会演化至(0,0)点。 在区域Ⅱ和Ⅳ之中,由于专注学术研究的研究生比例或严格管理的导师比例低于均衡点,所以即便另一方积极努力,导学关系依然保持一方增长,另一方缩减,最终演化到点(x*,y*),但微小的扰动都会使系统进入区域Ⅰ或区域Ⅲ,因此导学关系的演化趋势不确定,该状态是不稳定的。 综上,(x*,y*)越靠近原点,良性动态演化区域Ⅲ越大。为了让导学关系系统向(1,1)点良性均衡演化,学校可以增加对高出最低毕业要求学术成果的奖励力度以提高P(λmr);提高研究生毕业最低学术要求以提高C(sl);支持导师对研究生进行严格管理,包括适度提高毕业要求的学术成果ms及研究生成本系数γ,当然,在支持的同时要对导师加以监督和制约,防治导师滥用权力。 为促进导学关系良性发展,基于研究生导学关系演化博弈模型分析,可以采取以下措施: (1)以引导研究生增加科研投入为导向,优化研究生奖助体系。研究生奖助体系是研究生教育质量长效保障机制和内在激励机制的重要组成部分。当前大部分高校的研究生奖助体系由国家奖学金、国家助学金、学业奖学金、社会奖学金、“三助”津贴、国家助学贷款、导师发放的科研津贴等构成[9],主要发挥普惠性保障及差异性奖励作用。而其中发挥差异性奖励作用的国家奖学金覆盖面较小,难以对更多的研究生形成激励作用,学业奖学金普遍金额差异不大,导师发放的科研津贴一般平均发放,不能体现研究生个体差异。可见,现行的奖助体系未能很好体现差异性奖励作用。另一方面,从评价机制上看,现行的大多数奖学金都以成果奖励为主,而轻视了研究生科研投入的过程,对科研成果也存在重数量而轻质量的问题,导致研究生更注重浅层次“短平快”的学术研究,而对深层次、长周期的研究不足。因此,优化研究生奖助体系应该从突出奖励差异性和注重研究生的科研投入两方面着手,从而激励研究生更多投入学术研究,提高科研水平,进而促进良性演化。 (2)以提升研究生科研产出为导向,建立导师激励机制。导师是影响研究生培养质量的关键,导师制在国内外经过长期充分的发展,形成了全面、科学、多元化的发展性导师评价考核体系。导师考核的内容一般包括导师的科研水平、教学能力、实践经验、导师与学生的关系、导师的人品等方面[10]。除评价考核体系外,应建立考虑研究生科研产出的导师激励机制,要在导师激励机制中将指导的研究生研究业绩情况具体化,突出导师指导研究生的过程和实效,探索将研究生的科研产出与导师的招生指标相挂钩。强化导师对研究生的的责任意识,最大限度地激发导师的工作热情,激励导师不断提高指导研究生的水平和能力,提高研究生培养质量,从而促进良性演化。 (3)以降低导学矛盾冲突为导向,完善研究生管理制度。有研究表明,硕士研究生科研投入时间和导学关系具有极其显著的相关性,随着科研投入时间的增加,导学关系融洽度逐渐降低[11]。而研究生增加科研投入时间的原因之一是导师的严格管理,这也造成了高校导师与研究生的导学矛盾现象时有发生。为降低导学矛盾冲突,兼顾研究生科研水平能力提升,应优化研究生管理制度,将对研究生进行严格管理由导师行为转变为学校行为。具体来说,应由学校、院系建立科学规范的研究生管理制度,对不同学科门类、不同年级研究生制定相应学习时间、学业成果等具体要求。在一定程度上降低由导师给与研究生的管理压力,转变以往导师对研究生被动提要求的角色,突出导师指导和帮助研究生完成学业任务、提升科研业绩,进而理顺导师和学生关系,降低因导学矛盾带来的导师管理的无效投入,提升导师管理和指导研究生的效果。(二)导学关系中研究生群体的均衡演化路径分析
(三)导学关系中师生均衡演化路径与稳定性分析
五、对策建议