普通高等学校本科教育教学审核评估:困境、原因及解困*
——政治锦标赛理论的视角
2024-01-09孙占利
孙占利
(1. 厦门大学 教育研究院,福建 厦门 361005;2. 河南工业大学 新闻与传播学院,河南 郑州 450001)
一、问题的提出
2021 年,教育部印发了《普通高等学校本科教育教学审核评估实施方案(2021—2025 年)》(以下简称《方案》),标志着新一轮评估开启。始于1985 年的高等教育体制改革,从制度设计的主观上看希望实现“以评促建、以评促改、以评促管、以评促强”的目的。但是事与愿违,无论是2003 年至2008 年开展的首轮教学水平评估,还是经过修订2013 年至2018 年评估方案后开展的普通高校教学工作审核评估,尽管评估方法不同,评估指标有异,不可否认都对高校教学工作产生了巨大的积极影响,但是仍然存在一些问题。
为了探索本科教育教学审核评估中存在的问题,分析原因,改进方法,越来越多的学者运用公共政策、社会学、统计学等多学科的理论来分析、阐释。周湘林运用公共政策上的模糊综合评价法对评估进行分析,得出了本科教学评估制度基本上被认可,但也亟待改革,不断增强其有效性的结论[1]。刘爱生基于“一致性陷阱”理论,解读了我国大学参与评估过程中总结出的特色趋同现象,指出大学的特色需要在与周围环境互动中发展特色[2]。师玉生和林荣日运用豪利特与拉米什的自愿性、强制性和混合型政策工具三分框架对评估进行分析,认为评估作为一种政策工具,强制性突出,自愿性不足,评估要重视发挥政策的互补性[3]。周群英和刘晓雪利用美国政策学者保罗A.萨巴蒂尔(Paul A.Sabatier)提出的支持联盟框架,揭示不同评估政策参与者在决策过程中发挥作用的机理,认为完善评估组织是优化评估的重要路径[4]。朱泓和秦涛运用社会学家汤姆R.伯恩斯(Tom R. Burns)提出的ASD 理论(Actor-System-Dynamics,行动者—系统—动力学)对评估进行了分析,认为评估面临的行动者参与互动不足、制度短缺、环境约束等困境,要通过激发行动者的能动性,完善整改制度,营造环境支持氛围,才能更好地发挥评估的作用[5]。柳友荣和张蕊从历史制度主要的视角进行了分析,认为要重视高校主体地位,引导高校正视评估,要依法评估[6]。陈栋运用评估制度分析的复杂振动模型,通过分析认为本科教学评估存在的问题是,理念上政策驱动评估的效果有限、方式和内容有待完善、政府部门主导利弊参半等,要以“评学”为抓手,提升评估效果[7]。这些研究对总结评估的成效、梳理问题、分析原因,探索提升评估效果的路径有一定的意义,但是都是用国外的理论解释中国的问题,有一定的局限性。
高等教育良性发展是内外关系共同作用的结果,既有其特殊的发展规律,又受到社会环境的影响。2022 年全国教育工作会议特别强调,“必须跳出教育看教育、立足全局看教育、放眼长远看教育,准确识变、主动求变、积极应变”[8]。周黎安认为,制度是内生的,没有所谓全世界最好的制度。有人觉得中国会走到那个彼岸,但其实彼岸就是此岸。彼岸可能根本就不存在,是人造出来的虚幻概念,我们还不如在此岸寻找安身之处。中国治理体系本质上由中央政府承担无限责任,不可能和以有限责任为特征的韦伯式现代官僚制相匹配[9]。事实上,各国的制度都是内生的,以本土化的理论解释政策可能更能揭示本质。周黎安于2007 年系统阐释了中国官员晋升的治理制度——政治锦标赛制后,该理论得到了社会的广泛认可。他的论文《中国地方官员的政治锦标赛模式研究》于2007 年发表,截至2023 年4月30 日,在CNKI 被下载12 万多次,引用9 千多次。近年来,政治锦标赛理论应用已经超越了社会经济学的领域,广泛用于解释我国社会学、政治学领域的现象。因此,用政治锦标赛理论解释审核评估也有一定的适切性。
二、政治锦标赛理论及适用性分析
作为一种行政治理模式的政治锦标赛制是指,“上级政府对多个下级政府部门的行政长官设计的一种晋升竞赛,竞赛优胜者将获得晋升,而竞赛标准由上级政府决定,它可以是GDP 增长率,也可以是其它可度量的指标”[10]。该制度的实施需要满足5 个前提条件,一是上级对人事任免权集中管理,二是设置可衡量的客观竞赛指标,三是竞赛成绩可进行比较,四是参赛官员可以通过自身的努力控制和影响最终结果,五是参与人不易形成合谋。政治锦标赛制激发了各级官员的服务意识和创新意识,政府从潜在的“掠夺之手”提升为“帮助之手”,推动了我国经济社会进步。同时,也有一些局限性,如过分强调量化指标导致数据造假,上级部门自由裁量权使用不当演变成“合法性伤害权”,为了在夺取锦标赛中获胜发生“层层加码”现象[11]。
政治锦标赛理论可以解释高等教育领域的一些现象。公办高校是国家事业单位,高校的干部按照党和国家的干部有关规定执行,各级党组织参与决定高校的人事任免,与党和政府的干部具有类似的任免程序,相互间具有畅通的交流机制。在管理过程中有可衡量的竞赛指标,宏观的如“985 工程”“211 工程”;综合的如本科教学水平评估、本科教育教学审核评估;单项的如“双万计划”、教育的国家级产业学院等等。不同的高校在不同的领域取得的各种称号均可赋值比较。不同的高校通过对国家政策的研判,调整自身政策可以获得各种称号。政府部门设置的各种作为锦标的荣誉称号是有限的,不同的高校之间在同一类锦标的争夺中是零和博弈,不同的高校很难形成合谋。普通高等学校本科教育教学审核从教育管理领域来看是一个高等教育质量监控的制度设计,从晋升竞标赛制的视角来看,是教育主管部门对高校设置的一个“锦标”。政治锦标赛的一些负面影响在评估中也有体现,如2003 年至2008 年开展的本科教学水平评估,该轮评估参加院校589 所,423 所获得“优秀”等次,占比72%,优秀率呈现逐步提高趋势[12]。评估在推进我国高等教育基础设施提升、本科地位巩固等方面起到了积极作用。但是,从评估过程和结果来看,政治锦标赛的局限性也非常突出。评估过程中对生师比、教师拥有硕博士学位占教师的比例等可量化的指标过度重视;评估过程中获得优秀单位的比例逐年提高,体现了评估者自由裁量权的异化,对2004 年获得非优秀等次参评单位造成“合法性伤害”。如果不加调整,评估作为“锦标”的负面作用得不到有效遏制,作为教育质量监控的手段的效果将大打折扣。
三、作为“锦标”的评估:困境及原因
《方案》指出,审核评估分为两大类,第一类明确参评对象为世界一流大学建设高校,第二类根据办学定位和办学历史分3 种情况。第一类指标体系,一级指标3 个分别是党的领导、质量保障能力和教育教学水平。由于文件对第一类参评高校界定相对清晰,参加夺取“锦标”的高校范围小,有独立的规则,“政治锦标赛”的局限性可能表现不太突出。第二类参加的高校多,情况差异大,“政治锦标赛”的局限性就相对突出。第二类指标体系一级指标有7 个,分别是:办学方向与本科地位、培养过程、教学资源与利用、教师队伍、学生发展、质量保障和教学成效。如果按照指标之间的相关性进行归纳可以从3 个方面进行分析,一是办学定位,在大学发展中处于基础地位,决定了学校的发展方向和资源配置等方方面面;二是本科的地位,本科教育教学在学校的地位影响了培养过程、教师队伍的投入等方面;三是人才培养中心定位,可以体现学生发展、质量保障和教学效果。因此,本文从这三方面对普通高等学校参与本科教育教学审核评估中存在的问题和原因进行分析。
(一)高层次“锦标”的高回报:拔高办学定位
政治锦标赛理论视阈下,参与不同层次的锦标赛,意味着官员获得不同的晋升机会,组织获得不同的资源和发展机遇。换言之,参与锦标赛的层次决定了预期成功的高度,每个有进取心的官员都自觉和不自觉主动参与层次高、难度大的锦标赛。在高等教育领域,处于高层次的大学往往意味着,学校的管理层可以得到较多的升迁机会,大学能够获取更多的办学资源、更好的声誉、招录更优质的生源、得到更好的发展。我国的公办高校是国家事业单位,参照党政管理部门的行政级别可以分为副部级、正厅级、副厅级、处级等。普通高校更名、“升格”,依据是办学规模、学科数量、师资队伍状况、各种评估的结论等,结果是人才培养层次的提高,同时,也可能伴生管理人员的级别提升。如一个职业技术学校是副厅级单位,如果升格为本科学院就意味着成为正厅级单位,相应的学校的大部分管理者级别将得到提升。2004 年启动的本科教学水平评估把参与的普通高校分为6 类,提高办学定位是普遍现象。
然而,部分普通高校可能拔高自己的办学定位。本轮审核评估最重要的特征是分类,正是分类为学校拔高定位提供了机遇。《方案》指出,第一类审核评估针对具有世界一流办学目标、一流师资队伍和育人平台,培养一流拔尖创新人才,服务国家重大战略需求的普通本科高校。第二类审核评估针对高校的办学定位和办学历史不同,具体分为三种:一是适用于已参加过上轮审核评估,重点以学术型人才培养为主要方向的普通本科高校;二是适用于已参加过上轮审核评估,重点以应用型人才培养为主要方向的普通本科高校;三是适用于已通过合格评估5 年以上,首次参加审核评估、本科办学历史较短的地方应用型普通本科高校。从政治锦标赛的视角看,是设置了4 个锦标赛。参与不同锦标赛的前提是设定符合《方案》要求的人才培养定位,而人才培养定位是学校办学定位的核心内容。为了能够参与更高层次的评估,参与评估的普通高校都要对办学定位进行再界定。第一类和第二类的第三种情况参加评估的高校目标非常明确,第二类中的第一种和第二种情况为参与高校提供了拔高的空间。即使是第一类情况,也会给部分高校提供腾挪的空间,一个“双一流”建设学科的高校,是定位于第一类还是第二类的第一种情况?部分大学实际应该是第二类的第一种情况,但具体选择时确定为第一类。第二类情况就更加复杂,以河南为例,2020 年,根据《河南省特色骨干大学和特色骨干学科建设方案》精神,确定9 所大学为特色骨干大学。2021 年,中共河南省委、河南省人民政府出台《关于加快构建一流创新生态建设国家创新高地的意见》,从9 所大学中确定7 所大学为“双一流”创建大学。9 所大学发展状况有较大的差距,有的长期在国内各种大学排行榜中居100 名左右,以理工为特色,农学、医学、管理学协调发展,是学科门类齐全的综合性大学,有的是长期处于各类大学排行榜中300 名以外,以经济学、管理学、法学为主干的多科性大学。从实践看,有的应选第二类第一种情况,有的应选第二类第二种情况比较合适,但事实上都选择了第二类第一种情况。如果哪所大学选择了第二类第二种情况,也就是从起点就失去了和其他特色骨干大学竞争的机会。
(二)拥有高层次“锦标”高校发展路径的示范作用:部分高校本科地位不太稳固
政治锦标赛作为一种强激励制度,在推进经济社会快速发展的同时,也有一些负面影响,如行政竞争的零和博弈导致区域间的恶性竞争;各地区更多地关心数字可测的经济效益忽视长远效益[10]。高等教育发展过程中,政治锦标赛制零和博弈和强调数字可测量性的特征也非常明显。以河南为例,河南在确定9 所特色骨干大学后,又从中遴选7 所大学为“双一流”创建高校。并且在“十四五”安排55 亿元创建资金支持这7 所高校的发展[13]。没有被列入“双一流”创建的两所高校,失去专项资金的资助,在“十四五”期间面临的困难可能更多。河南“双一流”创建高校的遴选标准与国家确定“双一流”建设高校相似,都是以学科为标准,有“双一流”创建学科的高校就是“双一流”创建高校。学科评选有较多的指标,但区分度较大的仍然是可测量的发表论文的层次和数量,科研项目的层次和经费。入选“211工程”“985 工程”“双一流”建设的高校绝大部分是研究型大学,入选的基础更多依靠的是雄厚的科研实力、卓越的社会服务能力,研究生教育是在这些方面取得优势的基础。
模仿是对不确定性“标准化”的反应,组织的发展最简单的方法、风险最小的路径选择,是对心目中成功组织发展路径的照搬[14]。在我国高等教育发展过程中,“双一流”建设大学由于在包括教育教学审核评估的各种“锦标赛”中不断取胜,得到国家重点支持,获取了丰富的发展资源,他们成为大部分高校的榜样。于是,在我国的高等教育体系中,大部分高校的榜样不是清华大学和北京大学,就是以清华大学和北京大学为榜样的大学。职业技术院校以综合性大学和多科性大学为榜样。这就是高度模仿的结果。虽然在《方案》中明确提出要落实“以本为本”,但是大部分高校的榜样并非是“以本为本”发展,导致部分高校的本科地位不太稳固。
(三)为夺取“锦标”而评估:人才培养中心地位没有全面落实
政治锦标赛制度负面作用产生的原因,在于个别官员参与锦标赛的动机异化。官员把本地经济社会的发展,特别是以一些可量化指标的提升作为夺取“锦标”的手段,而不是工作的目的。这就导致竞争者处于零和博弈状态,个别官员为了在竞争中取胜忽视本地经济发展质量实行地方保护主义,为了出政绩出现重复建设现象[15]。部分官员不按照规律和国家的政策办事层层加码,导致国家一些政策的异化。事实上,无论是2004年至2008 年开展的本科教学水平评估,还是在2013年至2018年开展的普通高校教学工作审核评估,受到公众非议最重要的原因在于,评估的组织者在开展该项工作过程中自觉或不自觉地过分强化了其作为“锦标”的价值,参评者把在评估中取得优异成绩当成夺取锦标赛胜利的意义,大于提升育人质量的意义。
确保人才培养的中心地位贯穿于《方案》的始终。指导思想中提到要确保人才培养中心地位;基本原则5 条,除第五条关于评估方法外,其他4条每一条都在不同的角度强调人才中心地位。明确要求,审核评估要“坚持立德树人”,引导高校构建“三全育人”格局,要强化学生中心地位。由于人才培养的不易测量的特征,体现人才培养质量的教学效果“达成度”“适应度”“保障度”“有效度”“满意度”等大部分需要学校委托第三方调研后得出结论,第三方处于各种考量和难检测的事实,因此各高校往往差距不大。真正能够形成差距的仍然是评估者可直接抓取的与科研有关的数据,如在综合素质指标中选第二类第一种情况设有可选项,“本科生以第一作者/通讯作者在公开发行期刊发表的论文数和本科生获批国家发明专利数”。不可否认,科研在育人方面发挥着重要作用,但是对于应用型大学来说,提升教学质量仍是确保人才培养核心地位的重要途径。事实上,参评高校在拔高办学定位,本科教学地位不稳的前提下,人才培养中心地位得不到落实是必然结果。
四、回归教育质量监控的本质:审核评估的解困路径
政治锦标赛制作为我国一种特有的模式,虽然有一定的负面作用,但在我国创造经济发展奇迹中发挥了重要作用[10]。本科教育教学审核性评估作为国家高等教育方面的一种政策,从实践上看,仍然是积极意义大于消极意义。如受到社会诟病比较多的本科教学水平评估,据对2007 年198 所参评高校的统计,水平评估给高校生均四项教学经费带来超过 27%的增长率,而生均教学仪器设备值更是带来33%的增长额[16]。为了最大限度消除负面影响,发挥积极作用,提升教育教学审核评估效果,应当从以下几个方面着手解困:
(一)对高等教育科学分类:引导普通高校准确定位
分层、分区域是政治锦标赛制度的基本特点,不同等级、不同区域的参赛者参加不同的锦标赛。在这种情况下,参赛者的定位一般都比较切合实践。但我国普通高校本科教育教学审核性评估是全国一盘棋,给不同区域、办学层次不同的大学提供了一个统一的赛场。在这种形势下,所有的大学都把大力开展科学研究,获取丰富的办学资源,得到快速发展作为理想发展路径。从目前可以查到的普通高校“十四五”发展规划来看,获得国家级科学技术奖项是大部分高校的核心指标之一,无论以前获得过还是没有获得过,都要确保获得。事实上,占我国普通高校大部分的地方院校主要职能是培养应用型人才,服务地方经济社会发展,很难取得国家级科学技术奖励。但是,他们必须设定这样的目标,因为这是拔高学校办学定位的标配。
分类管理是遵循高等教育发展规划和办学规律的基本要求,逐步形成不同质量观指导下的立体化高等学校体系,是建设高质量高等教育体系的必由之路。通过建立科学的分类体系“引导不同类型的院校在各自的轨道中落实人才培养的特殊性、科学研究的针对性、服务社会的适切性、院校管理的规范性,只有这样,才能在不同类型高校的发展侧重点上有重大突破和成就。”[17]高校的分类政策要更加具有可操作性和协调性,帮助高校准确定位。《方案》把普通本科高校分为两类,第二类分3 种情况,实质上是分为4 类。2017 年下发的《教育部关于“十三五”时期高校设置工作的意见》中,把高校分为研究型、应用型和职业技能型三类,也就是把本科高校分为研究型和应用型两类。如果把评估中的第一类对应研究型大学,那么第二类第一种情况又是培养学术型人才。不同部门对高校的分类不一致,导致分类缺失了操作性,高校在自我定位时必然是采取选择性的忽视对自己不利的类别,努力夺取高层次的“锦标”。提升省级政府在高校分类中的能动性。“中国改革开放以来最重要的行政体制改革是中央行政和经济管理权力的下放和地方自主权的增强。中央向地方放权使地方政府从过去集中计划的体制束缚中解放出来,凭借其信息优势做出因地制宜的决策。”[10]高校管理体制改革后,不少省级政府积极探索省内高校的分类体系,以便更好地配置本省资源,引导本省高校服务经济社会的发展。但是,由于以评估为代表的国家分类政策处于强势地位,导致省内的分类政策处于非常尴尬的地位。因此,要顺应政治经济体制改革的趋势,提升地方政府在高校分类中作用。
(二)保持评估政策的稳定性:引导大部分普通高校坚持“以本为本”
稳定的政策环境是政治锦标赛制度发挥正向激励的重要保障。影响政治锦标赛正向激励作用的因素有很多,考核标准的模糊和主观性的判断,上级部门的晋升承诺随意改变,考核指标与参赛人关联性不强等是最主要的因素[11]。这些因素共同的特征是,都源自政策的不稳定性。如果政策稳定,参赛者能够通过努力得到上级事前承诺的晋升,正向激励就强,反之,政策不稳定正向激励就弱,跑官要官等破坏制度的事件就可能频发。从普通高校本科教育教学审核性评估的发展历程来看,作为教育质量监控的政策其稳定性较弱。1994 年初,国家教委开始对普通高等学校的本科教学工作水平评估,相继经历了三种形式:合格评估、优秀评估和随机性水平评估。2002 年,教育部将三种方案合并为一个方案,即《普通高等学校本科教学工作水平评估方案》,评估结论分为优秀、良好、合格和不合格四种。2012 年初,教育部下发《普通高等学校本科教学工作合格评估实施办法》,启动不分类别的审核评估。2021年《方案》公布,其最大的特点是分类。近30年来,评估不到10 年就有一次较大的变化。虽然每一次政策调整,在解读时都宣称,评估不是另起炉灶,是在总结上一次评估经验教训的基础上,根据高等教育改革发展的新使命,集众智编制完成的[18]。事实上,每一次评估的变化,对高校来说都是痛苦的抉择。《方案》发布后,有些普通高等学校为了参加第二类第一种情况的评估,把人才培养定位从培养应用型人才调整为培养学术型人才。正是由于政策的不稳定性,导致大部分高校采取了最“稳妥”的发展路径,模仿拥有高层次“锦标”的高校发展。
保持评估政策的稳定性是引导大部分普通高等学校坚持“以本为本”的重要保障。教育内外部关系规律是研究高等教育学的基本规律,对评估这一政策也同样适用。要保持高等教育政策的相对稳定。通过科学的分类,可以为大部分高等学校设置赛道,但是如果外部政策不稳定,不少学校会寻找政策漏洞,或者采取选择性忽视的方针,继续沿着拥有高层次“锦标”高校的路径发展,努力逃离国家设定的赛道,参加高层次“锦标赛”。事实上,国家政策的稳定性逐步增强。以国家建设世界一流大学为例,1998 年5 月,提出“985 工程”,首批建设高校只有9 所,但是国家出于各种研判,最终达到了39 所。而启动于2016 年的“双一流”建设,经过5 年的建设,各省都制定创建计划,投入巨额经费,希望区域内的大学入围第二轮“双一流”建设。但是,国家第二轮“双一流”建设高校与第一轮相比,没有出现“985 工程”扩容过大的现象。“双一流”建设政策的稳定,必然对各省“双一流”创建政策产生较大影响,从而引导各省从教育规律出发,科学规划本省高校的发展路径,引导大部分高校回归“以本为本”,开展应用型人才培养。评估的指标体系保持相对的稳定性。评估体系的稳定表现在指标设置的稳定性。进入21 世纪,我国的大学本科教育教学评估发生3 次变化,每一次的指标体系都有较大的差异。2004 年公布的《普通高等学校本科教学工作水平评估方案(试行)》,有详细的评估指标和等级标准;2013 年公布的《普通高等学校本科教学工作审核评估方案》,评估范围就比较宽泛;2021 年公布的《方案》,又有比较详细的指标体系。评估必然有指标体系,但是要有一个相对稳定的体系。
(三)理性认识评估:普通高校必须巩固人才培养中心地位
政治锦标赛之所以能够推动我国经济社会的发展,很重要的原因在于激发了地方官员围绕辖区经济发展的官场竞争嵌入市场竞争之中。以地方官员为代表的区域对竞争的认识,决定了区域发展的质量。进入新时代,党中央对地方的考核更加重视发展质量。2015 年10 月29 日,习近平在党的十八届五中全会第二次全体会议上,提出了创新、协调、绿色、开放、共享的发展理念。实质就是引导各级官员树立正确的政绩观,立足大局,着眼长远推动本地区的发展。教育教学审核评估是否能够实现《方案》中提出的“全面落实立德树人根本任务,坚决破除‘五唯’顽瘴痼疾,扭转不科学评价导向,确保人才培养中心地位和本科教育教学核心地位”的目的,参评高校的认识起到了基础性作用。高校内部的质量评价是对待教育教学审核评估的集中体现。“校内评价是为了应对外部评价、认证和排名而开展的,常常是简单机械照搬外部评价、认证和排名的标准及办法。因此,高校内部自我评价的自主性、独立性、专业性、独特性和质量只是差强人意。许多高校内部自我评价的积极性、主动性不高,没有将自我评价看作是自我完善、自我提升的机会,而是被看成为负担”[12]。
人才培养是普通高等学校的基本职能。高等教育职能中,人才培养是基本职能,科学研究和社会服务是衍生职能[19]。但是,由于科研和社会服务的可测量特征,使其在作为“锦标”的评估作用更加突出。要想巩固人才培养的中心地位,就需要高校全面贯彻新发展理念,尊重教育发展的基本规律,理性认识评估。要把参加评估当成提升育人能力的途径。其实,上一轮审核评估已经有了较好的趋势,“有专家认为,参加审核评估最大感受就是高校的平常心和开放态度,不回避矛盾、不隐瞒问题,学校愿意就教学工作中遇到的问题、困难和困惑对专家敞开心扉、平等交流,期待从专家那里受到启发,找到解决问题的办法”[20]。高校不能把评估作为“锦标”去争夺,而是作为提升人才培养质量的路径积极主动参与,要基于学生发展为中心建立内部的评价体系。高校立德树人的成效主要通过学生的发展来检验,促进学生发展是本科教育教学的根本之道[21]。以学生发展为中心建立评价体系,就是要把学校一切教育教学及其质量保障措施放在学生学习上。
本科教育教学审核评估作为一种高等教育政策,既受到教育内部因素的影响,也受到经济社会等外部环境影响,特别是我国高等教育的发展路径是典型的政策驱动型,受到政治方面的影响更大。从政治锦标赛的视角去分析其可能存在的问题和原因,提出解困路径,可以引导高等教育发展的各利益相关者客观地看待、不断优化这一政策,使其发挥更大的作用。