问责抑或改进：中国高等教育评估实践的背离与融合

2016-03-20

大学 2016年9期

1985年颁布的《中共中央关于教育改革的决定》中首次对我国高等教育评估工作进行了明确指示：“国家及其教育管理部门要加强对高等教育的宏观指导和管理 ,教育管理部门还要组织教育界、知识界和用人部门定期对高等学校的办学水平进行评估。”历时30年，中国高等教育评估工作经历了起步、试点、正规化阶段，[1]并于2011年建立了新时期高等教育评估制度的整体顶层设计：“建立学校自我评估、院校评估、专业认证及评估、国际评估和教学基本状态数据常态监测为主要内容，政府、学校、专门机构和社会多元评价相结合，与中国特色现代高等教育体系相适应的教学评估制度”（以下简称“五位一体”评估制度）。从我国高等教育评估制度的历史发展来看，我国的高等教育评估活动具有鲜明的行政性色彩，而新时期的“五位一体”的评估制度也在着重强调“从政府管理到公共治理”的重要意义。[2]

多元利益主体参与、以学生为中心、基于证据等评估理念逐渐应用到评估实践中，但与此同时，各个高校在进行评估活动的同时，也面临着两难的抉择：一方面评估活动是一种政府的问责行为，高校理应将自己在某一段时间内的办学成绩最大限度的展示给评估专家，以期获得肯定与避免惩罚；另一方面评估活动又是一种高校发现问题、改进现状的院校自我发展行为，对问题展现越到位、对问题剖析越彻底，越能体现出评估的真正意义所在。美国高等教育评估专家尤恩（Ewell）曾指出，当高等院校面对这种两难的抉择的时候，他们往往选择“问责的评估”。[3]如何解决评估活动中所存在的这两个相互矛盾的现实问题，是关系到我国高等教育评估活动能否真正实现提升教育质量、走“内涵式”发展的高等教育强国之路的关键。

一、问责评估与改进评估之争

随着高等教育由“精英”逐渐走向“大众”，世界各国的高等教育质量保障体系以不同形态、不同方式存在着，主要有三种模式：以政府主导的法国评估模式；以同行评议为主的英国审核模式；以民间为主的美国认证模式。从各国建立质量保障体系的过程可以看出一个普遍规律：随着高等教育大众化进程的加快，高校为了应对来自政府、社会、学生、家长等各方面对教育质量下滑的质疑，都在试图通过各种方式来证明自己所取得的成绩，并且所采取的方式呈现出多样化趋势。评估是世界高等教育质量保障的重要手段。对此，袁贵仁部长在部长专题会上强调：“ 评估非常非常重要，特别特别重要，是天大的事。它对任何国家来说都是重要工作，是政府监控办学的主要手段，在我国现阶段是贯彻《教育规划纲要》、提高质量最主要的抓手”。[4]

美国20世纪80年代中期兴起的“评估运动”（Assessment Movement）对“评估”一词的理解与实践活动起到了促进作用。尤恩将评估分为两种范式，一种源于基于院校研究的范式，称为改进范式；另一种源于早期国家管理的范式，称为问责范式。[5]表1-1描述了两种评估范式的区别。改进评估与问责评估从出发点到评估方式等各个方面都不尽相同，他们试图从不同角度对高等教育质量进行阐释。

表1-1 改进评估与问责评估范式比较

二、问责评估与改进评估之源

(一)问责评估源于外部质量保障

19世纪70年代，西方高等教育逐渐出现了对教育进行问责的呼声，但问责被大众普遍关注还是从19世纪末开始。从对高等教育进行问责产生的原因来看，一方面是受高等教育大众化的影响，高等教育大众化使更多的民众可以接触到高等教育，高等教育不再是少部分“精英阶层”的专利品，高等教育逐渐进入到普通大众的视野之中；另一方面，高等教育的质量越来越关系到国家和个人的发展，这一点已经被世界各个国家达成共识，对高等教育进行问责是巩固和加强知识经济社会的必要举措。[6]

“问责”一词在近十年的高等教育发展中是最常被提及而又是最难以被界定的词语，每个人在使用这个词语的时候都从自身的角度出发，从而使问责的含义错综复杂。[7]西方学者马丁•特罗认为“问责即向他人汇报、解释、证明及回答资源是如何使用的，并对实施效果加以说明。”[8]韦斯博特（Webster）将问责定义为“一种承担责任的义务与意愿，或是对自己的行为进行解释说明。”德勒（Schedler）认为“可答复性（Answerability）”与问责表达了相似的含义。[9]布尔克（Burke)阐述了问责对美国政府、公众以及院校的六个方面的含义，其中包括“向外界解释说明权力使用的正确性；展示他们所取得的成绩是适合于组织机构发展的；报告绩效情况；对资源的使用与获取的成绩进行效能与效率的评估；说明对课程与服务质量的保障情况；展示如何满足公众需求。[10]因此，对高等教育进行问责包括高校管理的方方面面，不仅涉及到学校与政府权力的划定、学校财务收支状况，而且最重要的是涉及到高校人才培养的教育质量问题。

教育质量的问责评估是指院校机构向教育管理部门（政府或中介机构）及公众，通过展示、说明在人才培养方面所做的工作以及所取得的成绩，以期获得外部认可的过程。其呈现出以下鲜明特点：从实施目的来看，问责评估是对政策制定者与公众解释说明资金使用的有效性，以期获得更多的资金支持；从证明角度来看，问责评估材料的收集通常来自教育活动以外，有特定的“观测点”；从主要理念来看，问责评估要使院校机构合乎一定规范、标准。以上战略目标所具有的特点决定了问责评估所实施的手段的独特性：由于问责评估的主要战略理念是合规，因此所收集的证据更加倾向于标准化测试，收集证据所采用的方法大多是定量方法。由于定量方法的使用以及标准化测试数据的收集，使观测点可以对院校、课程进行比较。评估结果主要用于外部利益者通过对评估报告的对比，对投资有效性做出判断。[11]问责评估适应了高等教育大众化过程中公众对建立一个更加公开、透明的高等教育的要求，让高等教育更加真实、贴切的展现在每一个利益相关者面前，同时也加速了高等教育大众化的步伐。

(二)改进评估源于内部质量改进

评估长久以来就是教学活动的一部分，教师通过课堂将知识、技能传授给学生，教师为了解学生掌握所学知识的情况便通过各种途径对学生的学习进行评估，在此基础上制定出更加完善的课程目标与授课过程，从而实现改进的目标。在高等教育精英化阶段，改进评估是高等院校机构与管理人员与授课教师的自觉行为：1825年，哥伦比亚大学校长伯纳德（Barnard）编撰的手册载明了关于课程与教学改革研究以及十所“选择性大学”招生工作研究方案；1823年哈佛大学教授提克诺（Ticknor）通过对德国大学的研究而在哈佛大学提出的课程与教学改革方案；以及1828年耶鲁大学发表著名的《耶鲁报告》等都属此类。这段时期美国的许多学校，如康奈尔大学、密西根大学、麻省理工学院等，也都进行了大量的课程与教学改革。[12]20世纪初（1908—1943年）在美国发起的“院校调查运动”促成了院校研究的组织化、制度化，改进评估作为高校质量保障的重要手段也成为院校研究内容的重要组成；此外，一些高校在院校内部成立了“评估中心”以实现教学的改进，例如芝加哥大学的考试办公室（Examiner's Of fi ce at the University of Chicago）和明尼苏达大学的通识学院（General College at the University of Minnesota）。[13]

教育质量的改进评估多是由高等院校自身发起的，为了从总体或局部上了解教育教学质量，以期对现有的教育水平做出合理的判断，并在此基础上改进不足、优化教学方案。因此，改进评估在很多特征方面不同于问责评估：从实施目的来看，改进评估旨在于通过评估结果对教学进行改进；从证明角度来看，改进评估的资料均来自教学参与者（教师和学生）在直接的教学过程中的积累；从主要理念来看，改进评估旨在提倡参与和持续改进的理念，并寻求建立具有说服力的证据文化。战略目标的不同也决定了改进评估具有与问责评估不一样的实施方式：收集材料的方法更加灵活，既包括标准化材料也包括非标准化材料，教师可以通过课堂作业、测试、展示等方式进行收集；教师既可以通过定量的方式收集材料，也可以通过质性的研究方法对学生在学习过程中进行观测；观测点也可以用于不同学生群体或院校之间的比较，并且可以随着材料的积累对院校、课程目标进行重新定位；评估结果通常以内部渠道与媒介进行交流，旨在通过评估结果建立多重的反馈循环，从而改进教学内容与教学过程。[14]改进评估是一种指向院校内部质量提升的评估范式，其基本出发点在于将高等院校人才培养质量作为评估的主要内容，其更关注学生在教学过程中知识、能力的提升。

三、期待走向融合的两种评估范式

无论是从战略目标还是应用方法来看，问责评估与改进评估具有不同的特征，其通过不同侧面对高等院校质量进行评估、监控，在高等教育质量保障过程中起到不可替代的作用。通过问责评估，政府、公众对高校的教育水平、教育质量从总体上有了较为清晰的把握，政府从管理的角度可以对高校实行管控，例如，我国第一轮本科教学评估就具有极强的问责范式特征。另一方面，改进评估更多的发生于院校内部，它通常不能以某一种固定不变的形式进行，教学的情景化和多样化决定了改进评估是一种松散的、个性化的评估方式，例如北京大学开展的旨在提高学生研究性学习能力和加强师生相互交流与探讨的多样性小班教学模式，[15]并对其实施效果进行评估与反馈的过程，就是一个典型的改进评估范式。与此同时，无论是问责评估还是改进评估都具有不可克服的缺点。问责评估强调外部性的可比指标，院校往往为了追求更好的评估结果而忽视了与学生学习直接相关的教学效果，评估的内容往往是“输入”指标，例如生师比、教学设备数量、博士学历所占任课教师比例等等。如何能够通过问责评估反应与院校人才培养质量直接相关的学生的学习结果是问责评估面临的一大问题。另一方面，改进评估强调内部性的教学改进，其具有专业性、个体性，而且各个院校的实践探索以及所取得的成绩仅限于内部交流，外部利益相关者不能清楚地了解院校做了什么、取得的成绩如何，使改进评估限制于院校内部狭小的发展空间。

伯顿（Borden）认为，问责评估与改进评估是一个矛盾的共同体，正如同一枚硬币的两面：相反，但是一个整体。[16]舒罗克（Shulock）将这种现象描述为“问责文化的鸿沟”：“学术团体认为问责评估对高校教学质量是一种威胁并且是不恰当的”；“他们认为统一化的评估方法忽视了不同学校所具有的使命、生源情况、获取资源情况以及外在环境。”“学校教师反对通过立法的形式对学生的学习情况进行测量与评估，这属于教师的职责范畴。”[17]由于问责是评估的主要刺激因素，但对评估的有效性又起到阻碍作用，因此对学校管理人员和教师就提出了更高的要求：能否寻找一种途径将二者相互结合，在评估中既能很好的说明院校的教育质量状况，又能起到改进教学的目标。伯顿提出了坚固问责与改进的有效评估的四个原则：1.定义质量；2.适应不同学习者需求；3.将绩效与学生学习结果相联系；4.坚持目的的有效性。[18]尤恩认为问责评估与改进评估是一种背道而驰的张力，而处理好这种张力要遵从以下几个原则：1.院校应对外部的合理关注点进行回应；2.展示与评估结果有关的行动；3.强调评估在大学发展中的重要地位；4.将评估嵌入到日常课程当中。[19]

四、学生学习结果评估——由背离走向融合的桥梁

基于学生学习结果的评价方式尝试将两种不同目的的评估范式相融合。“学生学习结果 ”（ Student Learning Outcome）是指学生在学完一门课程、一个专业或一个学位后所了解的知识、所形成的思维以及所能做的事情。[20]它既包括学生通过测试等手段可以外显的获得的知识和技能，同时也包括内化为自身素质和能力的结果，例如人际交往、公民素质和跨文化方面的知识和行动，即学者所谓的“软性 ”的学习结果。学者奥特（Otter）将学生学习结果定义为“学习者所知道的与所能够做到的”，对学生学习情况的考察伴随着教育活动的产生而自然形成，是教育过程必不可少的重要环节。

“学生学习结果评估”（ Student Learning Outcome Assessment）是对学生在教育过程中获得哪些知识和技能、能够做什么的真实评价。从历史发展来看，其经历了五个阶段：口试、论文等早期综合考核、学生学习进行标准化考试、通识教育和研究生教育评估、测试机构的增加和大学内部学习评估改革以及回应问责的时代。[21]美国学者尤恩认为，虽然人们对学生学习结果评估的定义各不相同，但根据其基本含义和使用情况来看，可以总结为以下三个方面：首先，学生学习结果评估建立在掌握学习（Mastery-learning）理念的基础之上，评估是通过可观测的绩效对个体掌握复杂能力情况的评断。其次，受K-12“大规模测试”（Large-scale Assessment）的影响，为了应对问责而针对院校指标基准设计需要产生的评估方法。再次，学生学习结果评估也是对课程的评估，通过学习结果资料的收集改进教学与课堂质量。[22]安吉鲁（Angelo）认为，学生学习结果评估可以涉及到高等教育的四个层面——高等教育系统层面的评价（包括在州或者全国范围内）、院校层面的评价、专业层面的评价和课程层面的评价。[23]由此，我们可以看出，学生学习结果评价的应用范围非常广泛：从学生个体层面来看，学生学习结果评估可以反映对一段时间内学生的学习情况，即获得的知识和能力；从课程、专业层面来看，学生学习结果评估可以帮助教师及教学管理人员制定基于学生能力的合理课程目标与专业体系，实现课程的改进；从院校层面来看，学生学习结果评估可以通过对学生学习结果证据的大规模数据的收集，而更加客观真实的反映高等教育质量状况。因此，学生学习结果评估受到越来越多的高等教育质量保障组织与专家的关注。目前，美国已经有 44 个州制定了有关学生学习结果评价的政策，并采取了适合本州情况的的措施和方法。[24]自1994年以来，美国联邦政府委托不同的地方机构不定期调查并发布55个州的大学教育质量的测量报告，内容逐渐从宏观层面上的与其他国家高等教育绩效指标的比较转变为自2008年起对学生学习情况的报告。[25]由OECD发起的学生学习结果评估项目（Assessment of Learning Outcomes in Higher Education）和美国路名那基金发起的美国学位资格框架项目（Degree Quali fi ations Pro fi e）都是近年来高等教育发达国家对学生学习结果评估方法的实践。

能否实现改进评估与问责评估的内外沟通关键在于学生学习结果评估方法的设计与运用。彼得森（Peterson）和沃恩（Vaughan）对影响学生学习结果评价的因素进行了总结（图4-1）：1.外部因素。例如联邦政府、州政府以及认证组织针对对学生学习结果评估所提出的政策支持与规定。2.院校背景因素。不同学校（例如公立、私立学校）在资源环境和学生规模等方面都各有不同特点，因此不同的学生学习结果评估方法适用于不同背景的院校。3.评估途径。即评估的内容和手段以及学生绩效报告的数量和类型。4.院校支持。包括是否强调将学生学习结果作为院校质量提升的目标，院校管理、教师参与是否能够给予学生学习结果评估足够的关注与支持。5.评估的管理政策与实践。即院校支持学生学习结果评估的运行机制，例如数据的收集、信息公开方式等。6.组织文化。组织中的质量文化深刻影响着学生学习结果评估的开展与实施。7.评估结果的使用与影响。评估结果能够实现教育教学的改进，学生学习结果评价的信息必须运用到教育决策当中。[26]

图4-1 学生学习结果评估的支持框架

五、结语

中国高等教育“五位一体”的评估制度已经构建完成，新形势下，作为现任教育部高等教育教学评估中心主任吴岩博士指出：“现在，任务和目标有了，路线图有了，关键是要抓好工作落实。”[27]从高等教育发达国家的实践经验来看，强调以学生为中心、平衡多元利益的学生学习结果评估是实现问责评估与改进评估相融合的有效途径。已有学者指出中国高等教育评估应开启“学生学习结果评估中心”时代。[28]这种将学校内部改进与外部问责通过学生学习结果进行沟通的方式，为我国高等教育评估实践提供了有效的评估范式。

注释：

[1] 刘尧. 中国高等教育评估的历史与现状述评[J]. 高教发展与评估, 2005, 21(5): 37-43.

[2] [4]吴岩. 高等教育公共治理与 “五位一体” 评估制度创新[J]. 中国高教研究, 2014,(12): 14-18.

[3] Ewell P T. Assessment, Accountability and Improvement: Managing the Contradiction[J]. 1987.

[5] [11] [14] Ewell P T. Assessment and Accountability in America Today: Background and Context[J]. New Directions for Institutional Research, 2008, 2008(S1): 7-17.

[6] [10] Burke, Joseph C. Achieving Accountability in Higher Education: Balancing Public, Academic and Market Demands [M]. San Francisco, CA : Jossey-Bass, c2005.(6，10).

[7] Punshon P. Western Interstate Commission for Higher Education[J]. Nursing Research, 1968, 17(2): 183.

[8] Trow M. Trust, Markets and Accountability in Higher Education: A Comparative Perspective[J]. Higher Education Policy, 1996, 9(4): 309-324.

[9] Schedler A. The Self-restraining State: Power and Accountability in New Democracies[M]. Lynne Rienner Publishers, 1999:14.

[12] 蔡国春. 美国院校研究的质量旨趣——基于高等教育问责制背景的历史考察[J]. 教育研究, 2013,(12):129-135.

[13] Pace C R. Measuring Outcomes of College. Fifty Years of Findings and Recommendations for the Future[J].1979.

[15] 北京大学关于开展“小班课教学”试点工作的若干意见（试行）[EB/OL].[2013-11-28] http://dean.pku.edu.cn/notice/content.php?mc=61411&id=1385536247.

[16] [18] Borden V M H. Accountability for Student Learning: Views from the inside out and the Outside in[J].Diversity, Transformation and Student Experience in Higher Education Teaching and Learning, 2011: 317.

[17] Shulock N. A Fundamentally New Approach to Accountability: Putting State Policy Issues First[J]. Institute for Higher Education Policy and Leadership. California State University, Sacramento.

[19] Ewell P. Assessment, Accountability and Improvement: Revisting the Tension[M]. National Institute for Learning Outcomes Assessment, 2009.

[20] 熊耕. 透视美国高等教育中的学生学习结果评价[J]. 比较教育研究, 2012,(1):7.

[21] Richard J. Shavelson. A Brief History of Student Learning Assessment: How We Got Where We Are and a Proposalfor Where to Go Next. Washington DC: Association of American Colleges and Universities, 2007:1.

[22] Ewell P T. An Emerging Scholarship: A Brief History of Assessment[J]. Building a Scholarship of Assessment, 2002:3-25.

[23] [25] 郭芳芳，史静寰.美国大众化高等教育中的学生评价研究: 缘起, 内涵与实践[J]. 教育科学, 2014(3): 90-96.

[24] National Center for Postsecondary Improvement. State Assessment Policy Analysis.［EB/OL］.http://www.stanford.edu/group/ncpi/unspeci fi ed/assessment_states/stateReports.

[26] Peterson M W, Vaughan D S. Promoting Academic Improvement[J]. Building a Scholarship of Assessment,2002: 131-147.

[27] 吴岩. 构建中国特色高等教育质量保障体系[M]. 北京：教育科学出版社, 2001:4.

[28]彭江. 美国高等教育认证中的学生学习结果评估[J]. 复旦教育论坛, 2014, 12(1): 85-92.