一流学科评估的理论探讨

2012-04-03王建华

大学教育科学 2012年3期

□ 王建华

一流学科评估的理论探讨

□ 王建华

评估是学科建设的重要一环。学科评估既要依靠先进的评估技术手段又要尊重学科自身的发展规律。在学科建设过程中科学的评估的确能够起到一定的激励和导向作用，但真正一流的学科绝不全是评估评出来的，而是知识与学术长期积淀的自然结果。对于一流学科的评估，应充分尊重科学规律和学科文化的差异，在完善同行评议机制的基础上，谨慎地使用量化评价技术，并及时对学科评估本身进行认真评估，以确保评估是促进而不是妨碍一流学科的发展。

学科评估；学科建设；一流学科

传统上，大学植根于文化，是文化的载体和象征。在不同国家，大学植根于不同的文化传统，不同的大学本身也有不同的组织文化。现代以前，作为人类的精神家园或智识场所，大学与大学之间很难进行直接比较，更不存在大学排行榜。现代以降，伴随着研究型大学的迅速崛起，以学科为基础的科学探究成为大学生活的主要内容。在功利主义和绩效主义高等教育政策的主导下，在以科研水平为主要评价标准的评估机构的影响下，追求一流的学科或科研的卓越成为了世界各国大学发展的新观念。为了实现一流大学的目标，建设一流学科、产出一流科研成果就成为首要的选择。学科原是大学进行学术生产与知识传播的基本单位，学科的声誉维系于那些知名教授和学术精英身上。今天，在那些高度研究型的大学里，学科也高度制度化。为了方便政府的量化管理、评估机构的定量评价和媒体的学科排名，学科知识的整体性被抛弃或忽视，学科诸要素均被指标化或定量化。其结果，所谓的一流学科成为了一个技术性很强的名词。一个学科是不是一流往往取决于评价指标的选择或政府的政策倾向而主要不是学科本身的综合实力或学术声誉。那么，一流学科是否真的存在呢？一流学科与学科评估之间又是什么关系呢？一流学科评估何以可能呢？

一、学科何以一流

“一流”或“卓越”是现代性话语体系的重要特征，实践中常常需要通过量化的手段来加以把握。今天在现代大学内部虽然对于“什么是一流”以及“如何达到一流”往往没有一致的看法，但“‘一流’（excellence）是学术生活的神圣目标”[1](P1)却是无可争议的。虽然现代以前任何事物也都会有优劣之分，大学也会有好坏之别，学科也会有水平的差异，但不会有一流大学、一流学科之类的概念。一流大学和一流学科概念的流行是我们时代的现代性精神在高等教育领域的直接反映。这种进步主义的时代精神有积极的一面，但也有其局限性。无论是雷汀斯在《废墟中的大学》一书中对于现代大学作为“一流的技术——官僚体系”的批评，还是刘易斯在《失去灵魂的卓越》一书中对于以哈佛大学为代表的研究型大学的失望都反映了将“一流”或“卓越”作为现代大学发展理念的局限。相比于历史上的文化大学或理性大学，“一流”或“卓越”的理念背后总是隐藏着大学对于科研成果量化评价方式和学术资本主义的迷信，以及对于科学和学科的功利主义思想的服膺。事实上，无论是对于大学还是学科，也无论是过去、现在还是未来，“一流”或“卓越”永远都只能是一种迷思。在对于一流的追逐中，无论大学还是学科都很容易忘记自己的真正使命，从而迷失在知识帝国的无尽征途中。学科是知识的载体，但是学科绝不只是知识生产的机器。一流的大学不意味着“好”大学，一流的学科也不意味着“好”学科。对一所“好”大学而言，知识生产与人才培养是学科建设不可分割的两翼。在一所“好”的大学里，学科建设还必须承担起文化传承和创新的重任。在任何一个国家大学都是造就公民的重要场所。公民教育必须成为所有“好”学科共同的责任。即便是仅在知识层面上，一流大学的理念也有失偏颇。当下在研究型大学的范式下，一流学科建设往往偏重于知识的生产。无论是一流学科的评选还是评估“重点必须超出‘学科的’知识生产与交换，延伸至包括知识的应用、它的受益人，以及被包含进和被排除出关于科学未来方向协商的各方的特征等问题。其重点在于科学、技术和社会的相互适应性”[2]（P204）。一流学科评估中必须摆脱学科就等于科研，科研就等于论文发表，一流论文就等于一流学科，学科建设就等于拿大项目、花大钱、出大成果的思维定势；必须注重学科、专业与产业之间的互动，一流学科的建设要着眼于从实践出发，在增进学科知识积累、提升学科实力的同时也要服务于经济社会发展。毕竟,今天的科学已不再只是科学家的科学（纯科学）而是成为了所有人的科学（公众科学）。科学家的科学研究和学科建设花的是纳税人的钱，必须对纳税人的合理需求在知识和教育层面上有所回应。

当今，大学内的一流学科主要有两大类。一类是因为国家的重视或评估的结果而成为一流；另一类是因为学科本身的科学能力和学术声誉而自然成为一流。前一类往往是“科学上次要但社会地位很高的部门”；后一类则往往是“科学上居支配地位但社会上只是从属性的专业部门”[3]（P59）。不过无论是哪一类，一流学科总是处在学科等级链的顶端。由于拥有学科平台的制度优势，一流学科在建设过程中不可避免地会拥有更多的社会资源。“学术秩序既是科学性的又是社会性的”[3]（P114）。在建设世界一流大学过程中人们对一流学科建设寄予了太多希望。学科与大学之间确实存在密切关系。一流大学确实离不开一流学科。但有了一流学科并不等于就有了一流大学。更何况，学科上一流的大学未必是一所伦理上和道德上的好大学。今天对一流学科建设的过度重视在某种程度上反映了现代大学在科研上的深度迷失。在对于科研有用性和大学功能化的强烈预期下，一流学科获得的经费资助非常巨大。政府部门为了能够对如此庞大的经费开支给出合理辩护，以绩效为目标的一流学科评估就成为必然的选择。不过，这种行政导向十分明显的一流学科评估，由于受到政策正确性和财政公共性的压力，在学科建设中充其量只能起到“劣中选优”的作用而很难“优中去劣”。

无论任何领域，也无论任何事物，一流都不是单一的而是多样的。“一流和认识论上的多元并非不可兼得。相反，多元成就了各种一流类型的存在”[1]（P6）。今天的大学里有各种各样的学科，每一种学科一流的标准以及通向一流的道路都不一样。由于学科的差异，大学里有些学科成为一流是因为教授的研究水平高，有些学科成为一流是因为毕业学生的薪酬高。有些学科因为懂的人少而成为一流，有些学科因为喜欢的人多而成为一流。一流学科评估的组织者总是假设作为本学科的同行对于什么是一流应该存在不言自明的共识。但是事实情况通常未必如此。对于一流没有共识的学科恐怕会比对于一流有共识的学科还要多。简单地说，以自然科学为代表的硬科学对于一流的共识可能要远多于人文社会科学领域对于什么是一流的共识。当然，对于一流学科有没有共识并不影响一流学科的真实存在。即便在自然状态下，任何一个学科领域都会有一流的存在。差别也许仅仅在于该学科有没有被政府或其他组织贴上一流学科的标签。在一个标签化的时代，有时被称为一流学科的未必真的是一流，没有一流学科称号的也未必真的不是一流。毕竟任何一个学科的学术经典和英雄人物都需要时间来检验，短时距的一流学科评估无论如何都操之过急。这种评估结果充其量只能满足政府、民众或媒体对于大学学科发展状况的好奇，而不能说明任何真正的问题。

当前，一流大学建设中政府投入巨额经费建设一流学科对于大学而言可能并非全是好事。“专项拨款就其本身而言，既非危险的，也非错误的。但它是分配系统中根本缺陷的反映，并且它向科学未来的自治提出了挑战”[2]（P141）。政府拨专款建设一流学科在某种意义上反映了现代大学自身学术制度的失败。如果现代大学的学术制度是成功的，应该无需政府的介入，一流学科就会自然成长。但现实是大学愈成功所面临失败的压力就愈大，由于无法拒绝政治和经济的介入，现代大学最终失败的命运又似乎是必然的。在政府主导的一流学科评选和评估的过程中，大学的自治、学科的自主和学术的自由不断地遭遇到政府行政权威的侵蚀。在政府“胡萝卜加大棒”式的评估政策的操纵下，学术的资本主义化、学科发展的工具化、大学组织的功能化现象将更加明显。一流学科建设中，大学通过与政府的合作从而获得了巨额的经费。由此大学作为政府的合作伙伴将不再在道德层面上有任何优越感。在大学内部，学科也不再是一个学术组织，而是变成了高校行政管理体系的一个基本单位。在经济全球化的今天，大学走出“象牙塔”，以科研服务于经济社会发展是必要的。但过分的功利主义的做法仍然会使现代大学在建设一流学科和一流大学的过程中迷失方向。一流学科的建设需要政府的支持，但绝不能完全由政府来主导，否则就会破坏大学的整体性和学科的自主性。因此，如何评选一流学科，如何对一流学科进行评估，必须要尊重大学自己的意见。“当政治家为科学直接分配资源，并使用超科学的标准指导他们的评判时，工作质量和科学事业的秩序就会遭受危害。但在另一方面，如果科学家的分配机制不能够很好地适用于科学领域表达社会的优先安排，那么直接的政治介入是需要的”[2]（P141）。客观而言，大学与政府绝不是天敌，但也不能成为共谋或合作伙伴。二者之间必须保持必要的、适当的张力。一流学科建设不应成为大学与政府的“共谋”，而应完全属于大学内部学术自治的范畴。对学科水平的评判以及随之而来的资源分配如果完全服从政治的目标或由政府所操纵，那么，最终受害的将是整个学科共同体和大学本身。因为，随着政府习惯于对学科的直接行政控制，大学学术活动的内在规律将被行政管理的便利性和政府政策的功利性所替代。

二、一流如何评估

一流学科建设理念的提出与一流大学建设工程以及各类或由媒体或由研究机构发布的一流学科排行榜的风行密切相关。现代社会是一个信息高度发达与信息饥渴同时共存的社会。在现代社会中，虽然大学走出了“象牙塔”，虽然学科高度世俗化，但对于广大民众而言，大学内部的学科和学者生活方式仍然是神秘的。20世纪80年代末以来，为了能够满足大学众多利益相关者对于大学内部学科发展水平的信息需求，为了适应政府组织对于大学的评价标准，以获取更多的办学资源，源于企业管理中的“一流”或“卓越”的理念被引入大学学科建设中。通过媒体的介入，学者学术生活的神秘感消失。在“量化技术”的帮助下，学科的优劣变得一目了然。高深学问与社会大众之间的知识鸿沟被“数目字”填平。一些学科经过排行榜的排名和媒体的宣传开始成为政府和社会大众的“宠儿”。但事实上，一流学科评估本身是十分脆弱的，充满不确定性。学科与学科之间是很难比较的。即使不同大学的同一个学科，由于研究方向的不同也很难直接比较彼此水平的高低。现有关于一流学科的各种评估以及各种排行榜上所提供的与学科水平相关的信息并不能反映学科发展的真实情况，而只是反映了某种评价指标体系下或某个组织机构中的人们对于当前学科发展水平的一种主观认识，这种信息更多的是市场或行政需要的产物，而非对事实的客观性的揭示。今天基于对一流的追逐，任何一种学科评估总是在尝试把不可比的东西可比化，把不可量化的事物尽可能地加以量化，此过程充满不确定性。正如在普林斯顿大学爱因斯坦办公室里的铭牌上所写的：“不是一切有价值的都能量化，也不是一切能量化的都有价值。”[4]当与学科相关的各种不确定性经过理性设计最终确定下来，那些通过一流学科评估所得到的经过技术处理的数据，其反映的不可能再是客观的真实，而只是“数字化”后的“假象”。评估之后的所谓一流学科在某种意义上只是一种评估技术层面上的一流，并不意味着它真的比其他非一流的学科更好或水平更高，而只是意味着该学科比其他学科在这些评估指标上的表现可能略胜一筹。

为了弥补量化评估技术的可能不足，定性的同行评议机制就成为一流学科评估中的重要方法。在实践中一流学科评估虽然是一项专业活动，通常由评估专家所主导，但学科评估离不开同行是评价科学工作的一项基本原则。在所有与学术有关的评估活动中同行评议原则都是最基本的。同行评议象征了学术的自治，也维护了学科知识的专业尊严，同时也可以为一流学科评估的诸多利益相关者提供专业性服务，满足了评估合法性和学术性的需要。实践中，各国正是通过同行评议才在大学内部的学科发展和大学外部的资源投入间建立了紧密联系。历史上，同行评议实践最初起源于期刊论文的评审，后来被广泛应用于科学研究基金的分配和大学内部学术人员的晋升、学生学位的授予等学术活动中。“从肇始于17世纪的体制化科学的整个历史来看，同行评价概念是由科学共同体作为质量控制的机制提出来的。同行评议发挥着三个方面的功能：（1）确保科学家对他们受到的公共资助负有责任；（2）保护科学共同体的职业自治；（3）证明科学和技术领域新成果的正确性”[2]（P7）。在高等教育领域中，学科评估是出现得比较晚的一种新生事物。今天在一流学科评估中同行评议机制设计还很不成熟。所谓的同行往往是非常宽泛的概念，对于作为学科同行的资格并没有严格的要求。由于学科本身的高度分化和综合，有时很多所谓的同行对于自己所要评估的学科并不真正了解，对于学科评估的技术也并不专业，他们在评估中所发挥的作用非常有限，有时候同行评议在一流学科评估中只是起到象征性作用。“由于研究领域变得越来越专业化（也许更窄），尤其与科学劳动力的数量有关，合格的评议人来源预计在缩小。科学日益的跨学科特征，也导致了合适评议人来源日益窄小——在每一个相关领域，也许都可以找到大批的评议人；但在学科的交叉之处可能找不着几个。而处于离学科交叉之处太远的人，又可能作出太挑剔或者不适当的评议”[2]（P73）。对于一流学科评估而言，首要的问题就是选择哪些专家作为同行。由于竞争关系和利益冲突的普遍存在，学科同行的选择往往会面临两难。一流学科评估不是普通的评估，在评估背后牵涉到复杂的利益格局的改变。在一流学科评估过程中，各学科共同体内部不可避免地会展开激烈的竞争和较量，政府的权力、官方的意识形态和学术的价值观等也会介入其中。在这种背景下，同行专家的选择往往会成为各方利益妥协后的产物。最终，在一流学科评估中最有专业性的同行评议机制不得不面临随时滑向“政治协商”的危险。当然，一流学科评估本身就不是一个单纯的学术评价问题，而是一个政策导向问题和政治选择问题。尤其是在建设世界一流大学过程中那些具有战略性意义的一流学科评估，其本身就会带有极鲜明的政治色彩，体现了政府主导的国家意志。在这方面，我国高校国家重点学科的评选以及各省重点学科、优势学科的评选都是很好的例子。由于其他因素的干扰，在一流学科评估中同行评议的象征意义有时比实际意义还要大。同行评议满足了公众和媒体对于专家主义和绩效主义的需求。通过同行评议的介入，政府可以宣称尊重了大学的自治和学术的权威，从而避开各方面的可能的批评。

在技术性问题之外，一流是真实的存在还是评估的结果，是一流学科评估中另一重要问题。如果一流真的存在，评估的关键就是通过科学的方法找出一流。如果一流只是评估的结果，那么一流学科评估就失去了科学意义。现实中两种一流都是存在的，既有真实的一流学科，也有评估出来的一流学科。一流学科评估的真正价值可能就在于使评估出来的一流尽可能接近真实的一流。而要在真实的一流与评估产生的一流间达成共识，就需要充分尊重学科主权和学术权威，更多地依赖学科专家而不是评估专家，更多地尊重学术权威的判断而不是对评估指标的统计分析。当前从我国高校发展的实际情况出发，对一流学科与学科评估之间的关系大致可分为两种情况。第一种情况是政府或非政府部门通过评估活动对所有学科进行评审和筛选，从中挑选出符合评估指标要求和各利益相关方需要的“一流学科”。第二种情况就是对已经评审出的所谓一流学科进行诊断性或终结性的评估以检验其学科建设的绩效。无论上述哪一种情况，评估的本意都是在对某种身份进行确认；但吊诡的是，今天由于评估的介入，一流学科的真实性倒成为了疑问。由于评估的盛行，真实的一流学科与评估的一流学科之间的边界已日益模糊。真实的一流也是评估出的，评估出的一流最后也可能成为真正的一流。换言之，今天大学里的一流学科既是评出来的又不是评出来的。一方面，没有评估也可能有好的学科，但没有所谓的一流学科。在这种意义上，一流学科是评出来的。但另一方面，一个学科之所以能被评为一流学科有时可能还在于学科本身的实力，而不全是评估本身。评估能做的不过是给某些强势学科或较强学科贴上一个“一流”的“标签”，但无论如何绝不可能通过评估把所有学科都“评”为“一流”。

由于在一流与评估之间这种吊诡关系的存在，一流学科评估本身可能会面临一个困境。一方面，一个学科是否是一流学科需要通过学科评估来确认；另一方面，一个学科被确认为一流学科之后仍然要面临评估。一般来说，前面一个评估是选拔性的，后面一个评估是绩效性的。前一个评估的目的是优中选优，发现需要的一流学科。后一个评估的目的是保证一流学科建设的质量，强化问责性。但现在问题的关键是，很多时候关于一流学科的评估都是政策性的，错过的学科可能就永远错过了。一流学科评估面临的另一个困境是择优原则和民主原则的冲突。学科之间本应是自由和平等的关系（虽然学科内部也会有潜在的等级制度），一流学科评估人为地在学科之间造成了一种类等级化的利益分配制度。虽然一流和多样性并不矛盾，但是学科或学术发展上的寡头主义无疑是不受欢迎的。大学如何调和效率与公平、精英与大众、一流与多样之间的可能冲突是一流学科评估中不能忽视的问题。在一流学科评估的过程中，学术质量的标准是多样化的，有科学的标准、行政的标准、教育学的标准，也有科学学的标准。一个好的评估指标体系不应是大杂烩，而应有所取舍。在我国，一流学科通常由政府评选，评优后的一流学科的评估也由政府主导，这种状况很容易给学者和大学一种错觉，即学科建设可以“逃避学术或科学市场的特定规则”[3]（P24）。但事实上，这是不可能的，任何学科的发展归根结底仍要遵守“学术和科学市场的特定规则”。政府的专项政治拨款也许可以为学科发展提供资源，但资源并不能直接转化为学术成就。尽管如此，为了避免可能的误导，一流学科评估一定要避免政治化或行政化的倾向，要尊重科学和学科发展的内在规律。

除上述两种困境之外，一流学科评估中还会面临另两种截然相反的困境。一种是说起来容易做起来难；另一种是做起来容易说起来难。“恰如在阐释和实施、操作等人类行为从理论到实践过程中有‘说着容易做着难’的现象，在更深层的文化理论推导和研究上亦有吉尔兹所描述的教人骑自行车之类‘做着容易说着难’的相反现象”[5]。在一流学科评估中“说起来容易做起来难”是就评估技术而言，而“做起来容易说起来难”是就评估理论而言。理论上，对于一流学科的评估方案，专家和学者可以做出严谨而深刻的论述。对于一流学科的成长规律、主要特征、评估的指标体系等复杂问题也可以通过科学的方法加以完美的讨论和解决。但所有这些都不足以保证评估本身的有效性和科学性，都不能为评估的顺利开展提供充分的可行性。无论如何，现行的所有评估对于学科都意味着某种“软暴力”，体现了外界对于学科从业者和学科组织的不信任。实践中在学科自身与学科评估者之间不可避免地存在着信息的不对称。由于评估理论和技术，评估的科学性和可行性之间存在天然的内在矛盾，如果没有本学科从业者的积极配合，所有的评估在某种意义上都只能是“虚假评估”或“数字游戏”。评估理论强调科学性，评估技术注重可操作性；在评估实践中，理论的科学性又让位于实际的可行性。其结果，一流学科的评估就极有可能会成为那些评估专家和学科从业者的“游戏”以及政府官员和高校管理者的政绩，学科发展的真实状况和存在的真实问题没有人感兴趣，评估的结果从属于政府的政策选择，公众、媒体，甚至学科自身关心的只是评估的结果以及可能由此带来的利益。

三、评估何以可能

Carol Weiss将评估定义为：“评估是根据一组显性或隐含的标准，有系统地衡量一项政策或方案的执行或成果，其目的是经由此项工具的使用来改善政策或方案的质量。”[6]（P6）基于此，一流学科评估也就是根据一组显性或隐含的标准，有系统地衡量一流学科建设政策的成果，其目的是经由此项评估来完善一流学科建设政策，提高一流学科建设水平。一流学科评估中各种不同的评估往往基于不同的目的，很难比较不同评估之间的优劣。不过无论何种学科评估，评估目的与学科建设目的之间的契合度都很重要，学科评估服务于学科建设是最基本的原则。如果评估目的偏离了学科建设的目的，或学科建设刻意迎合评估的目的，那么为评估而评估的现象就很容易出现。当然任何“评估工具的本身总是隐含着一种要达成什么目的的理念”[6]（P9），要求一流学科评估完全反映学科建设的全部情况也是不可能的。为了避免评估本身被视为一种目的而非手段，对评估工具本身的评估就成为必要。

对于一流学科而言，评估既是一种技术，又是一种生活方式。长期以来，大学里的学科作为一种无形学院，是同行能够相互认同为同行的重要场域。在学科建设过程中，人们尊重学术权威，追求同行承认。学科的评估属于学术共同体内部学术自治的范畴，一般都是各种学科组织自己管理自己的事情，政府无权插手。学科英雄和学术声誉是一流学科的重要标志。无论是自然科学还是人文社会科学，实践和时间都是人们检验学科水平的最终尺度。实践和时间是人类知识的最公平的评判者，在漫长的历史长河中经过大浪淘沙、千锤百炼，各学科的学科英雄与学术经典逐渐在各自学科史、科学史以及人类的知识史上完成定格。现代以来，大学之外的各种势力越来越多地介入大学的学术评价和学科评估之中。政府的政策倾向性、媒介与媒体的偏好以及企业的需求等都成为影响评价学者学术成果优劣和学科水平高低的重要因素。与中世纪和近代社会不同，现代社会是一个高速变化的社会，凡事强调即时性。大学里的学科发展和知识积累本是一个漫长的过程，但在今天这样一个强调数目字管理的量化时代，学科的评估不再可能完全交给学者自己，更不能一直留待时间和实践检验。为了满足诸多利益相关者对于信息的“饥渴”，评估周期被高度压缩，评估种类也不断增多。今天各种大学与学科排行榜一年一更新已经成为业界的惯例。客观上，无论大学还是学科都是一个变化缓慢的组织，一年之内一所大学和一门学科的水平不可能有明显的变化，能够变化的只能是评估的指标和评估结果（不变的结果绝对无法吸引人们的眼球）。无论是大学排行还是学科排行，各类评估多半是为评估而评估。评估的目的只是为了满足社会各界对于排名信息的市场需要，而不是为了学科的发展。此外，无论在理论上还是实践中，评估文化与学科文化也都是有冲突的。评估文化是专制的，学科文化是宽容的。评估是要得出唯一的结论，学科发展则允许多样化的探索。评估喜欢拿数目字说话，学科更喜欢追逐声誉和名望。评估只为学科的成功喝彩，而学科自身发展的历史表明有时失败也是有价值的，甚至于有时失败的价值还要大于暂时的成功。由于评估过程的神秘性以及对保密原则的坚守，学科评估本质上是一种精英主义的和类“独裁”似的理性活动。学科评估过程中，评估者在被评估者面前成为当然的权威。然而，事实上那些评估者远不及被评估者对于评估对象的了解。

由于一流学科评估可能涉及到外部巨额资源的分配，为了在这种随机的政策性窗口期抓住机遇，在一流大学和一流学科的竞争中占据有利位置，有组织的学术不端和道德失范开始越来越多地出现在各个学科迎接评估的过程中。“不端行为和政治专项拨款同样发端于现代科学对大量资源的需求和激烈的竞争压力，而且，每一个均对科学的自我管理提出了挑战。研究不端行为表明，科学可能并非如同它主张的那样是利益无涉的，也不是一项自我管理的事业。这种认识削弱了公众对科学的信任和承诺，并产生了监督和控制的新机制。政治专项拨款将某些资源分配决定从科学共同体转向了政界，因此对科学引导和管理自身的能力提出了挑战”[2]（P118）。无论国内还是国外，在各学科激烈竞争政府部门一流学科建设专项政治拨款的过程中，大学内的学术不端行为不可避免地被错误的政策导向所激励。而且，由于这种失范是有组织的，具有高度隐蔽性，在短暂的评估过程中很难被发现，从而导致评估有可能失去公正性和合法性。由于评估时间的限制，评估者面对的更多的是被评估学校和学科整理好的一流的文本，文本的技术性处理可以抹掉很多文本背后不想呈现的东西。

为了尽可能地避免由评估所可能带来的道德恐慌和学术不端，在评估技术的选择上以及评估机制的设计上有很大的弹性空间。在一定要评估的前提下，“评什么”与“如何评”至关重要。现代大学里学科建设涉及的范围十分广泛。无论是第一阶段的评审还是第二阶段的绩效评价，可选择的评估对象和评估方法都很多。一流学科评估过程中是评总量还是评增量？是重教学还是重科研？是论成果还是论条件？是评投入还是评产出？是讲数量还是讲质量？是重规模还是重效率？是强调效果还是强调效率？是注重绩效还是注重水平？一流学科评估到底是评学科的过去、现在还是未来？所谓的一流学科是相对的还是绝对的？比较学科水平高低的参照系多大为宜？学科发展的时滞性和评估的时间窗如何确定？一流学科成果的常规性、可预期性与不可预期性的关系是什么？凡此等等，都直接影响最后的评估结果。在确定评估的对象以后，“怎么评”也同样重要，甚至更为重要。在选择评估方法的过程中，除了评估技术与理念的冲突以及评估目的与手段的倒置以外，评估的过程是务虚还是务实？评估的方法是定量、半定量还是定性？评估的结果是线性排序还是非线性排序？评估的目标是选优还是去劣？评估的性质是诊断性的还是战略性的？对评估的对象是分层还是分类？具体评估者是以学科同行为主还是以评估专家为主？评估组织者是政府部门还是中介机构？这一系列问题同样错综复杂。面对这些复杂的甚至是难以解决的问题，在一定要评估的大前提下，如果评估的组织者没有科学严谨的态度和先进的理念，在具体实践中有时只能是“快刀斩乱麻”，为评估而评估极有可能会成为一流学科评估的常态。

对事物做出评价是人的基本能力，但将评估发展成为一门专业性活动则是人类对于自己理性的过分自信，甚至是自负。无论是学科还是大学，事实上都很难进行评估。对一个复杂的系统或一项复杂的学术活动，任何一种评估都不可避免地存在削足适履的问题。任何一个一流学科都绝不只是一个单纯的知识生产机器，同时也必然是一个文化的共同体。在理论上通过理性设计我们可以为一流学科评估提供各种理想范式或技术手段，但实践中却很难实施。在实践中通过制度建构可以对一流学科进行各种评估，但对其评估的科学性却很难说清楚。对于那些真正的一流学科的精神层面的东西，人类的理性很难把握。最终，一流学科评估的结果往往取决于对学科可量化部分的评估指标体系的设计。评估结果也仅对评估指标体系负责，离开了具体的评估指评体系就无法证实学科之间确实存在着优良中差。此外，理论上学科与学科之间的可比性也很成问题。比如：同一学科的国际可比性，不同学科之间学科差异性，等等，这些在理论上都仍有很大争议。人类的理性是有限的，在一流学科评估的问题上也不会例外。无论选用何种科学的评估方法、设计出如何完善的评估制度，也无论组织多少顶尖的评估专家、邀请多少资深的学术同行，一流学科评估都应是不得已而为之的事情，绝不是越多越好。任何一所大学里都会既有强大的学科也有弱小的学科，但不同学科之间的地位并非固定不变，而是会随着时间而改变。一流学科评估必须要有足够的前瞻性。由于学科间相互影响的普遍存在且难以测量，仅仅将评估中心从大学下降到学科还是不够的，评估过程中必须尽可能地注意那些一流学科成长的学科生态环境。“今天，科学中许多激动人心的事件是在学术院系和传统学科之缝隙发生的，是在研究所、中心、跨学科计划和新兴的院系及领域中发生的。一个一流的物理系可能受益于一个较低级别的化学、地质学、天文学、考古学、生物学、数学、计算机科学系，并且可能因为与这些相关领域的分离而消亡。支持和开发‘卓越尖子’而排斥大学的其他部分的政策，可能毁坏新尖子建立于其上的基础”[2]（P191）。由此可见，一流学科评估远比想象的要困难的多。由于学科体系的高度复杂性以及学科知识的高度不确定性，人类的理性对此可能根本难以把握。现在之所以各种机构都能轻易地进行学科评估，恰恰是因为我们还未充分地意识到学科评估本身的复杂性，以行政的便利性和强制性代替了理论的严谨性和科学的有效性。其结果，对一流学科的评估往往为政治或行政所主导，学科专家处在附属的地位。一方面由于彼此的不信任，评估组织者、评估专家、高校行政管理者、政府官员以及被评学科的带头人对于学科评估都有抱怨；另一方面由于利益链条的存在，各方又需要“合作”和“共谋”以争取双赢或多赢。

在一流学科评估过程中，政府官员和评估组织者会认为评估结果应当成为政府资源投入的主要依据，高校管理者和学科从业者则认为赢得评估是获取资源的有效途径。在此背景下，高校与政府，评估者和被评学科间的合作或妥协成为必然。和其他事情一样，对于评估有规则就有例外，有成功就有失败。对于被评学科在“一流”的争夺中无论成功还是失败，时间和精力的付出都是必须的。面对这种不可控的结果，一流学科评估本身有时会成为各方争议的焦点。当然，争议本身并不必然就是坏事，有原则的争议绝对好过无原则的妥协。在一流学科评估或同行评议过程中，“如果政治家对科学必须独立于政治控制而运作作出让步，或者科学家接受科学必须始终并即时服务于国家目标的话，这就有更多的理由令人担扰，因为，任何一种让步都意味着将带来危险的损失。如果政治家放弃他们引导和监督科学的责任，那么，科学与社会之间的桥梁将会损毁。如果科学家放弃他们科学自治的主张，那么，科学家关于科学的方向与可能性评价所带来的社会收益将会丢失”[2]（P31）。无论何时在一流学科评估过程中政治问责性与学科自主性之间都必须保持必要的张力。政府出于向纳税人负责以及保证资源配置的科学，必须对一流学科的建设进行绩效评估，强调效率和问责；大学出于对真理的追求，则必须对于政府的功利主义政策取向时刻保持警惕，力争学科自治与学术自由。在一流学科评估过程中，如果政府与高校、学术与政治公开合谋那才是最坏的结果。如果学科的发展极力讨好政府的政策取向和国家的意识形态，如果政府部门完全放任学科的自利行为和知识的粗制滥造，那么一流学科的建设将成为空谈。

今天，随着大学规模的增大，学科的规模也在增大。在某些大学内部一流学科本身就成为一个小大学。在这些像小大学一样的一流学科内部，随着研究成本的上升其对于外部资源的依赖日益强烈。作为大学内部自治的基本单位，学科不再是一个自足的和自治的组织，而是逐渐成为一个自利的组织和附属的组织。为了满足组织内部对于外部资源的强烈需求，在一流学科评估过程中学术之外的因素不可避免地掺杂进来。就像有考试就会有应试一样，有评估也就会有“迎评”。最终在各方的努力下，评估极有可能成为一种事关资源和利益分配的面子工程，所有参评的学科都很优秀，各方皆大欢喜。这方面英国高校学科评估过程中的“分数膨胀”就是最好的例子。由于获得优秀等级的学科的比例越来越高，英国最终终止了对于高校的综合性的学科评估，以院校审查来替代[7]。最后要指出的是，无论何种评估，绝对的公正都是一个神话。任何评估都是情境性的，绝对客观的评估是不存在的。“过分接近真实与过分远离真实都同样会构成通向科学认知的障碍”[3]（P1）。无论评估专家还是学科专家都是有情感的个体而不是机械的评估工具。在一流学科评估过程中，学科专家的学术专长与学科本身的社会网络相互重叠是不可避免的事实。当然，强调需要理解评估者的主观性和情境性并不意味着可以容忍学科评估中的道德失范和学术不端。相反，任何严肃的评估活动必须坚决抵制道德失范和学术不端。一流学科评估当然也不例外。除了评估本身的主观性和情境性之外，无论评估专家还是学科专家对于知识和学科本身都还会有自己的学术偏好或趣味倾向。这也会在无形之中影响评估的结果。因此，在对一流学科评估指标权重进行分配的过程中必须充分考虑不同学科的不同知识习性（in tellectual habitus）。“对学术意义的评判只能由那些具有精湛学识的人来做，他们不仅就某一具体领域现有知识状态来说如此，而且在尚待开发的领域也要如此”[1]（P120）。一流学科评估绝不是一项抽象的专业工作，而是与学者和学科的生活方式、情感方式密切相关的一项学术活动。一流学科评估的成败通常会与评估组织者对于各学科学者生活方式和情感方式的了解程度呈正比。

总之，在建设世界一流大学的大背景下，一流学科评估既是一项高度复杂的专业性活动，又是学术人生活世界的重要组成部分。一流学科评估既牵涉到政府巨额资源配置的有效性和公正性，也会影响到大学的排名和学科的声誉，更会关乎学者自身的学术发展平台和空间。因此，对于一流学科的评估必须科学组织、精心筹划，尽可能减少学科评估带来的负作用，使一流学科评估促进而不是阻碍一流学科和一流大学的建设。

[1][美]米歇尔•拉蒙特．教授们怎么想——在神秘的学术评判体系内[M]．孟凡礼，唐磊译．北京：高等教育出版社，2011．

[2][美]达里尔•E.楚宾，爱德华•J.哈克特．难有同行的科学：同行评议与美国科学政策[M]．谭文华，曾国屏译．北京：北京大学出版社，2011．

[3][法]P.波丢．人：学术者[M]．王作虹译．贵阳：贵州人民出版社，2006．

[4]王义遒．建设世界一流大学究竟靠什么？[J]．高等教育研究，2011（1）．

[5][美]克利福德•吉尔兹．地方性知识——阐释人类学论文集[Z]．王海龙译．北京：中央编译出版社，2000：54．

[6]官有坦，陈锦棠，陆宛苹．第三部门评估与责信[M]．北京：北京大学出版社，2008:6.

[7]林晓．英国高校学科评估的现状分析[J].外国教育研究，2006（08）：58．

（责任编辑黄建新）

Theoretical Study on First-class Disciplines Evaluation

WANG Jian-hua

Evaluation is a key part in discipline construction. Discipline evaluation should follow the law of discipline itself while depending on the advanced methods of evaluation. Scientific disciplines evaluation can function as an incentive and guidance in certain ways. However, a firstclass discipline is not a result of evaluation, but a natural result of know ledge accumulation. When evaluating first-class disciplines, we should fully respect the rules of science as well as the cultural differences among various disciplines. On the basis of improved peer review mechanism, evaluators should adopt quantitative evaluation technology with great caution，carefully evaluate discipline evaluation itself timely and make sure that evaluation is beneficial for the development of disciplines rather than a hinder for first-class disciplines.

discipline evaluation; discipline construction; first-class discipline

book=64,ebook=1

G 649

1672-0717（2012）03-0064－09

2012-04-20

2011年国家社会科学基金教育学一般课题“高校学科建设的理论研究”（BIA110064）；江苏高校哲学社会科学研究重点项目“江苏高校优势学科、特色学科、新兴学科建设研究”（2010ZD IXM 046）；江苏高校哲学社会科学研究重大项目“世界一流水平学科评估指标体系研究”（2011ZDAXM 001）。

王建华（1977-），男，河南息县人，教育学博士，南京师范大学教育科学学院教授、博士生导师，主要从事高等教育理论研究。