大学教学质量评价的模糊方法范式研究

2018-02-13邓飞李开宇

黑龙江教育·高校研究与评估 2018年12期

邓飞李开宇

摘要：提高大学教学质量，是大学建设的应有之意，是实现高等教育内涵式发展的关键内容。目前基于模糊数学理论建构的教学质量评价方法渐趋成型，其在突破传统评价模式的二元真理论前提方面产生了巨大的影响，但也存在将数学确定性置换为实践结果二分性的危险，这将不利于大学课堂教学质量的有效提高。在反本质主义的立场之上，重新思考评价系统的逻辑负载和价值判断依据，厘清模糊方法的范式价值和方法论意义，是超越和拒斥当前二元逻辑范式对评价本质追求遮蔽状况的必然选择，也是建构新时代具有解释力和实践想象力的评价体系的必然方向。

关键词：教学评价;教学质量;模糊数学;模糊评价+;评价范式

中图分类号：G640 文献标识码：A 文章编号：1002-4107（2018）12-0056-04

十九大报告指出，“建设教育强国是中华民族伟大复兴的基础工程，必须把教育事业放在优先位置”[1]。教育之道，致广大而尽精微，教育事业的整体发展有赖于教育各环节的紧密配合与协同推进，其基石则必来自每一节课程教学的有序、有效、高质量完成。课堂教学是大学教育中最为微观的场域，是教学质量最微小的而又坚实的构成土壤，对教学质量的有效测量与评价一直是高等教育改革与实践中的热门话题。伴随着数次本科教学评估和各年度的例行教学督导与检查，教学质量评价一再成为教务部门、行政主管单位、高等教育研究者关注与讨论的核心[2]。几乎每一个代表性评价体系的提出，都紧跟着社会舆论与专业领域的研讨与纷争，矛头往往指向评价指标之僵化和分散，似乎是“唯分数论”在高等教育评价场合的另一次狂欢。学界迫切呼唤一种具有广泛代表性与说服力的评价体系，为标准之争画上一个完满的句号。与此同时，对于评价方法本身的前提分析或者元分析（meta-analysis）正逐渐进入学界视野，以模糊评价为代表的一类方法也开出了不一样的处方，一度看来颇有希望终结上述争论。但是，模糊评价方法体系中的关键性缺失也导致了其在范式意义上的自相矛盾，这提醒我们在质量评价中需要进一步克服潜藏的二值逻辑风险，在反本质主义立场上重塑评价意义，在实践中真正实现评价范式的转换。

一、教学质量评价的真理性问题与二值逻辑困境

高等教育中教学质量评价的对象是大学教学行为及其影响本身，所要进行的判断是一种逻辑真值的求解，即对“XX课的教学质量是合格的”这一逻辑命题的判断。这一判断从形式逻辑角度来看，有且只有两种结果：真或非真（即假）。这种采用二值逻辑进行事实划分的实践方式除了操作性价值外还有其方法论意义，这是教育评价过程的基本价值尺度。

从这种价值二分的历史合理性来考察，在真、善、美的范畴序列里，早期的哲学家和思想家不约而同地首先将知识与“真”联系在一起。在理性主义哲学家看来，真理就是诸个命题及命题网络的一致性。不论是斯宾诺莎、莱布尼茨，还是黑格尔都基本秉承这种融贯论（The Coherence theory），将知识、真理、真实看作同一种逻辑形式在不同层面的不同表达。而在以苏格拉底为代表的古希腊哲学家和后来的罗素看来，“真”被看作知识表述与客体的一致性。但这种真理符合论（The Correspondence theory）中的“符合与否”由谁判定、是否自明的追问又导致了维柯、马克思、哈贝马斯等的社会共识理论（The Consensus theory），将判定者的主体间性看作真理的关键要素。这些不同的关于真理，即“真”的定义，揭示了我们在价值判断过程中的“确定性”需要。甚至可以说，“将结绳记事看作人类尝试用数据表征实在世界的话，那么我们对于数学意义上的确定性追求最终都致力于进行一种逻辑求解”[3]。从本质来讲，教学质量评价在总体趋向上和价值“取值”上，仍然与这一思路是同构（isomorphism）的[4]。

正是因为只有逻辑上“真—假”“是—否”“对—错”“好—坏”“及格—不及格”“通过—不通过”的二值可能，或与此同构的“非无即有”“非0即1”式计算结果，在这一尺度下的质量评价本质就是：

1.从评价过程来说倾向于不断地“化简”。在教育评价特别是质量评价过程中，为了处理质量本身的复杂性和多层次性，采用了从形式到内容，从课内到课外，从硬件到软件，以尽可能详尽而多样的分类指标来综合“映射”评价对象，并按照专家意见或者实践经验，赋予不同的权重。典型的层次划分结构的内在逻辑是，将内在“复杂性”外化为指标系统的“清晰性”，最终形成自上而下的分层分类系统。

2.对于评价结果来说意味着尺度的单一。评价结果一定遵循由“分”到“合”，化“繁”为“简”的取向，将评价指标体系施测汇总后，得到一个加总分数，再与预设的评分体系相互参照（如>85分为优秀，85—60分为合格，<60分为不合格），或者与常模参照系统（以预期理想的被测群体的正态分布模式，或者测试系统原有的常模系统）比对，得出一个最终的结果。

3.对于被测者来说其获得的评价结果是确定的。评价结果不能既A又非A，而只能根据矛盾律和排中律在二者中选择其一。这是一种对于被测者属性的价值认定，是对于其所属价值群体的再一次确认。按照共识真理论的看法，这种确认的真理性则由评价体系的合理性来“承诺”。

由于以上本质属性，不论评价是复杂的还是简单的，是充分论证的还是未经验证过的，在使用过程中，都将产生评价工具本身的价值负载与评价行为的价值追求相互背离的“二律背反”。深层次的问题始终是：作为评判尺度的“标准”体系，是否真实表征和表达了一种本质状态？或者，是否真实存在着一种相互對应的“本质”属性，它可以成为透过教学质量“现象”所看到的“真相”，或成为判断教学质量与效果的最终标准。这一“本质主义”认识论路线“把反映了事物唯一本质的知识（概念、命题与理论体系）尊崇为‘真知识，即真理，其他都是不反映客观实在因而无足轻重的‘伪知识‘意见甚至‘谬误”[5]。教学质量评价的潜在逻辑就是，某种教学或者是好的，或者是非好的，二者必居其一。没有任何教学既是成功的，又是失败的;既是高效的，又是低效的;既是育人的，又是毁人的;如此等等。

可以说，这一现今最通行的评价实施方式，已经在施测之初为被测者定义好了可能的“值域”——A或非A。也使得这类教学质量评价超越了一般意义上的“方法”（method）概念，而成为一种评价范式（Paradigm）。“范式”概念源于古希腊Paradeig-ma一词，指的是模范或者模型。库恩将“范式”看作“一个公认的模型或模式（Pattern）”[6]。在我国各类型的教育教学评价中，二值逻辑已然成为一种默认的选择，一个潜在的秩序，凸显出技术理性对于真实的复杂事实的宰治，也代表着二元逻辑对教育实践逻辑的僭越与遮蔽。

二、模糊评价方式的逻辑突破与实践局限

二值逻辑的基本原则是，“任何命题不能既真又假，也不能既不真也不假，这分别是由矛盾律和排中律保证的”[7]。这一原则将所有的教育事实看作可以和必须进行二值逻辑判断的潜在命题[8]。所忽视的问题正是在确定性的定律与事实之外，还有非确定性的定律与事实。

大学教学质量中任何可能考察的一个问题：“这节课准备得充分吗？”对于这样一个语义上的简单问题，惯常的思路自然是寻找信效度最高的方法。要保证信度，就要在一个教师的不同教学时段，以及相似教师在同一教学时段能够经由评价获得一致的评判。要保证效度，则需要使评价手段契合教学准备程度这一核心问题。这一过程的每一项指标都可以不断展开为更加细化的子指标，其前提假设即是可以通过相应的“现象”来洞见“本质”所在。

模糊数学的发展使得这一领域相关问题的解决产生了较大的突破。从1965年Zadeh创立模糊数学开始，模糊关系的计算就开始应用于广泛的社会问题研究中，用以处理严格的二值逻辑边界量化“不确定性”的情况。教育中的“好—差”“优—劣”“通过—不通过”等复杂问题都重新获得了解释。它直接面对逻辑二分的本质问题，弱化乃至否定了本质主义严格的边界划分，用一定的“含混性”来还原事实本身的性质。这样的致思取向也引发了20世纪60年代末逻辑学家的兴趣，三值逻辑、模糊逻辑、超赋值论等理论纷呈，揭示出真实存在的“亦此亦彼”性质[9]。

图1可以较为明晰地说明这一问题，图中呈现的是典型的二值逻辑评价过程：整体分值最高分100，最低0分。85—100分为A等级，65—84分为B等级，50—64分为C等级，0—49分为F等级（即不合格）。评价尺度简单明白，清晰明确，将评价得分与分值范围一比对，即可得出所属类别。但是问题也正在于此，假如48与83两位得分者遇到另一组得分为50和85的被测者，则如何证明48—50分及83—85分之间2分的差距可以划分到不同的类型中去。从微观上来说，组内的差异经常远大于组间的差异，在评价过程中，这已然形成了对评价过程科学性的指责。虽然有研究者采取统计推断的方法，采取T检验或方差分析，证明两个群体之间的显著性差异，但是在临界值非常小的情况下（如两个班评教结果分别为89.1和89.3的情况下），等级差异无法得到统计检验的支持。这也从侧面说明，二值逻辑在面对真实的实践评价数据时，很难证明分类、分层、分等指标的合理性。

模糊数学的处理方法是，将一个事实看作是多种本质或者属性的混杂状态，通过隶属度（membership degree）概念，构建一个介于0和1之间的度量值，描述某事物属于某类事物的概率（0为完全不属于，1为完全属于），“描述各因素模糊界限并构造模糊判别矩阵，然后通过多层复合运算，对所有因素做出综合评价，最终确定评价对象所属等级”[10]。其数学表达可以表示为：

其中U是论域，映射称为隶属函数，称为

x对的隶属程度。

如图2所示，上述分类问题在图中则是另一种处理逻辑：48分并非对应唯一一个分类标尺，而是在F和C两个等级上都有交点，分别对应F：0.2和C：0.8。同理，83分则分别对应A：0.8和B：0.2。对于48分来说，它隶属于F的程度是0.2而隶属于C的程度是0.8，从最大隶属度的判别标准来看，虽然从前面49分的分割点来看，48分属于F水平，但从模糊尺度来评判似乎48分属于C的合理性要更大一些。同样，83分隶属于A的合理性也大于将其划分到B类。

这样的处理优势是显而易见的，在对边缘状况的判断中，非此即彼的黑白分明判断被亦此亦彼的灰色空间取代，一个被评价对象兼有两种性质，我们可以根据两种性质在其身上的负载来判断何者更加科学和具有主导地位。

但这是否一劳永逸地解决了评价尺度的二值逻辑缺陷，而使得评价过程可以增加更大的容错性和包容性呢？在教育评价领域使用较多的模糊综合评价法（Fuzzy Comprehensive Evaluation，FCE），正是采用了这样的模糊逻辑概念，试图考虑到评价问卷、评价标准、主体态度等多维度的复杂情况，将受多因素制约的对象进行总体评价，将其中的“定性评价”转化为“定量评价”[11]。这一处理克服了原有单一评价尺度的盲目性问题，也将基于专家判断的评价系统作为新的方法引入到评价尺度中，可以实现自下而上的指标体系生成建构，弥补了以往自上而下地采用预设指标的僵化弊端。但这一方法对实践需要做出直接有效回应的同时，也导致了模糊逻辑及其方法从方法到范式上的实践局限。

三、从方法到范式：教学模糊评价的现实局限与实践指向

课堂教学是一个无论如何描述其复杂性都不过分的系统，在使用各类方法切入现实的时候，评价者的第一诉求即是有效分层。之所以在一开始就选择了多维度、细分式的评价手段，是因为这一系统在基本逻辑架构上兼顾到了清晰性和可操作性。每一个指标都有对应的值域范围，并划分一定的范围为一个类别的等级度量值。

但这一过程的弊端也是显而易见的，正如本质主义和二值逻辑相伴而生的状态所显示的，课堂教学的优劣，并非一种非此即彼的概念。即使采用了模糊评价法，将评价者主观中无法权重或者说权重不明的部分，采用量化技術加以修正处理，但是在根本问题上，仍然遵循了二值逻辑的价值负载，要求在最后给出一个用最大隶属度加以衡量的归类结果。这一结果是确定性的，非模糊化的。即模糊逻辑方法在这里只是一种过渡性方案，它完成了对于主观模糊性的矫正，却最终走向对于客观确定性的实现。一旦这一结果呈现出来，典型的问题也就随之产生：假设受测者的隶属度函数分别为合格0.51，不合格0.49，那么采用最大隶属度方式进行判别的结果就是受测者属于合格行列。但这与经典性的基于二值逻辑的判别方式相比，真的具有本质的差别吗？

问题的吊诡之处恰恰在于，模糊数学基础之上的模糊逻辑系统最具突破性的一点正在于，对于任何事物的描述过程，采用了集合或函数方式，而非本质论意义上的二元逻辑。或者说，一种评价结果，是多个价值网络的节点，而非一个单一价值链条的一个定点。

这种对于真理性的重新确定对于实践中的真正解放性意义，不能从工具理性或者说技术理性的路线上来思考，甚至也不能仅仅从实践理性的角度加以说明，而要从解放理性的角度进行阐述。这种反本质主义的评价方法已经不能仅作为一种方法（method）来界定，而是从方法论视角上，具备了“重新评价一切价值”的可能性。在教学质量评价的现实诉求中，亟待解决的，也并非是教学质量的真理性问题，而是真理的包容性问题。

是否可能防止模糊评价使用中的二元化倾向，实现对于评价结果开放性的诉求呢？这样的方式权且可以定义为“模糊评价+”（Fuzzy Assessment Plus），将其与基于传统逻辑和经典模糊评价的方法比较来看，其针对问题、范式基础和利弊正如表1所示：模糊评价在抗失真和提高效度方面对二值评价是一种革命，而其本身对于结果复杂性的牺牲和二元化倾向，也需要在“模糊评价+”中进行矫正和还原。这也就促使我们在实践中必须高度关切外围支持系统的协同性，并变革当前模式，积极向新的评价范式转换。

模糊逻辑及其模糊评价+模式所揭示的新时代教学评价系统无疑应当在实践中具有以下指向性特点。

首先，教學过程与教学结果不可分割。教学结果的诊断性作用在逻辑上优先于终结性作用，并且在实施过程中，必须能够将评价结果详尽地提供和报告给任课教师，而非仅仅报告最终的分等结果。这一过程的核心是实现评价的主体转换，而非客观结果的达成。

其次，质量标准保持高度开放性。质量标准区别于教学系统的其他因素，具有自足的范畴维度，实践中也负载着其他基础性或中介性目标。但是在质量标准的生成过程中，淡化质量边缘区域，强化质量纵向和横向比较的差异性探究，是未来发展的必然趋势。

最后，质量可追溯系统的日趋完善。二值逻辑无法达成质量追溯的效果，强硬地扩展为序列性的多值逻辑也无济于事，根本性的转变需要依赖于将每一个原子事实扩展为关于事实的序列性逻辑隶属度判断，在此基础上将有关教学质量的概念团向大数据方向扩展[12]。这势必成为未来模糊逻辑系统最可期待改变教学质量评价的关键点。

总之，评价的第一问永远是评价的意义，而非评价的结果，在反本质主义的立场之上，重新思考评价系统的逻辑负载和价值判断依据，是拒斥二元逻辑对评价本质追求遮蔽状况的必然选择，也是建构新时代具有解释力和实践想象力的评价体系的必然方向。

参考文献：

[1]习近平.决胜全面建成小康社会夺取新时代中国特色社

会主义伟大胜利[N].人民日报，2017-10-28.

[2]吴亚丽，胡克瑾.基于模糊综合方法的高校信息化评价研

究[J].教育理论与实践，2010，（21）.

[3]Voskoglou M G.Fuzzy Logic as a Tool for Assessing Students

Knowledge and Skills[J].Education Sciences，2013，（2）.