中法11岁儿童三段论推理对比<br/>——基于自然三段论和传统三段论的实验

中法11岁儿童三段论推理对比
——基于自然三段论和传统三段论的实验

2020-04-20姜海霞杜国平

重庆理工大学学报(社会科学) 2020年3期

关键词：三段论玫瑰花理由

姜海霞，杜国平

(1.中国社会科学院大学(研究生院)，北京 102488； 2.中国社会科学院哲学研究所，北京 100732)

一、问题的提出

考虑以下推理：

1) 在公园里，所有的花都凋谢了。

在公园里，所有的盆栽植物都是花。

所以在这个公园里，所有的盆栽植物都凋谢了。

2) 在公园里，所有的花都凋谢了。

所以在这个公园里，所有的玫瑰花都凋谢了。

推理1)包含一个传统三段论。传统三段论由3个性质判断组成，其中两个性质判断是前提，另一个性质判断是结论；传统三段论的主项和谓项包含且只包含3个不同的概念，每个概念在其中的两个性质判断中各出现一次[1]。推理2)包含一个省略三段论，这个三段论省略了一个前提，即所有的玫瑰花都是花。将小前提补充完整，该推论就是一个典型的传统三段论。推理2)中的三段论，因为“玫瑰花”和“花”的类别包含关系是隐含在语义记忆中的，所以我们根据一个大前提就可以推出结论。语义记忆是人们使用语言所必需的记忆，它储存了人们对词汇和其他语言符号的意义和指称以及这些符号和指称的规则和算法的知识[2]。这种在日常会话中以各种形式出现的省略了一个隐含在语义记忆中的全称肯定命题的三段论被称作自然三段论[3-4]。自然三段论和传统三段论的主要区别在小前提，在传统三段论的小前提“所有的盆栽植物都是花”中，“盆栽植物”和“花”是偶然的关系，而自然三段论的小前提“所有的玫瑰花都是花”中，“玫瑰花”和“花”是基于知识的类别包含关系。自然三段论有两个特征：首先，在形式上，自然三段论比之传统三段论省略了一个全称肯定命题的小前提；其次，在语义上，小前提是包含一个存储在长时记忆中两个类别的包含关系。

传统三段论是心理学家使用的最古老的推理任务。多年来对三段论的心理学研究形成了一种统一的范式。在这种范式中，三段论的逻辑形式被自然语言所例示。三段论是人们日常生活中经常采用的一种推理形式。然而，以往的实验结果显示，人们在三段论推理任务上表现差，并且许多三段论推理的难度超出大多数人的能力范围[5-10]，这与人们在日常生活中论证和理解论证方面的熟练程度形成了鲜明的对比。人们不得不质疑传统三段论任务的充分性。Politzer等描述了“自然三段论”的概念，并开发了新的三段论任务[3]。他们测试了成人在传统三段论和自然三段论上的表现。在传统三段论上，成人的平均答对率不足50%，而在自然三段论上，成人的平均答对率为78.9%[4]。2017年，他们测试了11岁儿童在自然三段论和传统三段论上的表现，结果表明：即使是11岁的儿童也能熟练地解决自然三段论，并且他们在自然三段论上的表现远远高于传统三段论，自然三段论的平均答对率为72.5%，传统三段论的平均答对率仅为48.2%[3]。将这些结果推广到不同语言背景的群体中，是验证自然三段论普遍适用性的重要一步。近些年，国内对三段论的心理学研究多从内容因素(格效应、气氛效应、信念偏差)、认知风格、推理理论模型方面进行探索[11-21]，研究对象多为中学生或大学生，对小学生的三段论推理研究较少。儿童认知发展的四阶段论认为，11岁以后的个体可以进行形式逻辑思维[22]，而一些研究表明11岁以前的儿童也有可能进行有效的推理[6,23-24]。在我国基础教育将逻辑思维列为核心素养的背景下，研究小学生的逻辑推理能力显得尤为必要。

本文测试了我国11岁儿童在传统三段论和自然三段论上的表现，以提供更多且多样的群体数据以供讨论。本文的研究问题为：1)我国11岁儿童是否能熟练地完成自然三段论？2)我国11岁儿童在自然三段论和传统三段论上的表现是否存在差异？3)中法儿童的相关推理表现是否存在差异？

二、实验

(一)方法

1.被试

此次实验有山东(3所)、北京(2所)和杭州(1所)共6所小学(1)感谢临沂市册山中心小学、济南市高新区大码头小学、北师大实验小学未来科技城学校、北方工业大学附属小学和浙江师范大学附属丁蕙实验小学等学校对本次实验的支持与帮助。感谢杜广芝老师、徐荣梅老师、王雪老师、陈伊春老师和吴波老师等在实验实施过程中给予的帮助。的236名五年级小学生参加。其中，女生114人，男生122人，平均年龄10.67岁(SD=0.65)。实验共收集了1 887个作答数据。其中，有55个数据没有根据题目要求作答，有99个空白数据。删除这些无效作答，共得到1 733个有效作答，其中自然三段论的有效作答为846个，传统三段论的有效作答为887个。

2.实验材料

实验采用Politzer实验的8个对话场景[3]。实验前进行了小规模的试测，根据试测结果，结合中国儿童的发展特点对原有对话进行了一些修改，主要修改了一些对中国儿童不熟悉的词语，比如一些人物、动物、食物等的名称。将自然三段论嵌入在这些对话场景中，每个对话中有两个人物，前提由第一个人物提出，第二个人物根据第一个人物给出的前提推出结论。在每个对话后面有3道小题，前两题是为了确保被试能准确地理解对话内容。第三道题要求被试对该三段论结论的真假进行判断，并写出自己选择的理由。心理实验中的三段论通常发生在自然语境中，在这个条件下，无效三段论的结论一般可能为真也可能为假，所以在研究三段论推理的实验中，结论分为两种：结论正确和结论不确定[3]，所以本实验第3题的选项有两个：肯定是对的和可能对也可能错。本次实验材料中自然三段论的题目形式如下：

早上去上学的时候，明明总是经过公园，那里可以欣赏灌木、乔木和各种花：玫瑰花、雏菊和向日葵。

到了学校以后，明明告诉马丽：“在公园里，所有的乔木都会落叶。”

明明又说：“在公园里，所有的花都凋谢了。”

马丽回答说：“所以，在这个公园里，所有的玫瑰花都凋谢了。”

3) 根据短对话，判断马丽说的是否正确。用圆圈标出一个正确选项，并在正确答案的后面解释你的判断。

传统三段论的题目形式如下：

早上去上学时，明明总是经过公园，那里可以欣赏灌木、乔木和不同种类的花：玫瑰花、雏菊和月季花。

到了学校后，明明告诉马丽：“在公园里，所有的花都凋谢了。”

明明又说：“在公园里，所有的盆栽植物都是花。”

马丽回答说：“所以在这个公园里，所有的盆栽植物都凋谢了。”

3) 根据短对话，判断马丽说的是否正确。用圆圈标出一个正确选项，并在正确答案的后面解释你的判断。

本次实验采用了16个小前提为全称肯定命题的三段论，相同形式的自然三段论和传统三段论各16个，所以实验试题一共32道。在自然三段论中，为了与传统三段论保持类似的形式和字数，以控制阅读文本字数和三段论表面形式对推理正确性的影响，每个对话场景都在大前提前面增加了一句与推理无关的描述场景的话，这样保证了自然三段论的阅读文本和传统三段论的阅读文本字数基本一致，形式也比较相似。为了消除对话场景对三段论难度的影响，相同形式的自然三段论和传统三段论采用相同的场景。

3.实验过程

本实验作为小学语文课的课堂阅读小练习。实验进行了4～8周，共分8次课进行，为了消除题目之间的互相影响，每两次课之间的时间间隔在2天以上，每次课每个学生完成1道题目，8次课每个学生完成不同的8道题目。每次课有大约一半学生做自然三段论，一半学生做传统三段论。每个学生解决的三段论的格与式保持一定的均衡。

实验开始前，为了解释如何选择答案，我们让老师给学生进行了一个10分钟左右的训练。训练使用了Politzer实验2的训练题目[3]。训练题目为4个传递性推理题，比如：明明比马丽大，马丽比东东大，明明比东东大吗？答案是肯定正确。相反，明明比东东大，马丽比东东大，明明比马丽大吗？答案是不确定。老师引导学生得到正确的答案，然后开始实验。实验前的训练仅在第一次实验前进行。为了保证实验结果的准确性，全程实验都要求老师不要给学生讲解答案或者任何提示。

4.评分方法

因为题目形式为半开放式的选择题，每道题答对得1分，答错得0分。被试需要选择一个选项并写明选择的理由，因此题目的答案分为以下4种：1)选择正确，并且理由解释支持选项；2)选择错误，并且理由解释不支持选项；3)选择正确，但是理由解释不支持选项；4)选择错误，但是被试有充分的语用理由解释支持选项。其中1)和4)为给分条件。因此，评分将综合考虑选项和选项理由之间的内部一致性，在此基础上决定被试的作答是否正确。以下为具体示例：

(1)正确的作答

第一种情况：选项符合正确的逻辑规则，并且选择的理由支持选项。总正确作答数为992，这种情况(829)占总正确作答数的83.6%。比如(OA1)：在地下室，有些工具没有损坏。所以，有些螺丝刀没有损坏。正确答案：可能正确也可能错误。支持这一选择的理由是：没有说明哪些工具没有损坏。还有一个理由是：不是所有的工具都损坏了。这种理由实际上是大前提的同义句，只要被试的选项和理由是一致的，也可以接受这种作答。再比如(AA1)：在公园里，所有的花都凋谢了。所以在公园里，所有的玫瑰花都凋谢了。正确答案：正确。有两种支持这一选择的理由：1)玫瑰花属于花。这就把该三段论隐含的小前提明确地表达出来了。2)所有的花都凋谢了，玫瑰花是花。这种作答把两个前提都明确地表达出来了，表明被试已完全理解该三段论。此外，有些被试会重复大前提“所有的花都凋谢了”，意为前提条件已经显而易见了，这也是一种支持的理由。

第二种情况：选项不符合逻辑规则，但是被试有充分的语用理由。这时候被试的选择和提供的理由是一致的，这种情况(153)占总正确作答数的15.4%。比如(AA1)：在公园里，所有的花都凋谢了。因此，所有的玫瑰花都凋谢了。正确选项：正确。有些被试选择“可能正确也可能错误”，理由是：可能也有别的花也凋谢了。这里前提给出了“所有的花都凋谢了”，这是一个信息充足的陈述，而结论是“所有的玫瑰花都凋谢了”，相对于前提的陈述，结论推测出了一个信息不足的结论，儿童会认为这很奇怪，明明是所有的花都凋谢了，为什么要说“所有的玫瑰花都凋谢了”，所以会给出“错误”的答案。与受过抽象推理训练的成年人(通过中等和高等教育)相反，儿童严重依赖于所设定的情境。因此，尽管他们知道“花”也包括“玫瑰花”，他们怀疑结论限制谓词的扩展是错误的。这些儿童具有语用推理能力，他们的选择和理由是一致的，但是他们缺乏从场景中分离出来，并进行抽象逻辑练习的能力。儿童的这种认知发展现象在很多文献中都有验证[3,8,25]。

另外还有1%的作答可能是因为笔误选择了错误的选项，但是他们的理由可以支持正确选项。

(2)错误的作答

第一种情况：选项不正确，选择的理由也不支持选项。总错误作答数为741，这种情况(640)占了总错误作答数的86.4%。比如(IA4)：在自助餐厅里，有些旧的物品是碗，因此，有些旧的物品是餐具。选项选择：错误。理由是：旧的物品不只有碗。这是一个任意的断言，不是根据前提推导出来的。即使正确，也不足以证明结论是真是假。再比如(OA1)：在地下室里，有些工具没有损坏，因此，有些螺丝刀没有损坏。选项选择：正确。理由是：螺丝刀属于工具，有些工具没有损坏。这也是一个任意的断言，即使正确也不足以判断结论的真假。

第二种情况：选项正确，但是选择的理由不支持选项。这种情况的作答(101)占总错误作答数的13.6%。比如(OA1)：在公园里，有些金丝猴在笼子里，因此有些猴子在笼子里。选项选择：正确。理由：怕它们跑出来。理由提到的信息虽然符合事实，但不支持给出的逻辑推论。再比如(OA2)：在宠物店里，有些身上有标记的动物不是狗，因此，有些身上有标记的动物不是金毛狗。选项选择：正确。理由：有些狗身上有标记，有些狗身上没有标记。这些是被试自己加的断言，不能支持论证。

(二)实验结果

表1 我国11岁儿童自然三段论和传统三段论答对率比较 %

注：a代表无效三段论。*P<0.05

实验表明99%以上的被试都能正确回答每个对话后的第1题和第2题，这说明被试能很好地理解对话内容，以下分析主要集中在第3题，即儿童对三段论结论真假的判断。表1为我国11岁儿童在自然三段论和传统三段论上的表现分布(数据为四舍五入的结果)：

从表1可以看出，我国11岁儿童在自然三段论上的平均答对率为68.7%(33.3%～88.0%)，在传统三段论上的平均答对率为46.0%(18.4%～71.2%)。该结果说明我国11岁儿童可以熟练地完成自然三段论，在自然三段论上的答对率大部分都显著地高于传统三段论，并且在自然三段论上的答对率远远高于以往传统三段论实验的结果[5]。卡方检验的结果显示：我国儿童在自然三段论11个形式上的答对率都显著高于在传统三段论上的答对率。在传统三段论EA1、OA2和OA4上的答对率略高于自然三段论，但是没有显著差异。

根据表2，法国儿童在自然三段论上的平均答对率为72.5%(45.8%～95.8%)，我国儿童在自然三段论上的平均答对率为68.7%(33.3%～88.0%)。法国儿童在10个三段论上的答对率高于我国儿童。对于百分数的显著性差异检验可以近似地采用U检验法，对我国和法国儿童在自然三段论上的答对率做U检验，结果显示：法国11岁儿童在5个三段论上显著高于我国儿童。我国儿童在3个三段论上显著高于法国儿童。对我国儿童比较难的三段论形式对法国儿童也比较难，比如OA4和OA2。对我国儿童比较容易的三段论形式对法国儿童也比较容易，比如AA1和AA4等。总体而言，法国11岁儿童在自然三段论上的表现优于我国11岁儿童。

由表3可知，法国儿童在传统三段论上的平均答对率为48.3%(12.5%～79.2%)，我国儿童在传统三段论上的平均答对率为46.0%(18.4%～71.2%)。法国儿童在7个传统三段论上的答对率高于我国儿童，其中有5个三段论显著高于我国儿童。我国儿童在8个传统三段论上的答对率高于法国儿童，其中有3个三段论显著高于法国儿童。大部分形式的三段论，中国儿童和法国儿童的答对率呈相同态势。即，对中国儿童比较难的三段论形式对法国儿童也比较难，比如AA2、IA2和OA1等形式。对中国儿童比较简单的三段论，如AA1、EA1和IA4等形式，法国儿童的答对率也较高。总体来说，法国11岁儿童在传统三段论上的表现优于我国11岁儿童。

表2 中法11岁儿童自然三段论答对率比较 %

注：a代表无效三段论。*P<0.05

表3 中法11岁儿童传统三段论答对率比较 %

注：a代表无效三段论。*P<0.05

根据上述结果，我们可以得出我国11岁儿童可以熟练地解决自然三段论，在自然三段论上的答对率普遍高于传统三段论。中法实验对比的结果表明：我国11岁儿童在自然三段论和传统三段论上的总体表现低于法国儿童。本次实验11岁儿童在自然三段论和传统三段论上的答对率都高于以往的实验室任务，可能的原因是：第一，每次测试仅测试一道题目，对被试的要求较低。每次只测一个题目是为了让被试在比较自然的对话环境中测试，不作为单纯的逻辑测试。此外，每次只测一个题目还防止了两道题目之间的互相影响。第二，让被试写下选择的理由可能促使被试更多地反思两个选项。让被试写下选择的理由更有利于了解被试选择背后的真相，防止猜题或者误选选项。第三，正式的推理判断题目前有两道题目，或许能够促进被试理解。前两道题目是为了了解被试是否正确理解了对话，因此这两道题目能帮助被试专注于推理。这些措施都是为了开发更适合于测试儿童推理能力的生态环境。

三、讨论与分析

(一)自然三段论与传统三段论

本次实验结果佐证了法国学者的实验结果。实验结果表明：我国11岁儿童可以熟练地解决三段论，并且自然三段论的答对率显著高于传统三段论。自然三段论比传统三段论简单的一个原因是自然三段论与传统三段论属于不同层面的认知过程。自然三段论发生在各种形式的对话中，小前提包含一个存储在长时记忆中两个类别的包含关系，这个类别包含关系是基于经验知识的类别包含关系，而传统三段论的小前提中项的关系是偶然的，因此在解决自然三段论时，这种基于经验知识的类别包含关系比传统三段论中基于偶然的关系更易处理。以往的三段论心理实验都采用了传统三段论，这些实验要求被试在解决问题前先达到对这些问题的某种程度的抽象，从这个角度来看，这种心理实验是一种元认知任务，它们测试的是被试如何在现实生活中使用抽象的形式规则解决问题。这些测试并没有考虑实验的生态有效性，脱离了被试的日常生活实际，构造了一些人为的论证形式。这些实验对于测试人的推理能力作用并不大，它们的作用只是帮助解释人们在解决演绎推理时可以使用哪些方法或者策略。

即使自然三段论比传统三段论更简单，但是不同形式的自然三段论难度仍然存在差异。难度不同的原因是解决不同的三段论形式需要使用不同的策略[3]。Politzer等将这16个三段论分为难度不同的4组。第一组使用了〈EXHAUST〉策略：AA1、AA3、AA4、EA1、EA3、IA3、IA4和OA3；第二组使用了〈SUPPOSE〉策略：AA2、EA2、EA4、IA2和OA2；第三组使用了〈CO-REF〉策略：IA1和 OA1；第四组使用了〈CO-REF〉和〈SUPPOSE〉策略：OAO4。使用〈EXHAUST〉策略要求推理者考虑一个集合的某个元素的某个特征是否可以推广到所有元素。辨别子集和集合关系的这一策略是比较基础的策略，因此难度相对较低。另外两种策略相对来说更复杂一些，〈CO-REF〉策略要求推理者判断具有同一属性的两个元素是否相同，然后避免将该属性归类到集合中的其他元素。〈SUPPOSE〉策略要求推理者先有一个假设性的步骤，这一点与〈EXHAUST〉策略不同。因此，第一组的三段论答对率较高，第二组和第三组的答对率相对低一些。最后一组OA4需要同时使用〈CO-REF〉和〈SUPPOSE〉策略，所以它的难度最大。从本实验的结果来看，〈EXHAUST〉组的8个三段论平均答对率为76.6%(69.6%～88%)，〈SUPPOSE〉组的5个三段论平均答对率为61%(45%～84.4%)，〈CO-REF〉组的两个三段论平均答对率为74.5%(69.6%～79.3%)，而最后一组OA4的答对率最低，为33.3%。这个结果与法国的测试结果一致。

(二)中法结果差异的文化教育原因

实验发现法国11岁儿童在自然三段论和传统三段论上的表现普遍高于我国11岁儿童。法国儿童较高的推理能力得益于法国对哲学教育的重视。十几年前，法国部分学者已经开始尝试在初中、小学甚至幼儿园开设哲学课。在课上，老师们引导孩子思考诸如“什么是不同”“什么是正义”之类的话题，这些课程不仅启发了学生思考问题的能力，也促进了学生语言整合能力和论辩能力的发展[26]。在法国，哲学教育具有公民教育的功能，他们希望藉此能够培养出具有理性判断能力的公民。法国是世界上唯一一个在中学阶段将哲学课作为必修课的国家。法国中学阶段的哲学教育的主要目的在于培养学生的反思精神和批判精神[27]。哲学在19世纪就已经成为法国高中的教学科目。从1840年开始，法国就强化了哲学教育在中学教育中的作用，引入了作文的形式来培养学生的哲学思考分析能力和书面表达能力。法国的哲学课教学没有百科全书式的或者抽象深奥的内容灌输，也不强制要求学生死记硬背，更多地是在老师的引导下启发学生自主思考。

相较之下，我国在哲学尤其是逻辑教育方面相对缺乏经验。曹宇提到“中国有着丰富的哲学遗产，古代中国有用哲学开启民智、激发智慧、强化精神的传统。然而,这种局面在近代改变了，中国人的思辨品质退化了,特别是大众化的学哲学传统逐渐丢失了”[28]。杜国平指出，我国的逻辑教育在大学教育中比较缺乏，在中学教育中没有“逻辑学”的课程，一般将逻辑思维训练渗透在各科教学中，虽然这在一定程度上促进了逻辑思维的发展，但是直接学习逻辑是提高逻辑思维能力的最有效途径之一[29]。“我们现在的教育与清末民初的课程体系相比，一个重要的差异是在高中及其以后的教育中缺乏逻辑教育；我们现在的教育产出和清末民初的教育产出相比，一个重要的差异是缺乏大师。这两者之间是否存在相关性值得探究。”[29]夏素敏指出，一方面，我国对儿童思维、儿童逻辑的研究需求很强烈，另一方面，我国逻辑学界的儿童哲学研究非常少，出现了将“儿童哲学”当噱头的现象[30]。杜国平和邹崇理提出了逻辑在中国振兴的基本途径，强调要充分重视基础教育中逻辑思维能力的培养研究，要推动逻辑教育向中、小学延伸，进而提高国民的理性思考能力[31]。

四、总结

至少从古希腊开始，人们就已经认识到推理实际上是一种有影响力的社会活动[32]。从自然对话中进行论证和推理是人们日常生活中频繁的社会交往活动，儿童推理能力的发展对其从事社会活动有着重要的影响。在过去的10年中，人类推理的心理学研究已经扩展了对自然环境中非形式推理和论证方面的研究，从这个角度看，研究传统三段论和自然三段论任务中使用的论点之间的差异具有重要的理论价值和应用价值[3]。在传统三段论中，论证通常都是孤立的、无目的的，具有传统的表面结构，小前提传达的是新的偶然信息；而在自然三段论中，论证通常发生在对话中，有具体的目标，小前提包括了已知的类别包含关系，大多没有明确的说明，结论也可能不在前提之后。

本次实验对比了中法11岁儿童在自然三段论和传统三段论上的表现差异，实验结果表明：我国11岁儿童可以熟练地解决自然三段论，并且在自然三段论上的表现显著优于传统三段论。与法国儿童比较表明：我国11岁儿童在自然三段论和传统三段论上的表现普遍低于法国11岁儿童。法国儿童在三段论推理上的良好表现得益于法国基础教育中对哲学教育的重视以及崇尚思辩的民族性格，这是值得我们认真反思和借鉴的。

结果还表明：自然三段论比传统三段论更简单。但是不同形式的三段论难度不同，心理模型和Politzer等都给出了难度差异的原因[3,5]，具体到不同形式的三段论，造成难度差异的因素可能有多种，未来还需要进一步进行深入的研究。

本研究仅探索了11岁儿童的三段论推理能力，在未来的研究中可以探索更多形式的有关儿童的推理能力的发展。如今，我国教育高度重视学生逻辑思维能力的培养，对儿童和青少年的逻辑思维能力发展进行深入探究是非常必要的。