性别、意图与道德判断<br/>——一个实验哲学报告

性别、意图与道德判断
——一个实验哲学报告

2021-03-10郭喨

西南民族大学学报(人文社会科学版) 2021年3期

郭喨

[提要]性别是否会影响人类的意图和道德判断？为考察性别、意图与道德判断的关系，通过218个样本的实验，发现：(1)“危害”与“改善”的意图之间存在显著的不对称。在统计学意义上证明“诺布效应”在中国文化语境中依然成立。(2)无论被试具体性别如何，都存在将结果的道德性纳入到意图中进行考量的特点。(3)男性、女性在意图相关的道德判断上有所不同，无论是“危害”还是“改善”情境，男性对“有意性”的判断均显著高于女性，男性可能对“意图”的认定有着更为宽松的标准。可见，至少男性和女性的部分“道德判断”不尽相同，“性别”在我们的道德判断中扮演了一个不容忽视的角色。

一、意图、责任与道德判断

意图与责任之间有着怎样的关系？这很早就引起了人们的兴趣。

责任(Responsibility)通常被视为伦理学的核心概念。从词源的角度看，它源于拉丁语中的respondere，本义为“回应”或“回答”。[1](P.24)不过，从日常生活经验的角度合理推测，它应该很早就在我们人类祖先的部落生活中扮演着重要角色：失手放走了合围的兔、怎样分配打到的鹿，“责任”必然要出场。“意图”(Intention)则是哲学中另一个经典的主题。在此，我们暂不关心意图被“加括号”悬置的方式，只在一种“民间心理学”(Folk Psychology)的意义上使用“意图”一词。①我们将报告公众对特定行动的“有意/无意”之“意图”的判断，它对“责任”的归属和道德判断具有重要影响。

实验哲学家约书亚·诺布(Joshua Knobe)在2003年率先提出了人们对“有意行动”的判断不对称的现象[2][3]，这引起了哲学界广泛注意，以致于该现象在后续研究中也被称作“诺布效应”(Knobe effect)②。诺布效应是一种“道德效价影响行为意图判断的现象”，一般被视为“道德判断对意图的反作用”即“坏结果的有意性”规律：

当结果是好的时候(help condition)，人们倾向于认为实施者是无意而为的；当结果是坏的时候(harm condition)，人们倾向于认为实施者是有意而为的。

诺布效应自提出以来得到了多重验证，“有更多的研究利用与Knobe该研究类似的材料证实了该现象的稳定性和显著性”：从发生学角度看，人类儿童4岁就开始表现出这种判断的不对称性；从跨文化角度看，印度人也具有此种不对称判断。[4](P.92)就整体而言，中国文化之外的实证经验证据广泛支持了这一结论。

二、关于性别、意图与道德判断的实证研究

由于意图与道德判断的密切关系，我们决定在东方文化环境中对道德判断相关要素进行实证考察。此前国内杨英云等曾进行过一次考察，并且获得了一些有益的结论：

(1)诺布效应也适用于中国语境，行为的性质会影响人们的道德判断；(2)“坏的结果”情况下，道德义务和道德责任起主要作用；“好的结果”情况下，出生地、专业、道德义务等起主要作用；(3)道德责任判断影响意图判断，道德责任判断视角可以解释诺布效应的产生。[5](P.34-36)

同时，我们也发现该研究存在一些明显的局限。作者“采用当场发放问卷并回收”的方式(推测应为纸质问卷)获取数据，全文未交待对问卷内容进行随机化处理，因此几乎不可避免会受到顺序效应的影响。特别是作者全文分析未报告样本具体数量而只报告了“总量”(“问卷共分为六种”，被试“共480名”)，可能导致推出关键结论的具体样本量偏少而影响信度。③另一方面，选择出生地等因子略显随意，“出生地”的影响几乎可以确定为假阳性结果。以上那些操作不符合严格的统计要求，可能也不满足实验哲学的实证标准。

因此，我们决定另行展开实际样本容量更大的实证，对中国语境中的效应进行符合统计标准的考察。我们进行了样本总量为218的实证研究，样本中性别分布为：男性71名，占比32.57%，女性147名，占比67.43%；年龄分布以青年为主，19-25岁的居多数，共188名，占比86.24%；被试学历背景以本科或在读本科为主，计152名，占比69.72%；被试的高中知识背景中，文科、理科正好各占一半，各有109名占比50%。为了便于与西方语境的实验直接比较，研究采用的案例是诺布效应经典版[2]。所有被试同时参与了两个测验(“危害版”与“改善版”)，实验中对两个版本中的选项进行了随机化处理以避免“顺序效应”的影响。实证通过“问卷星”(www.sojump.com，当前网址已更改为www.wjx.cn)具体实施。除了以更大的样本检验诺布效应在中国语境中是否成立这一“定性”之外，也进一步定量了考察对应主体需要“负责”或者“载誉”的强度——这是诺布效应的“定量”维度；还将考察性别对意向性的影响，后两者此前未见文献报道。

具体问卷如下：

危害版(版本A)

一位公司的副总裁到董事长面前，说：“我们正在考虑开始一项新的计划。它将帮助我们增加利润，但它也会危害环境。”

董事长回答：“我才不管什么危不危害环境。我只想获得尽可能多的利润。让我们开始这项计划吧。”

他们开始了这项新的计划，环境果然被破坏了。

改善版(版本B)

一位公司的副总裁到董事长面前，说：“我们正在考虑开始一项新的计划。它将帮助我们增加利润，还会有益于环境。”

董事长回答：“我才不管什么有益于环境。我只想获得尽可能多的利润。让我们开始这项计划吧。”

他们开始了这项新的计划，环境果然从中受益了。

对危害版(版本A)，我们的提问是：“这位董事长是不是有意危害环境的?”对改善版(版本B)，我们的提问是：“这位董事长是不是有意改善环境的? ”这是对“意图”的考察。除此之外，与国内外其他研究不同的是，我们还增加了“定量考察”的部分，即分别要求“认为有意危害环境”的人判断“如果是有意危害环境的，那么这位董事长应该为此负多大的责任？”要求“认为有意改善环境”的人判断“如果是有意改善环境的，那么环境的改善应该在多大程度上归功于这位董事长？”量表采用likert 7点制量表。危害版(版本A)中，数字即星星的个数(为对被试更加友好，采用了可视化的方式即将责任点数与对应五角星个数并列，被试直接点选星星个数即可)越大，代表所需要负的责任也越大。数字“1”和“7”分别代表“无需负任何责任”与“需要负全部责任”,从“2”到“6”的数字代表所需负的责任逐渐成比例提升。改善版(版本B)中，数字“1”和“7”分别代表“无需任何归功”与“需要完全归功”,从“2”到“6”的数字代表所需归结的功劳逐渐成比例提升。

(一)“意图”对“道德判断”的影响

在此我们考察：在中国文化中，“诺布效应”是否依然成立？结果非常有趣。

图1 “危害环境”的意图

图2 “改善环境”的意图

由图可以直观看出，“危害”与“改善”的意图之间存在着显著的不对称，“危害环境”的意图明显大于“改善环境”的意图。换言之，“诺布效应”在中国文化环境中依然成立。不过，有趣的是，两种情况下，持“有意”判断的公众都没有超过总体的一半。事实上，这一结果是启发我们获得一个重要发现的关键。

此外，即使都是“有意”的，危害版(版本A)与改善版(版本B)意图的程度也有所差别。董事长需要“负责”的程度大于他应该“载誉”的程度。在7点制likert量表中，前者的均值为5.76 而后者的均值为4.86，差异明显。因此，“诺布效应”不仅有定性的维度，还有定量的维度，而后者为本文首次报道，值得引起重视。

(二)“意图”判断上的性别差异

我们注意到关于性别与道德判断之间关系的复杂有趣图景。在目前可见的不少实验研究中，无论中外文献，多数场景都得出了“性别对于道德判断无重要影响”[6]的结论。④例如，徐迪在一项样本量为150的2×2水平的实验中指出，“本研究中，男女大学生道德判断取向不存在性别差异。”[7](P.31)邢强在更早的一项研究中认为，男女两性的道德判断“大同小异”，认为性别相关的道德判断差异可以归结为情境因素，[8](P.69)试图将这一差异淡化或者抹煞。此说法的问题在于，首先没有确切的数据的支持，其次逻辑上也不连贯：无论道德判断存在性别差异还是跨性别一致，都是由“研究所假设的情境引起的”——要么承认这一事实，要么就连其主张的“道德判断的跨性别一致”也要一起否定掉。在一些具体的场景中，性别对于道德判断的影响证据是确切的，难以否认——本文将呈现这类证据。

关于道德判断性别差异的原因，研究指出，可能是男性更关注“公平”而女性更注重“关怀”。女性更偏向于“关怀推理”，而男性更偏向于“正义推理”。进一步的研究指出，这种差异受到文化的影响[9]：在一种男性更多将自己视为“独立个体”而女性将自己视为“广泛联系的一部分”的文化背景中时，这种差异就会出现。⑤因此，尽管不少场景中的道德判断缺乏“肉眼可见”的性别差异，然而众多场景中这一差异的确存在。

实际上，“道德判断”经常是复杂的，不仅仅体现在性别方面。“评价自己与评价他人、自己决策和为他人建议、与自身相关和自身无关等不同的条件下，道德判断明显存在差异。”[10](P.1，P66)由于注意到性别属于基本的人口统计学变量之一，且越来越多的实证研究表明，男性与女性甚至存在大脑本身构造(如脑区面积、神经元密度、连接性等)和认知上的根本差异⑥；因此，我们重点考察了性别变量对有意性和归因强度的影响。

实验中我们没有人为控制性别比例，问卷回收完成发现218个样本中女性占据了147名而男性仅有71名；不过这一性别差异不会对数据分析产生危害，只会对一些描述性统计(descriptive statistics)结果带来影响——例如前述的“危害环境”意向没有超过半数就与男性样本偏少有关；根据数据分析，更多的男性样本存在会使“危害环境”的意向超过半数。

在“危害环境”和“改善环境”的意图上，存在显著的性别差异。

表1 这位董事长是不是有意危害环境的?

表2 这位董事长是不是有意改善环境的?

交叉分析结果如下：

(1)被试内效应显著。即无论性别如何，公众都存在将结果的道德性纳入到“意图”中进行归因考量的特点。前文表明，诺布效应在中国文化的整体人群中成立；而本处则进一步表明：诺布效应对中国文化环境中的男性、女性均有效。

(2)被试间效应明显。即男性、女性在与意图相关的道德判断上存在显著不同。F(1,16)=7.141，P<0.01(P=0.007⑦)。容易看出，无论是“危害”还是“改善”，男性在“有意性”的判断上均显著高于女性；在“危害环境”的有意性判断上是女性的1.46倍，而在“改善环境”的有意性判断上是女性的2.07倍。(提请注意，这是相对强度，不是绝对强度。)这一“有意性”上的差异是同类研究中的首次报告。对此，一个可能的解释是，较之男性，女性更擅“移情”(empathy)且更具“亲社会性”(prosocial)，毕竟，“女孩在移情及亲社会行为表现上明显优于男孩。”⑧将带来不良后果行为的意图判断为“非故意”显然是一种“亲社会”的做法。我们推测，男性可能对“意图”的认定有着更为宽松的标准。实证支持的性别相关的“有意性”差异将是对思辨哲学“意图”问题上大量思考的一个有益补充，同时也表明，简单地将人群集合起来讲“集体意图”的习惯做法可能是有害的，这一“传统方法”获取的某些结论可靠性存疑。

(3)认为“危害环境”和“改善环境”情况下都需要董事长负责/载誉的群体中，性别无差异。F(1,29)=5.044，P=0.033。即，无论男性女性，都存在一定比例的“强负责”观(可以近似理解为“偏极端”)人群，此类被试对他人有着较严格的要求，同时在中华文化环境的人群中占比稳定。公众中稳定存在着一定比例的偏极端观点的人，这是一个合理外推。

三、男性和女性的“道德感”不尽相同

前述的发现此前未见哲学研究者报告。我们认为，其中最值得关注的一点是，“性别”在我们的道德判断——至少是某一具体的判断中扮演了一个重要的角色！这表明，男性和女性的“道德感”不尽相同，“道德哲学”局部可能是性别相关的——这些部分可能比我们此前预计的更加广泛。⑨其主要动因包括如下两点。首先，一项对儿童的实证研究表明，“道德判断、移情和性别也存在着交互作用，经分析，当道德判断、移情水平都较高时，女孩的亲社会行为表现显著多于男孩。”[11](P.79)换言之，性别对人类的道德行为存在影响(而且多数研究表明，女性是更加“亲社会”的)。其次，相关实验指出，男性与女性在知识广度、言语抽象、概括、理解能力方面，以及空间知觉、知觉运动速度、视觉空间理解、分析综合的能力等方面均有所不同。[12](P.416)由于责任归因与道德判断涉及基本的认知、理解和价值判断，因此，存在性别对意图与道德判断的效应是很自然的，不存在反而是奇怪的。

当然，我们也有理由认为，其他一些因素特别是社会经济地位(social economic status)如经济收入、教育水平和职业状况，以及年龄等要素也会在人类的意图判断中扮演各自的角色。社会经济地位对人类道德判断和道德行为的影响被严重低估了，值得进一步研究。在这个学术资料获取异常便利的时代，无根的“哲学思辨”、虚浮的“哲学想象”实在是太多了——多到理论赖以建立的哲学事实严重短缺。我们对责任归因和道德判断的“实然”问题——这些基础的道德哲学事实，[13][14]非常感兴趣——这乃是“应然”的必要前提。进一步的探查将有助于我们收获更加精细的道德判断地图，不过就本文而言，我们的目标已经达到了，即向伦理学和道德哲学的研究者如实汇报：性别在道德判断至少是意图问题上扮演着重要角色，男性和女性在意图相关的道德判断上显著不同。其哲学意蕴在于，某些关于“人类”道德判断的全称命题至少需要改写为“X%的男性/女性认为……”这样的方式才能继续保持其真值；同时也把一些虚浮无根的“哲学想象”拉回地面——这是一个虽然很小然而扎实的道德哲学进展。

注释：

①“民间心理学”(Folk Psychology，又称“常识心理学”)与采用具体的理论或系统地实验的“科学心理学”(Scientific Psychology)有所不同，然而两种心理学都主要地服务于帮助我们正确地预测和解释行为。参见：Knobe J. The concept of intentional action: A case study in the uses of folk psychology[J]. Philosophical studies, 2006, 130(2): 203-231.在“民间心理学”的意义上使用“意图”并不是要采用一种非科学的方案，而是采取一种“大众理解”的方式使用“意图”概念，即关注“有意/无意”性。这也是关于“诺布效应”考察的常规做法。

②“诺布效应”(Knobe effect)有时也被称作“副作用效应”(side-effect effect)，包括发现者在内起初都试图如此解释(可能也有谦虚的成分在内，毕竟作者一般不以自己的名字命名自己的发现)。但是随着研究的深入，人们发现，“副作用效应”仅仅表达了研究者对诺布效应原理的早期理解，而且不够全面。因此除早期外，近年来的研究已不再使用“副作用效应”这一提法。

③例如，为了有效地说明一所有2000人的学校的“一般状况”，在95%的置信水平上，以±10%的估计精度，也至少需要取样92人。文中作者对取样的描述较为复杂，6个问卷总量为480，由于“问卷3”“问卷6”与其他问卷具有包含关系，推测单一问卷样本量可能超过80但依然偏少。样本偏少容易导致随机误差渗入结果中，获得的结果归于随机误差的概率比较大。

④在一个评述中，通过元分析(metaanalysis)，Walker的结论是：“the overall pattern is one of nonsignificant sex differences in moral reasoning. ”

⑤在这篇影响巨大的论文中，作者指出，美国的男性被认为可以形成和维持独立的自我建构，而女性则被认为可以构建并维持相互依存的自我建构(an interdependent self-construal)。

⑥参见VanRyzin J W, Marquardt A E, Argue K J, et al. Microglial Phagocytosis of Newborn Cells Is Induced by Endocannabinoids and Sculpts Sex Differences in Juvenile Rat Social Play[J]. Neuron, 2019.论文指出，大脑性别差异在胚胎发育的早期就已出现，雌雄小鼠出生时大脑杏仁核存在差异，同时会受到雄性激素的影响，进而影响到小鼠的行为控制与社会活动。

⑦“只关注P<0.05的时代应该过去了。”为响应APA的号召，在此我们同时报告具体的P值。

⑧参见丁芳：《儿童的道德判断、移情与亲社会行为的关系研究》，《山东师大学报(社会科学版)》2000年第5期，第80页。“移情是个体由真实或想象中的他人的情绪、情感状态引起的并与之一致性的情绪、情感体验，是一种替代性情绪、情感反应能力。”

⑨“不尽相同”意味着我们承认还存在着相当广泛的部分是一致的，然而我们反对对性别差异的刻意无视。实际上，哪怕只有一个可靠的反例存在，我们就只能拒绝“道德判断无性别差异”的结论。