道德判断访谈法和问题确定测验的比较述评

2019-12-27陈抗

渭南师范学院学报 2019年5期

陈抗

(宿州学院马克思主义学院，安徽宿州234000)

0 引言

作为道德心理研究的一个重要组成部分和重点内容，道德判断一直备受国内外研究者的关注和重视。其研究历史悠久，早期的传统哲学“思想实验”研究方法得出的结论被实践证明并非绝对可靠，要突破这种困境，研究者开始了新的研究方法转向，并结合其他学科的最新研究成果，尝试探索道德心理的相关问题和内在运作机理，这就是当前被广泛运用的实证取向研究方法。

近年来，随着国内对道德判断领域研究的进一步深入，越来越多的研究已不再局限于对其理论层面进行系统阐述和结构分析，开始向实证化研究方向迈进和发展，以求获得更为翔实可靠的数据支持和内在机理分析的数理支撑，这在一定程度上显示了国内在道德判断领域的研究开始向科学化、客观化和实证化方向发展。这一研究取向的凸显对于国内道德判断研究而言，既是一种可喜的现象，也标志着国内研究开始了国际化并轨，达到了一个新的研究高度。实证研究不可避免地要使用各种量表对道德判断进行测量，但通过对国内相关道德判断研究文献的梳理，结果发现所使用的测量量表较多，较为经典的量表有皮亚杰的对偶故事法、科尔伯格的道德判断访谈法、莱斯特的问题确定测验、林德的道德判断测验。[1-5]大多数量表基本上都是在科尔伯格的道德判断访谈法(Moral Judgment Interview，MJI)和莱斯特的问题确定测验(Defining Issues Test，DIT)两个量表的基础上依据中国实际进行部分修订和发展而来的，但也有一些量表是在借鉴这两个量表的基础上，国内研究者自己编订的。[6-8]由此可看出，道德判断访谈法(MJI)和问题确定测验(DIT)这两个量表对国内研究道德判断的重要性。然而，笔者在对相关文献梳理过程中，发现国内研究者在众多量表的使用和分析过程中存在边界混乱、理论模糊、等同效用等现象较为严重。在一定程度上，这种现象会带来较为严重的问题，使得研究结论的推广和使用出现混同化、模糊化和弱效化。要解决这一问题，必须对道德判断访谈法(MJI)和问题确定测验(DIT)两个量表进行溯本求源，分析它们间的差异，以此来厘清二者间的联系和区别，为国内后续的相关研究作一指引和说明。但就目前国内研究现状而言，针对二者间异同性的专门研究则没有出现，因此，在此进行具体分析二者间的异同点，来区分二者的理论基础、研究框架和具体操作，以避免出现研究的前置性错误，最终解决所得数据结果与研究内容、目标的不匹配，影响结论的使用和推广的问题。

1 研究对象与方法

本文研究对象为道德判断访谈法(MJI)和问题确定测验(DIT)两个量表。研究方法主要采用文献分析法和理论比较分析法。前一种研究方法是对相关文献的查询、收集和梳理，阐述道德判断访谈法(MJI)和问题确定测验(DIT)两个量表的主要理论观点和具体内容。第二种研究方法是通过对道德判断访谈法(MJI)和问题确定测验(DIT)两个量表的比较，来分析二者间的异同，从而加深对二者在性质、理论基础、内容和结构、方法论上的深入理解，为后续相关研究在量表的使用上提供参考和指引。

2 研究结果与分析

通过对道德判断访谈法(MJI)和问题确定测验(DIT)两个量表进行文献梳理、理论比较分析，得出以下结论。

2.1 MJI和DIT在理论基础上存在差异

MJI和DIT量表编制的理论基础均来自于科尔伯格的道德认知发展阶段理论，从这一点来说，二者在理论建构上是同根同源的，二者在理论上均强调道德认知发展的核心地位，认为个体道德成长过程是一个动态的、发展的过程，这一发展过程是以个体的自我建构为主、文化影响为辅的过程。[9]但MJI量表是建立在科尔伯格道德认知发展“三水平六阶段”理论之上的，该理论强调：“个体在其道德发展的每一阶段上只使用一种思维方式，不同级别的思维方式之间有着不可逾越的鸿沟，进入到一个新的阶段就意味着抛弃前一种思维方式。”[3]而DIT量表则针对科尔伯格道德认知发展阶段理论所存在的自身缺陷，采用道德图式来取代“六阶段”理论，该道德图式理论强调：“个体道德认知发展进程并不是从低级阶段直接向高级阶段的上升，而是新旧思维间的转换分配。同时发展阶段与思维并不是一一对应的，而是多种思维并存。”[3]显然，DIT量表的建构理论是对科尔伯格的道德认知发展阶段理论作进一步补充、完善和深化，形成了DIT量表编制的理论基础。

另外，科尔伯格应用道德两难论的方法来研究道德认知发展问题，其实质就是设置道德价值冲突情境让被试来选择及解决，以此来评估、确认为什么某些行为被视为是道德的或优先选择的，从而了解被试进行道德判断所依据的原则及其道德认知发展水平。通过长期研究，科尔伯格得出个体道德认知发展能力是随着年龄发展而不断地向高水平阶段发展的结论，提出了“三水平六阶段”理论，每一水平又包含两个阶段。“三水平”为前习俗水平、习俗水平和后习俗水平，“六阶段”为惩罚与服从定向阶段、工具性相对功利取向阶段、寻求认可定向阶段、遵守法规和秩序定向阶段、社会契约和个人权利定向阶段、以普遍的伦理原则为定向阶段。[10-11]另外认为个体道德判断或推理遵循着一个明确的发展模式，即逐步发展模式。这种发展既不会超越，也不会逆转，具有不可逆性。[12]在某个阶段，个体更倾向被高于他们所处的道德主导阶段的推理所吸引。因此，在科尔伯格道德认知发展阶段模型中，道德推理的发展性评估更有利于预测个体后续的道德发展状况和水平，倾向于对使用的道德原则的认知，而不是对整个道德推理发展过程的评估。

在对科尔伯格道德认知发展阶段理论进一步补充、完善和深化的基础上，莱斯特开发了一个适应道德判断发展过程和模型。该模型与科尔伯格道德认知发展阶段模型存在着以下几个重要方面的差异，这也是在使用MJI和DIT两个量表对个体道德判断测量时所要注意的。

2.1.1 核心概念界定上的差异

科尔伯格和莱斯特在界定道德认知发展阶段时均使用了道德公正概念，但道德公正概念在二者的理论体系中有着不同的内容和诠释。科尔伯格理论主要是在形式主义的条件下(可逆性和普遍性暗示着公正是存在于个体内的)来界定道德公正概念的，而莱斯特理论则突出每一个道德认知发展阶段的公正概念是基于不同的社会合作概念如何被组织的，其理论源于社会正义思想。该思想认为个体来源于集体，个体必须在集体中平衡他/她与别人在利益上的冲突。因此，在社会合作中，公正问题就变成了一个利益平衡问题，并且通过这个平衡来达到一种利益合理分布的均衡状态。这在莱斯特模型中体现为从阶段1遵从规则平衡图式到阶段6的对社会系统中的基于每一成员同时最大化受益图式的发展过程中，在这一过程中每一个阶段都有一个不同的道德公正概念存在。因此莱斯特认为道德思维的形成是基于社会正义通过平衡不同的利益以及在社会系统中权利和责任的分配，最终目的是达成社会合作和社会稳定。另外，在科尔伯格的理论中公正概念更强调权利和责任是通过他人和自己分配给个人的，公正是存在于个体内的；而在莱斯特的理论中，公正则不是。莱斯特认为公正是在社会合作中综合各种利益、权利和责任的均衡和分配来最终作出判断的一种结果。

2.1.2 结构框架建构上的差异

在道德认知发展阶段的框架结构构建上，莱斯特理论模型认为每个阶段都是基于共同期望和平衡图式两个因素的整合，在个体解决道德困境时，所有的反应都被视为这两个因素的功能整合。科尔伯格理论模型则认为每个道德判断都被视为解决某种道德问题、使用一种特殊的理由、凸显一定的社会制度这三个因素交互影响的结果，该模型为所有的反应类型创建了逻辑网格，而不是接受推理阶段的不同表现，这是由于推理过程的内容和结构在框架结构上的差异所造成的。科尔伯格认为发展阶段是独立于哲理上的差别，最有用的分析单元应是个体提出解决道德问题的思考，而莱斯特认为如此微小的差别并不具有心理学意义，认为在不同阶段个体的社会合作思维是按照一对一的关系进行的，而不是按照社会网络系统来进行思考的。

在科尔伯格理论模型中，这些差别代表着内容上的差异(特别是具体信仰上的差异)，又因其阶段划分是结构性的，因此这些差异不能代表道德认知发展的不同阶段。总之，科尔伯格认为在认知结构诱发的基础上，个体的每一反应都是不同的、单独的和分类的；而莱斯特则认为反应范围代表着相同类型推理的不同表现。比如，莱斯特认为虽然阶段2可能会以不同的方式表现出来，但都会包含着相同的概念和组织结构，而科尔伯格理论模型则认为阶段2 不仅与其他阶段不同，而且在反应分数上要低于阶段2B、阶段2C或者阶段3。

2.1.3 认知结构手段上的差异

在个体道德推理的认知结构上，科尔柏格使用了一个“硬阶段”概念，莱斯特则使用了一个“软阶段”概念。科尔柏格认为在特定的时间，个体的推理结构适合某一给定阶段将是具有跨情境的一致性，这一阶段将是给定的、不变的，是一种非连续性的阶段(硬阶段)。即认为对于一个特定道德问题的反应没有混合或交叉阶段，除非作为下一个阶段的短的“过渡”阶段存在。莱斯特在个体如何使用认知结构上则采用了一个“软阶段”概念，认为个体道德推理水平是一个各种思维类型的总和，代表着几个相邻阶段或几个相邻阶段的混合或交叉。因此，个体道德推理所处的阶段绝不是一个给定的阶段，而是一个阶段向另一个阶段的过渡或渐近抑或是一个阶段发展的进行时。总之，莱斯特认为个体道德推理所处的阶段不是一个特定的阶段而是一个正在发展、形成的阶段。

2.2 MJI和DIT在内容和结构上存在差异

如前所述，MJI和DIT均是评估个体道德推理的两个主要的工具方法。为验证科尔伯格理论和道德认知发展阶段，MJI被开发出来。MJI量表本身是一个诱发式和自发产生式的半结构性访谈问卷，主要依据被试的判断推理水平反应进行阶段的归档和评分，间接探明个体的道德认知所处的发展水平和阶段，属于定性测量工具。[3]其初始过程是对被试进行访谈，然后是列出一系列涉及道德冲突的困境让被试依据自己内心判断标准进行自发的道德思考。比如海因兹偷药事件，在药剂师坚持高价卖出药品而海因兹无钱购买时，海因兹是否应该偷药品来救他的妻子，这就涉及保护生命价值和遵守法律价值之间的冲突。而后每个困境被提出来，被试被问及专门设计出为了诱发被试在解决道德冲突时其道德推理的相关信息的一系列开放式、探索式的问题。于是MJI被设计成一种“诱发被试”道德推理的结构，判断对与错的参照或假定道德标准，作出道德决策或证明道德决策合理所使用的信仰和假设的方式。[13]其问题是明确规定以便推出个体应该做什么的规范判断，而不是描述或预测个体将会做什么的规范判断。同时，MJI量表存在只注重被试者能够用语言表达出来的那一部分，却忽略了被试者能理解但无法用言语表达那部分的问题。[3]

随着科尔伯格和同事对MJI的被试反应编码受到较多的质疑之后，MJI评估方法也由原来的结构问题评分法演变为对不同阶段的标准问题评分法。新计分法不仅是对明确和具体的道德认知发展阶段标准的详述和评估，同时也是对每个阶段内具体的、概念化的发展顺序的一种改进性释义。随后科尔比和科尔伯格针对原有的个体道德推理计分问题，发展了一套包括3部分17步骤用来概括描述被试每一阶段分数反应的编码计分方法。这些反应能够使研究者依据个体在解决道德困境时其解释为什么采用某一行为的缘由，来确定个体处于道德推理的某单一或综合阶段。

基于对科尔伯格模型的改编，莱斯特开发了一个非访谈式、确定问题的测量工具，这就是DIT，它属于定量测量工具，是一种以界定两难故事的确定性特征作为测量被试道德判断能力的基础，以简短句子为特征的标准化的测量工具。[3，14]

DIT不依赖于个体的言语技能来评估道德推理，它包括6个假设困境，其中3个是源自于科尔伯格的两难困境，用来确定个体道德推理技能和水平，这些困境包含各种各样的社会问题。在DIT测试过程中，被试通过对用以描述关于道德困境的一系列道德推理不同阶段原型的语句内容进行重要性评级和排序，并且在评估之前研究者要对被试的评级和排序进行一致性检验，以确定被试回答反应的可信度和有效性。所以，DIT量表不像MJI量表那样，让被试“开放式”地自由阐述自己的观点以及选择的理由，最后由研究者根据被试的表述与各阶段的特征一一对应，从而决定被试所处的发展阶段，而是事先将各阶段的典型观点写出，呈现给被试，让他们对这些观点进行分级和排序，从而确定其道德类型。[3,14]DIT初始版本包含6个假设困境，后来精简本包含3个假设困境，这是通常所使用的DIT-1。明尼苏达道德研究小组于1999年对莱斯特的DIT进行改进，发展成为DIT-2。DIT通过对个体在解决道德两难困境时对涉及阶段5和6推理的问题内容的重要性排序来计算这两个阶段推理分数之和在排序整体分数中的百分比来评定个体道德决策水平，这个分数称之为P分数或P指数。后来戴维森设计出一个新的评估指标，即D指标，它是一种个体对道德两难困境作出反应时基于双中心项目评分的经验加权和的计算。在DIT-2中，又引进了一个N分数或N指数来评估个体道德决策水平。但是在对个体道德决策能力评估时使用非访谈式评估方法存在一个潜在的难题，那就是个体存在着因自我高估或自我掩饰而造成个人评估分数提高的现象。这一问题在MJI测量中不会存在，因为MJI测量被试所形成的反应不像DIT测量的那样使用了一套典型的可能性语句陈述。但雷斯特本人认为这种潜在的问题在DIT中不可能出现，这是因为在DIT测量中使用了测谎手段来测量被试的反应是否真实，从而对不符合测量要求的被试进行筛选，这就是M问题的应用，它用来检测被试对测试问题反应时是否存在说谎以及对DIT测量要求的理解是否存在误解。

2.3 MJI和DIT在方法论上存在差异

虽然MJI和DIT之间的相关性存在着高度的可靠性[15]，但二者在许多方面还存在着方法论上的差异，主要体现在以下方面。

2.3.1 测量内容上的差异

MJI的测量是一种生产性任务，即被试的道德反馈不是由研究者或问卷本身激发出来的，而是允许被试在对道德两难问题解决时自发地进行个人道德理性建构，因此这种对于被试道德推理过程的评估方式，相对来说可能在道德推理的形成上更加符合个体的真实状况，但由于其过程的主观性较强也为研究带来较大的挑战。DIT的测量是一种再认性任务，在DIT的测量中，被试面对的是一系列的假设困境和一系列对不同道德认知发展阶段推理的限定性问题陈述，被试只需要对问题内容的重要程度进行评级和排序，不像MJI测试对研究者和被试有较高的要求，所以实施起来就相对容易，因此莱斯特认为DIT在更高级道德推理的可信度上要超越MJI。[16]同时大量的相关研究也表明，在科尔伯格的MJI测量中被试的阶段5和阶段6的推理能力很难显示出来，而在DIT测量中则能很好地显示出被试在道德认知发展阶段5和阶段6的推理能力。因此在近年来的MJI测量研究中不再包括对阶段6推理能力分数的计算，这就要求研究者在比较运用不同的研究方法所获得的结果时要注意这种差异性，以免比较不当或将研究结果扩大化。另外，依据 “个体在进行道德判断时，首先会根据要点以直觉的方式进行判断，随后当要求给对其道德选择方案进行判断时，需意志努力的认知过程便会启动，这时个体会采用回溯性推理为之前的道德判断寻找依据[17]”这一模糊痕迹理论观点，在MJI测试中个体对个人的道德理性建构会出现上述现象，而在DIT测试中则不会出现。

2.3.2 量表管理使用上的差异

在MJI和DIT量表的管理使用上，二者对研究者和被试的要求是不同的。在对研究者的要求方面，MJI量表在使用之前，要求研究者必须具备量表测量的相关培训和训练，具备一定的测量技巧和技能。同时，由于研究者和被试在访谈的过程中是面对面进行口头的访谈，因此这一研究方法相对于其他的测量方法有诸多的不便：一是MJI是一种个别谈话法，在测量的过程中需要占用大量时间，导致测量过程因时间的关系而出现一些不受个人意志为转移的意外事件的发生，同时也会因时间过长导致被试疲劳，有可能致使测量准确率降低等，同时也不适用于团体测验；二是这一研究方法对研究者本身要求较高，不仅需要研究者对测量本身及测量步骤有较深入的了解和把握，同时也要求研究者有较高的沟通能力和访谈技巧，还要有对访谈结果进行专业化处理的能力等。在被试的要求方面，主要是在言语表达上的要求，要求被试能熟练、准确、清晰地表达自己内心的思维逻辑发展过程，这就要求被试在访谈的过程中，既要主动配合研究者的访问，又要付出一定的努力来思考访谈的内容和解决问题的方式、方法。显然，这对于年龄小、不擅于语言表达的被试不适用。而DIT测量则没有这方面的限制和约束，它是限制性的问题确定标准测验，使用的评分方式是李克特评分方式，被试只需要依据自己内心倾向判断标准去选择符合自己内心选择的评分就行了，不需要较高的言语表达能力和一定的努力付出。但DIT同样存在被试年龄限制问题，它一开始设计时就规定被试年龄是在12岁以上。总体而言，在量表的管理使用上，MJI就比DIT更加复杂和难以管理，在某种程度上致使MJI应用受到诸多限制，不利于MJI的推广使用。

2.3.3 数据结果统计和分析上的差异

MJI的评分方式是对被试自由回答的内容进行编码分析，然后再依据被试反应内容与科尔伯格道德发展理论的“三水平六阶段”相比对，对被试所处的道德认知发展阶段进行评定。这一过程较为复杂，处理起来需要研究者具有较高的编码能力和内容转换能力。针对此，科尔比和科尔伯格在1987年专门开发设计了一个17步骤的评估程序来处理。[18]后来韦伯又开发设计了一套相对简化的评估程序来避免17步骤评估程序在评分上的烦琐性[19]，但MJI的评分程序依然较为复杂和烦琐，不利于调查数据结果的统计。而DIT则采用百分比式的评分标准，评分方式为李克特评分方式，因此较为简便，有利于调查数据结果的统计。同时DIT在评分时针对自陈式量表自身出现的常见问题，比如数据缺失、被试对指导语的理解错误、回答问题的夸大效应等，都作出相应的应对措施，有效地避免了自陈式量表在调查统计方面的自身局限性，如M分数的应用和对被试的评级和排序的一致性检验等。

另一方面，MJI评分只是评估被试所处某一道德认知发展阶段，是用来直接评估被试在解决道德困境时的一种具体的认知结构，其评分是一种离散式的、等级序列的数据，属于非连续性数据，在统计分析中因其数据自身的特性很难进行复杂的、数据性的分析，只能依据研究者对数据结果和科尔伯格道德认知发展阶段理论进行比对来分析。DIT的评分指标无论是P分数还是N分数均是一种评估被试使用更高水平(后习俗水平)推理的倾向性预测指数，是一种加权平均指数，属于连续性数据，在统计分析中更利于复杂的、数据性的分析，比如方差分析、回归分析或者是其他参数分析以及模型建构等，这就为研究向纵深化、内在化和量态化发展提供便利。

2.3.4 信度和效度的比较

总体而言，MJI和DIT量表在最初的版本中都具有很好的信度和效度。[16,18]MJI标准问题评分法始终显示其信度在一般可接受水平范围之内，其效度因其量表本身内容的修正而在不断发生变化，但都在统计学可接受水平范围内。[20]大量涉及不同人群的DIT研究结果表明：DIT量表在内部一致性和重测信度上同样在可接受水平范围之内。[21]由于MJI和DIT两个量表本身的性质不同，加上两个量表因其在实际研究中由于理论基础和研究内容的不同而致使其本身发生了一些相应的变化，这就导致两个量表在信度和效度方面很难去比较孰优孰劣。

3 结论与建议

通过对MJI和DIT两个量表间异同性的比较，得出以下结论：

(1)MJI和DIT是两种不同性质的量表；

(2)MJI和DIT两个量表在核心概念界定、结构框架建构和认知结构手段理论基础上存在差异；

(3)MJI和DIT两个量表在内容和结构上存在差异；

(4)MJI和DIT两个量表在测量任务、量表管理使用、数据结果统计和分析上存在差异。

基于MJI或DIT量表上述的差异，希望研究者在实际工作中对这两个量表进行使用时，应注意以下几点：

3.1 应充分认识两种量表背后概念的差异

DIT量表在评估个体道德思维倾向上使用了基于社会合作的公正概念，而MJI则使用了更多关注基于一般和不可逆道德原则下的交换或信赖的公正概念。在量表选用时应认识到方法背后概念与研究对象、内容的匹配性和一致性，否则会导致因使用方法的不当致使获得的数据结果与研究初衷出现南辕北辙的现象。

3.2 应充分注意两个量表关于内容和结构的不同关系

MJI只强调了内容，没有强调结构，认为个体思考所代表的内容与个体的道德认知发展水平、道德结构无关，强调的是个体道德认知发展“硬阶段”属性。DIT不仅强调了内容的重要性，还强调了结构的重要性，认为个体思考的类型暗示着个体道德认知发展水平，强调的是个体道德认知发展“软阶段”属性。这一内容和结构的关系差异会对研究数据结果的解释造成不同的影响。

3.3 应充分认识两种方法在任务上的差异

事实上，两种量表为被试提供了两种不同类型的任务，因此在数据的解释和比较过程中就会呈现显著的差异，研究者应充分考虑每个量表潜在的偏好以及在得出结论时每个量表的潜在局限。同时还要注意DIT量表因其是再认性任务，可能会导致提供倾向于道德推理水平高端的结果，而MJI量表因其是生产性任务，可能会因被试的语言能力问题而导致对其认知技能评估的夸大或降低现象。

3.4 应充分关注两个量表在测量过程中被试反应过程上的差异

个体的道德推理过程不仅是一个认知过程，而且也包含了直觉、情感因素。[22]因MJI测量是访谈性质的，被试在解决道德困境过程中是依据自己内心标准自发地作出判断和解决问题的，在这一过程中既有被试的理性因素在发挥作用，同时也有被试的直觉、情感因素在发挥作用；而DIT测量是限定问题的定量测试，被试只是对早已设置好的确定问题进行重要性评级和排序，这在一定程度上限制了被试的直觉和情感因素在道德判断中的作用发挥，同时也限制了被试其他判断思维和解决问题的内容表达，这些需要研究者在选择使用量表时应充分考虑。

3.5 应注意两个量表在应用上的差异

MJI属于定性测量工具，适用于心理咨询与心理疏导、治疗以及心理教育领域，比如具体适用于道德心理学领域专业测试、开放式、非结构式的个体访谈测试、对个体某一具体道德认知的片段式测试以及对个体整体性道德推理的测试；DIT属于定量测量工具，适用于大规模实证研究、纵向研究以及大数据技术分析领域，比如具体适用于密闭式、结构式的大规模的测试、对个体道德认知阶段连续性的测试。

总之，对MJI和DIT两个量表的比对分析，目的是让未来的研究者对这两个量表有一个清晰的认识和了解，也为将来的相关研究提供理论参考和方法论指引。但应注意MJI和DIT两个量表源自西方，表述语言为英语，这就需要国内使用者在使用量表时不仅要注意翻译量表的语言表述问题，还要注意量表自身内容与中国被试实际相匹配的问题，只有这样才能真正发挥这两个量表的实际功用。另外，本研究也存在一些不足，没有从实证的角度对MJI和DIT使用同一调查对象进行比对研究，从而分析二者间的信效度和适用性上的差异；没有对MJI和DIT后续衍生量表进行引介和比对，这均将在以后的研究中进行系列的、深入的研究。