动态系统累积变量判断中的关联启发式*
2018-02-04王晓庄王思聪牟伟莉张建娥尹文超
王晓庄 王思聪 牟伟莉 张建娥 尹文超
(教育部人文社会科学重点研究基地天津师范大学心理与行为研究院, 天津 300074)
(天津师范大学教育科学学院, 天津 300384)
1 引言
随着人口、城市化和气候变化等问题的加剧,经济和生态环境可持续性成为全世界关注的热点。而可持续性发展在很大程度上与人的可持续性决策密切相关。有研究提出管理者可持续性决策认知加工模型, 考察影响可持续性决策的个体心理因素, 研究多采用静态的实验或测试情境(Eberhardt-Toth & Wasieleski, 2013; Gallego-Álvareza &Ortas, 2017)。然而, 经营管理和生态环境是动态而持续的, 这就需要破解动态系统中影响可持续性决策的因素, 特别是造成判断偏差的心理原因。
累积变量(accumulation variable)是指可随时间递移而积累或减少的事物, 既包括可见的, 如资金、产品、人员数, 也包括不可见的, 如压力、认知负荷等。累积变量的变化体现在随时间递移而产生的流量和存量变化。流量是事物在单位时间内量的变化速率, 包括流入和流出量, 二者均可产生增加、减少等变化。存量是状态变量, 是累积变量在某一时间点上的累计状态, 如库存量等, 为决策和行动提供信息基础。人员流、信息流、资金流、设备流、物料流及订单流, 构成组织系统运作的基本结构(Forrester, 1961)。在气候变化、环境治理等动态系统中, 包含了废气、污水、气温等更为多样的累积变量, 只有对其流量、存量及之间关系的正确感知和决策, 才能保持系统运行的可持续性。
然而, 人们对于累积变量的判断常出现偏差,其实质是对存量、流量数值间关系的错误估计,有研究称其为“存−流量错误” (Stock-Flow Failure,简称“S-F 错误”) (Diehl & Sterman, 1995)。S-F 错误主要有三种形式:将流量值(轨迹)判断为存量值(轨迹)、将存量值(轨迹)判断为流量值(轨迹)、将净流量(轨迹)判断为存量值(轨迹) (Sterman, 2008,2012; Ranney, Clark, Reinholz, & Cohen, 2012)。可见, 累积变量判断偏差以不同形式的 S-F错误表现出来。
Cronin, Gonzalez 和 Sterman (2009)提出, 累积变量判断偏差是由关联启发式(Correlation Heuristics)导致的。关联启发式是进行动态系统累积变量判断时所采用的一种错误的、自动化的思维模式。在这一思维模式下, 将存量与流量(流入量、流出量、净流量)之间建立正相关关系, 认为存量的运行变化特征与流量的变化特征具有相似性。由于使用了关联启发式, 就将存量与流量的数值之间建立起简单匹配与对应关系, 导致判断偏差(Dutt& Gonzalez, 2012b; Fischer & Gonzalez, 2016)。
关联启发式是从认知加工视角提出的导致累积变量判断偏差的一个新的概念。那么, 关联启发式导致判断偏差的心理机制是什么?受哪些因素的影响?如何减少这一思维模式对累积变量判断的负面影响?由于对关联启发式研究的历史还不长, 研究结论还不尽一致。本文在总结已有研究基础上, 对有关问题予以思考和分析。
2 S-F错误与关联启发式
2.1 S-F错误:累积变量判断偏差的表征
关联启发式所导致的判断偏差以不同形式的S-F错误表现出来。
2.1.1 出现S-F错误的任务情境
回顾以往研究, 检验 S-F错误的动态系统情境可分为多特征交互任务情境(multi-faceted task)和简单任务情境(simple task)。早期多采用多特征交互任务情境, 随着对 S-F错误与关联启发式研究的深入, 涌现了许多基于简单任务情境的研究。
(1)多特征交互任务情境
多特征指动态系统中包含多个累积变量、两个以上对累积变量变化产生影响的因素(如, 信息延迟、运输延迟、流量或存量的非线性变化、多重反馈等)。交互指多元决策主体及其行为相互连带和制约。如, Sterman (1989a)的啤酒产销实验,四类决策主体在有延迟因素的系统中进行 36周产销决策, 他们应合理地管理订单和库存, 使总成本最小化, 避免积压或欠货带来的成本损失(如图1)。
起先, 市场需求平稳, 库存和供货是保持一个稳定数量的(如, 每个零售商保持库存4箱、每周接货4箱; 经销商保持库存12卡车、每周接货4卡车), 但由于市场需求增大, 而供货又有 4周的生产和运输延迟, 零售商们从第 6周开始出现欠货。为了补充欠货和库存, 随着周数的推移, 零售商们下订单量越来越大, 进而引发批发商和经销商增大下单量、生产商加大产量的连锁反应。第9至13周, 订单持续增加, 进货缓慢增加, 库存持续赤字。而到第14、15周, 进货大量增加, 积欠数字终于开始减少, 但随着之前订单陆续生产和到货, 各类决策主体的库存均持续超出基本库存量, 货物积压的平均成本损失高达最佳水平的10倍。在任务情境中再加入反馈因素, 被试出现了更大偏差, 绩效比最佳水平差19倍(Sterman, 1989b)。
S-F错误在复杂任务情境中得到反复验证(Moritz, Hill, & Donohue, 2013)。如, Brehmer (1990)采用森林灭火模拟系统, 被试作为消防队长调度消防设备前往现场灭火。向被试动态呈现火灾蔓延与控制效果等反馈指标。由于下达调度命令到接到火情反馈之间有时间延迟, 多数被试出现决策失误, 造成火势严重蔓延。Jensen和 Brehmer(2003)的一项包含狐狸−兔子作为捕食者−猎物系统平衡实验, 向被试呈现兔子和狐狸每年的繁衍量、数量消长等指标, 让被试估计两种动物生态平衡的理想数量。在有反馈的条件下, 62.5%被试出现估计错误。
可见, S-F错误在复杂系统具有共性和易发性。而由于情境因素的多样性, 被试常常将错误归因于决策主体交互、延迟和信息超载等情境因素, 而忽视对自身心理偏差的认识和反思。
图1 啤酒产销决策系统
(2)简单任务情境
S-F错误在由一个累积变量构成, 不包含反馈、延迟或非线性变化等因素的简单情境中也得到反复验证(Sweeney & Sterman, 2000; Cronin &Gonzalez, 2007; Sterman & Sweeney, 2007)。
Sterman (2002)的商场顾客量“四问任务”是经典的简单任务情境(如图 2)。折线图呈现 30分钟内进入和离开的顾客数, 被试依次回答问题Q1-Q4。其中, 进入量和离开量的最大值是流量的“极值点”, 某个时间点上净流量的最大值(进入和离开人数差值最大)为“Gap区”。58.3%被试认为第 8分钟商场内人数最多, 即将最大净流量作为存量值; 56.5%被试认为第21分钟商场人数最少,即将极值点即流量值作为存量值。
有研究采用浴缸水流、油箱流量、公司资金流、财政赤字与国债量、医院患者流量、停车场流量、人体体液与骨组织细胞量等简单任务情境。答题形式既有数值估计问题, 也有请被试画出存流量变化轨迹的画图问题(Brunstein, Gonzalez, &Kanter, 2010; Kainz & Ossimitz, 2002; Ossimitz,2002; Dutt & Gonzalez, 2012b)。
研究表明, 简单任务情境虽然剥离了多个结构因素, 但依然出现S-F错误, 进一步反映S-F错误在动态系统判断中的普遍性。作为累积变量判断偏差的表征, S-F错误为动态系统判断偏差研究提供了基本线索。
2.1.2 S-F错误的主要形式
总结以往研究, S-F错误主要有三种形式:
(1)将流量值(轨迹)判断为存量值(轨迹)。如,呈现 30分钟内进入和离开商场的顾客数(图 3a),让被试画出商场内顾客量变化轨迹。被试错误地将存量与流入量或净流量变化匹配起来, 71%被试画的顾客量轨迹与进入量一致(图 3b) (Cronin et al., 2009)。
(2)将存量值(轨迹)判断为流量值(轨迹)。如,让被试根据2000年至2100年大气层CO2的聚积轨迹(图 4a)画出 CO2排放量和吸收量轨迹, 即流入和流出量轨迹。虽告知CO2排放量是吸收量的两倍, 但多数被试画的排放量轨迹高于吸收量,且排放量轨迹与聚积量轨迹一致(图 4b)。即他们误认为CO2依然可以以较高的水平排放, 而2050年之后趋于平缓的聚积量曲线表明, 排放量应是低于吸收量的(Sterman & Sweeney, 2002, 2007)。
图2 商场顾客流量情境
图3a 商场人数变化流量图
图3b 被试画存量图
图4a CO2聚积(存量)轨迹
图4b 被试画(流量)轨迹
图5a 0-16周公司资金的收支状况图
图5b 被试画公司资金存量图
(3)将净流量(轨迹)判断为存量值(轨迹)。如,呈现公司资金在16周的变化轨迹图(图5a), 假定在0周时初始资金为100美元。被试画出的0-16周资金存量图与资金净收入(收入与支出之差)变化一致(图5b) (Sweeney & Sterman, 2000)。
可见, 三种形式 S-F错误的共同点在于, 存量与流入量、流出量或净流量数值之间的简单替代和匹配, 变化轨迹呈现高度相关和一致性。因此有理由推断, 这种共性的判断偏差使用了同样的思维模式。
2.2 关联启发式导致累积变量判断偏差
总结已有研究, 关联启发式导致累积变量判断偏差, 其内涵可归纳为两方面:
(1)关联启发式是将存量与流量建立正相关关系的思维模式
从关联启发式视角, 累积变量判断偏差并非因为累积变量知识的不足, 而是错误的启发式思维模式所致(Cronin et al., 2009)。人们不能正确理解存量和流量的关系, 而是以线性思维, 认定存量变化模式与流量变化模式是高度相关的, 二者变化特征是相似的(Weinhardt, Hendijani, Harman,Steel, & Gonzalez, 2015)。在温室效应任务中, 当CO2的聚积速度较现有速度有所降低, 多数被试就认为全球气温可以维持稳定甚至低于现有水平。高达 84%被试画的排放轨迹与吸收轨迹呈相同的走向。即使 CO2排放量一直高于吸收量, 画出的 CO2聚积量轨迹仍然是保持稳定的, 与排放量轨迹相似。可见, 无论是已知存量估计流入量,还是依据流入量与吸收量的关系估计存量, 均将存量与流量数值之间建立了高度正相关。
有研究对关联启发式的思维过程进行检验。如, Cronin等(2009)采用9个画图任务, 通过分析S-F错误特征, 对被试使用关联启发式的思维活动做出推断。例如, 给定的坐标图上, 商场顾客进入量以线性规律呈下降趋势(即斜率为负的直线),离开量保持稳定且离开量始终小于进入量。71%被试画的存量图是斜率为负或斜率为正的直线,即正好与流入量或净流量的形状完全相同, 相关接近+1。Korzilius, Raaijmakers, Rouwette和Vennix(2014)采用出声思考范式, 证明了关联启发式导致 S-F错误的思维过程。实验材料是商场顾客量和银行存取款折线图四问任务, 要求被试大声说出回答Q1-Q4问题的思考及答题过程。对被试的推理类型进行编码, 概括出七种推理类型, 其中包括A-M共10种推理路线(如表1)。其中, C、D、E是典型反映关联启发式特征的推理路线, 混合推理中的H、I中也部分包含关联启发式的推理特征。使用C、D、E推理路线答错Q3、Q4的占61%和 52%; 使用 H、I推理路线答错 Q3、Q4的占13.6%和11.4%。这些结果为揭示关联启发式将存量与流量数值建立正相关的思维本质提供了直接证据。
表1 出声思考:推理类型和推理路线
供应链产销决策是最具代表性的多特征交互情境之一。啤酒产销实验在不同国家上万次的实验结果, 反复证明了 S-F错误导致库存积压及高额成本损失的现象。而这种现象是如何发生的?以某产品供应链为例(如表2; 张静芳, 2007)。
如果各级企业通常要保持一周销售所需的基本库存, 即从上游供应商购买足够的产品以使存货满足下一周的需求, 因此每周要制定和补充“目标库存”, 作为供下一周的“初期库存”。假如在N周内某产品的顾客需求一直稳定在每周100件,而第N+1周的顾客需求多了5件, 首先做出反应的是零售商, 为了满足顾客需求、维持基本库存,零售商除了将本周顾客需求纳入订单数之外, 还将目标库存调整为本周顾客需求量, 以备下一周销售之需。接着,这种反应向供应链上游逐级传递,到达生产商时产量提高到180件。第N+1周数据显示, 企业订单量逐级增大。这种因下游消费需求轻微变动而导致上游企业生产、经营决策剧烈波动的现象, 称为“牛鞭效应” (bullwhip effect),体现了产销过程的动态决策偏差(Lee, Padmanabhan,& Whang, 1997)。
表2 供应链订单决策案例(单位: 件)
如果第N+2周的顾客需求仍保持105件, 但因运输延迟, 基本库存未能得到及时补充。各级企业陆续出现“欠货”, 订单量进一步逐级激增。在到达生产商时, 其获得的需求信息和顾客需求之间出现巨大偏差, 生产量高达1840件。第N+2周数据显示, 运输延迟因素使供应链订单量激增,出现更大幅度的牛鞭效应。
数据分析表明, 无论顾客需求稳定还是变化、有无运输延迟, 供应链各级企业订单量呈现共性规律:(1)本期订单量=本期接单量+(目标库存−初期库存); (2)目标库存量=本期接单量。可见,接单量(需求线上的当期流入量值)、目标库存与初期库存之差(供给线上的当期存量值), 两项动态指标成为订单决策的直接依据; 本期接单量成为确定下一期基本库存量的直接依据。数值之间呈现高度相关和匹配关系, 体现了关联启发式的思维本质。各级企业订单量增大的幅度有所不同,但各决策主体使用了相同的思维模式而产生S-F错误, 导致牛鞭效应(Macdonald, Frommer, & Karaesmen,2013)。
再如, 在 2008~2012年的国内白酒牛市中,价格快速上涨因素同样引发各级企业的囤货热情,订单数出现逐级传递、越来越大的延迟相位, 导致积压大量库存(如图6)。许多知名企业, 如惠普、IBM、宝洁等都曾经历过牛鞭效应导致的产品积压和高额成本损失。
图6 供应链订单决策的牛鞭效应
启发式思维的使用是产生牛鞭效应的主要原因, 其实质在于简单地将订单量与下游需求量及当期库存量直接建立匹配和相关关系, 忽略供给线和需求线的连贯性及其二者之间的关系(Macdonald et al., 2013)。订单决策简单依赖于下游订单需求(需求线上的当期流入量值), 优先考虑其当前库存(供给线上的当期存量值), 而严重忽视未处理订单(outstanding orders)在补给线上的状态与货物即将到来的事实(Sterman, 1989b)。人们倾向于关注最近的事件与风险(如, 供货中断),使当前库存“锚定”了目标库存决策(Gavirneni &Isen, 2010)。Macdonald等(2013)采用 Sterman(1989a)的啤酒实验成本损失模型, 通过短期和长期数据模拟分析表明, 从短期看, 这种启发式决策导致牛鞭效应; 从长期看, 会使动态系统稳定状态出现混乱, 同时还影响系统恢复到稳定状态的时间。特别是需求不稳和剧烈变化时, 则造成更大偏差, 影响组织的现实利益及长远发展。
(2)关联启发式是一种内生性的、顽固的心理模式
基于动态系统的多种因素, 有研究力图建构帮助人们进行正确判断和决策的模型, 并通过现实数据对模型予以检验, 结果却发现所有的模型都难以准确揭示人们对动态系统的判断规律(Sterman, 2002)。究其原因, 这些模型多是基于外生性(exogenous)因素建构的, 难以全面涵盖隐藏于人内心的假设和偏差, 即难以纳入来自人心理上的内生性(endogenous)因素, 所谓“软变量”。而这些内心的假设和偏差隐藏很深, 连建模者也难以自我觉察(Meadows & Robinson, 2002)。也正是这些内生性的假设和偏差形成人们狭窄的、基于事件的、简化论的推理方法论, 而关联启发式正是基于“相关”假设下导致判断偏差的“内生性”思维模式。
为此, 与以往Kahneman和Tversky等阐述的概率判断难题一样, 关联启发式是一种内在的、稳固的(robust)心理模式(Cronin et al., 2009)。对气候变化问题产生的普遍误解, 源自累积变量信息加工过程中心理模式的基础性缺陷(Sterman &Sweeney, 2007)。人们自动化地通过寻找数值间的相关和匹配性来进行判断, 将 CO2排放模式与聚积模式匹配起来, 将 CO2排放与气温变化匹配起来。Sterman (1989a)操纵延迟和反馈等因素的啤酒产销实验表明, 虽然被试行为偏离最佳标准的程度略有差异, 但却呈现共性规律, 即在决策中使用了相同的思维模式。
此外, Cronin等(2009)操纵内外部影响因素的实验结果也表明, 关联启发式具有自动化的启发式特征。一是从问题框架上, 将商场顾客任务分别表达成折线图、表格、文本、柱状图等多种框架, S-F错误的结果无显著差异。二是操纵问题熟悉性、答题动机、认知负荷等被试因素, 也未对答题结果产生积极或消极影响。从一定程度上支持了关联启发式思维的自动化特征。
可见, 关联启发式是将存量值与流量值建立正相关关系的思维模式, 是内生性的、顽固的心理模式。它与其它决策启发式一样, 依靠较少的认知资源, 具有快速节俭及自动化的特征。由于关联启发式, 会将国债和财政赤字建立相关, 认为财政赤字下降, 国债也就下降。而实际上, 只要没有财政结余, 即使赤字下降, 国债依然还在积累。碳聚积与碳排放的关系亦是如此, 即使排放量降低, 但只要排放量大于吸收量, 温室效应仍在加剧。因此, 关联启发式会造成财政状况、气候变化、能源消耗等问题的误判, 对于环保行动“等等再看”的态度与使用关联启发式判断偏差有关(Sterman, 2008, 2012; Sterman & Sweeney, 2007),直接影响人对复杂系统可持续性决策, 给经济及生态管理带来负面影响。
3 关联启发式的心理机制
目前, 关联启发式心理机制的解释主要有客体偏差、特征替代及不充分调整等观点。其中, 客体偏差是从发展心理学视角的理论推断, 特征替代和不充分调整则是借用代表性启发式、易得性启发式及锚定启发式机制的观点。在三种解释观点中, 不充分调整取得了基于特定任务情境的数据支持, 而客体偏差和特征替代观点尚欠缺实验数据的检验。
3.1 客体偏差
Chen (2011)从存在论出发认为, “客体”和“过程”是事物的两种存在形式, 由于过程不一定以某种物质形态存在, 因此它不像客体那样有具体的形状、重量、大小等特征。过程是随时间而变化或活动的, 不独立占据某个空间, 两个过程可以同时占用相同空间, 就像地球转动过程和变暖过程是同时发生的。
气候变化是过程, CO2累积虽然是事物的存量, 但是其核心特征是持续变化的, 这种变化包含时间的整体性和连贯性。这就意味着在理解累积变量时, 不能只关注某一时间点的流量值, 而应从发展角度关注整体时间跨度, 将某个时间点作为过程的一个微观阶段。这也正是“过程”与“客体”的根本差异。而关联启发式思维的本质在于将“过程”与“客体”混淆, 产生了“客体偏差” (object bias), 即视动态“过程”为静态“客体”, 以感知和判断“客体”的方式感知和判断了“过程”。
从发展心理学视角, “客体偏差”的出现并不是偶然的, 也很难去纠正。因为早期形成的客体知识系统对于成年后认知的影响是持久、根深蒂固的。婴儿从 4个月开始, 就具有客体永久性知觉, 并逐步发展形成客体知识的核心系统。客体知识体系内在的一致性、持续性和相关性成为人们认识客体运动的重要原则。直到7岁时才能将过程从客体中分开, 而客体知识核心系统的一部分, 作为“常识”在成年以后依然完整地保留下来(Chen, 2007)。因此, 成年人在推理时也不能完全摆脱客体知识系统的影响。正是由于这一系统固有的特征, 造成了“客体偏差”, 在认知任务中,更多地依赖静态客体而不是动态过程。对静态时间点的依赖, 导致对随时间推移而变化的流量问题的不正确把握(Cronin & Gonzales, 2007; Ho,Camerer, & Weigelt, 1998)。
3.2 特征替代
“特征替代” (attribute substitution)是代表性启发式和易得性启发式的机制解释观点之一(Kahneman & Frederick, 2002)。Newell和 Pitman(2010)借用特征替代观点来解释关联启发式的发生机制。他们在分析气候学家如何就研究成果与公众有效沟通时认为, 气候变化是一个专业、复杂的系统, 普通人在理解气候术语、碳排放与全球变暖的关系时, 之所以会依赖输入信息去预测累积变化是采用了“特征替代”策略。
Kahneman和 Frederick (2002)提出的特征替代解释假设认为, 当面对难题或不确定性问题,人们会用一个容易回答的问题去替代, 而对于替代过程却没有觉察。例如, 问“一年中长途电话断线的比例?”, 人们会用“是不是能容易地回忆起长途电话断线的实例?”来替代。教授听了候选人的述职报告后应考虑的是:“给予候选人终身教职的可能性有多大?”, 而实际考虑的是“述职报告令人深刻印象的程度?”。“特征替代”是自动化的心理加工过程, 人们会不自觉地采用特征替代进行判断和选择。
在特征替代过程中, 启发式特性的易得性是由对其属性的自然评估程度所决定的, 凡具有相似性、流畅性、可得性等特征的信息被自动激活,替代了较难的原始问题。因此, 在解决温室效应这种同时包含空间和时间概念的难题时, 人们会将CO2存量替换为CO2排放量这一更易理解的概念。这样, 难以把握或推断的累积过程, 通过直观的流量表征进行了替代, 流量和存量间的相关关系就建立了起来。
3.3 不充分调整
锚定启发式是指在不确定问题情境中, 人们以最近接触或回忆到的数值(锚值)作为参照去估计一个不确定数值, 估计值接近锚值的一种启发式策略。“不充分调整” (insufficient adjustment)是锚定启发式心理机制的观点之一, 是指在数量估计时, 以锚值为基点, 根据其他一些因素进行调整, 由于调整是不充分的而导致偏差的思维过程。Sterman (1989a)借用这一观点对啤酒产销决策偏差的发生机制进行分析。
在啤酒产销决策中, 每个“决策者”应该选择使预计成本最小化的订单和库存水平。然而, 受系统复杂性和决策时间的限制, “决策者”既没有时间也没有充分的信息来推断最佳库存。因此,对库存水平的判断可能强烈受到初始水平的“锚定”作用。其中, 锚值是预计损耗率(Le), 损耗包括原材料库存损耗和厂房设备折旧。“决策者”根据Le去调整两个差异:一是调整预计库存和实际库存间的差异(AS); 二是调整预计供给和实际供给间的差异(ASL), 以求达到经营的最低成本。以上三个因素决定了决策的订单率(IO), 用公式表示为:IOt=Let+ASt+ASLt。在任务进程中, “决策者”能获得局部的有关损耗率的信息, 然后进行调整。由于受到来自预计与现实库存和补给线矛盾带来的压力, “决策者”对于订单率的调整偏离了能够维持库存现状的水平。调整值越大, 表明采取更主动的方式使库存和补给线达到期望的水平; 值越小, 表明采取了更谨慎的决策, 或者对期望与现实库存间的矛盾更不敏感。回归分析表明, “决策者”对预计库存的判断显著受到初始库存及预计损耗率的“锚值”影响。
分析上述三种观点, 客体偏差是从认识论和认知结构角度, 特征替代是从思维过程的问题转换角度, 不充分调整是从初始数字信息的影响角度, 从不同视角探讨了关联启发式的心理机制和解释思路。然而, 多是侧重理论视角的分析, 不充分调整观点虽然有数据分析的支持, 但是仅限于特定任务情境。三种观点都有需要深究的问题,如, 在客体偏差的解释中, 人们是如何以感知和判断“客体”的方式来感知和判断“过程”的?在特征替代的解释中, 人们是用什么简单问题替代难题的?是如何替代的?在不充分调整的解释中, 是如何选择“锚值”并出现不充分调整的?这些问题尚不明确, 还难以揭示其中的微观加工机制。
此外, 在三种机制解释中, 有两种是借用了其它启发式心理机制的观点, 且缺乏直接实验证据证明, 这反映出对关联启发式心理机制的探究尚存在很大空间, 应着眼于关联启发式的特异性,深入探讨更具针对性的机制解释。
4 关联启发式的影响因素
4.1 个体因素
(1)性别
研究表明, 女性比男性有可能更多使用关联启发式。如, Sweeney和Sterman (2000)发现, 在浴缸水流、公司现金流、库存管理等任务上男性好于女性。Kainz和Ossimitz (2002)进行浴缸水存量等五项判断及画图任务测试, 在雨水桶存量判断任务上不存在男女差异, 在其它四项任务上存在性别效应。Ossimitz (2002)的联邦赤字和国债等六个判断任务与Jensen和Brehmer (2003)关于捕食者−猎物系统平衡估计任务中, 男性均显著好于女性。
虽然有研究支持了关联启发式的性别效应。而作为研究者, Ossimitz对自己的实验结果也感到意外, 难以解释性别效应的原因。他认为, 不能简单地从实验结果认定女生比男生表现差, 因为关联启发式是与数量估计有关的思维模式, 而多种角度的学业研究表明, 男女生数学能力和学科学业成绩是不存在差异的; 特别是在其它多种启发式的研究中也未发现性别差异。因此, 还应对于已有研究结果的稳定性及产生原因进行检验。
(2)专业背景和经验
部分研究证明了专业背景和经验的影响。如,Dutt和Gonzalez (2012a)发现, 在回答气候变化问题上, 科技专业比其他专业学生更少出错, 有经验比缺乏经验被试答题绩效更好。Newell和Pitman (2010)实验表明, 在根据 CO2存量图画出排放图、根据债务和收入图画出支出图、以个人债务任务作类比来画出碳排放图等三项任务中,后两项任务答题准确性显著高于第一项, 个人经验对判断偏差有调节作用。
另有部分研究未能支持专业背景和经验的优势。如, Cronin等(2009)发现, 受过高等教育的人仍会使用关联启发式。Sweeney和Sterman (2000)研究显示, 科技专业比社会科学专业被试在浴缸水流、公司现金流等画图任务上成绩更好, 但在其它同类任务则没有差异。Brunstein等(2010)五项医学专业任务和一项商场客流任务实验发现,虽然医学专业学生整体上判断准确性高于非医学专业学生, 但在骨组织变化、血糖变化任务上与非医学专业学生不存在差异。
可见, 专业背景和经验对关联启发式的影响是不稳定的, 这在锚定启发式、合取谬误等研究中也有类似的结果。正如Moutier和Houdé(2003)指出, 概率知识无法减少启发式, 判断偏差并不是因为缺少必要的概率或逻辑计算能力造成的,而是无法阻止启发式加工导致的。从这个意义上说, 专业背景和经验对关联启发式并不能产生实质上的影响。
(3)认知加工方式
关于认知加工方式对关联启发式偏差的影响,主要有直觉−分析思维、局部−整体思维两个视角的研究。如, Moritz等(2013)发现, 分析思维的人在解决报纸订单存流量问题时表现更好。Weinhardt等(2015)也发现, 分析思维比直觉思维的人能更好地理解存流量问题, 判断正确率更高。Fischer和Gonzalez (2016)发现, 整体加工方式的人能将元素与系统结构相联系, 进而理解有时间跨度的累积过程, 较少出现判断偏差。而Weinhardt等(2015)的实验却未证明整体加工方式与局部加工方式个体判断上的差异。
根据认知反应测验(CRT, cognitive reflection test; Frederick, 2005)的研究, 思维推理的类型影响信息加工和决策过程, 直觉思维个体更偏向于启发式加工(Hoppe & Kusterer, 2011), 这表明认知加工方式影响个体决策过程中启发式的启动和执行。而局部−整体思维又决定了认知加工的范围和系统性, 因此, 应将认知加工方式作为主要影响因素进行深入考察。目前实验结果不一致, 很可能是认知加工方式分类与测量、关联启发式实验范式等局限造成的。
4.2 情境因素
(1)呈现方式与任务模式
多项研究证明了呈现方式和任务模式的影响作用。如, Cronin和Gonzalez (2007)将商场顾客流量经典图形变换成有多个流量最高或最低点(多极值点)的图形, 以及流入、流出变化轨迹上只有一个差异点(单gap区)的图形。相对于经典图形任务, 在多极值点和单 gap区图形任务中, 选择“不能回答”的人数增多了。Cronin等(2009)采用三种复杂程度的流量图, 让被试画出存量图, 结果表明任务越复杂, 偏差程度越高。Guy, Kashima,Walker和O’Neill (2013)操纵有图和无图条件, 让被试估计保持大气层CO2聚积量轨迹稳定的碳排放量, 有图组出现更多的判断错误。Newell等采用债务、储蓄以及碳排放等三项估计任务, 比较有图(排放图、聚积图、排放图和聚积图)与无图条件下的估计准确性, 有图组均低于无图组。Dutt和Gonzalez (2013)采用物理表征图和折线图两种形式, 让被试画出大气层 CO2及容器内玻璃球的流入、流出和存量变化轨迹, 物理表征组优于折线图表征组。
也有研究得到不一致的结果。如, Strohhecker和Größler (2015)采用实物操作任务, 让被试尽可能快地将水通过长漏斗倒入玻璃杯中, 以使玻璃杯的水量保持目标水平, 将这项任务的成绩与之后进行的订单决策任务成绩相比较, 发现成绩之间无相关性, 说明有形实物操作未对存流量问题纸笔任务产生积极影响。Newell, Kary, Moore和Gonzalez (2013)力求通过简化存流量问题难度、改善计算机答题界面等形式减少关联启发式偏差,但未得到预期结果。
鉴于已有多项研究支持呈现方式和任务模式的影响作用, 同时, 其它类型决策偏差研究也表明, 呈现方式影响个体对信息的知觉和加工, 对不同个体呈现其所偏好的信息表达方式, 能减少偏差发生(Bonner & Newell, 2010)。如, 相对于图片, 呈现文字材料, 个体非理性选择更少, 比率偏差较低。因此, 呈现方式和任务模式应作为关联启发式的主要影响因素, 今后应细化个体信息加工偏好与呈现方式及任务模式关系的研究。
(2)任务熟悉度
Newell, Kary, Moore和Gonzalez (2016)发现,债务存流量问题的答题正确率显著高于CO2存流量问题; Dutt和Gonzalez (2013)也发现, 玻璃球存流量任务的绩效要显著优于CO2存流量任务。而Cronin和Gonzalez (2007)将接触度高的浴缸和轿车油箱问题与接触度相对低的商场顾客流量问题进行比较, 两类问题判断结果不存在差异。Newell等(2013)研究发现, 被试在高熟悉度的储蓄任务上也出现判断偏差, 而让被试像考虑债务问题那样考虑碳排放问题, 也未改善碳排放问题的答题绩效。
分析这些不尽一致的结果, 单纯的熟悉性并不一定对关联启发式偏差产生影响, 因为研究设计还有可能掺杂了其他影响变量, 如债务问题的情绪情感因素(如损失与获益的主观感受等)、玻璃球问题的呈现方式、问题熟悉度的界定等, 都可能使结果产生差异。
分析已有研究, 个体因素的认知加工方式、情境因素的任务模式与呈现方式是影响关联启发式的主要因素, 今后应从不同研究范式和实验设计角度开展研究, 得出更确切的结论。而性别、教育背景和经验、问题熟悉度对关联启发式偏差的影响不具稳定性, 应针对不一致的实验结果澄清其他影响变量的作用。同时, 个人因素中的人格因素、情绪因素、元认知技能等都有可能是影响关联启发式偏差的重要方面, 应予以考察和检验。
5 减少关联启发式的策略
由于关联启发式偏差直接影响人对复杂系统的可持续性决策, 减少偏差策略的研究也已实现起步。目前, 分别从累积知识培训和知识启动、类比、反馈与模拟训练等方面取得了初步研究成果。
(1)知识培训和知识启动
有研究表明, 知识培训和知识启动能减少关联启发式偏差。如, Kainz和Ossimitz (2002)先通过前测, 让被试完成浴缸水流量等五项判断任务,之后对实验组实施90分钟存流量知识速成课, 学习、讨论存流量问题基本特性和常见错误。6个月后的后测发现, 速成课提升了判断正确率。Sterman (2010)通过给研究生开设6周的系统动力学课程, 促进其对累积概念的理解, 每次课程 80分钟, 共计11次课, 判断正确率也有显著提升。
同时, 也有研究得到了不一致的结果。如,Pala和 Vennix (2005)的实验, 让被试就浴缸水流量、商场顾客流量、库存管理等任务逐一讨论, 学习存流量知识及其应用。13周后进行后测, 虽然整体成绩有所提高, 但是在商场顾客流量任务的正确率与前测无显著差异。Cronin等(2009)让被试根据简化的商场客流图计算每分钟商场里的顾客数, 以激发潜在的存流量知识。假设认为, 启动任务能使被试注意到存流量结构的存在并提高判断正确率, 然而结果并未支持假设。
(2)类比
一是通过熟悉任务与不熟悉任务的类比, 提高不熟悉任务的判断绩效。如, Smith和 Genter(2012)证明即使是简单的类比图形训练也能帮助人们理解存流量图形。Guy等(2013)采用浴缸水流量与CO2存流量类比任务, 使CO2存流量判断准确性显著提高。Newell等(2013)采用债务存流量与 CO2存流量类比任务, 被试进行CO2累积判断的准确性也显著提高。
二是通过任务内部特征的类比来提高判断绩效。Gonzalez和Wong (2012)采用商场顾客流量任务, 通过改变时间点数量和存量变化轨迹, 形成表面相似性和行为相似性两个维度, 表面相似性是指时间点数量相同, 行为相似性是指存量变化均呈倒U形。根据表面相似性与否和行为相似性与否, 形成四种任务类型。结果发现, 行为相似性组答题正确率显著高于非行为相似性组, 表面相似性与否对正确率未产生影响。
(3)反馈与模拟训练
研究表明, 反馈和模拟训练能有效减少启发式偏差。如, Cronin等(2009)发现, 在有反馈的九次尝试之后, 答题准确率从20%上升到83%。Dutt和 Gonzalez (2012a, 2012b)采用 Dynamic Climate Change Simulator (简称DCCS)模拟训练系统, 考察累积原则的学习绩效。被试可以根据CO2聚积量图等信息, 填写各个年份 CO2排放量和吸收量估计值。通过一个用红线标识最大允许聚积量的方槽给被试以反馈, 如果填入数值正确, 聚积量就不会超出红线; 否则就会超出红线。DCCS有效提升了决策质量。Stave, Beck和Galvan (2016)证明了基于仿真的学习环境(SBLEs)可以帮助被试增强对累积原则的理解力。
总结已有研究, 要减少关联启发式偏差, 必须认识和理解累积原则, 学习和建立理性思维路径, 知识培训如能达到这两方面目标, 就可减少判断偏差, 而简单的启动任务则难以减少判断偏差。行为相似性类比之所以优于表面相似性类比,是因为前者激发了更深层次的比较和加工。反馈和模拟训练过程实际是对被试思维路径的纠偏和引领过程。可见, 应将累积原理的理解与思维路径的引领有机结合, 开发减少关联启发式的有效方法。
6 研究展望
关联启发式在实验范式、作用机制、影响因素等方面研究均有待深化。由于关联启发式影响气候变化、能源耗费、产能计划等动态系统的可持续性决策, 还应着力开发减少关联启发式偏差的方法。
6.1 澄清关联启发式的发生机制
关于关联启发式的心理机制, 从存在论及决策启发式的视角, 提出了客体偏差、特征替代、不充分调整等三种解释。今后应从两方面进一步开展研究, 其一, 通过实证研究对于三种解释进行检验。正如Chen (2007)通过实物估计任务与物理问题估计任务的比较, 证明客体偏差的存在一样, 关联启发式中的客体偏差加工过程同样有待实证研究的支持(Chen, 2011)。其二, 特征替代、不充分调整分别借用了易得启发式和锚定启发式心理机制的解释观点, 还应针对关联启发式的特异性, 从认知加工和神经机制视角探讨更具解释力的模型。
6.2 澄清关联启发式影响因素及其相互作用的机理
应从三个方面深化关联启发式影响因素的研究, 一是对已有研究中不一致的结果进行验证,确认对关联启发式产生影响的主要因素。二是进一步扩展不同类型影响因素的检验, 如人格因素、情绪因素、元认知技能等。如, Korzilius等(2014)认为应关注自我意识、自我管理、社会意识等情绪能力的影响, Weinhardt等(2015)建议对个体冲动性和决策质量因素进行检验。三是对于影响因素之间的相互作用进行考察。有研究认为(Sterman, 2002), S-F错误是由思维启发式与动态系统结构间互动的结果, 因此有必要考察个体因素与情境因素间的相互作用。同时, 同样的因素在不同的研究中结果不一致性, 抑或更加提示了这一需求。因此, 应考察影响因素间的相互作用,从因素间关系视角考察使用关联启发式的条件,形成关联启发式影响因素的作用模型。
6.3 丰富和深化关联启发式的研究范式
目前, 能够直接检验关联启发式策略的研究范式还较少, Cronin等(2009)是从画图任务S-F错误的分析对被试使用关联启发式进行推断。Korzilius等(2014)的出声思考是迄今唯一能直观揭示关联启发式思维路径的研究范式, 但该研究还发现 S-F错误并不仅仅源自关联启发式策略,其它思维路径也会产生 S-F错误。Brunstein等(2010)对错误判断分析发现, 有些被试使用的是直觉, 而不是关联启发式。因此, 如何从研究范式上澄清关联启发式与 S-F错误之间确切的关系,如何将导致 S-F错误的关联启发式思维路径与其它思维路径有效区分, 是需要重点突破的问题。此外, 未来研究应开展有一定复杂性的存流量问题, 如多层次供应链系统问题(Weinhardt et al.,2015), 着力于如何将简单存流量问题设计运用到复杂操作管理任务中, 提高关联启发式研究的生态效度。
6.4 开发和检验减少关联启发式的有效途径
累积原则普遍存在于气候变化和产能管理等社会情境, 体现出关联启发式研究的现实意义。如, 只有排除关联启发式偏差, 才能更好地理解碳排放与碳聚积对温室效应的影响, 树立科学的环保意识, 采取恰当的决策和行动。再如, 自然资源可持续管理的关键是区别可再生资源和不可再生资源的产生与消耗机制(Weinhardt et al., 2015),有效区分二者的存流量结构, 这是可持续性开发的前提。
有研究认为(Cronin et al., 2009), 学生所接受的 STEM教育, 对于提升运用累积原则的能力是不起作用的。早期的数学教育强调相关推理, 有可能助长了存流量问题的判断定势。这一观点是否确切?一些研究证明了培训、模拟训练等对减少关联启发式的积极作用, 提示了将累积原理的理解与思维路径的引领两方面结合减少关联启发式的途径, 但是还不清楚产生作用的机制。因此,为了提升公众对累积变量的判断能力, 在学校教育、舆论宣传等层面应如何采取行动, 怎样使行动结果更加有效, 应成为研究着力的方向。
致谢:感谢中科院心理所李纾教授在本文选题及写作过程中给予的指导。感谢审稿专家提出宝贵的修改意见。
张静芳.(2007).供应链中“牛鞭效应”案例分析及解决方法研究.物流科技, 30(7), 73–76.
Bonner, C., & Newell, B.R.(2010).In conflict with ourselves?An investigation of heuristic and analytic processes in decision making.Memory & Cognition, 38(2), 186–196.
Brehmer, B.(1990).Strategies in real-time, dynamic decision making.In R.M., Hogerth (Ed.),Insights in decision making(pp.262–279).Chicago: University of Chicago Press.
Brunstein, A., Gonzalez, C., & Kanter, S.(2010).Effects of domain experience in the stock–flow failure.System Dynamics Review, 26(4), 347–354.
Chen, X.(2007).The object bias and the study of scientific revolutions: Lessons from developmental psychology.Philosophical Psychology, 20(4), 479–503.
Chen, X.(2011).Why do people misunderstand climate change? Heuristics, mental models and ontological assumptions.Climatic Change, 108(1–2), 31–46.
Cronin, M.A., & Gonzalez, C.(2007).Understanding the building blocks of dynamics system.System Dynamics Review, 23(1), 1–17.
Cronin, M.A., Gonzalez, C., & Sterman, J.D.(2009).Why don’t well–educated adults understand accumulation? A challenge to researchers, educators, and citizens.Organizational Behavior and Human Decision Processes, 108(1), 116–130.
Diehl, D., & Sterman, J.D.(1995).Effects of feedback complexity on dynamic decision making.Organizational Behavior and Human Decision Processes, 62(2), 198–215.
Dutt, V., & Gonzalez, C.(2012a).Decisions from experience reduce misconceptions about climate change.Journal of Environmental Psychology, 32(1), 19–29.
Dutt, V., & Gonzalez, C.(2012b).Human control of climate change.Climatic Change, 111(3–4), 497–518.
Dutt, V., & Gonzalez, C.(2013).Reducing the linear perception of nonlinearity: Use of a physical representation.Journal of Behavioral Decision Making, 26(1), 51–67.
Eberhardt-Toth, E., & Wasieleski, D.M.(2013).A cognitive elaboration model of sustainability decision making:Investigating financial managers’ orientation toward environmental issues.Journal of Business Ethics, 117,735–751.
Fischer, H., & Gonzalez, C.(2016).Making sense of dynamic systems: How our understanding of stocks and flows depends on a global perspective.Cognitive Science, 40, 496–512.
Forrester, J.W.(1961).Industrial dynamics.Cambridge:MIT Press.
Frederick, S.(2005).Cognitive reflection and decision making.Journal of Economic Perspectives, 19(4), 25–42.
Gallego-Álvarez, I., & Ortas, E.(2017).Corporate environmental sustainability reporting in the context of national cultures:A quantile regression approach.International Business Review, 26, 337–353.
Gavirneni, S., & Isen, A.(2010).Anatomy of a newsvendor decision: Observations from a verbal protocol analysis.Production & Operations Management, 19(4), 453–462.
Gonzalez, C., & Wong, H.-Y.(2012).Understanding stocks and flows through analogy.System Dynamics Review, 28(1),3–27.
Guy, S., Kashima, Y., Walker, I., & O’Neill, S.(2013).Comparing the atmosphere to a bathtub: Effectiveness of analogy for reasoning about accumulation.Climatic Change, 121(4),579–594.
Ho.T.-H., Camerer, C., & Weigelt, K.(1998).Iterated dominance and iterated best response in experimental “p-beauty contests”.American Economic Review, 88(4), 947–969.
Hoppe, E.I., & Kusterer, D.J.(2011).Behavioral biases and cognitive reflection.Economics Letters, 110(2), 97–100.
Jensen, E., & Brehmer, B.(2003).Understanding and control of a simple dynamic system.System Dynamics Review,19(2), 119–137.
Kahneman, D., & Frederick, S.(2002).Representativeness revisited: Attribute substitution in intuitive judgment.In T.Gilovich, D.Griffin, & D.Kahneman (Eds.),Heuristics and biases: The psychology of intuitive judgment(pp.49–81).New York, NY, USA: Cambridge University Press.
Kainz, D., & Ossimitz, G.(2002).Can students learn stock–flow–thinking? An empirical investigation.Paper presented at the 2002 System Dynamics Conference,Palermo, Italy.
Korzilius, H., Raaijmakers, S., Rouwette, E.& Vennix, J.(2014).Thinking aloud while solving a stock–flow task:Surfacing the correlation heuristic and other reasoning patterns.Systems Research and Behavioral Science, 31,268–279.
Lee, H.L., Padmanabhan, V., & Whang, S.(1997).Information distortion in a supply chain: The bullwhip effect.Management Science, 43(4), 546–558.
Macdonald, J.R., Frommer, I.D., & Karaesmen, I.Z.(2013).Decision making in the beer game and supply chain performance.Operations Management Research, 6(3–4),119–126.
Meadows, D.H., & Robinson, J.M.(2002).The electronic oracle: computer models and social decisions.System Dynamics Review, 18(2), 271–308.
Moritz, B., Hill, A.V., & Donohue, K.L.(2013).Individual differences in the newsvendor problem: Behavior and cognitive reflection.Journal of Operations Management,31(1–2), 72–85.
Moutier, S., & Houdé, O.(2003).Judgement under uncertainty and conjunction fallacy inhibition training.Thinking &Reasoning, 9(3), 185–201.
Newell, B.R., Kary, A., Moore, C., & Gonzalez, C.(2013).Managing our debt: Changing context reduces misunderstanding of global warming.In M.Knauff, M.Pauen, N.Sebanz, &I.Wachsmuth (Eds.),Proceedings of the 35th Annual Conference of the Cognitive Science Society(pp.3139–3144).Austin, TX: Cognitive Science Society.
Newell, B.R., Kary, A., Moore, C., & Gonzalez, C.(2016).Managing the budget: Stock–flow reasoning and the CO2accumulation problem.Topics in Cognitive Science, 8,138–159.
Newell, B.R., & Pitman, A.J.(2010).The psychology of global warming.Bulletin of the American Meteorological Society, 91(8), 1003–1014.
Ossimitz, G.(2002).Stock–flow–thinking and reading stock–flow–related graphs: An empirical investigation in dynamic thinking abilities.Paper presented at 20th International of the 2002 System Dynamics Conference, Palermo, Italy.
Pala, Ö., & Vennix, J.A.M.(2005).Effect of system dynamics education on systems thinking inventory task performance.System Dynamics Review, 21, 147–172.
Ranney, M.A., Clark, D., Reinholz, D.L., & Cohen, S.(2012).Changing global warming beliefs with scientific information:Knowledge, attitudes, and RTMD (Reinforced Theistic Manifest Destiny theory).In N.Miyake, D.Peebles, & R.P.Cooper (Eds.),Proceedings of the 34th annual meeting of the cognitive science society(pp.2228–2233).Austin,TX: Cognitive Science Society.
Smith, L.A., & Genter, D.(2012).Using spatial analogy to facilitate graph learning.In C.Stachniss, K.Schill, & D.Uttall (Eds.),Proceedings of the 2012 international conference on spatial cognition VIII(pp.196–209).Berlin, Germany:Springer.
Stave, K.A., Beck, A.& Galvan, C.(2016).Improving learners’understanding of environmental accumulations through simulation.Simulation and Gaming, 46(3–4), 270–292.
Sterman, J.D.(1989a).Modeling managerial behavior:Misperceptions of feedback in a dynamic decision making experiment.Management Science, 35(3), 321–339.
Sterman, J.D.(1989b).Misperceptions of feedback in dynamic decision making.Organizational Behavior and Human Decision Processes, 43(3), 301–335.
Sterman, J.D.(2002).All models are wrong: Reflections on becoming a systems scientist.System Dynamics Review,18, 501–531.
Sterman, J.D.(2008).Risk communication on climate: Mental models and mass balance.Science, 322(5901), 532–533.
Sterman, J.D.(2010).Does formal system dynamics training improve people’s understanding of accumulation?System Dynamics Review, 26, 316–334.
Sterman, J.D.(2012).Sustaining sustainability: Creating a systems science in a fragmented academy and polarized world.In M.P.Weinstein & R.E.Turner (Eds.),Sustainability science: The emerging paradigm and the urban environment(pp.21–58).New York, NY: Springer.
Sterman, J.D., & Sweeney, L.B.(2002).Cloudy skies:Assessing public understanding of global warming.System Dynamics Review, 18(2), 207–240.
Sterman, J.D., & Sweeney, L.B.(2007).Understanding public complacency about climate change: Adults’ mental models of climate change violate conservation of matter.Climatic Change, 80(3–4), 213–238.
Strohhecker, J., & Größler, A.(2015).Performance in tangible and in cognitive stock–flow tasks: Closer than expected.Simulation & Gaming, 46(3–4), 230–254.
Sweeney, L.B., & Sterman, J.D.(2000).Bathtub dynamics:Initial results of a systems thinking inventory.System Dynamics Review, 16(4), 249–286.
Weinhardt, J.M., Hendijani, R., Harman, J.L., Steel, P., &Gonzalez, C.(2015).How analytic reasoning style and global thinking relate to understanding stocks and flows.Journal of Operations Management, 39–40, 23–30.