贝叶斯推理及其个体发生:内涵与证据
2020-02-24何国意李佳芮
何国意 李佳芮 周 珲
(1.绍兴文理学院 大脑、心智与教育研究中心,浙江 绍兴 312000;2.绍兴文理学院 教师教育学院,浙江 绍兴 312000)
引言
在思维过程中,人们是如何进行推理,思考事件前因后果,一直是心理学研究者关注的内容,并取得了越来越多的研究成果[1]。概率推理作为推理的重要组成部分,是指人们对不确定事件发生可能性的概率做出推测或判断[2-3]。
贝叶斯推理(Bayesian Reasoning)问题是概率推理的一个重要类别[4],是典型的概率推理。它源于人们在日常生活或学习中,根据环境新信息或证据来调整头脑中对某一事物或事件的原有经验或观点。如医生看病时,首先会根据原有经验估计病人患某种病的可能性,之后通过化验、检查得到新信息。如果新信息符合原有经验的判断,即增加了病人患某种病的可能性,医生就会对病人进行确诊。如果新信息与原有经验存在出入,就会影响医生的判断,即可能会错误地估计病人患某种病的可能性,造成误诊[5]。所以,探讨贝叶斯推理问题能够很好地揭示人们在进行概率信息估计时的认知加工方式,科学地指导人们进行有效地学习、合理地判断推理和正确地决策等行为[3]。
一、贝叶斯推理的界定
贝叶斯推理解决的是条件概率问题[7],条件概率是指事件的发生往往受到其他事件的影响,即某一事件发生的概率依赖于另一事件发生的概率。
人们在面临某一事件时,通常会思考对该事件可以采取的解决或应对措施,并进一步推理不同措施后的不同结果,根据不同结果做出恰当的选择,但人们在推理时可以依赖的条件信息并不是确定的。贝叶斯推理就是指根据不确定性的信息人们是怎么进行推理、评估各种推理结果的概率,最终做出判断、决策的[6]。
贝叶斯推理有多种形式,心理学研究的主要是二元假设的贝叶斯推理[5],即存在两个互斥的H和-H事件构成一个完全事件,已知P(H)和P(-H),E为任意事件即观察到H和-H事件的某种证据,且已知P(E|H)和P(E|-H),要求估计后验概率P(H|E),采用公式可以表示为:
这就是著名的“贝叶斯定理”。在这个公式中,预先知道的P(H)和P(-H)为先验概率,已知的P(E|H)和P(E|-H)分别表示假设H与-H成立时E出现的概率,P(H|E)表示E出现时假设H成立的概率即后验概率。一些文献中也常常把P(H)和P(-H)称为基础比率、P(E|H)为击中率、P(E|-H)为误报率[5,3]。
Eddy的“乳腺癌问题”是经典的贝叶斯推理问题:参加常规X光透视检查的40岁妇女患乳腺癌的概率为1%。一位乳腺癌患者的胸透片呈阳性的概率为80%;一位非乳腺癌患者的胸透片呈阳性的概率为9.6%。若某妇女检查报告结果为阳性,求该妇女为乳腺癌患者的概率?按照贝叶斯定理可得出:
=0.078=7.8%。
2016年至今,王世君担任鸡东县农村公路县乡路网改造工程建设指挥部总工程师,负责农村公路工程建设及质量管理工作。农村公路施工队伍情况复杂,管理难度大,为了保证工程质量,他从招标履约开始,对进场人员从严管理,对进场材料严格把关,对施工步骤认真监控,对工程质量做到达不到标准不验收、不允许进入下道工序,在同事的支持下,克服重重困难,完美地完成了各项工作。
对于这类问题,虽然说懂得贝叶斯原理的人可以通过公式计算去判断,但是不懂得贝叶斯原理的人在进行推理时并不一定会按照公式进行推断[13]。心理学领域的贝叶斯推理是基于贝叶斯定理的,是在已知基础率的前提下,根据新信息(即击中率和误报率)调整基础率,得出后验概率的过程。大多数研究者将人们直觉推理的估计值与贝叶斯公式计算的准确值进行比较分析来探究人们的认知加工特点与规律[7]。
为了进一步探讨人们在贝叶斯推理上的心理规律,Gopnik和Bonawitz根据贝叶斯理论阐述了贝叶斯规则的相关概念。首先,在获得概率数据之前,学习者会对哪些事件是可能的有一套已有的信念,此为“先验”;其次,学习者会考虑每个事件结构产生观测数据的概率,此为“似然”;最后,结合“先验”和“似然”,学习者得出了一个与给定数据的概率成比例的量,此为“后验”。在贝叶斯学习中,学习者可以利用其存在的高度结构化的知识来得出“先验”和“似然”,同时依据新的数据改变原先的认识。也就是说,学习者先前的信念会影响其对数据的解释,而新的数据也会导致这些已有信念的改变。在这个过程中,确定给定数据结构的概率是推理的主要内容[8]。
二、贝叶斯推理的理论模型
自20世纪60年代到80年代以来,关于人类推理是否遵循贝叶斯定理存在两种截然相反的观点。一是Edwards代表的保守贝叶斯主义[9],二是Kahneman和Tversky提出的基础概率忽略现象[10]。到20世纪90年代,Gigerenzer和Hoffrage首次提出以往两种相互矛盾的观点都基于一种不完全分析,强调了贝叶斯推理问题的概率信息形式对人们的概率判断有着重要作用[11],并由此引发了国内外一系列贝叶斯问题表征方面的研究。
(一)代表性启发式理论
Edwards等人通过询问被试在进行概率判断时所依据的信息线索,得出一些被试的基础率,但忽视了新证据。他们指出人们会在贝叶斯推理中出错源于对基础率的关注,对新信息的忽视,从而导致判断结果更接近基础概率,这便是保守主义(conservatism),但即便是保守的推理也在一定程度上与贝叶斯定理计算结果较为一致[9]。
与Edwards等人提出的“保守的贝叶斯”理念不同,Kahneman和Tversky在研究中得出人们的直觉概率推理与贝叶斯推理存在很大的区别。Kahneman和Tversky在“工程师-律师问题”实验中首先发现了基础概率忽略现象:给被试呈现一段描述性文字,告诉被试需要从律师70人、工程师30人,这100人中随机抽取一人进行身份判断。结果当研究者将该人的身份信息描述得像工程师时,被试将其判断为工程师的概率很高。因此,被试明显忽略了工程师的基础概率仅有30%[10]。之后,Kahneman和Tversky通过“出租车问题”进行验证:某市出租车中85%属于绿车公司,15%属于蓝车公司,现有一位目击者指认了一辆肇事出租车属于蓝车公司,而目击者的准确性为80%。结果当研究者问被试肇事出租车属于蓝车公司的概率时,大多数被试判断概率为80%。被试忽略了出租车属于蓝车公司的基础概率仅有15%[12]。
Kahneman和Tversky先后通过“工程师-律师问题”“出租车问题”等研究发现并验证了基础概率忽略现象,即被试在进行直觉推理时,往往会忽视基础概率,而根据新信息做出判断,导致高估结果的判断偏差。Casscells等人在以医学院工作人员为被试,以经典乳腺癌问题和其类似的问题为材料的实验中,被试忽视了基础率,关注击中率,高估了答案[13]。Eddy用上述“乳腺癌问题”让内科医生判断,结果95%的医生得出的该名妇女患乳腺癌的概率远高于贝叶斯公式下计算的准确值[14]。
对此,Kahneman和Tversky提出了“代表性启发式”来解释,他们认为人们在进行贝叶斯推理时并不遵循将所有信息进行整合的原则,而主要根据证据和可能结果之间的代表性程度做出估计,所以具有代表性或典型事件发生的概率会更高[15]。
但也有研究表明基础概率不会被忽视。如Koehler和Evans认为人们只是没有足够重视基础概率[16-17]。国内学者张向阳通过直接操作基础概率来考察被试是否运用了该信息。结果在概率估计值方面,低基础概率组的被试概率估计较低;在反应时方面,无基础概率组的被试反应时显著短于有基础概率组。实验还得出被试在各种条件下概率估计正确率都偏低。说明了人们未忽略基础概率,只是对它的重视程度不够[18]。唐源鸿和史滋福通过同时操作贝叶斯推理问题中的基础率和击中率的方式来进行研究。结果得出被试估计的后验概率会随基础率、击中率的提高而增加,表明了两者对贝叶斯推理都有影响[19]。史滋福,廖紫祥,刘妹在眼动研究中进一步指出虽然人们对基础率的关注程度不如击中率和误报率,但这并不意味着他们完全忽视了基础概率的作用[20]。
(二)自然频率论
在人类推理是否遵循贝叶斯定理问题上,Gigerenzer和Hoffrage提出了第三种观点,认为贝叶斯推理问题的概率信息形式影响概率判断。他们提出前人在研究中只考虑了认知加工过程而未考虑贝叶斯推理问题的信息表征是否符合人们的思维习惯[11]。
在信息格式方面,人们主要使用以自然数表示的自然频率格式和以百分数表示的标准概率格式来表达概率问题。Gigerenzer和Hoffrage在实验中运用了以自然频率格式表征的“乳腺癌问题”:参加常规X光透视检查的40岁妇女中,1000名中有10名患有乳腺癌,这10名患了乳腺癌妇女中有8个胸透片呈阳性;未患乳腺癌妇女中990个中有9个胸透片呈阳性,现有一些妇女的胸透片呈阳性。结果当研究者询问被试这些胸透片呈阳性的妇女中实际有多少人患有乳腺癌时,在自然频率格式下46%的被试判断正确,而在标准概率格式下只有8%的被试判断正确。说明了以频率格式代替概率格式,能够提高被试的贝叶斯推理水平。他们还从进化论角度来解释,人们的心智适应频率信息形式[11]。
国内学者傅小兰和赵晓东在贝叶斯推理问题的信息表征方面进行了总结,与进化论解释不同,他们强调了自然频率表征的优越性主要体现在:简化计算(计算过程操作更少);减轻注意负担(只需注意击中率和误报率信息);可以忽视基础率(这在自然取样中是完全合理的);可以计算后验分布,且自然频率格式提供信息的更多[21]。
国内外的一系列研究表明,自然频率代替概率格式能够改善和提高贝叶斯推理能力,但只是在一定程度上有所提高,仍有一半以上的推理者未获得正确答案[22]。这一结果导致大量研究者开始进一步全面研究贝叶斯推理问题的不同信息表征形式在其中所起的作用。
(三)问题形式和信息结构影响理论
Girotto和Gonzalez研究得出在贝叶斯推理问题上无论是概率格式还是自然频率格式,完成两步问题优于完成一步问题且完成具有分割信息结构的问题优于不具有分割信息结构的问题。因此,贝叶斯推理的问题形式和信息结构对人在解决贝叶斯推理问题中发挥着重要作用[23]。Cosmides和Tooby在实验中要求被试构建一个图形表征,结果得出图形表征有利于被试解决贝叶斯推理问题[24]。
傅小兰和赵晓东根据国外学者对贝叶斯推理问题的信息表征形式的研究试图进一步研究其对中国被试的影响。实验从问题材料的问题形式、信息结构和辅助图形表征三方面进行探讨。结果得出在问题形式上,一步问题形式有时比两步问题形式的推理成绩好,频率信息格式有时比几率信息格式的推理成绩好;在信息结构上,分割的信息结构形式比未分割的信息结构形式的推理成绩显著更好;在辅助图形表征上,结构图形式的辅助图形表征显著比条形图形式和饼图形式的辅助图形表征的推理成绩好[22]。史滋福等人也认为适宜的信息表征在贝叶斯推理中起着关键的作用,认为通过图形表征(完整和不完整树图)可以显著提高贝叶斯推理成绩[25]。
随着研究的深入,研究者开始关注影响贝叶斯推理的其它方面,如有研究表明,个体的知识图式和认知水平等也会影响推理结果。Eddy以内科医生为被试,设计了一个内容涉及疾病诊断的贝叶斯问题的实验,该问题具有较低基础率、高击中率和低误报率,要求被试估计某人患病的概率。结果95%的内科医生都做出了过高的估计,这源于他们长期的专业实践,大脑中形成了一种习惯性或自动化的诊断图式。在他们的知识图式中,若击中率高,则患病概率就高,这证明了知识图式在贝叶斯推理中的影响[14]。Gretchen等人考察了被试的计算能力在贝叶斯推理中的作用,研究发现高计算能力的被试在贝叶斯推理问题上的概率估计水平更高[26]。之后,Sirota和Juanchich在此方面的实验结果也与Gretchen等人研究结果一致,在自然频率格式的贝叶斯推理问题中,拥有高计算能力的被试比拥有低计算能力的被试的贝叶斯推理成绩更好[27]。
三、儿童的贝叶斯推理
早前大多数贝叶斯推理研究都聚焦于成人的贝叶斯推理,之后也有研究涉及年龄较大的儿童,如小学生群体。与成人相比,儿童没有丰富的知识经验的积累,思维、记忆等认知功能也没有达到成人的水平等造成了儿童解决贝叶斯推理问题的困难。但有研究表明儿童也能在一些贝叶斯推理问题中有较好的表现,特别是当问题的表征形式符合儿童的心理表征特点时。
Zhu和Gigerenzerb通过构建10个内容适合于儿童的贝叶斯推理问题,以成年的MBA学生和四、五、六年级的小学生为被试来探讨贝叶斯推理能力是否依赖于信息的呈现方式。结果在概率格式中,成年人能够解决约一半的问题,而小学生被试没有一个能解决此类问题;在频率格式中,成年人能够解决达到70%以上的贝叶斯问题,而小学生被试能够解决的问题数量也逐年级增加,甚至部分六年级儿童的推理成绩超过了成年人。这一研究表明自然频率代替概率格式的信息表征方式不仅能够改善成年人的贝叶斯推理能力也能改善儿童的贝叶斯推理能力[28]。李美珍对小学生被试进行贝叶斯问题的研究得出了信息格式在很大程度上影响着小学生解决贝叶斯推理问题的能力,被试在自然频率格式比标准概率格式下成绩更好,同时,她的研究也表明了图示表征能够帮助小学生求解贝叶斯推理问题[29]。
同成人贝叶斯推理一样,在儿童贝叶斯推理问题中,除了问题的表达方式,研究者也开始关注影响贝叶斯推理的其它方面。如史滋福以小学六年级到大学二年级的学生为被试,采用了更贴合生活情境的任务(如李明-小刚任务)与经典测查任务(经典乳癌问题)作为问题材料。实验结果得出在前者任务情境中,贝叶斯推理水平随年龄的增长呈现出缓慢但平稳地提高,而在后者任务情境中,不同年龄段被试的贝叶斯推理水平未表现出明显差异。表明了问题创设的情境会影响儿童贝叶斯推理能力[5]。
研究者在以小学生为被试对儿童的贝叶斯推理问题进行研究后,对于更年幼儿童-婴幼儿的贝叶斯推理能力同样感兴趣。但是研究者无法用类似上述的贝叶斯推理问题去研究婴幼儿的贝叶斯推理能力,因为婴幼儿在显式和有意识的概率推理中存在很多困难,如他们不能有意识地用言语表述推理过程,研究者也不可能明确询问婴幼儿关于条件概率让其进行类似贝叶斯推理公式的计算。但是对于婴幼儿,研究者可以通过研究他们是否会隐式地使用这些推理技术进行推理和决策行为[30]。
婴幼儿是如何进行推理决策的?概率模型认为儿童在进行推理时,并不会单纯地从事件或纯数据出发,他们会测试假设,通过假设评估数据,做出决策,他们类似于理想的贝叶斯学习者。在很大程度上,儿童使用数据来制定和测试假设,他们了解世界的其中一种方式就是分析数据中的统计模式。已有研究表明,婴幼儿不仅能发现统计模式,还能从有关共变的统计证据中恰当地推断出物理因果关系[31]。Gopnik等的实验中借助一个Blicket探测器(一种当一些组合的物体被放在上面时,就会发光并播放音乐的机器),用因果关系的干涉主义来解释儿童应该能够利用这种结构来设计对世界的新干预措施。实验中,儿童看到积木B单独出现并没有激活探测器,但是当积木B与积木A同时出现探测器会被激活,而积木A单独出现会激活探测器。儿童被要求设计一个干预措施,使探测器运转或停止。那么,儿童应该对A进行干预,而不是B来使机器停止运转。实验结果得出2岁、3岁和4岁的儿童可以使用积木和探测器激活之间的共变模式来推断机器的因果结构,然后他们可以利用这些因果知识来找出如何让机器运转或停止。他们会添加积木A,而不是积木B或积木A和B来激活探测器;他们会去除积木A,而不是积木B或积木A和B使得探测器停止运转[32]。在这个实验中婴幼儿根据新证据建立了一个新的因果模型,从统计数据中恰当地推断出了因果关系。之后,Gweon和Schulz发现即使是16个月大的婴儿,他们在积木和探测器共变模式中推断因果关系的能力是相似的[33]。
因此,事实上,无论是儿童还是成人,他们在生活中进行推理和决策时,总是在无意识地广泛使用贝叶斯推理。通过推理,来了解生活中发生的不同事件。
四、小结与展望
推理是人们日常生活和学习中必不可少的一种思维活动。贝叶斯推理问题自Kahneman和Tversky提出存在忽略基础概率现象以来受到了越来越多研究者的重视,关于贝叶斯推理方面的研究也更加丰富。
这些研究为人们进行贝叶斯推理提供了以下启示:表明了人们在进行贝叶斯推理时,并不会按照贝叶斯公式进行推理,推理结果与现实存在着偏差,而造成偏差的影响因素有很多;除了大多数研究者关注的成人群体,儿童作为研究对象在贝叶斯推理中也有着重要意义;探索贝叶斯推理的脑与神经机制有助于揭示情境性、主动性、预测性等贝叶斯推理的重要特征。已有学者提出根据贝叶斯大脑理论(bayesian brain),大脑会依据外界输入的信息和模型做出客观概率信息的主观概率判断,并估计事件概率最大的可能性。所以,大脑在主动构建关于世界的假设,并用假设来解释世界。例如,近来对镜像神经元系统(mirror neurons system)的研究发现,其遵循贝叶斯大脑的基本假设,受情境调控实现对社会认知的预测编码[34]。因此,对贝叶斯推理的未来研究,我们需要从发展的视角探讨其在儿童、成人不同群体中的特点,更系统全面地考察贝叶斯推理这样一个复杂的认知加工过程。