因果关系学习的思维取向和概念分析
2021-11-20刘礼吴飞李廉
刘礼 吴飞 李廉
摘 要:因果和因果关系是人类理解和描述自然与社会现象,构建科学知识体系的核心概念,近年来频频出现在人工智能的教材中,在数据分析、机器学习、人工智能等研究领域以及计量经济学、健康医学、政策制定等应用领域受到越来越多的关注。但是与其他教学内容有所不同的是,学习因果关系会更多地涉及哲学层面一些基本内容,从不同的基本原则和思维定式出发,对于因果关系会有不同的理解和结论,从而形成不同的流派。因此在因果关系的教学中,必须清晰地阐明所约定的先验性原则和假设。也就是说,需要关注其中明确的思维取向。目前在研究生和本科生教学中所采用的相关教材大多包含以图灵奖获得者Pearl为主发展起来因果分析理论和技术。本文主要根据Pearl的两本著作Causal Inference in Statistics, A primer和Model, Reasoning, and Inference (Second Edition)的内容,对于因果关系学习中需要注意的思维形式和基本假设,以及与此相关的一些概念问题,进行较为深入的讨论、解释和评论,澄清其中容易混淆的地方,以此掌握好因果关系分析的理论实质和计算要义。
关键词:因果与统计;实验与观察;干预操作;因果时序性;结构因果模型;反事实推断;非完美实验数据;责任归因
当前数据驱动的因果分析和因果推断成为学术界的研究热点,其中既有人工智能研究中对于知识利用和知识生成的需要,也有对机器学习的结果做出因果解释的需要,这些研究成果推动了计量经济学、健康医学、政策制定等社会与人文科学等领域的发展。从统计数据中得出因果关系结论是现代科学研究的核心之一,Pearl等人从20世纪末开始提出的基于数据的因果演算受到了广泛的重视和逐渐的普及[1-2],并且已经进入教材,成为人工智能领域的重要学习内容。但是因果关系的学习,有很多地方涉及对于科学研究的基本规范、思维取向以及哲学层面有关人类如何理解自然和社会现象的基本模式。不同的规范和思维定式会产生对于因果关系的不同理解,从而形成不同的流派。在这一方面,高等教育出版社的《人工智能导
论:模型与算法》(该教材对应的MOOC入选首批国家级线上一流课程),从“知其然、且知其所以然”角度介绍因果分析中“引起和被引起”的关系,揭示了因果之间的深刻内在联系,以及在人工智能中的作用和地位。Pearl等在2016年出版的Causal Inference in Statistics,A primer(中译本:《统计因果推理入门》,高等教育出版社),阐述了通过观察和实验数据分析和计算因果关系的基本方法,对于因果关系的相关定义和原则,以及哲学层面的理解做了较为详细的阐述。因此在学习中,对于如何描述因果、因果关系以及通过计算手段挖掘潜在的因果关系,需要建立正确的思维取向和假设约定,这是在因果关系的教学中需要十分注意的地方。
从教育学的角度,卡耐基梅隆大学和印第安纳大学所进行的面向教育的实验分析表明:学习习惯、教育手段和教育资源与学习效果改善之间存在一定的因果关系。我们知道,在教与学过程中,因和果之间关系由于学习主体(即学习者)的引入而变得异常复杂,如何应用因果模型来洞悉学习过程中混淆变量(confounder)和干预变量(treatment)以及应用合理的控制手段对学习效果进行评价,准确界定针对个体的研究结论推及总体的泛化能力,形成可靠的知识和经验积累,找出影响教学效果的真正原因,做到“对症下药”,是构建循证教育学(Evidence-based education)的基础理论和方法,成为推动教育评价科学化发展的重要原生动力。
由此看出,无论是对于自然和社会现象的研究中引入因果关系,还是在教学本身采用因果的观点分析相应的数据,以更好地解读教学效果和实现教学改进,都有着重要的意义。为了加深对于因果和因果关系学习过程中问题的剖析和理解,本文选取了其中8个有代表性的概念问题,通过对于这些问题的讨论,阐述因果关系学习内容中体现的哲学观念、人类认知模式,以及人工智能与人类智能之间的相似与不同,给出相应的阐述、解释和评论,这些问题如不能梳理清楚,有可能误导读者对于该理论的正确理解,以至于产生不适当的应用。
一、因果关系与统计关系
Pearl一再强调因果与统计之间有着本质的区别,然而因果分析与推断仍然是建立在统计学的语境上。根据Pearl的看法,统计学主要研究数据中所蕴含变量的联合分布,以及联合分布有关的参数特征、分布密度、存在性和可检验性。与之不同的是,因果关系研究的是联合分布中变量的变化规律,即当联合分布式中一个变量发生变化时,如何影响其他变量。简单地说,就是有关分布的静态性质与动态性质的区别。可见,传统统计学不能有效处理因果关系。Pearl给出了有关因果关系的一些定義(不止一个),例如图形化的定义或变量之间条件独立性的定义等,这都可以作为不同的角度来理解因果关系。建立因果分析基本操作的基本计算模式,这是当前对于因果关系最为数学化的描述,也是在应用中与现象和常识解释最为契合的。但是其中所需要的因果图(DAG)的构造,涉及的一些先验假设,对于这些假设的认可,不仅涉及对于具体问题的理解,也涉及一些哲学层面的考虑,因此仍然存在某些不确定性,从而导致在同样的数据集合下,对于因果关系可能会有多种解释。最早试图定义因果关系的是休谟(David Hume,1711—1776),他用下面的三条定义了X是Y的原因:(1)X发生在Y之前;(2)X发生必导致Y发生;(3)X不发生则Y也不发生。这个定义看起来十分自然,也符合我们的常识理解,但是却不严格,可以举出符合该定义,但不是因果关系的例子,也可以举出不符合该定义,但却是因果关系的例子。为了寻求更为科学和严谨的因果定义,一些科学家例如格兰杰(Clive W. Granger)、赖辛巴赫(Hans Reichenbach)、麦基(John E. Mackie)、鲁宾(Donald Rubin)、珀尔(Judea Pearl)等持续不懈地探索,给出了各具特点的、从不同角度阐述因果和因果关系的定义。就目前状况而言,寻找一个与人类常识符合的因果关系普适的定义也许还没有出现,因为因果关系所具有的人文属性和复杂内涵,严格的数学化定义因果关系是非常困难的,要得到大家公认的定义看起来更是需要继续做出深入的研究。
“因果以及相关的概念(例如随机化、混杂、干预等)不是统计概念”,这是贯穿Pearl因果分析思想的一条基本原理,Pearl称之为第一原理。同时Pearl还进一步解释道:“如果混杂因素是一个统计学概念,我们就可以从非实验数据的特征中找出混杂因素,对这些混杂因素进行校正,得到无偏差的因果效应估计。这违反了我们的黄金法则——在任何因果结论背后一定有某种未经检验的因果假设。”
因果分析或者因果推断,当前有各种学派,从最保守的到最宽容的,最为保守的只相信建立在严格的动机—效果模型(或认为是这样的模型)上的推断,对于数据和假设有近似苛刻的要求。有些学派认为因果推断必须借助随机化的实验,或者准随机化的实验(包括自然实验),并在一些強限制的假设下进行数据处理。更为宽容的属于Pearl的学派,认为通过适当的观察和必要的假设可以从关联中识别因果关系。再放宽一步,认为人类在日常生活中进行因果推断很少诉诸实验,因此计算机也可以基于这样的原理设计因果推断算法,即推断完全可以借助经验或者纯数据进行。尽管这些不同的观点对于因果关系的看法有分歧,但是有一点是共通的,即都不认为单靠统计学可以解决因果问题[3]。
因果关系和统计之间的区别用决策理论可以说得更清楚。决策理论中有两类,前者称为求果问题(forward),后者称为溯因问题(reverse)。
对于前一类问题,无法采用统计公式P(Y|X,Z)
来解决。因为该公式描述“在环境Z下,同时采取了策略X之后,Y的取值”。但是,决策问题关心的是在当前环境Z下,如果采取措施X,产生效果Y的概率,因此正确的写法应该是P(Y|do(X),Z),这是一种干预操作。统计公式表示了观察情形,被动地看见的效果(seeing),而干预公式表示主动的作为,即施加策略后产生的效果(doing),两者是不一样的。
二、实验研究与观察研究
Pearl的因果分析框架非常强调区别实验研究与观察研究,并且在多种场合说明由于混杂因素的存在,实验研究与观察研究的结果会非常不一致,从观察性的数据中,获取因果知识具有特殊的困难和问题。在基于数据的因果推断中,主要技术就是解决好混杂影响。传统的方法是通过物理实验识别和消除混杂,即公式P(y|x)?P(y|do(x))。这为那些实验成本很高或者是无法进行试验的社会科学和人文科学无疑开辟了一条新的途径,使得实验手段借助数学计算进入这些学科[4]。
通常认为,实验是科学研究的基本手段,是对于假设的实证性验证,长期以来被认为是获取科学结论的唯一手段,在这种观点下,那些难以做实验的社会科学和人文科学(包括医学),就因缺少手段支持而发展艰难。而对于数据,特别是大规模的观察数据,虽然是自然的、粗糙的(crude)和杂乱的,却蕴含了现象内部发生的规律,通过数据来揭示事物内在的因果联系是科学研究的另一种艺术。尽管后者出现的时间不长,但却正在而且必然成为科学研究新的主要手段之一。
在实证研究中,实验表示一种干预,观察表示一种描述。但是观察与实验也不是截然分开的,Pearl的因果分析特别强调,在一定程度上,充分的观察可以替代实验。在此基础上,发展了一套完整的基于数据的因果分析方法,其核心是把因果分析建立在当前可利用的数据上(观察的和实验的),并且与最新发展的统计学融合起来,把预测和反演问题归结为基于数据的计算和分析。
任何学科的研究都需要建立在一些前提(假设)上,这些前提有时是明显的,有时是隐含的,它们的正确性都需要外部确认。但是统计学与因果性研究对待前提的区别是,统计学的前提可以根据样本数据的增加而发生变化,如果前提被样本否定,则统计学会抛弃原有前提,或修改前提以拟合数据;而因果性研究的假设一般不会因为样本数量而改变,基本陈述格式是“在这种前提下,因果关系如此这般”,也就是承认前提,才能接受相关结论。从这一点说,统计学的前提是一种先验假设,而因果性的假设是一种信仰。贝叶斯主义不太看重先验假设,只要给定充分多的样本和足够细致的测量,原则上统计假设是可以检验的。当然从直观上说,越是平凡且容易认同的假设越合理,过于牵强和复杂的假说尽管在数学上能够通过,但在研究中不被认可。
Pearl因果推断中最基本的两个假设(称之为基本定律),第一个是关于反事实假设(或干预假设),即
Yx(u)=YMx(u)
其中u是环境变量,Mx是强制X=x后的修改模型(图模型或结构方程模型)。
第二个假设是条件独立假设,任意两个节点之间缺失的箭头都意味着数据中的某种条件独立性,即
(XsepY|Z)G(m)?(X┴Y|Z)
即变量X和Y在图上的条件分离,意味着在数据中的某个条件分布独立。这一条可用来从数据构建因果模型,或者验证某个模型是否与数据拟合。
第一个构成了干预操作计算的基础,第二个构成了因果模型的判别准则。这两个假设构成了Pearl因果推断的基石,不承认这两条就是拒绝Pearl因果推断模式。
三、后门准则和随机实验
后门准则是Pearl提出的用以计算因果效应的基本方法。从本质上说,后门准则是随机实验的数字化版本,随机实验的目标正是消除其他因素对于目标变量因果关系的混杂,而后门准则将这种物理手段上的消除,通过数学上取平均值的方式予以模拟,从而建立了通过数学演算消除混杂的方法,因此后门准则以及相应的do操作有很好的物理和数学背景支持。大数据提供了现象之间的变化及其关系,这些变化是大自然有意或无意中形成的,理论上说,只要数据量充分大,同样可能蕴含了随机实验中所需要的结果,只是数据的质量和分布可能没有实验那么完美。直接从这些数据获取因果关系,就是基于数据的因果发现。其重要意义在于,人们因此可能降低随机实验的巨大成本与资源消耗。
贝叶斯学派以及其他的统计学派,都是以被动观察作为基本研究手段的,而因果推断是以实验或者对于数据的主动操作(即do操作)作为基本研究手段的,特别是基于数据的因果推断。两者根本的区别在于,观察的结论是可以更改的,随着数据量的增加,以前的结论可以被不断修改和完善,这也是贝叶斯主义的基本原则。但是对于实验来说,不同的实验只能得到相同的结果。无论是一次实验还是多次实验,其结果必然是一致的,如果出现矛盾,是实验本身设计出了问题,而不是结论出了问题。这是因果推断学派与统计学派的区别。
在传统的统计学里,一条原理是“观察不能代替实验”,但随着Pearl等人的基于数据因果分析方法的引进,这条“金科玉律”可以修改。在充分大的(观察)数据背景下,通过依赖数据的分析方法,也可以揭示现象之间的因果关系。这也许印证了另一句话:“每个关联关系背后都有某种因果关系。”[5]
四、统计时间与物理时间
具有时间标记的数据对于因果分析是至关重要的,在因果分析中,将数据发生的自然时序称为物理时间。而从数据中通过DAG图形描述,将变量划分为层次关系的次序称为统计时间,在统计时间里,父节点变量的事件发生于子节点变量之前。如果在建模中,物理时间与统计事件一致,当然最好,但也可能不一致,理論上物理时间只有一个,但是统计事件却可能有多个。不同的统计时间可能导致不同的因果解释(统计时间也是假设前提之一),从应用角度,自然应该找出那个与物理时间相对应的统计时间,但是在数据本身缺失时间标记时,这种寻找是困难的。因此数据的语义问题很重要,也就是说,我们不仅需要关心数据本身,也要关心数据产生的机制和方式,即数据产生的环境。不加区别地使用数据,可能会走进死胡同。
由于因果关系是不对称的,因此如果缺乏时序信息,不可能唯一地确定因果关系。在一个模型里,X是Y的原因,在另一个模型里,也可能Y是X的原因。从观察数据来看,我们只能得到X与Y联合出现或者不出现的信息[即联合分布P(X,Y)],除非提供时序信息,即哪个变量先出现,否则永远无法确认因果关系。我们平常谈论因果关系时,经常明确或者隐含地涉及时序。但是在很多(甚至在大多数)场合下,时序问题并不重要,数据中即使包含了时序信息对于因果分析也没有用处。例如胆固醇和锻炼的关系,单独看着这两个变量,我们无法知道是锻炼的变化影响了胆固醇水平,还是胆固醇变化影响了锻炼的兴趣,时序信息在此毫无用处。另一个例子出现在同时发生的现象,例如,一个高的旗杆与长的阴影的关系,是旗杆的高度决定了阴影的长度,还是阴影的长度决定了旗杆的高度,时序信息在此也毫无用处(当然这时常识可以帮助我们确定因果,但是在常识不具备的情况下,做出判断就不容易了)。因此要确定两个非时序事件(变量)之间的因果关系,必须有多于三个以上的事件(变量),通过相互之间的条件独立性来确认。
五、回归方程与结构方程
在因果分析的计算公式中,Pearl多次强调回归方程与结构方程的区别。从形式上看,两种方程都是等号连接的公式,或者更一般地,等号左边是一个变量,右边是一个数学表达式。两者之间本质的区别在于对称性。对于线性回归方程
Y=aX+bZ+e(*)
写作
X=Y?Z?
是允许的,同样表示了X和Y之间的关联关系。但是结构方程却没有这种对称性。在线性回归方程(*)的例子中,结构方程表示变量X,Z,e可以影响Y,而Y不能影响X(用图的语言说,X,Z,e是Y的父节点),因此方程不能逆转,不能用Y,Z,e表示X,否则数学意义完全与数据不符。在最近的报告中(北京智源大会,2020年6月),Pearl使用“←”取代“=”描述结构方程,突出强调了方程两边的不对称性。
构建回归方程只要(随意)选取相关变量,然后利用协方差关系就可以确定系数。而结构方程则需要利用数据中的各种条件独立性来构建,也就是说,构建结构方程,其中的变量选择需要更多地依赖数据内部的性质和某些假设,单靠相关关系无法获取结构方程。
结构方程理论上允许互为因果,即两个变量X,Y可以在两个方程中互相出现在左边和右边。但是一般来说,希望方程具有“层次性”,每一个变量至多出现在左边一次,并且两个变量不能互相出现在右边。那些从未在左边出现的变量称为“外生变量”(exogenous variable),否则称为“内生变量”(endogenous variable),显然内生变量的取值由外生变量唯一确定(统计意义上)。这样一来,结构方程把变量定义了层次,上层变量的值决定了下层变量的值,这等价于将数据定义了一个“统计时间”(见上面的第四点),如果该统计时间与物理时间(如果有)相一致,则说明结构方程是客观上合理的,如果不一致,不影响数学处理,但是其结果是否符合实际情况需要验证。
对于互为因果的结构方程,可以认为在两个互为因果的变量X,Y之上,还有未被观察的第三个变量U。U可能同时影响X和Y,从而导致从当前的观察来看,X和Y互为因果,也就是说,X和Y互为因果不是实际情况,而是由于观察不充分引起的,事实上可能存在第三个变量Z是X和Y的公共原因。这个问题涉及对于因果的哲学理解和实证分析,目前只能作为一种假设(即Reichenbach的公共原因原理)[5]。
这颇有些像当代物理学的困境,对于纠缠等与常识相违的粒子行为,到底是物质的本质属性,还是缺少观察的维度和手段。
在合理地确定了相关的变量后,建立线性结构方程仍然需要借助回归的手段,因此两者在形式上有相同之处。顺便强调一下,即使对于线性系统(*),a未必是X对于Y的全因果效应,只有当回归变量Z,e满足后门原则时,a才是X对于Y的全因果效应。
六、反事实推断与假设世界
反事实推断是最能代表人类智能的特征,Pearl认为具有反事实推断的智能才能称为真正的智能,也就是人工智能的第三个阶梯。反事实在日常生活和科学论述中是大量出现的。Pearl对于反事实的定义和计算是目前关于反事实推断的最为清晰、涵盖面最广以及最便于在实际中应用的方法。传统的统计学也试图讨论在事件A已经发生并产生结果Y的前提下,反推如果在事件A不发生的情况下可能出现的结果。但是由于相关的定义和解释是模糊的,关键是没有严格区分现实世界与假设世界的不同。事实上,反事实推断涉及现实世界和假设世界两个不同的世界,传统的统计学对此的理解是不深刻和不充分的,因此留下了很多问题无法说清。Pearl的框架为此建立了专门的语言,使用逻辑和数的必要性和充分性原因,这大大提升了对于因果关系的理解。因果关系从定性研究发展到定量研究。其中PN(必要性原因)、PS(充分性原因)、PNS(充要性原因)的计算可以将因果分析扩大到许多领域,并且使之精确化和计算化,而且具有简明性和精准性的优点。
从过去可以推算现在,但是从现在难以推算过去。过去的现象很多,哪个现象都会与现在相关,过去所有的现象集合构成现在现象的充分原因,但是其中真正的必要原因很难从观察中获知。这就是著名的INUS理论,INUS是Insufficient but Necessary part of a Unnecessary but Sufficient condition的缩写,意思是在充分不必要条件下寻找其必要不充分部分[6]。如果要回溯某个结果的必要原因,只靠观察显然不行,需要借助因果分析中的反事实公式,例如P(y'x'|x,y)进行计算,即计算在x和y已经出现的情况下,如果x不出现(x'),y也不出现(y')的概率,这是x作为y的原因的必要性度量。因果分析可以令人信服地刻画对于未来的预测和过去的溯因[7]。
七、非完美实验与区间估计
非完美实验指的是受试者可能没有完全按照实验协议操作,事先设计的方案未能实现理想的控制,实验结果可能会因受试者不完全服从协议而偏差。比如,通过投放广告来推销某种产品,由于接受实验的用户可能违反协议不看广告,因此广告的真实作用难以估计。这种不完全符合协议的现象使得实验变得不可靠,并且给数据中得出的结论带来了偏差。而且这种偏差是不可知且无法纠正的。
因果分析也可以应用在这类问题的处理上,并且给出了因果关系的一个区间估计。举一个检验治疗方案的实验,受试者被随机分为两个组,一个组实施实际治疗,另一个组实施安慰治疗。给出两个假设:(1)对于任何一个人来说,分组会影响他所选择的治疗方法,但不会影响治疗方法的效果。(2)治疗对于受试者的效果是相互独立的。但是没有限制治疗效果对于选择治疗之间的相互影响,即治疗效果好的方法可能会有更多的人选择该治疗(这在日常生活中很常见)。
非完美实验在很多场合是不得不采取的实验方式,例如:
(1)随机的治疗实验可能会受到违反协议的影响。例如,实验药物的不良反应可能会使受试者擅自决定减少指定剂量。或者,如果实验是测试一种药物治疗晚期疾病,那么怀疑自己是对照组成员的实验者可能会偷着从其他来源获得药物。这种协议遵守的不完全性使得实验数据产生偏差。
(2)拒绝给予某些受试者提供治疗会产生道德和法律后果。例如,在艾滋病研究中,被分配到对照组的患者将会禁止拯救生命的治疗,在道德和法律上可能是不允许的。
(3)随机化可能影响受试者的参与以及行为。例如,在对于学校录取情况的随机控制实验中,一旦申请者知道学校是随机选择录取标准,可能会对申请学校持谨慎态度,这就改变了原来学校正常的申报情况,录取数据出现失真。
使用不完整数据(缺失或者失准)虽然难以做到对于因果效应的精确点估计,但是在一定的条件下却可以做到区间估计,这是非完美实验的因果分析的基本思想。结构因果模型(SCM)描述了各个变量之间的关系,其中外生变量(可观察或不可观察)处于最外层,而内生变量处于里面。外生变量的每一个具体取值定义了因果图的一个状态,这样该系统中可能有的因果关系,完全由外生变量的可能取值决定。反过来,通过部分内生变量的当前取值,可以反推外生变量当前可能的取值范围,从而确定所有内生变量的状态(区间值)。将外生变量的取值水平离散化,划分为有限个等价类,每个等价类对应一个因果效应,这个分划称为典型分划。再依据SCM各个变量之间的依赖函数,通过求解方程,可以得到平均因果效应ACE(X→Y)的取值范围(区间值)。这就给出了因果效应的区间估计。这样一来,即使实验数据不完整或者不准确,例如实验的协议实际遵守情况不了解,只要具有大概的信息(例如有10%的不遵守协议,或者再加上其他信息),就可以得到平均因果效应ACE的区间值,这就是基于不完美实验数据推断的区间估计方法,当然如果数据是充分的和精确的,则区间估计可能会塌缩为一个点,即精确的点估计。
为了进一步计算ACE,可以对于服从协议的比例有一个先验假设,然后通过Gibbs抽样进行假设检验,进而估计概率ACE(X→Y)。结合已有的对于总体的知识,这个先验概率可以取平均分布,或者偏态分布,并通过抽样分析修改先验假设。该方法不仅可以用于评估群体的平均概率分布,也可以应用于单个个体的情况,通过不完全合作背景下的反事实推断,估计单个个体的因果效应。
八、归因分析与法律责任
Pearl在很多报告中,都谈到一个有关药品事故归因的问题,虽然问题本身是杜撰的,但其内容说明了归因分析的重要性质,并且引起很多争议。我们先来介绍一下该问题(见表1)。
表格的左边是制造商对某种止痛药品进行实验的数据,因为该实验是按照标准的程序和要求进行的,该药品通过了审批部门的核准,从表中可以看出:
(1)虽然药品增加了死亡率(从14/1000增加到16/1000),但是由于药品能够有效减轻疾病痛苦,还是可以容许的。
(2)根据流行的统计学中额外风险的计算公式,ERR==0.125,因此如果某人因为吃药死亡,则制造商需要承担12.5%责任,对于这部分责任,制造商可以通过购买保险的方式赔付,而不是进一步提高药品的安全性。
但是在诉讼中,原告律师拿出另一个数据,即表格的右边,这是律师进行实际调查时获取的数据,两者的区别是,实验数据是强迫性的,无论受试者是否愿意服药,必须根据实验协议服药。而律师的数据是观察性的,服药是出于自愿。因此根据Pearl的计算公式,制造商需要承担的责任是
PN=+
=(0.002?0.028)/0.002+(0.028?0.014)/0.001=1
其中PN的第一项是观察结果的(不是实验结果的)额外风险率,第二项是观察结果的混杂修正。两个计算公式产生了巨大的差异,Pearl认为被告(即药物制造商)的责任为1是可能的,理由有三点:
(1)数学公式如此,根据单调性假设,数学推断的逻辑没有问题,算出来的结果不会有问题。
(2)观察数据反映了个体自愿选择服药,而不是像受控实验那样,根据实验协议服药。即实验数据是药物的“指定影响”,而观察数据是药物的“自愿影响”,由于观察数据更加符合原告的情况,所以归因计算应当采取观察数据而不是实验数据(采用实验数据,被告的责任就是0.125)。
(3)由于提供的数据比较粗略,缺少受试或者观察人员属性的细节描述,因此对于非确定的个人来说,某些概率值(药商责任)的估计为1是可能的。
但是这个问题还是具有争议,本质上说,这是所谓“亚群翻转”问题(subpopulation reverse,见文献[1]的1.2节),即总体人群分布与其中某个亚群的分布完全不同,甚至相反。在这种情况下,对于总体而言的实验数据与实际观察数据的关系就值得探讨,在估计混杂因素时,应用了公式P(y|x')?P(y|do(x')),其直观意义是观察数据值与实验数据值的差,并认为这就是混杂因素,这一点值得商榷。由于观察数据可能来自总体的一个特殊亚群,这个亚群成员中存在某种未知的原因(属性),使得吃药与未吃药的死亡比例与实验数据差别如此之大,因此可以认为观察的对象并不服从总体的随机分布,甚至反转了实验结果。因此需要对于实验结果的适用范围(即总体的亚群)做出假设,而不是泛泛认为对于所有的亚群都适用。如果假设实验结果适合于所有的亚群(当然包含观察的亚群),显然其合理性受到质疑,如果不包含观察的亚群,则实验结果不能用于该观察人群。理论上说,只有在这类特殊的亚群中重做随机对照实验,才能有说服力地识别出亚群条件下的混杂。否则总体人群与亚群之间的分布完全不同,它们的差是否就是真正的混杂,还是存在疑问的。这个例子说明,当观察数据和实验数据可能产生很大的分歧时,可信的因果推断必须慎重,并需要有进一步的研究支持(例如可迁移性)。无论怎么说,被告(药品制造商)的律师还是有辞可辩。
哲学上把现象与现象之间那种“引起和被引起”的关系,叫作因果关系,其中引起某种现象产生的现象叫作原因,被某种现象引起的现象叫作结果,如“力,形之所以奋也”。因果分析和推断是一种重要的获取知识的手段,是人类智能的关键组成。本文对因果推断中的核心概念进行了解释。尽管因果关系是人类思想的基础,但因果关系却长期笼罩在神秘、争议和谨慎之中,一般很难确定一个事件是否真正导致了另一事件。Pearl给出了一种描述和处理因果关系的数学语言,理清了一些模糊的和相互矛盾的概念,为科学处理和获取因果知识奠定了坚实的基础。但是,真正具有挑战性的问题仍然摆在我们面前:对教学效果、学习兴趣、性格倾向这些现象仍然无法理解其因果性,只有数据的积累和敏锐的洞察力,最终才能实现真正理解,并在此基础上,实现人工智能理论和技术的新飞跃。
参考文献:
[1] PEARL J, GLYMOUR M, JEWELL N P. Causal inference in statistics, A primer[M]. Hoboken: John Wiley & Sons Ltd, 2016.
[2] PEARL J. Model, reasoning, and inference (second edition)[M]. Cambridge: Cambridge press, 2009.
[3] SLOMAN S. Causal models, How people think the world and its alternative[M]. Oxford: Oxford University Press, 2005.
[4] GELMAN A. Causality and Statistical Learning[J]. American Journal of Sociology, Volume 117 Number 3, 2011: 955–966
[5] SCH?LKOPF B. Causality for machine learning, arXiv: 1911.10500v2[DB]. 23Dec 2019.
[6] MORGAN S, WINSHIP C. Counterfactual and causal inference, method and principle for social research[M]. Cambridge: Cambridge University Press, 2007.
[7] HOERL C, MCCORMACK T, BECK R. Introduction: Understanding Counterfactuals and Causation[M]//HOERL C, MCCORMACK T, BECK R (eds.). Understanding Counterfactuals, Understanding Causation: Issues in Philosophy and Psychology. Oxford: Oxford University Press, 2011.
[責任编辑:余大品]