论演绎与归纳推理在实践活动中的应用
2018-02-20林玉慈
林玉慈
(东北师范大学 数学与统计学院,长春 130024)
推理是人们生活中不可须臾离开的思维形式,将推理应用于实践的过程实际上就是人们为了解决实践中的问题而通过思考来决定自己如何行动的思维过程。在实践中,可以依据定义性规则和策略性规则,把逻辑推理的本质作为一种目标导向型的行为来作出区分。定义性规则明确实践规则,策略性规则解释怎样才能做得好。在逻辑理论化的过程中,绝大部分的研究都集中在定义性规则上而放弃了策略性规则,其原因可能是20世纪早期数学基础的危机,该危机促进了对逻辑推理规则稳定性的强调。但在逻辑的实际应用中,策略性规则显得极为重要。[1]本文属于对策略性规则的研究,旨在结合统计学中收集样本的相关理论与策略,来讨论演绎推理和归纳推理在实践活动中的应用。
对实践的讨论一般认为是从亚里士多德开始的,他在著作《尼各马可伦理学》中强调:“我们所有的活动都只有一个目的,这个目的就是那个可实行的善”[2]17,“而人的善就是灵魂的合德性的实现活动”[2]20。据此,“善”就为人的实践活动所体现。而实践活动可分为心理活动与身体行动,实践活动“按照正确的逻各斯去做”[2]37而将两者结合起来,才能够实现“善”。但实践活动具有极大的不确定性,人们即使有追求“善”的目的,又采取了合适的行动,也不一定能够真的实现“善”。这就要求人们在实践活动过程中进行理性的思考,而这个思考过程中存在着演绎推理和归纳推理。
一、集合类型
通常来讲,演绎推理和归纳推理分别是从一般推到特殊的推理和从特殊推到一般的推理。从实践的角度出发,所谓“一般”,就是一类事物所具有的同一性质,所以不妨将具有同一性质的一类事物看作一个集合,将此类事物中的某个事物看作集合中的元素,即所谓“特殊”。演绎推理基于一种理想化的大前提,相信集合中所有元素都具有某种性质,从而推断其中的某个元素也具有此种性质;归纳推理则基于某个或某些元素具有某种性质,并且确定这个或这些元素属于某集合,从而推断该集合也具有此种性质。在实践活动中,演绎推理与归纳推理本质上是对集合性质与集合中元素性质之间关系的思考,而集合表现出什么性质,是由集合中的元素决定的。
根据集合性质与集合中元素性质之间的关系,可以区分出四种类型的集合,分别为:同一集合、兼容集合、共和集合、杂合集合。这四类集合都是由许多性质相同的个别事物构成的,均具备同质性和大量性;除“同一集合”外,其他三类集合都具有差异性。这里的差异性是指,构成集合的各元素除了某一方面或某几方面性质相同以外,必须在其他方面存在着性质差别。同质性是组成集合的根本条件,大量性是组成集合的基本前提,差异性是集合研究的主要内容。上述四个集合类型涵盖了集合性质怎样被集合中的元素性质决定的全部情况。
1.同一集合。“同一集合”中所有个别单位的所有方面都表现共同性,因此,如要知道集合的性质,只需研究其中一个元素即可。这种情况在实践活动中几乎不可能出现,基本只会出现在数学等抽象领域中。例如,平面上任意一个三角形的内角和都是180度,那么由平面上所有三角形构成的同一集合,也满足“内角和是180度”这个性质。
2.兼容集合。兼容集合中的元素具有同质性、大量性和差异性,就实践活动中影响集合性质的元素性质而言,集合性质由集合中具有同一性质的多数元素的性质决定。拿《中华人民共和国宪法》中的规定来说,中国宪法的修改,由全国人民代表大会常务委员会或者全国人民代表大会代表提议,并由全国人民代表大会以全体代表的三分之二以上多数通过。也就是说,当三分之二以上的多数人大代表通过了修改宪法的提议时,由全体人大代表构成的兼容集合将体现出由大多数人大代表认可的“修改宪法”这一性质。
3.共和集合。共和集合中的元素具有同质性、大量性和差异性,就实践活动中影响集合性质的元素性质而言,集合性质由集合中少数具有代表性的元素的性质决定。这样的集合在实践活动中也极常见:每个组织都有其负责人,任何单位都有其领导者,少数人作出的决定多数人都须执行,“下级服从上级”也是这样的情况。也就是说,共和集合表现出的性质是少数具有代表性的元素所具有的性质。
4.杂合集合。杂合集合中的元素具有同质性、大量性和差异性,就实践活动中影响集合性质的元素性质而言,集合性质由外部条件与内在性质等综合因素决定。杂合集合这种复杂的集合类型才是实践活动中最常见的,其元素间的差异性可能是两方面或多方面的,并且还可能同时受几种不同的外部条件影响,导致诸多不同因素影响下集合表现出的性质也不同,因此这种情况无法简单述说清楚。但是面对实践活动中的杂合集合,可以将繁杂的情况分类讨论,结合统计学中样本选择的理论与方法,讨论怎样选择样本能够得出比较好的结论。
下面根据四种集合类型,分别讨论演绎推理与归纳推理在实践活动中的应用。
二、实践活动中的演绎推理与归纳推理
归纳推理的核心思想是通过集合中部分元素的性质来推断集合的性质,而统计学就是一种运用归纳思维、通过样本推知总体的科学。统计学的两个核心理论是大数定理*大数定理关心的是样本均值和总体均值。该定理认为,当样本足够大时,样本均值将落在总体均值附近。和中心极限定理*中心极限定理的内容是:无论抽样分布如何,样本均值总是对称地围绕在总体均值附近,服从一个以总体均值为中轴的钟形分布(正态分布)。,前者证明了部分样本就可以代表全体,后者说明了样本量和结果可靠性之间的联系。大数定理和中心极限定理保证了根据样本推断总体的合理性,但这两个定理的成立基础是样本的随机性,而就人类现有的技术来说,完全随机是不可能的,只能是尽量随机。怎样选取部分样本是非常重要的,选取的好坏将很大程度地影响推断的准确性。对于不同的集合类型,选取样本的侧重也应该有所不同。
(一)同一集合中的演绎与归纳
这种情况在社会实践中几乎不可能出现,而是大多出现在数学等抽象学科中。下面以著名的费马大定理*费马大定理的内容是:不可能将一个立方数写成两个立方数之和,或者将一个4次幂写成两个4次幂之和;或者,总的来说,不可能将一个高于2次的幂写成两个同样次幂的和。从提出到最终证明的过程为例详细讨论。
费马大定理的起源与勾股数有关。基于a2+b2=c2对所有直角三角形成立,费马可能希望将此结果推到更高维的情况,即求出正整数a、b、c,使得an+bn=cn,其中n≥3且n∈N*。他很可能尝试了n=3和n=4的情况,但未成功,于是反过来猜想n≥3且n∈N*时该等式无正整数解。之所以未将这个命题称为“猜想”,是因为费马说自己已经想出了证明方法。[3]187-189显然这个定理是通过归纳得到的。
费马大定理的实际证明历时358年。欧拉在研究费马大定理时认为给出一般性的证明是极为困难的,所以采用了个别尝试的归纳方法,分别证明了n=4时和n=3时费马大定理成立。狄利克雷和勒让德证明了n=5时费马大定理成立,拉梅证明了n=7时费马大定理成立。后来拉梅和柯西都宣布自己基本证明了费马大定理;然而库默尔发现他们的方法在逻辑上是不可调和的,并证明了当时的数学方法不可能给出费马大定理的完整证明;沃尔夫斯凯尔又发现并证明了库默尔的那篇指出拉梅和柯西证明错误的文章存在着一个漏洞,再次为定理的证明注入活力。但是没过多久,哥德尔提出了不可判定性定理,认为费马大定理没有任何证明。[4]尽管历经了三个世纪的失败,还有哥德尔的警告,数学家们仍然继续投身这个问题。二战后,计算机的出现使大量的计算不再成为问题,数学家们利用计算机,先后验证了在25 000以内、乃至400万以内费马大定理都是正确的;但是,范围再大也不能证明到无穷,无法宣称证明了这个定理。后来,由德国数学家弗赖提出,并经美国数学家里贝特验证,费马大定理的完整证明可以遵循这样的逻辑路线:如果谷山-志村猜想*谷山-志村猜想的内容是:每一个椭圆方程必然与一个模型式有关,而模型式又与复数空间几何图形的对称性有关。正确,那么每一个椭圆方程都可以模型式化;如果每一个椭圆方程都可以模型式化,那么椭圆方程y2=x3+ax2+b不成立;如果椭圆方程y2=x3+ax2+b不成立,那么方程an+bn=cn无解,即费马大定理成立。[3]187-189最终,美籍英国数学家怀尔斯证明了谷山-志村猜想,费马大定理的证明宣告完成。
从这个证明过程中,可以看到一个好的猜想是怎样引发人们深入思考的。所有的猜想都是归纳推理的结果,当不能给出一般性的演绎论证时,数学家们采取个别尝试的归纳方法。凭借对数学本质的理解和基于经验的直观,将问题转化为关于椭圆方程和复数空间几何图形的对称性,最终完成了对费马大定理的演绎证明。在此过程中,归纳与演绎是紧密结合在一起的,虽然论证是形式的和演绎的,但思维的过程是归纳的。
(二)兼容集合中的演绎与归纳
兼容集合的性质是由集合中大多数具有同一性质的元素决定的。要通过这类集合中的样本的性质来归纳性地推断集合的性质,如果不能保证样本的随机性,就需要主观地选择此集合中具有同一性质的多数元素来进行归纳推理,不然就会导致归纳得出的结论与实践不符。下面举例说明这一点:
1936年的美国总统大选“民意调查”是样本选择失败的一个典型案例。著名的《文学摘要》杂志社按照电话簿目录和汽车俱乐部成员名单向外派发了1 000万份调查问卷,调查结果显示兰登将赢得大选,但结果正好相反。这是因为当时电话和汽车十分昂贵,《文学摘要》的调查结果只说明了中产阶级更支持兰登,而忽略了人数更多的贫困阶级是罗斯福的支持者。这一疏忽最终导致了《文学摘要》杂志名誉扫地,关门停刊。
2016年同样是美国总统大选,大选的结果显示特朗普获得了佛罗里达州的选票。佛罗里达州在本次总统选举中有96%的选民投了票,其中49%的选民支持特朗普,47%的选民支持希拉里,数据表明该州支持特朗普的选民多于支持希拉里的。众所周知,美国总统大选采取的是“赢家通吃”的原则。就这种竞选获胜必须获得较多选票的事件而言,要根据选民的投票意向推断在该州获胜的候选人,只需知道据以推理的选民属于该选举地区拥有更多支持者的那一方,就能推出该地区的获胜人选了;反之,如果选择支持人数少的那一方的选民来据以推理,那么得到的结论就是与事实相悖的。
可见,对于实践活动中的兼容集合而言:我们能够应用演绎推理,根据集合表现出的性质,推断集合中的多数元素具有此性质,少数元素不具有此性质;我们也能够应用归纳推理,选择集合中具备同一性质的多数元素来进行推理,推出的集合性质就是符合实际的。
(三)共和集合中的演绎与归纳
决定共和集合性质的是集合中的少数代表性元素。要通过这类集合中的样本性质来归纳性地推断集合性质,应当选择此集合中少数具有代表性的元素来进行归纳推理,才能得到与实践相符的结论。下面举例说明这一点:
拿美国退出了跨太平洋伙伴关系协定(TPP)来说,如果说兼容集合的情况是“少数服从多数”,那么共和集合则是“下级服从上级”。集体中的少数人制定决策,而决策为整个集体所执行。对于美国是否要退出跨太平洋伙伴关系协定,美国的参议员们争议颇多,但是特朗普作为美国总统,作出了退出的决策,虽然有的参议员不同意,美国也一样会退出跨太平洋伙伴关系协定。
可见,对于共和集合来说:我们能够应用演绎推理,根据集合表现出的性质,推断其中具备代表性的少数元素具有此性质,而不具代表性的多数元素则可以不具有此性质;我们也能够应用归纳推理,选择集合中具备代表性的少数元素来进行推理,推出的集合性质就是符合实际的。
(四)杂合集合中的演绎与归纳
对于杂合集合中的复杂情况,在作出决策的时候不但要考虑以上三类基础情况,还要结合环境、情势等多重因素来综合考虑,以保证推理的有效性。这样的集合很难简单述说清楚,却是实践活动中最常见的整体类型。
以人们耳熟能详的“空城计”故事为例:诸葛亮误用马谡而致街亭失守,于是他将多数军士派出应急,只留很少的军士守城。这时忽闻司马懿率领15万大军前来,情势危急,诸葛亮却大开城门,安坐于城楼之上。司马懿看到后认为,诸葛亮一生谨慎,如此情状定是城中设了埋伏。于是他立刻退兵了。司马懿的思维就是归纳的,以他对诸葛亮的了解,知道诸葛亮凡有行动必然安排妥帖,这次也必定不例外。实际上,他的认识是对的,就连诸葛亮本人也说,自己并非要弄险,实乃不得已而为之,城内兵士太少,若弃城而走,必为司马懿所擒。这个事件中司马懿通过归纳推理获得的结论之所以与实践不符,是由于关键信息缺失。受条件或情势所迫,以往总结的规律极有可能会失效。
再从数量方面讨论。对于要推理的总体而言,样本的数量需达到多少才能保证推断的结论尽量准确呢?对于这种“样本推断总体”的问题,可以参考统计学中的“37%法则”。下面以一个流传很广的故事为例来解释:
有一天,古希腊哲学家柏拉图问他的老师苏格拉底什么是爱情,苏格拉底就叫他先到麦田里去摘一棵全麦田里最大最金黄的的麦穗。整个期间只能摘一次,并且只可以向前走,不能回头。柏拉图照着老师的话去做了,结果却两手空空地走出麦田。老师问他为什么没摘到,他说:“只能摘一次,又不能走回头路。其间,即使见到一棵又大又金黄的,也不知前面是否有更好的,所以没有摘;走到前面时,又发觉总不及之前见到的好,原来麦田里最大最金黄的麦穗早已错过了。于是,我什么也没摘到。”老师说:“这就是爱情。”
我们对这个引人深思的故事进行策略方面的思考,也就是说,在不回头并且只能摘一次的要求下,是否有可能摘到最大的麦穗?怎样保证摘到最大麦穗的可能性最大?下面用统计学的思路来处理这个问题,即使摘不到最大的麦穗,也一定能够摘到比较大的。[5]2-7
假设行走路径的两旁共有n棵麦穗,需要解决的问题就转化成了怎样从这n棵麦穗中选出最大的一棵。因为柏拉图不能回头,无法将总体中的样本都考察一遍再选,只能根据经验过的麦穗的大小来作决定。柏拉图在起始位置时,对于前方的麦穗一无所知,随着他见过的麦穗越来越多,他对总体的认识也就越来越全面了。所以问题可以表述为如何根据已经见过的麦穗来决定摘哪一棵,也就是说如何从样本来推断总体。
如果柏拉图走过了一半的路程,见过了n棵麦穗的一半,便可以知道这一半的麦穗中最大的麦穗是哪一棵,在接下来的一半路程中,只要见到比这棵麦穗大的就摘下来,这样的话,即使它不是最大的,也是属于比较大的了。[5]2-7但这种方法的缺点是:麦田中的麦穗必须是随机分布的,而且最大的麦穗必须在后半段。对于前者,只要站在小路的一端观察一下麦穗是不是有序排列的,就可以知道了。至于后者,实质上是说取多少麦穗作为样本才是最合适的。
不妨假设取k棵麦穗作为样本,这k棵麦穗是不能摘取的,从第k+1棵麦穗开始,只要发现比前k个大就摘下来。[5]2-7如果麦穗随机分布,那么n棵麦穗中的任意一个都可能是最大的,所以每棵麦穗都有1/n的概率是最大的一棵。如果最大的在前k棵中,那么柏拉图就摘不到最大的麦穗,发生这个事件的概率是k/n;如果最大麦穗的位置非常靠后,而前k棵麦穗又都比较小,那么柏拉图可能会在遇到最大麦穗之前就摘了一棵小于最大麦穗的麦穗。
用i代表最大麦穗的位置,当i大于k并且前k棵麦穗包含了前i-1棵麦穗中最大的那棵时,柏拉图才能确定摘到最大的那棵。因此找到最大麦穗的概率是:
当n无穷大的时候,可把上式化为:
设k/n为x,对函数f(x)=-x·lnx求导,解出:当f(x)取最大值时,x的值为1/e。
这也就是说,当k=n/e,即取n/e棵麦穗作为样本时,摘到最大麦穗的概率是最大的。e的值大约为2.718,1/e大约是37%,所以取总体数量的37%作样本最有可能找到最大的麦穗,这也就是前面提到的“37%法则”。在此过程中,演绎与归纳同样是紧密结合着的,人们用归纳推理来根据经验过的东西推断未经验过的东西,但解决问题过程中的每一步运算都体现着演绎推理的严谨性。
三、大数据时代对“因果关系”的冲击
上述方法属于“小数据”时代的随机采样,旨在通过最少的数据获得最多的信息。但是,大数据时代的来临已经深刻地影响了人们的工作、生活和思维方式。
随机采样必须经过非常周密的安排和执行,并且还只能从采集的样本中获得事先设计好的问题的答案,一旦人们突然意识到其他需要了解的问题,就需要重新布置安排。另外,当数量无比庞大而又无法保证样本的随机性时,虽然可以主观地选择有代表性的样本作为推理前提,但仍容易出现漏洞。
在大数据时代的全数据模式下,虽然核心仍旧是进行预测,但相对于传统“根据样本推知总体”的理念而言,在数据处理的理念上存在着三个重大转变:(1)由追求随机抽样转向追求样本总体。在大数据时代,数据处理的技术变得非常强大,可以分析更多的数据,如果可能的话会收集全部数据,即“样本=总体”。此时,被随机采样所忽略的细节信息可以清晰地显现出来。如果社会科学中常用的样本分析法被大数据分析所代替,就不需要担心研究人员在实施研究和设计调查问卷时存在的主观倾向了。(2)由追求精确度转向到追求效率。由于使用所有可以获取的数据变得可能,人们在“小数据”范围内追求的精确度变得不可能,也不再重要。由于数据量巨大,某个数据点对整套分析的不利影响甚至可以忽略不计,人们需要做的工作就是接收纷繁混乱的数据并从中获取信息,而不再需要花巨大的代价去消除所有的不确定性。(3)由追求因果关系转到追求相关关系。大数据告诉人们“是什么”而非“为什么”。在大数据时代,事物之间的因果关系不再重要,寻求事物之间的相关关系才是人们努力的方向。比方说,我们只需要知道什么时候买机票最便宜,而不用知道机票价格的变动原因。在大数据时代,通过这样的思维方式,亚马逊公司可以根据人们的购买记录和浏览记录推荐其可能需要的书籍,QQ软件可以根据用户的社交网络得知用户的喜好和可能关系人,沃尔玛公司可以根据每一位顾客的购买物品、购买时间等信息搭配用品而提高销售额。人们不再需要在收集数据之前先根据经验数据通过归纳推理确定一个假设,然后应用演绎推理去验证这个假设是否正确。[6]16-23
相对于传统的寻找因果关系的思维习惯而言,大数据时代解决问题的思维方式发生了巨大的变革,人们通过所有的模型,拟合所有可能的参数,让问题从一个端口进入,答案就从另一个端口输出,中间像是一个黑匣子一般,无法知道为什么会发生这样的结果,这样,与其说大数据让我们重视相关超过重视因果,不如说机器学习和以结果为导向的研究思路让我们变成这样。[6]Ⅸ
思维方式的转换会释放更多的数据价值,能为人们提供更精准的预测和巨大的经济资产。但“相关重于因果”只是大数据的一种数据分析手段,人们一旦放弃对因果性的追求,就可能遭遇“数据决定一切”的危险,计算机的数据分析优势将凌驾于人类的智力优势之上,就像计算机可以在围棋比赛中战胜人类一样,人们一旦放弃创新,计算机将接管世界,为了避免这个危险,人们应该重视挖掘数据间的因果关系而非相关关系。[6]Ⅸ这是因为,在创新过程中,逻辑思维为问题切入、课题确定、深入研究、方案验证等方面都提供了基础、手段与保证,创新离不开逻辑思维的运用,推理是思维的基本形式之一,演绎推理与归纳推理对事实的解释和预测、科学理论的发现和检验起都着重要作用。[7]
四、结语
在实践活动中,演绎推理与归纳推理这两种思维方式的交融发挥着重要的指导作用。正如爱因斯坦所指出的:“西方科学的发展是以两个伟大成就为基础,那就是:希腊哲学家发明形式逻辑体系(在欧几里德几何学中),以及通过系统的实验发现有可能找出因果关系(在文艺复兴时期)。”[8]爱因斯坦所说的前者就是指演绎推理,后者则是指归纳推理。[9]本文采取“分而治之”的方法,将实践活动中的总体划分为四类集合,根据各类集合中集合性质与集合中元素性质之间的关系,结合统计学中样本选择的理论与策略,分类讨论了演绎推理与归纳推理在实践活动中的应用。总的来说:归纳推理是基于“经验”的推理,演绎推理是基于“理念”的推理;归纳推理是为了得到结论的推理,演绎推理是为了验证结论或运用结论的推理。如果把这两种推理模式有机融合,就可谓“按照正确的逻各斯去做”[2]37,将人的心理活动与身体行动结合起来了。
大数据时代的到来改变了人们的思维方式和操作模式,在全数据模式下相关关系重于因果关系。但是日常生活中我们早就习惯了用因果关系来考虑事情,因此在大多数情况下,人们完成了相关关系分析之后,并不满足于仅仅知道“是什么”,而是会进而研究因果关系,来找出背后的“为什么”。所以,大数据时代的到来也为“因果性是否存在”这个争论已久的话题提供了新的视角,因果关系能够用来说明人们所发现的相关关系,而相关关系也能起到提示因果关系的作用。