公理形式演绎:从形式句法到形式语义

2013-02-17李可胜邹崇理

江西社会科学 2013年8期

■李可胜邹崇理

公理形式演绎原本是数学或形式逻辑的一种研究思想，20世纪50年代乔姆斯基(N．Chomsky)将其应用到语言研究中，提出了转换生成句法学，开启了句法研究的形式化道路，使得语言学这门传统的人文学科有了自然科学的属性。60年代戴维森(D．Davidson)提出的真值条件语义学和70年代蒙太格(R．Montague)提出的蒙太格语法，将公理形式演绎思想应用到自然语言的语义研究中，奠定了形式语义学的基础。公理演绎思想代表着语言研究中的理性主义。

由于引进了公理演绎思想，现代语言学出现了形式化的趋势。翻开当代句法学和语义学的外文文献，里面充满了各种逻辑符号。隐藏在这些逻辑符号背后的就是公理形式演绎思想。宁春岩认为:“形式语言学中的元语言不只是用来作为描写、表述的符号系统，更重要的是一种用来推理、推论的形式符号系统，因而具有公理性和演绎性。”[1](P206)毫不夸张地说，如果不了解公理形式演绎思想，就很难真正读懂当代句法学和语义学的外文文献。

在我国，形式逻辑在语言研究中长期得不到重视。我国高校的语言学硕士和博士培养方案中，基本都没有形式逻辑课程。这种情况导致的后果之一是，很多学者没有充分理解语言研究中的公理形式演绎思想，从而影响到对国外语言学理论的理解、消化和吸收。在形式化最为突出的语义学研究中，这种情况尤为明显。例如，由于不了解真值条件语义学中的公理演绎思想，一直有学者误认为真值条件语义学将真值或真值条件看成是句子的意义，并因此而质疑形式语义学的研究价值[2](P59－60)[3](P263)，并使得我国的语义学长期停留在传统的经验主义研究上。

一、公理形式演绎与自然语言的递归性

按照一般定义，演绎是一种必然性推理，即从给定的前提中，通过一系列的保真推导，获得结论。公理形式演绎是指构造形式化的逻辑系统，用来表现抽象的演绎过程。它包括两个重要特征:(1)设定尽可能少的初始概念和公理;(2)可以递归应用的定理。二者结合，就可以从数量有限的初始概念中，通过递归应用有限数量的公理或定理，推导出其他命题。

公理形式演绎本身具有工具性质，不同领域的研究者可以利用公理演绎的基本思想，依据不同的目的，构造不同的演绎系统。比如，形式逻辑学家构造一阶谓词逻辑语言，应用的就是公理演绎思想。一阶谓词逻辑的句法框架通常包括:

(1)有穷数量的初始符号:包括个体常元符号a，b，c等，个体变元符号 x，y，z等，谓词符号 P，Q 等以及逻辑连接词符号→，∨等;

(2)合适公式(well－formed formula)的形成规则:例如，如果P是n元谓词，那么P(x1，…，xn)是合适公式;如果φ和ψ是合适公式，那么φ→ψ，φ∨ψ也都是合适公式;

(3)有穷数量公理和定理，例如，如果P为真，那么P∨Q也为真;

(4)除了依据(1)－(3)所获得的公式外，都不是合适公式。[4](P104)

(1)和(2)属于约定的内容，具有公理的属性。通过递归应用(3)，就可以从(1)和(2)中推演出无穷数量的一阶谓词逻辑公式;(4)将所有非合适公式排除在外。这样，一阶谓词的所有合适逻辑公式都可以通过 (1)－(4)生成出来，这就是公理形式演绎思想的典型应用实例。

公理演绎被用来研究自然语言，与自然语言的递归性 (recursion)密切相关。递归性也被称为创造性(creativity)，是指从有限数量的词汇中，通过递归应用句法规则，得到任意数量、任意长度的句子。19世纪的哲学家洪堡(K．W．Humboldt)就曾指出语言具有递归的演绎特征，即“把有限的手段作无限的使用”[5](P70)。美国哲学家、语言学家乔姆斯基在20世纪50年代提出生成语法学，系统地应用公理演绎思想研究自然语言，其核心思想是:人类可以利用有限数量的词汇，递归生成无穷数量的句子，因此句子的生成过程必然是一个公理演绎过程。此后不久，美国哲学家戴维森提出了戴维森纲领，首次将公理演绎思想应用到自然语言的语义理论中，其理论假设与乔姆斯基的句法学相似，即:人类掌握的词汇概念是有限可数的，却可以理解数量无穷的句子意义，因此句子意义的生成过程必然也是一个从原子语义到命题的公理演绎过程。[6](P3－4)

因此，无论从句法角度还是从语义角度，自然语言的核心机制都是一种公理演绎系统。只是由于自然语言的句法结构复杂多样，语义内容包罗万象，语言的使用环境又存在千变万化的语境因素，才使语言的公理演绎本质被杂乱无章的表象所掩盖。现代语言学的任务之一，就是要掀开语言表象，揭示出语言的演绎本质。正如形式句法学家欧哈拉(J．Ouhalla)所说:“人类语言的创造性充分地证明，了解语言本质就是了解一套有限数量的规则，也就是一个计算体系，这个体系可以通过有限数量的规则和词库，生成无穷数量的句子。”[7](P6)

二、句法的形式演绎思想

在《句法结构》一书中，乔姆斯基将“语言看成是(有限或无限的)句子集合，所有句子的长度都是有限的，且都是从元素的有限集中构造出来的”[8](P13)。这是一种数学集合论的视角，所有合格句子构成的集合就是语言，这个集合可以是无穷大，因为人类说出的句子是无法穷尽列举的。而造句成分(如音位、语素、词等)构成的集合却是有穷集合，因为造句成分的总量是相对有限的。句子是由造句成分按一定的结构方式 (规则)组织起来的线性序列结构。既然无穷大的句子集是由有穷的造句成分集生成的，那么语言学家的任务就是要找出从有穷集中生成无穷集的生成规则。

不过，乔姆斯基并没有止步于给出某种具体语言的生成规则，在他看来，人类的语言虽然千差万别，但将一个牙牙学语的儿童放在不同语言社区里，则无论他的国籍和种族，也无论他的父母说的是什么语言，具有什么样的社会文化背景，这个儿童都可以很自然地习得该社区的语言。由此可见，人类语言的句法有着共同的核心，不同语言的生成规则都是从这一核心演变而来。在乔姆斯基看来，这个核心就是一套句法元规则，即普遍语法。而语言学家的任务，就是从千差万别的人类语言中，通过溯因推理，将这套元规则揭示出来。

翻开各种生成句法学的文献，里面讨论着各种各样的规则和假设，而提出并论证这些规则和假设，目的只是为了证明:假定存在一个公理形式演绎系统，如果能证明该系统可以推演出人类所有合乎语法的句子，则可以证明这个系统揭示了普遍语法的元规则。如宁春岩所说:“假定某形式语言学理论系统靠有限的数据型的和操作型的形式手段能够推导出语言的所有LF－PF(即逻辑表达式与语音表达式的匹配)，而不能推导出LF－PF之外的东西，那么作为形式推导系统的这个语言学理论在不需要经验证实的条件下便可逻辑地证明为是自足自明的。”[1](P208)

乔姆斯基认为人类语言的句法都可以从同一套元规则中推演出来。从理论上看，这意味着在儿童习得某种特定语言的句法规则之前，大脑中已有了这套元规则。由此推论，这套元规则就不可能是后天习得的，那么唯一合理的解释就是，这套元规则具有生物遗传属性，即人类生而具有某种语言官能 (Innated Language Faculty)，这就是所谓的“语言天赋论”假说。

本文对这种假设不做评论。但毫无疑问，乔姆斯基的语言学思想体现了公理形式演绎思想，如江怡指出的:“建立这种严格精密的语法形式，就是对一切自然语言给出一套预先设定的语言逻辑结构即转换规则和生成规则，并根据这些规则来解释和评价各种不同的语言，这就是一种逻辑的演绎系统。”[9](P2)蔡曙山在评论乔姆斯基时也认为:“乔姆斯基使用形式化的方法，使自然语言的结构变为逻辑上可推导的。”[10](P9)从这一点说，乔姆斯基对语言学的贡献具有里程碑式的意义。

理论上说，“语言天赋论”只有得到生物遗传学的证据才能成立，而到目前为止，生物遗传学并没有提出被大众所接受的证据。因此，认为人的句法能力具有生物遗传性的“语言天赋论”仍然处于假说阶段。也正因为如此，乔姆斯基的理论受到了很多质疑，但他的句法形式演绎思想却得到了继承和发展。此后兴起的广义短语结构语法(Generalized Phrase Structure Grammar)、词汇功能语法(Lexical Function Grammar)等形式句法理论，都致力于用公理形式演绎的方法刻画某种特定语言的外显句法结构，而不讨论内化在人脑中的普遍语法，更不涉及目前还没有被证实的“语言天赋论”假说，因此更贴近于实际使用的语言。在20世纪70年代以后，这类形式句法理论已经成了自然语言计算处理的理论基础。

三、语义的形式演绎思想

另一个继承公理形式演绎的语言研究领域是形式语义学，开创者是美国哲学家戴维森和美国逻辑学家蒙太格。虽然在蒙太格的论文中，可以看到语义的公理形式演绎借鉴了乔姆斯基的句法公理形式演绎思想[11](P222)，但形式语义学与生成句法学却有着本质的差异。

首先，生成句法学是一种认识论意义上的理论。乔姆斯基从本体论角度讨论语言，研究语言的共性，回答的问题是人类的语言是怎么回事，目标是用公理演绎的形式化方法给出人脑中抽象的语言结构，并以此证明句法能力遗传性的假说。形式语义学则是工程论意义上的理论，是从使用的角度讨论具体的语言，回答的问题是人类是如何理解语言的，目标是用公理演绎的形式化方法给出实际使用的语言结构所表达的语义。

其次，生成句法学属于语言学，而形式语义学则是语言学、逻辑学和哲学的交叉学科。形式语义学的理论先驱是哲学家戴维森，而技术奠基人则是数理逻辑学家蒙太格。1967年，戴维森在《真值与意义》(Truth and Meaning)一文中，提出改造塔尔斯基的“T－约定”来构建自然语言的真值条件语义学理论。[6](17－36)在戴维森的影响下，蒙太格1970年发表《作为形式语言的英语》(English as a Formal Language)一文，他采用形式逻辑的方法，构造严谨缜密的公理演绎系统来刻画自然语言语句的真值条件，这是蒙太格语法的最初形式。[11](P188－220)无论是戴维森的语义理论还是蒙太格语法，其核心内容都是公理演绎思想。

如前文所述，人类所掌握的词汇数量是有限的，但表达思想的句子数量却是无穷的。如果按照命题逻辑的做法，将句子看成是基本的意义单位，考虑到自然语言的句子数量几乎是不可穷尽的，因此要让所有的句子都得到形式化的语义表征 (semantic representation)也几乎是不可能的。事实上，唯一的方法就是让句子的意义表征从词汇的意义表征中生成出来，即给有限数量的词汇都配上相应的语义表征(即语义表达式)，同时给出若干语义运算规则。这样在应用句法规则从词汇组合成句子时，同步应用语义规则使得词汇的语义表达式推演出句子的语义表征。[12](P66)而整个的语义组合运算过程，所依据的是具有公理演绎性质的形式逻辑系统。

例如，通常情况下，解释某个句子的意思时，会套用“句子s的意思是p”的格式。其中s是对象语言，也就是需要解释的句子，而p是解释s的元语言，也就是s的语义表征。它可以与s属于同一种语言，也可以属于不同的语言(如外语)，甚至还可以是一种人工形式化的语言。但是这种解释方式始终存在一个问题，即s的数量不可穷尽，所以用以解释s的p也将是不可穷尽的。

解决这一问题需要让p通过某种“演算”规则从s的构成成分的意义中演绎而来。假定在某种自然语言中，有穷集 W= ｛w1，w2，…，wn｝是由句子的基本构成成分(主要指词汇)组成的，有穷集 M= ｛m1，m2，…，mm｝是由构成成分的语义表达式组成的 (考虑到有一词多义和多词同义的情况，W和M的基数一般不会一致)。无穷集S=｛s1，s2，…｝是由该语言中所有的句子组成，无穷集P=｛p1，p2，…｝是由所有句子的语义表征组成的。形式句法学认为:S中的任意一个s都是由W中的若干成员通过一定的句法规则获得的，而形式语义学则认为:P中的任意命题p也应该是从M中的若干成员通过一定的语义运算规则获得的。

但是形式语义面临一个难题，即如何定义S中的m?因为这种定义必须满足:(1)确保任意一个p都是通过一个公理演绎的形式系统从若干个m中推演出来;(2)确保推演出来的不同的p之间的逻辑关系(如蕴含、否定等)是可以判定的。做不到第一点，就不得不为S中的每一个s指派一个p，考虑S是无穷集，这项工作将永无尽头。做不到第二点，那么给句子指派意义就失去意义。

要得到这样的语义形式演绎系统，就需要引入真值和真值条件。究其缘由，实现形式演绎的前提是递归性，在自然语言的各种意义概念中，只有真值条件具有递归性。也就是说，句子的真值条件可以通过递归应用一定的规则，从作为原子语义的词汇所指中获得。这可以从下面的例子中得到说明。

按照谓词逻辑的通常做法，单称词的所指是个体，类名词的所指是一种集合，句子的所指是真值，用1和0表示。例如“柏拉图”的所指是一个个体，用b表示，“哲学家”的所指是一个集合，用Z表示，该集合是由所有哲学家个体构成的。再将“(单称词)+是+(类名词)”这种结构的语义作用表示成形式逻辑中的一种函项，记作P(x)，其中个体变元x代表单称词的所指，而谓词变元P代表类名词的所指。函项P(x)的定义域是个体集，如｛柏拉图，苏格拉底，凯撒大帝，秦始皇，…｝，值域是真值的集合，即｛0，1｝。并约定P(x)的真值条件是:如果在定义域中选取的个体属于P指称的集合，那么P(x)的值就是1，否则是 0。

这样b，Z和P(x)就分别成了“柏拉图”、“哲学家”和“(单称词)+是+(类名词)”的逻辑语义式。现在，将Z和b分别带入到函项P(x)中，就得到了一个命题表达式Z(b)，同时由P(x)的真值条件可以得到Z(b)的真值条件:Z(b)为真当且仅当存在一个个体b，b属于集合Z。以现实世界为参照，b属于Z所代表的集合，所以得到了Z(b)的所指1。这样，Z(b)的所指(即真值)就直接依赖于b和Z的所指以及句法结构所体现的函项P(x)，这就是被誉为现代逻辑基石的弗雷格组合性原则:一个复合表达式是其构成成分的意义的函项。[13](P75)

鉴于Z(b)是句子“柏拉图是哲学家”的语义表征，因此Z(b)的真值条件也就是这个句子的真值条件。要特别注意的是，语义的形式化并非是为了得到句子的真值，而是以获得真值为目标，给出句子获得真值的条件。事实上，句子是否为真并不重要，重要的是如果这句话为真，则必须满足什么样的条件。换言之，如果该句子成立，则出现什么样的情境。所以戴维森认为真值条件就是句子语义的外显形式，并且“给出真值条件就是给出句子的意义”[6](P56)。

上述例子虽然简单，但很好地体现了形式语义学的公理演绎思想。当然在自然语言中，像“柏拉图是哲学家”这样的简单直陈句仅属于特例。大多数情况下，自然语言的句法和语义都不是一一对应的关系，而是受制于句法、语义和语用等多重机制的作用，因此自然语言语义的形式化研究才显得困难重重。也正因为如此，基于公理演绎思想的形式语义学才有了自己的存在价值。

四、结论

无论是形式句法研究还是形式语义研究，都否认自然语言和人工逻辑语言有本体论上的差别[6](24)[11](P188)。二者都具有递归性，即从有穷初始符号集，通过递归应用有限数量的组合规则，得到无穷的句子集合或句子语义表达式的集合。因此，构造各种类型的公理形式演绎系统，揭示自然语言的不同的运作规律就成了自然语言研究的重要内容。尽管语言的形式化研究面临许多困难，但是公理形式演绎是实现自然语言机器理解的唯一途径，所以形式语言研究成为西方语言研究的前沿热点也就不奇怪了。

[1]宁春岩．形式语言学的纯科学精神[J]．现代外语，2000，(2)．

[2]徐烈炯．语义学[M]．北京:语文出版社，1995．

[3]李福印．语义学概论[M]．北京:北京大学出版社，2006．

[4]李可胜．生成语言学的公理演绎思想[J]．中国社会科学院研究生院学报，2011，(4)．

[5]Noam Chomsky．Cartesian Linguistics:A Chapter in the History of Rationalist Thought(3rdEdition)．Cambridge:Cambridge University Press，2002．

[6]Donald Davidson．Inquiries into Truth and Interpretation．Oxford:Oxford University Press， 1984．

[7](英)欧哈拉(Ouhalla， J．)．转换生成语法导论:从原则参数到最简方案[M]．北京:外语教学与研究出版社，2001．

[8]Noam Chomsky．Syntactic Structures(2ndEdition)．Berlin:Mouton de Gruyter，2002．

[9]江怡．当代语言哲学研究:从语形到语义再到语用[J]．外语学刊，2007，(3)．

[10]蔡曙山．没有乔姆斯基，世界将会怎样[J]．社会科学论坛，2006，(6)．

[11]Richard Montague．English as a Formal Language．in R．H．Thomason(ed．)Formal Philosophy:selected Papers of Richard Montague．New Haven:Yale University Press， 1974．

[12]邹崇理，李可胜．逻辑和语言研究的交叉互动[J]．西南大学学报(人文社会科学版)，2009，(2)．

[13]邹崇理．组合原则[J]．逻辑学研究，2008，(1)．