APP下载

从转换生成语法看范畴类型逻辑的基本思想

2015-12-30

关键词:句法

温 雪

(中国社会科学院 研究生院,北京 102488)

从转换生成语法看范畴类型逻辑的基本思想

温雪

(中国社会科学院 研究生院,北京102488)

摘要:范畴类型逻辑基本思想中的“完整的”和“非完整的”表达式的概念,以及乔姆斯基(Chomsky)所提出的“完整的功能复合体”(complete functional complex,简称CFC)的概念,分别是范畴类型逻辑和转换生成语法在句法结构层面的重要理论基础。两者虽有一定相似性但又有不同之处,加上自然语言的句法语义不对称现象,造成自然语言逻辑分析中的一些由于方法论和概念冲突而引起的问题。为此,在语料的基础上分析上述问题,论证范畴类型逻辑作为一种形式化分析自然语言语义的手段的优势和有待改进之处,并举例说明语言学研究和逻辑学研究之间是取长补短、互相促进的关系。

关键词:范畴类型逻辑;转换生成语法;句法-语义接口;词汇语义学;多体类型逻辑

Basic Concepts in Categorical Type Logic: From the Perspective

一、缘起

在语言和逻辑交叉研究领域,范畴类型逻辑一直处于核心的地位。作为一种基于运算和推演手段描述语言结构的形式化工具,范畴类型逻辑具有描述精确、严格、无歧义的特点,能够很好地弥补自然语言结构不清晰的缺陷。尽管范畴类型逻辑在发展的某一阶段对于自然语言的处理较多地借助了乔姆斯基(Chomsky)转换生成语法的短语结构规则,但其句法描述规则尚不能全面而有效地贴合转换生成语法的句法系统,由此也引发了一些值得思考的问题。首先,范畴类型逻辑是一种基于运算和推演手段描述语言结构的形式化工具,而转换生成语法对于句法结构的描述是基于中心语投射和θ-角色指派的思想,因此在方法论层面,二者难免存在难以兼容之处;其次,由于范畴类型逻辑遵循语义分析依托句法分析,每一条句法操作都具备与之相对应的语义操作的“语形和语义对应原则”,而转换生成语法允许存在纯粹的句法成分,也就是排除了语义因素的纯粹句法成分,例如英语中的形式主语it和there-be存现句,这也就造成了自然语言研究中句法和语义的不对称现象,从而对范畴类型逻辑的“语形和语义对应原则”提出了挑战。本文从范畴类型逻辑基本思想中的“完整的”和“非完整的”表达式的概念,以及乔姆斯基所提出的“完整的功能复合体”(complete functional complex,简称CFC)的概念入手,探讨二者之间的区别和联系,为解决上述问题提出一些可能的解决途径及其依据。

二、范畴类型逻辑基本思想介绍

邹崇理将范畴类型逻辑的发展划分为古典范畴语法、兰贝克句法演算、蒙太格语法、类型-逻辑语义学和语法逻辑5个阶段,并归纳出范畴类型逻辑的基本做法是从不同层次的语言表达式抽象出句法范畴,再通过范畴运算将较小的范畴逐层毗连生成较大的范畴;基本思想是“自然语言的句法生成是一种运算和推演,并且其语义解释也离不开集合、函项、λ-词项和高阶内涵逻辑这些概念”[1]1。而这一基本思想的重要来源是古典范畴语法(categorial grammar或categorical grammar)阶段德国哲学家、逻辑学家弗雷格的语句函项观点,以及英国逻辑学家罗素和波兰逻辑学家列斯尼维斯基(S.Lešniewski)提出的罗素-列斯尼维斯基分层思想。弗雷格将数学的函项运算概念扩展到语言研究,把句法生成过程看作函项运算,认为一个自然语言表达式能够被分析为函项和主目的关系。其中,满足恒定不变的性质的部分就是函项,并具有“未填满的”(unsaturated)性质,需要结合(至少一个)主目才能获得完整的句子;而主目就是可变的部分。考虑这样一个简单例句:

(1) John smiles.

从古典范畴语法的角度来说,John这样的表达式就是“完整的”(complete)。根据贾格尔(Jäger)的说法,因为John是一个专名,指代特定的个体,即一个名字为“John”的人,意味着它具有初始的基本意义,即它的意义不受处于语言学层面的上下文的影响;而smiles这样的表达式是“非完整的”(incomplete),它是一个函项,需要结合一个主目才能得到完整的句子,语义学层面而言,它是一个从个体到命题(真值)的函项;John smiles这句话是“完整的”表达式,它的真值只由非语言学层面的因素影响[2]。同时,张秋成提到了20世纪初德国哲学家胡塞尔的“意义范畴”(meaning categories)理论,认为弗雷格和胡塞尔的语言哲学思想促使波兰的逻辑学家在20世纪30~40年代创立了范畴语法,并指出“胡塞尔的意义范畴组合规律和弗雷格的函项概念的相似之处在于:适合于填充它们的独立表达式之间的关系类似于函项与其主目之间的关系”[3]。莫瑞尔(Morrill)指出,从范畴语法的发展历史来看,由弗雷格的思想产生了“完整的”和“非完整的”表达式的概念;由罗素的思想产生了类型理论[4]。在此基础上,结合胡塞尔“意义范畴”理论,列斯尼维斯基发展了“语义范畴语法”(grammar of semantic categories),之后爱裘凯维茨(Adjukiewicz)进一步发展了列氏的系统。巴希尔(Bar-Hillel)于1953年开创的AB演算系统标志着古典范畴语法的系统成型[4]。

范畴类型逻辑的后4个阶段是沿着古典范畴语法的基本思想路线在不同维度的发展。兰贝克句法演算系统确立了“运算即推演”的思想,从逻辑的角度理解范畴语法,将范畴运算变成了范畴推理,句法规则变成了逻辑定理,使得兰贝克句法演算成为一种关于范畴推演的逻辑系统。蒙太格语法(Montague Grammar)认为自然语言和逻辑语言没有本质区别,提出了一个通用语法(Universal Grammar)模式描写二者的相同规律,并看到句法范畴和逻辑类型的对应关系,通过建立类似逻辑形式系统的自然语言部分语句系统,为自然语言确立了严格的语义学理论,但句子生成规则基本限于转换生成语法短语结构的层面,并未有句法理论的贡献。类型-逻辑语义学(type-logical semantics)继承了蒙太格语法对于自然语言语义的间接解释方案,但不同于蒙太格语法将句法范畴运算和基于高阶类型的λ-词项组合分开进行的路子,类型-逻辑语义学采用了句法范畴和λ-词项的并行推演,语句系统采用了根岑后承演绎图示和自然演绎系统的表示方式,所提出的辖域算子有助于处理自然语言中的量化结构[1]22-81。类型-逻辑语法TLG(type-logical grammar,简称TLG)是对范畴语法的现代化扩展,强调推演和运算,具有严格精确的规定,是一部真正面向计算机处理自然语言的语法[5]。组合范畴语法CCG(Combinatory Categorial Grammar,简称CCG)是对范畴语法进行现代化扩展的另一版本,是一种基于词汇主义的语法形式理论,大量句法生成信息集中于词条的范畴构造上。邹崇理指出:“组合范畴语法CCG 比较类型逻辑语法TLG 而言,能更加深入揭示自然语言的语言学特点,全面服务于自然语言的计算机处理需求。其特征是:(1) 为刻画自然语言词类的丰富句法特征对原子范畴进行加标多样化的设置; (2) 为描述自然语言句法生成的细微之处对斜线算子实行模态化分类,据此确立不同斜线算子范畴的多样组合规则;(3) 基于范畴等级和范畴构造的思想构造CCG 的证明论系统。”[6]语法逻辑则将语法和逻辑置于同等地位,回归兰贝克演算并据此重新构建语义理论,并借鉴了模态逻辑的工具和思想观念,为自然语言的范畴运算建立了可能世界的语义解释[1]81-107,[3-4]。

三、乔姆斯基提出的“完整的功能复合体”

“完整的功能复合体”(complete functional complex,下文简称CFC)这一说法首次出现于乔姆斯基1986年的著作KnowledgeofLanguage:ItsNature,Origin,andUse,用来进一步阐释约束关系的管辖语域,但只是被非正式地描述为“(在CFC的辖域中)所有和中心语(head)相匹配的语法功能都在其中体现,其中包括必要的成分,即根据投射原则应出现的补语,以及可选的成分,即根据定义,只有需要审核谓词的合法性时才必须出现的主语”[7]。徐烈炯将其解释为“中心语、补语、主语可以俱全,一切语法功能均可体现的结构体为完整的功能复合体。S符合条件,NP也可能符合条件”[8]265。*参见文献[8]第265页,此处有脚注:“其他语类不符合条件,例如VP不可能是完整的功能复合体,因为VP不能有主语,VP有了主语就成了S。”乔奇(Giorgi)结合意大利语的研究,指出如果中心语由系动词充当,主语作为外论元会被指派一个θ-角色,因此这个句子由中心语定义的最小CFC就是这个句子本身,此时作为补语的NP就不构成一个CFC[9]。基于以上观察,乔奇为CFC提出了一个更为清晰的定义[9]:

(2)γ是一个完整的功能复合体当且仅当它满足以下条件之一:

a.它是充当中心语的词语所具有的一切θ-角色均得到指派的语域;

b.它是中心语所具有的一切语法功能均得到体现的语域(即θ-角色, R-关系,*根据Grorgi的注解,“R-relation”此处用以指代承担非严格意义的θ-角色的所有元素。状语等)。

关于θ-角色的指派机制,由于涉及很多语言学方面的背景知识,此处不作讨论。

“完整的”表达式和“完整的功能复合体”之间的确存在共通之处。列斯尼夫斯基和爱裘凯维茨采用的基本范畴名称是n(名称)和s(语句);卡朋特(Carpenter)设定类型-逻辑范畴语法有3个初始范畴:np(描述名词短语),n(描述普通名词),s(描述句子)[10];而转换生成语法中CFC的语类也基本分为NP 和S两类。 依据张秋成的观点,名称和语句是自然语言中最基本的两个方面,分别对应个体和真值,范畴语法正是从这里开始建立自己的演算体系的[3]。然而,这两种“完整”之间也存在着概念和方法论的冲突,下一节将着重讨论这些冲突所带来的问题。

四、两个主要问题

从范畴类型逻辑的发展历史中,可以看到范畴类型逻辑在语言研究中有逻辑成分比例增加的趋势,人们越发将“语法”和“逻辑”等同起来。这个趋势造成的一个情况就是:范畴类型逻辑可以不参考语言学层面的句法结构,凭自己的运算推演规则就推导出句子的生成过程。这样,虽然保证了句法演算系统的简明严格和内部的一致性,但也不可避免地脱离了自然语言本身的特点。基于以上考虑,本节以类型-逻辑语义学为代表,讨论以下两个主要问题。

首先,语言学中的一类作格现象(ergativity)*关于“作格”(ergative),语言学界也存在争议。据《牛津英汉双解语言学词典》(上海外语教育出版社,2006年),“作格”有两种定义,一种是“作格”本身是一种格,在中心语为不及物动词的结构中用来标记受事,举例来说,中心语为及物动词的结构Bill-ERG built wall-ABS “Bill built the wall”,当中心语为不及物动词时就有collapsed wall-ABS “The wall collapsed”;另一种是认为存在一类作格动词(ergative verb),比如sink,可以说we sank the ship,也可以说The ship sank,但可能是对前一个概念的部分误用。本文采用的是第一种关于作格的定义。指受事被赋予通格(absolutive,-ABS),也就是受事位于外论元也就是主语的位置,此时施事被赋予作格(-ERG),但范畴类型逻辑的推导过程在这种情况下并不能有效区分施事和受事。试举例如(3):

(3) a.The wall collapsed.

b.The bird flew.

“墙塌了”,并不是墙自己主动塌了,而是某种外因致使的。但“鸟飞了”一定是鸟凭借自己的能力飞起来的。例句(3a)和例句(3b)中的主语一个是受事,一个是施事,但句法范畴是一样的,都可以套用(3c)的类型-逻辑语义学推理过程。尽管这两个句子在语言学看来属于不同的句式,但当前的范畴类型逻辑描写难以刻画出存在于θ-角色的差别。

其次,由于自然语言中存在句法和语义的不对称现象,造成范畴类型逻辑中为自然语言表达式指派范畴和λ-词项的困难。试以英语中的形式主语it和there-be存现句为例:

(4)It rains.

例句(4)按照短语结构规则可以描写为:

(5)NP VP → S

然而在范畴类型逻辑中,例句(4)并不能简单分析为形如np,nps → s的推演。原因在于,np范畴指个体,nps指从个体到真值的函数。然而形式主语it本身不指代任何个体,它没有任何实际意义,而是用来填补主语的空缺,以满足英语的强EPP特征,即要求主语必须在句法结构中显性体现。更为复杂的现象是在汉语中有一类无主语句,如“下雨了”,根据转换生成语法的解释,这是由于汉语的弱EPP特征,范畴类型逻辑也很难解释这种由于参数变化导致的语言结构差异[8]343-344。

英语中there-be存现句的情况更为复杂,转换生成语法研究中关于there的句法地位也尚未达成共识,目前比较通行的观点是乔姆斯基提出的“虚词替代假说”和“逻辑词缀说”,这两种观点的共同点是均不认为there-具有实义,但这两种观点都引发了一些句法理论问题[11]。唐玉柱认为在没有方位地点词组出现的存现句中,there作为独立论元出现;方位地点词组出现时,there作为该方位地点词组的LF层面上的同标共指成分[12]。吴会芹[13]、马志刚[14]就逻辑缀词理论提出了各自不同的见解和改进方案。潘海华和韩景泉提出了“双层小句结构作补足语”,认为表存在实体的DP与表存在处所的词语先构成内层小句,然后该内层小句充当逻辑谓语以虚词there为主语再度构成外层小句,并认为存现句中处所词组是必需的,即使句法层面没有显性出现,也一定暗含在语境之中,可以理解为here或there,例如There is a problem等同于There is a problem here[11]。

回到范畴类型逻辑,可以看到由于语言学层面对于there-的句法地位仍存有争议,并且there是虚词,句法功能大于语义功能,不能在范畴逻辑中简单地指派为np范畴。并且,无论给there指派np范畴,还是s/s范畴,都要考虑例句(6a)的there之后的部分如何指派范畴和匹配λ-词项,并且是否(6a)和(6b)具有不同的深层结构。以上问题导致范畴类型逻辑难以处理there-be存现句的生成过程的推演。

(6) a.There is a book on the table.

b.A book is on the table.

五、一种解决思路——从多体类型论的视角

尽管目前无论从逻辑的角度看自然语言,还是从自然语言的角度看逻辑,都存在难以克服的问题,我们认为这些问题并不影响范畴类型逻辑作为一种对自然语言语义进行形式化分析的有效手段。首先,随着逻辑工具的丰富,虚词也可以有相应的变通的逻辑处理手段,比如例句(4)中的形式主语it就可以考虑仍然指派范畴np,但指代类型为地点的个体,这样It rains就相当于This place rains。其次,范畴类型逻辑也可以从语言学研究中得到启发。以类型-逻辑语义学为例,基本类型e(个体)和t(真值)远远不能满足描写自然语言现象的需求,其中值得注意的是词汇的选择需要加以限制,避免产生句法合格但语义怪异的句子,如*The chair barks。如果在“个体”类型中进一步区分,比如分为“有生命”和“无生命”的个体类型,那么就可以避免生成类似*The chair barks这样的句子。本文采用的是雷托雷(Retoré),所使用的基于多体类型逻辑(many-sorted type logic)的组合语义学(compositional semantics)框架内的词汇语义学(lexical semantics)[15]。基本思路如下:

a.个体类型e内部也要区分出不同类型的个体,以满足词汇选择的限制性要求,e.g.*a chair barks。

b.语义类型应该是认知上自然的分类,并且能够表达对词汇选择的限制[15]。

首先,给出每个语词的基本λ-词项和备选λ-词项,基本λ-词项是初始设置,当初始设置导致类型运算冲突时启用备选基本λ-词项,然后设置基本语义类型。首先看英语例句(7a)~(7d):

(7) a.It rained.

b.It rained outside.

c.It rained yesterday.

d.It rained outside yesterday.

例句(7a)~(7d)的λ-词项设置见表1。

表1 例句(7a)~(7d)的λ-词项设置

规定基本范畴:

Pl:place(地点)

Ps:person(人物)

为语用算子tn(n>0,n(N)设置结合语境(上下文)的使用规则如下:*由于时态涉及其他方面的语言学知识,此处恐繁不引,为方便讨论,本文不将作动词的rain和rained区分,而是统一处理。

(8)若α = it,β = rain,则:

αβlexlexαa:Aβb:ABE’βb(te→Pln(αa)):B

由此,将形式主语it指派类型为Pl (place)的个体,英语例句(7a)~(7d)的类型-逻辑语法推演如下:

(7) a.It rained.

ItrainedLexLexIte:nprainpl→t:npsE’rainpl→t(t1e→Pl(ite)):s

b.It rained outside.

ItrainedoutsideLexLexLexIte:nprainpl→t:npsoutsidet→t:ssE’rainpl→t(t1e→Pl(ite)):sEoutsidet→t(rainpl→t(t1e→Pl(ite))):s

c.It rained yesterday.

ItrainedyesterdayLexLexLexIte:nprainpl→t:npsyesterdayt→t:ssE’rainpl→t(t1e→Pl(ite)):sEyesterdayt→t(rainpl→t(t1e→Pl(ite))):s

d.It rained outside yesterday.

ItrainedoutsideyesterdayLexLexLexLexIte:nprainpl→t:npsoutsidet→t:ssyesterdayt→t:ssE’rainpl→t(t1e→Pl(ite)):sEoutsidet→t(rainpl→t(t1e→Pl(ite))):sEyesterdayt→t(outsidet→t(rainpl→t(t1e→Pl(ite)))):s

如上分析处理,不仅能够生成英语例句(7a)~(7d)的推演过程,而且可以防止生成*John rained这样的句子,因为John的语义类型是Ps而非Pl,而且根据使用规则(8),只有it 和rain(ed)组合在一起时才能生成句子it rain(ed),这样就排除了rain作动词之外的其他成句选择。遵循类似的设置,汉语的无主语句如“下雨了”也可以考虑作相应处理。但由于汉语无主句字面上不出现主语,不能完全按照分析英语形式主语的办法来操作。汉语有自己特殊的表达方式,具体的句法生成规则也和英语不同。因此,如果要准确地把汉语刻画成形式语言,并通过相关规则推演其句法和语义的生成过程,就需要对汉语的语法结构有比较深入的了解[16]。由于涉及的问题较为复杂,本文由于篇幅所限,暂不讨论,留待日后另文探讨。

由上述分析可见,自然语言研究周详有余,严密不足;逻辑学研究清晰严谨,但适用范围较为局限。正如邹崇理所提倡的,自然语言和逻辑学应该取长补短、互相促进,在此基础之上自然语言逻辑这个交叉学科研究领域必定会有一番广阔的前景[17]。

六、结束语

经本文分析,范畴类型逻辑处理自然语言的难点,根源在于CFC的“完整”意味着在该语域中由中心语驱动的一切句法功能都得到体现,以及由充当中心语的词汇意义驱动的一切θ-角色均得到指派。这个定义的两个层面均建立在句子中的各种成分互相制衡的基础之上,和范畴类型逻辑中的运算和推演是两种不同的思路——前者着眼于整合,后者着眼于分析。另一方面,由于范畴类型逻辑对于句子生成结果的推演严格遵循“语形和语义对应原则”,自然语言的句法和语义不对称现象导致范畴类型逻辑很难处理自然语言中有语义内容但缺乏句法特征,或者有句法特征却缺失语义内容的部分。

本文认为范畴类型逻辑仍然是一种对自然语言语义进行形式化分析的有效手段,并且随着逻辑学的发展,虚词也可以有相应的逻辑处理手段,范畴类型逻辑也可以从语言学研究中得到启发而充实自身,语言学研究和逻辑学研究之间是取长补短、互相促进的关系。然而,文中只尝试解决了英语形式主语相关的部分问题,前文涉及的很多问题,如在有定冠词the的情况下作格现象的施事和受事区分,以及there-be句式的推演,仍需逻辑学和语言学研究者们的通力合作,共同找到问题的解决途径。

参考文献:

[1]邹崇理.范畴类型逻辑:从语言到逻辑[M].北京:中国社会科学出版社,2008.

[3]张秋成.类型-逻辑语法——一种自然语言语义分析的重要工具[J].中山大学学报:社会科学版,2003(S):57-66.

[4]MORRILL G.Type Logical Grammar:Categorial Logic of Signs[M].Dordrecht:Kluwer Academic Publishers,1994:1-4.

[5]邹崇理,雷建国.论形式语义学[J].重庆工学院学报:社会科学,2007(11):10-14.

[6]邹崇理.关于组合范畴语法CCG[J].重庆理工大学学报:社会科学,2011(8):1-5.

[7]CHOMSKY N.Knowledge of Language:Its Nature,Origin,and Use[M].New York:Praeger,1986:169.

[8]徐烈炯.生成语法理论:标准理论到最简方案[M].上海:上海教育出版社,2009:265,343-344.

[9]GIORGI A.The Notion of Complete Functional Complex:Some Evidence from Italian[J]. Linguistic Inquiry,1987(3):511-518.

[10]CARPENTER B.Type-Logical Semantics[M].Massachusetts:MIT Press,1997:112-114.

[11]潘海华,韩景泉.虚词there的句法地位及相关理论问题[J].当代语言学,2006(1):17-35.

[12]唐玉柱.存现句中的there[J].现代外语,2001(1):23-33.

[13]吴会芹.虚词there的句法难题与逻辑缀词理论新框架的构建[J].现代外语,2011(3):221-229.

[14]马志刚.最简方案下的探针-目标一致关系与“虚指词there更低位插入”假说[J].英语研究,2013(3):13-19.

[15]RETORÉ C.The Montagovian Generative Lexicon ΛTyn:An Integrated Type-Theoretical Framework for Compositional Semantics and Lexical Pragmatics[C]//19th International Conference on Types for Proofs and Programs (TYPES 2013) LIPICS,2014:202-229.

[16]贾改琴,邹崇理.汉语NP短语的形式语义分析[J].重庆工学院学报:社会科学,2008(6):15-18.

[17]邹崇理.自然语言和逻辑语言:现代逻辑的延伸[J].绵阳师范学院学报,2007(3):1-6.

(责任编辑张佑法)

收稿日期:2015-06-04

基金项目:国家社会科学基金重大项目“自然语言信息处理的逻辑语义学研究”(10&ZD073)

作者简介:温雪(1987—),女,北京人,博士研究生, 研究方向:语言逻辑、因明。

doi:10.3969/j.issn.1674-8425(s).2015.08.003

中图分类号:B81

文献标识码:A

文章编号:1674-8425(2015)08-0016-06

of Transformational-Generative Grammar

WEN Xue

(Graduate School,Chinese Academy of Social Science,Beijing 102488,China)

Abstract:The basic notions of “complete” and “incomplete” expressions in categorical type logic and the notion of “complete functional complex” (CFC) proposed by Chomsky are important theoretical bases at the syntactic level in categorical type logic and transformational-generative grammar respectively. Although they have some similarities in form,they are different in essence,which leads to some problems caused by conflicts in their different methodologies and basic ideas in the analyses of natural languages. This article illuminated those problems with examples from natural languages to demonstrate the advantages and disadvantages of categorical type logic as a formal instrument for the analyses of natural languages,and then instantiated the relationship between linguistic and logical researches which was supposed to be mutually beneficial.

Key words:categorical type logic; transformational-generative grammar; syntax-semantics interface; lexical semantics; many-sorted type logic

引用格式:温雪.从转换生成语法看范畴类型逻辑的基本思想[J].重庆理工大学学报:社会科学,2015(8):16-21.

Citation format:WEN Xue.Basic Concepts in Categorical Type Logic: From the Perspective of Transformational-Generative Grammar[J].Journal of Chongqing University of Technology:Social Science,2015(8):16-21.

猜你喜欢

句法
述谓结构与英语句法配置
限定性范围副词“不过”的来源及其句法语义表现
中日目的关系复句在句法层面的对比研究
句法二题
诗词联句句法梳理
《空间句法在中国》
基于空间句法的既有工业建筑改造空间形态分析
汉英语中动构式句法构件及其特征的认知对比研究
“分”的音变构词及其句法语义特征
形态分布学与汉语“的”的句法地位研究