APP下载

语义类型的细化和转换
——MG中类型论的新进展

2018-05-14崔佳悦1邹崇理

关键词:王宇细化食堂

崔佳悦1,邹崇理

(1.首都经贸大学 外国语学院,北京 100070;2.四川师范大学 逻辑与信息研究所,成都 610066)

上世纪,形式语言学的主要理论体系,如转换生成语法TG等,均以句法分析为基础,使得大多数自然语言计算机处理系统主要以句法分析为理论框架[1]463。随着研究的深入,学者们发现TG并不能确切地解释自然语言语义的规律[2]。于是,人们开始反思,对已有理论进行不同程度的修订。在TG句法研究所获成果基础上,美国逻辑学家蒙太格从逻辑角度审视自然语言的语义,提出了著名的蒙太格语法MG。蒙太格认为,自然语言的语义组合推演不是凭空产生的,而是追随句法的产物,即句法生成的规律决定了语义组合的机制,句法引领语义。这样语义分析就有了来源根基,而不是无源之水。这样MG从TG的句法分析出发,一步一步对应出语义分析,从而确立了自然语言语义分析的完整系统。

MG对自然语言的语义分析,具有简洁明白和严格精准等优点,成为机器翻译中关于语义处理的重要基础理论[3]。但是,在计算语言学领域内,将MG全面应用到自然语言计算机处理系统中的做法甚少,结合汉语的具体情况进行MG语义分析的计算机处理更是少见。原因在于:MG对自然语言的语义分析基于传统的类型论,有忽略具体语境而脱离语言实际的倾向,这样不能满足计算机处理系统针对“大规模真实文本”的需求。因此,在MG基础上发展关于自然语言语义的分析技术,即对自然语言语义类型的细化和转换进行系统而全面的研究,显得尤为迫切。

一 背景综述

国外学者关于类型论的研究始于20世纪40年代,为严格精准描述自然语言的语义,需要把自然语言翻译成逻辑表达式,但自然语言什么样的表达式对应什么样的逻辑表达式,这就需要“类型”来牵线搭桥。类型严格讲是作为载体的逻辑表达式的语义标记,也可看作是自然语言语义的标注工具。而语义类型的细化和语义类型的转换是提升自然语言语义分析水平的关键。

关于类型细化,Church最早划分了类型层级[4],并引入λ-项作为类型的载体。后来蒙太格的一系列经典论文发表,标志着蒙太格语法MG的诞生。MG基于类型论对自然语言语义进行刻画,并形成完整的语义系统,在学界引起巨大反响。Luo Z[5-9]在1994—2013年间发表的系列文章认为,个体类型e难以解释丰富的语义特征,需要对其进行进一步细化,他对类型细化的产物——子类型进行了说明,解决了“多体分类”的基本问题。Livy Real和Christian Retoré写出Deverbal semantics and the Montagovian generative lexicon ∧Tyn等系列文章,将MG应用到词条词汇学当中,创立∧Tyn词汇系统,将个体类型e根据具体事例细化为“处所个体”、“工具个体”、“食物个体”等子类型[10]。早期这些著名的学者介绍了语义类型细化的基本思想,并提出类型转换的设想,但没有给出具体的解决方案。

之后,学者们继续他们的研究。针对类型的转换,Luo Z认为,可以通过把名词、副词和语篇作为具体事例来进行类型的转换,并提供了一个强大的形式框架来刻画名词等的类型划分。Chatzikyriakidis S在Luo Z之后的2012—2014年间发表五篇文章[11-13],分别对自然语言处理中名词的子类型和副词的子类型进行阐述,说明语义类型在不同的上下文中产生的不同作用,并对语义类型在语篇中的应用提供了依据,这是将语义类型运用到更广阔的语法范围——语篇的尝试。Livy Real 和 Christian Retoré[10]对前人的研究成果进行了总结,对Luo Z和Chatzikyriakidis S提出的不同语言现象,结合英语具体实例,将类型转换的结果用逻辑方式表达出来,这是对语义类型的转化进行具体化的尝试。

学者们已经意识到传统类型论用于刻画自然语言语义的基本类型——个体类型e难以说明复杂多变的语义现象,因此通过对该类型的细化来增强对自然语言语义特征的解释力。但个体类型的细化一方面能够揭示自然语言丰富多样的语义特征,另一方面又排斥了一些原本人们惯例认可的语句,这就需要对语义类型的转换进行深入的探讨。

MG关于自然语言语义分析所依据的是传统的类型论思想,本文在MG框架内,强调对传统类型论的改进,其要点有:

第一,类型细化,对个体类型进行细化分类。

第二,类型转换,即根据不同语境采用不同的语用算子给予转换(将“张三吃食堂”等不符合直观语义的句子经过动词的类型转换而成为可接受的语句)。

传统类型论使用个体类型e表示名词指称的所有个体,这在处理自然语言语义时显得过于粗放。类型细化的做法把笼统的个体类型划分成各种各样的个体类型,这一改变能够排除“An apple cries”等不符合语义的句子[10]。类型的细化虽然可以排除语义上错误的句子,却不能处理如“张三吃食堂”之类不符合直观语义却又为人们所接受的句子。在自然语言的语义分析中添加语用算子对动词的语义类型进行转换,就能够对上述语义异常句进行合理的解释。本文结合汉语的例子,给出了类型转换所需要的具体语用算子。

二 MG中的类型细化和类型转换

(一)类型细化

MG中依据的传统类型论仅需要两种基本类型:标注个体表达式的类型e和标注真值表达式的类型t。以e和t为起始点,可以生成无穷多的复合类型,用以标注各种层次的表达式。Retoré[10]指出,MG的类型思想能够服务于自然语言的语义分析,但是并不完善,需要一个更为细致的类型理论来处理语义。传统类型论中的个体类型用e表示,但在实际的自然语言真实文本中,名词在不同的语境下可能指称不同语义特征的个体,因此仅用e标注所有的个体类型显然是不够的,需要将名词所指个体的类型细化,将e划分为e1, e2, e3,……。MG对传统类型论进行创新,提出了细化的个体类型如下:

A(施事个体),C(城市个体),D(地理位置或场所个体),G(工具个体),F(方式个体),S(食物个体),X(信息个体)……

比如下面的句子:

(1)San Francisco was named in 12 century.(旧金山在12世纪被命名)

(2)San Francisco is wide. (旧金山地域广阔)

(3)San Francisco is wide and voted last Sunday.

(旧金山地域广阔,且居民在上周六进行了选举)

在上面三个句子中,“San Francisco”(旧金山)的语义特征是不同的,例(1)中的“San Francisco”的语义特征指“城市”,例(2)中的“San Francisco”指“地理位置”,例(3)中的“San Francisco”分别指 “地理位置”和“旧金山的居民”,因而它们将被标注不同的语义类型,分别是城市个体C、地理位置个体D和施事个体A。

在MG中,细化的个体类型总是用来标注名词所指称的个体,而动词对应的语义类型往往是一种复合的类型a→b。类型a→b的计算涵义如下:一个a→b类型的表达式与一个类型为 a 的表达式毗连运算后,将产生一个类型为 b 的表达式。上文例句中的动词类型分别为:C→t, D→t和A→t。就例句(2)而言,意味:D→t类型的动词谓语“is wide”跟类型为D的“San Francisco”毗连就获得类型为t的合法语句。

类型细化解决了MG语义上仅由个体e表示所有个体,导致语义解释力不够的问题。但是,仅仅有类型的细化,一些在汉语交际中为人们广泛接受的语句,如“王宇吃食堂”、“王宇吃父母”等句子的语义组合却不能获得说明。因为谓语动词“吃”是在什么情况下由本义转化为引申义,转化的机制没有明示。由此需要引入另一技术手段——语用算子来对动词的语义类型进行转换,从而获得对“王宇吃食堂”等特殊的“语义异常句”的合理解释。这就是本文所要做的工作。

(二)类型的转换

“语义异常句”的合理解释问题,一直被视为自然语言处理的重点和难点。中国工程院院士陈力教授在谈及中文信息处理与印欧语系的语言信息处理的不同之处时指出:汉语语法研究尚未形成规范化,而且人们习惯于约定俗成的语法,于是语义研究显得尤其重要,例如“吃饭”“吃大碗”“吃食堂”的理解只能靠语义来解决[14]。北京大学著名语言学家陆俭明教授[15]指出,就动词“吃”所构成的事件来说,包含事件的参与者:吃饭的人和吃的对象、吃饭的时间、场所、方式等。“吃”的事件形成了由多个认知域形成的关系网络,由一个认知域激活另一个认知域,如由“吃的对象”这样的认知域在一定语境下激活“吃的场所”这样的认知域,从而形成特定的“语义异常句”[16]。

由于汉语词语搭配的灵活性,汉语中只要与“吃”活动有关的个体似乎都可作为“吃”的宾语所指[17]。由于“吃”被广泛应用在各种语境中,这就形成了动词“吃”的多义性。比如下面的例子:

(1)文化找了个吃米饭的女人,她小小的个子,细细的脸皮。(许辉《吃米饭的人》)

(2)整天吃食堂,一年三百六十五天地吃食堂。(王海鸽《新结婚时代》)

(3)记得1987年冬天和几个同事在广州吃大碗,4个人,8块钱,亦汤亦菜。(《读者·平民的饮食》)

(4)因此一年中,他那店里吃救济的,少说点也有两桌人。(《发财秘诀》三回)

就上述特殊的“语义异常句”而言,动词“吃”与宾语名词在语义组合过程中需要调整有关的语义类型,才能使整个句子获得合理解释。动词“吃”的宾语名词不一定都是指称“食物个体”,而是在不同语境下指称不同类型的个体[8]。据语言学家对动词“吃”的用法统计,后面的宾语名词可以除了可指称食物个体(如吃米饭、吃馒头)外,还可指称“吃”的场所个体(如吃食堂,吃餐馆),也可指称“吃”所需要的工具个体(如吃大碗、吃筷子),以及指称“吃”所依赖的经济来源方式(如吃救济、吃父母),等等。为分析的简洁起见,对上述“语义异常句”的核心语义特征可简略表述如下:

(1)王宇吃米饭。

(2)王宇吃食堂。

(3)王宇吃大碗。

(4)王宇吃救济。

在例句(2)“吃食堂”的表述中,“食堂”指称处所个体,而没有指称食物个体。“吃”原有的语义类型与“食堂”的语义类型不能直接匹配,因此“吃食堂”不是语义正常的表达式。而在现实中,“吃食堂”这一表述已经得到了众多汉语母语使用者的认可。以“吃”为主要动词形成的类似表达式,如“吃大碗”和“吃救济”等已经成为日常汉语的常用搭配。我们需要对这些特殊的“语义异常句”作出合理解释。

为解决这个问题,本文引入关于动词“吃”的语用算子χ。作为算子模式的 χ 涉及类型的转换,也可称类型转换算子。提出 χ 的目的是为了描述动词的“本义”到“引申义”的变化。χ 算子丰富了MG解释自然语言现象的能力,使MG能够参照动词的语境(动词后名词宾语的指称情况)来改变动词的语义类型,从而使那些特殊的“语义异常句”获得合理解释。

我们给出语用算子 χ 的定义、类型和触发机制:

χ 的定义:χ 将动词“吃”的语义类型进行调整,使之能够跟后面的宾语名词的语义类型相组合,能够进行类型的函数运算。同时,“吃”对应的逻辑式“吃”也被转换成新的逻辑式χ(吃)(新逻辑式具有类似框架动词的涵义)。

χ 的类型:[S→(A→t)]→[α→(β→t)]

其中S→(A→t)是动词“吃”本义的原初语义类型(针对宾语的食物个体和主语的施事个体),α→(β→t)是根据不同的语境转换后获得的动词类型。比如“吃”处于宾语名词是“食堂”的语境中,则“吃”的类型就转换成D→(A→t),这就需要语用算子χ1[S→(A→t)]→[D→(A→t)]的作用,将动词的原初类型S→(A→t)转换为类型D→(A→t)。

χ 的触发机制:通常“吃”只有一个刻画本义的原初类型,当作为语境的宾语名词具有的类型与动词原初类型不能匹配时,就会触发语用算子的使用。

针对例句(1)—(4),我们在MG的框架下,确立基本语词的集合PNP1,PTV,PNP2。通过翻译函项g把基本语词翻译成有关的逻辑式,如王宇A,吃S→(A→t),等等。

PNP1={王宇,…}

PTV={吃,…}

PNP2={米饭,食堂,大碗,救济,…}

g(王宇)=王宇A

g(吃)=吃S→(A→t)

g(米饭)=米饭S

g(食堂)=食堂D

g(大碗)=大碗G

g(救济)=救济F

再确立下述语义翻译规则:

若α∈PNP1, δ∈PTV, β∈PNP2,且α′, δ′, β′分别是α, δ, β的翻译, 则

上述规则的应用:针对4个语境,我们相应提出4个语用算子。就第1语境(动词本义)而言,动词“吃”的宾语名词是“米饭”,其语义特征是食物个体类型S,这时语用算子χ1是恒等函项,通过对翻译动词“吃”的逻辑式的运算,使得χ1(吃)=吃,同时动词的语义类型保持原样,仍是S→(A→t),这是“吃”的原初语义类型,这样使“王宇吃米饭”之类的语义正常句获得认可。就第2语境(动词第一引申义)而言,动词“吃”的宾语名词是“食堂”,其语义特征是处所个体类型C。这时语用算子χ2,一方面把翻译“吃”的逻辑式“吃”转换成新的逻辑式“χ2 (吃)”,这个新的逻辑式具有类似框架动词“…在…吃”的涵义;另一方面,χ2使动词“吃”的原初语义类型由S→(A→t)转换成C→(A→t),这样的类型跟“吃”后面的宾语名词“食堂”对应的处所个体类型C和“吃”前面的主语名词“王宇”对应的施事个体类型A能够先后进行毗连运算,从而使“王宇吃食堂”之类的特殊“语义异常句”获得推演组合的结果,即从逻辑角度得到认可。第3语境(动词第二引申义)和第4语境(动词第三引申义)的情况是与第2语境(动词第一引申义)类似的。

在对自然语言的翻译中,对应的逻辑式的毗连及其类型的运算是逐层逐级进行的。下面仅以前述语义翻译规则涉及的第3个语境(动词第二引申义)的毗连运算为例给出清楚的图示:

(((χ3[S→(A→t)]→[G→(A→t)](δ′))(β′))(′α) 第3语境:若α=王宇,δ=吃,β=大碗

((χ3[S→(A→t)]→[G→(A→t)](吃S→(A→t))(大碗G))(王宇A))根据g对基本语词的翻译

(χ3(吃))G→(A→t)逻辑式的毗连及其类型的运算

((χ3(吃))(大碗))A→t逻辑式的毗连及其类型的运算

(((χ3(吃))(大碗))(王宇))t逻辑式的毗连及其类型的运算

人们大多看到在毗连运算中类型的转换,而其中逻辑式的逐层毗连也是很重要的内容,值得关注。特别是“χ3(吃)G→(A→t)”,已改变了“吃”的“本义”,而获得了新的类型,也就是新的“引申义”,具有类似“…用…吃”的逻辑语义。

在对自然语言的翻译中,对应的逻辑式的毗连及其类型的运算是一种并行的态势。语用算子一方面把动词“吃”的原初类型转换成所需要的类型,另一方面把对应的逻辑式转换成新的逻辑式。如把“吃”的逻辑式“吃S→(A→t)”换成了“(χ3(吃))G→(A→t)”。 “χ3(吃)”≠“吃”,按照其类型的指向,“χ3(吃)”具有框架动词“…用…吃”这样的逻辑语义。其结果提供的方法论启示是:汉语作为非形态的“意合”语言,句法上没有严格的形态标志,但语义上则非常灵活,而且起到弥补句法缺欠的作用。在句法层面,特殊语义异常句“王宇吃大碗”没有出现介词“用”,但在语义的层面,通过动词类型的转换,暗中把动词“吃”原初的本义变成了类似框架动词“…用…吃”这样的语义,这样的分析彰显了“句法形态的缺失由语义分析来弥补”的做法,对揭示汉语意合语言的特性具有方法论的指导作用。

三 结论

MG中类型论的新进展体现在:提出“类型细化”和“类型转换”的思想。由于类型论是表示语义特征的基础理论,类型概念的变革直接导致MG对自然语言语义特征的刻画深度,因此需要不断增加类型来解释更多的语义现象,通过“类型细化”来增加新的“子类型”。增加“子类型”的做法,能够区分“语义正常句”和“语义异常句”,但同时导致一些在真实文本中广泛被人们接受的所谓“语义异常句”变得难以理解。为解决这一问题,在语义翻译规则层面引入“语用算子χ”,只要动词的原初类型跟后面的宾语名词的类型不能匹配,就会触发“语用算子χ”的介入,进行类型的转换,从而使那些“特殊语义异常句”获得认可。

鉴于汉语语义匹配问题在语言逻辑理论中的重要地位,学者们做了多种分析和尝试,但鲜有采用MG及其类型论的技术手段对此类问题进行研究。本文中讨论的类型细化和类型转换的案例是一个关于汉语语义匹配现象具有方法论价值的试验样品,为学者们展示了一条研究思路,可以此为基础扩大研究范围,对更多的语义匹配现象进行解释,所处理的词条例句也因此可以充分的展开和拓展。经典的MG框架只有为数不多的句法语义规则,而基于类型细化和类型转换的MG由于关注结合语境的“真实文本”,对语言表达的个案个例进行分析,因此需要建立的句法语义规则会有一个很大的数量。这似乎正顺应了当今计算机人工智能领域关于自然语言研究所推崇的大数据方法的新潮流。

注释:

①在MG理论中,对自然语言进行间接解释时,语义规则就是翻译规则。根据对基本语词的翻译函项g,α′, δ′和β′可能分别表示成αA,δS→(A→t)和βS。

参考文献:

[1]冯志伟,胡凤国.数理语言学(增订本)[M].北京:商务印书馆,2012.

[2]LUO Z. Formal semantics in modern type theories with coercive subtyping [J].LinguisticsandPhilosophy, 2012,(6).

[3]冯志伟.用计量方法研究语言[J].外语教学与研究,2012,(3).

[4]CHURCH A. A formulation of the simple theory of types[J].TheJournalofSymbolicLogic. 1940,(2).

[5]LUO Z.ComputationandReasoning:ATypeTheoryforComputerScience[M]. London: Oxford University Press, 1994.

[6]LUO Z. Coercive subtyping[J].JournalofLogicandComputation, 1999,(1).

[7]LUO Z. Type-theoretical semantics with coercive subtyping[J].SemanticsandLinguisticTheory, 2010,(20).

[8]LUO Z. Contextual analysis of word meanings in type-theoretical semantics[J].LogicalAspectsofComputationalLinguistics, 2011,(3).

[9]LUO Z,Soloviev S, XUE T. Coercive subtyping: theory and implementation[J].InformationandComputation, 2013,(1).

[10]RETORÉ C.TheMontagoviangenerativelexiconΛTyn:anintegratedtype-theoreticalframeworkforcompositionalsemanticsandlexicalpragmatics[M]. Bordeaux: Universit’e de Bordeaux & IRIT-C.N.R.S. & LaBRI-C.N.R.S,2013.

[11]CHATZIKYRIAKIDIS S, LUO Z. An account of natural language coordination in type theory with coercive subtyping. //Parmentier, Y., Duchier, D. (eds.) Proc[J].ConstraintSolvingandLanguageProcessing(CSLP12), 2012,(2).

[12]CHZTZIKYRIAKIDIS S, LUO Z. Natural language inference in coq[J].JournalofLogic,LanguageandInformation, 2014,(4) .

[13]CHZTZIKYRIAKIDIS S,LUO Z. Natural language reasoning using proof-assistant technology: Rich typing and beyond[J].ProceedingsofEACL2014, 2014,(2).

[14]詹卫东.面向中文信息处理的现代汉语短语结构规则研究[M].北京:清华大学出版社,2000.

[15]陆俭明.现代汉语语法研究教程[M].北京:北京大学出版,2003.

[16]邹崇理.从逻辑到语言—Barbara. H. Partee访谈录[J].当代语言学,2007,(2).

[17]邹崇理.多模态范畴逻辑研究[J].哲学研究,2006,(9).

猜你喜欢

王宇细化食堂
基于ShuffleNet V2算法的三维视线估计
A novel low-loss four-bit bandpass filter using RF MEMS switches
“互助孝老食堂”值得推广
食堂
人生的岔路口,幸好遇到你
幸福食堂值得推广
三千食堂
中小企业重在责任细化
“细化”市场,赚取百万财富
“住宅全装修”政策亟需细化完善