APP下载

自然语言处理用藏语格助词的语法信息研究

2010-06-05扎西加顿珠次仁

中文信息学报 2010年5期
关键词:藏语助词语义

扎西加,顿珠次仁

(西藏大学 计算机科学技术系,西藏 拉萨 850000)

引言

藏语格的用法受语法、语义、语用等多种因素的制约,句子中使用的频率极高,因此藏语格助词的功能是非常强大的;它不是一种格助词对应一种格关系,而是一种格助词表示多种格关系。格助词在对句子进行分析与描述,了解句子的语法信息,深层语义关系,观察句子歧义等语言现象中都有着十分重要的意义,并在自然语言处理领域中发挥极其重要的作用。

1 格的含义

格(Case) 这个概念在普通语言学中通常是指名词或代词等有类似屈折变化的词的一个语法范畴,表示该词和其他词在句子中的关系,而在藏语的这种语法关系通常通过格助词的添接来表现。“格”是指词与词之间起区别作用而不至于和其他词混同、并说明该词在词组或句子中的作用的一类虚词。这样看来,“格”有两种不同的概念,传统上所说的“格”属于形态格,如藏语中的八个“格”,德语中的六个“格”等不同语言中不同的说法,而格语法中所提出的“格”属于语义格,指动词所涉及的事物的不同角色。如施事、受事、客事等等。另外,不同语言中“格”的表现形式也不同,有些语言通过屈折性变化来表现,有些语言主要用词序来表现,有些语言通过介词来表现,有些语言综合采用上述各种形式。藏语主要通过上述中的第三种表现形式来表现。在传统藏语语法中,格分为词格、于格、主格、为格、从格、属格、依格、叹格等八种格。为了叙述方便,本文从格的相同语法形式入手,格主要可分为四大类,即:属格、主格、于格、从格。

藏语的该四类格按后置字的添接规则可分为变式和定式两大类,变式主要有属格、主格以及除于格中的“na”和“la”以外的其余格助词,共包含15个变式格助词,这些格助词都受添接规则的约束,而定式格助词只有上述于格中的“na”、“la”和从格中的“nas”、“las”,共四个格助词,这些格助词则可以自由运用,不受任何添接规则的约束限制,如表2所示。

表1 属格助词和主格助词的添接规则

表2 于格助词的添接规则

藏语格助词的功能非常强大,它不是一一对应或者一种格标记对应一种格关系,而是一种格助词通常表示多种格关系,比如:业格、为格、依格、时间格、同体格都用“于格助词”来表示的。有的格助词还可以附在动词谓语后面用来关联分句之间的关系,具有格助词和连词双重作用。这类兼类还出现在格助词间、格助词与实词间、格助词与连词间的兼类等。

2 藏语格助词的语法信息描述

藏语的句子由若干个格关系构成,格关系是动词和其周围对象发生事件的约束关系,可以说句子的主要成分几乎都用格助词来相互关联,一般表达句子各成分之间的语义关系也只能依靠它。不同的格助词附在相同的名词或名词性短语后,起着不同的语法作用。具体地说,藏语主语大多数情况下与主格助词相连,宾语多带有于格助词,领属之间多以属格助词相联等。

例如:

藏语作为一个通过介词来表现的语言,我们很有必要对格助词的语法信息库中各类格助词进行详细的分析和描述。从格助词的添接形式或类型来说,可分为变式联结词和定式联结词;从语法功能上看,表示句子结构关系,既可以附在词上,也可以附在词组上做句子成分功能的标志,并且粘着在句子的中间,具有框式介词的特点;从兼类的情况看,既有格助词内部的兼类,也有格助词与连词的兼类,还有格助词与实词的兼类;从格的义项考察,有义项类和无义项类等信息。根据以上格助词的语法信息,我们对藏语格助词建立了格的类型信息、格名信息、格标记信息、义项信息、音节信息、词性信息、粘着信息、规则信息、成分信息、兼类信息等共十个属性项,详见表3藏语格助词属性库。

表3 藏语格助词属性库

续表

3 藏语格助词的功能结构分析

藏语中,多个词在述语(动词) 的驱动下依照逻辑格和语义格的结构映射关系,在词汇概念联想的约束和话语音律的限制下构成句子[1]。不同的句子中格助词充当的句法功能也是不同的。藏语格助词的功能结构如下:

其一,主格的语法功能是表示动作者和动作的施动关系,指明动作的施动者、工具、方式等。具体引用方面取决于谓语动词的他动性,因此它是他动词谓语句的一个标志。换句话说,他动词作谓语时,能带涉事宾语,该句应属于有能所关系(bdag gzhan dbye bs)的句子,此时主语必须加主格助词。相反,自动词作谓语时,不能带涉事宾语,该句应属无能所关系(bdag gzan gyi dbye ba med pa)的句子,此时主语不能加主格助词。

其二,领属之间多以属格格助词相联接,句末经常用判断动词。

其三,于格在藏语传统语法中又分为宾格、为格、依格、同体格、时间格,这些都用于格标记来表示。其中宾格的主要语法功能是区分宾语,藏语的宾语分为两种,一种是直接宾语,例如:sdong po btsugs. 另一种则是间接宾语,例如:sa la btsugs. 有时候还可以作地点状语,并且常与处所方位名词phyi nan/ rgyab mdun/ gong vog/ gyas gyon等组合在一起。

其四,为格的主要语法功能是区分所需,表示动作的目的、对象和意图。 可以添接于名词后面,例如:sa bon du vbri rigs nyo 也可以添接于动词后面,例如:bya bas grub tu song 这些需格替换成ched du /phyir du/slad du/ phyir du/don du等就可以使句子所指的语义更加明确。这是宾格与需格的区分标志。

其五,依格的主要语法功能是表示依存、方位、处所,在句中作状语。依格通常出现在方位词和处所词后面。也可以说,它就是处所词的区分标志。

其六,同体格的主要语法功能添接于动词、区别词、形容词性的后面,在句中做状语和补语的作用。

其七,时间格的主要语法功能表示动作行为所发生的时间,在句中作修饰谓语的时间状语等等。

其八,从格助词的主要语法功能表示来源关系。

上述可知,无论是于格助词和属格助词、还是主格助词、从格助词,它们与自己前后词语关系是一个整体,他们与不同词语的组合,体现了不同的语法结构和语法意义,具体见表4。

表4 藏语格助词的语法信息表

续表

4 藏语格助词的语义信息分析

一个完整的句子是一个动词和若干个不同的名词及名词性短语构成,这些名词或名词性短语在句中与其他动词发生各种各样的语义关系。由于格助词前后的词语发生变化,这个句子的格关系也随之会发生变化,如果我们只是停留在格的形式上去孤立地考察[2],研究句子的意义,具体分析他们在句中所代表的语法意义,就只能在一维的语法平面上揭示格助词与前后词语之间的关系。因此,我们利用菲尔墨的格语法理论,将藏语的格进行进一步格型区分,这就使得我们能够在多维的语法平面上对相同格而名词与名词短语不同的句子进行多层次的分析与研究。

格型:AgentbppAgentbpAgenttAgentgtsh

Agenrgch

2. 属格*详见著名藏学专家多识教授的《藏语语法深义明释》。(Genitive): 表示领属(ddb)、总别(ylyl)、来源(bkh)、施事者(bpp)、依存(tt)、时间(dkh)、材料(gch)、修饰(khch)、分离(gch)、自性(ngc)、客事(ngbkh)、方法(t)、性质(khp)。

格型:GenitiveddbGenitiveylylGenitivbkhGenitivebppGenitivettGenitivedkhGenitivegchGenitivekhchGenitivegchGenitivengcGenitivengbkh

GenitivetGenitivekhp

3. 业格(Patient):表示客观事物和动作的关系,指明对象(las)、地点(yul)等。

格型:PatientlasPatientyul

4. 为格(Benefactive):表示受益的对象(yul)和动作(bya)。

格型:BenefactiveyulBenefactivebya

5. 依格(Locative): 表示依存(tt)、主属(ylyl)、性质(khp)、领属(ddb)等。

格型:LocativettLocativeylylLocativekhpLocativeddb

7. 同体格(Character):表示事物性质(tt)、动作(tt)的变化。

格型:CharacterngrzhCharacterbrzh

8. 时间格(Temporal):表示动作发生或是作用的时间。

格型:Temporaldtsh

9. 从格(Source): 表示动作或状态的起源(bkh)、原因(gk)、区别(khp)等。

格型:SourcebkhSourcegkSourcekhp

以上的分析中,我们为格与格之间,格与动词以及格助词之间的语义关系建立了不同的格型,各类格的格型用右上角的字母表示,这对分析句子的语义信息和歧义问题有重要的实用价值。我们可以归纳为以下形式。

主格Agent分为五类:Agentbpp、Agentbp、Agentt、Agentgtsh、Agenrgch;属格Genitive分为十三类:Genitiveddb、Genitiveylyl、Genitivbkh、Genitivebpp、Genitivett、GenitivedkhGenitivegch、Genitivekhch、Genitivegch、Genitivengc、Genitivengbkh、Genitivet、Genitivekhp;业格Patient分成两类:Patientlas、Patientyul;为格Benefactive分为二类:Benefactiveyul、Benefactivebya;依格Locative分成四类:Locativett、LocativeylylLocativekhp、Locativeddb;同体格Character分成二类:Characterngrzh、Characterbrzh;时间格Temporal分成一类:Temporaldtsh;从格Source分成二类:Sourcebkh、SourcegkSourcekhp。详见表5。

表5 格型表

5 结束语

藏语具有丰富的格助词,并在句子中所起的作用极为重要,无论是人的思维机制,还是计算机的处理方式,最关键的问题是怎样理解和分析不同句子的语法、语义等,这些都离不开格分析,故格的研究在藏文信息处理领域中极为重要。

[1] 祁坤钰.信息处理用藏文自动分词研究[J]. 西北民族大学学报(哲学社会科学版),2006,4:92-97.

[2] 李其松.格语法析句初探[J].江西教育学院学报,1997,18(1):44-47,52.

[3] 扎西加, 索南尖措.基于藏语信息处理的词类体系研究[J].西藏大学学报,2008,1:36-41.

[4] 扎西加,多拉,欧珠,大罗桑朗杰.《信息处理用藏文词类及标记集规范》的理论说明[C]//第十一届全国民族语言文字信息技术研讨会论文集,2007.

[5] 陈玉忠. 信息处理用藏语虚词的语法信息表述研究[C]//中国语文现代化学会2003年年度会议论文集, 2003.

[6] C.J.菲儿墨.格辨[M].商务印书馆,2005.

[7] 多识.藏语语法探义明释[M].甘肃人民出版社,1999.

猜你喜欢

藏语助词语义
浅谈藏语中的礼仪语
韩国语助词的连续构成与复合助词的区分
藏语传统辞书词目编排法探析
语言与语义
高校朝鲜语专业学生助词使用偏误调查分析
日语中“间投助词”与“终助词”在句中适用位置的对比考察
藏语拉达克话的几个语音特征
批评话语分析中态度意向的邻近化语义构建
“社会”一词的语义流动与新陈代谢
藏语地理分布格局的形成原因