《现代俄语详解组合词典》的优劣与借鉴
2016-09-24黑龙江大学俄罗斯语言文学与文化研究中心哈尔滨150080
李 侠(黑龙江大学俄罗斯语言文学与文化研究中心,哈尔滨 150080)
·文学与文化研究·
《现代俄语详解组合词典》的优劣与借鉴
李 侠
(黑龙江大学俄罗斯语言文学与文化研究中心,哈尔滨150080)
《现代俄语详解组合词典》是莫斯科语义学派“意思⇔文本”模式理论的词库,词条部分涉及的理论有语义元语言理论、支配模式理论和词汇函数理论。将《现代俄语详解组合词典》和汉语主要的语义词典相对照,分析其在词汇单位划分、释义、配价结构(支配模式)设置等方面,可为汉语语义词典提供可借鉴之处。同时该词典本身在语义角色标注、语义搭配限制描写等方面仍有需要完善和补充之处。
语义词典;配价结构;释义;词汇函数;语义角色
《现代俄语详解组合词典》(Современный русский комбинаторный словарь,以下简称《组合词典》)出版于1984年,是莫斯科语义学派“意思⇔文本”模式理论(теория лингвистических моделей《Смысл⇔Текст》)的词库,它是理论语言学词典化的典型代表。《组合词典》词条部分分为释义区、支配模式区和词汇函数区,分别涉及的理论有语义元语言理论、支配模式理论和词汇函数理论,每个部分都有丰富的语言学理论做支撑。虽然《组合词典》出版至今已几十年,但其编写原则和结构设置对国内语义词典的编写仍具有借鉴意义。
一、《组合词典》为汉语语义词典提供的借鉴之处
对于动词配价词典,词汇单位如何设置、标明什么样的信息十分重要。范晓指出,理想的“动词配价词典”实际上是“某种语言生成句子的词典”,“这种配价词典应对某种语言里的动词配价组成的动核结构作出说明,不仅要给出某个动词(多义动词要分解到每个义项)的‘价类’,而且还要对动核的性质(动作、性状、变化、关系等等)和所联系着的动元(配价成分)的‘角色’(施事、受事、与事、系事、起事、止事……)以及某些常联系着的状元(非配价成分)作出准确的诠释;在此基础上,对该动词的形式特征以及它组配成的动核结构所生成的句模和各种可能有的句型或句法格式进行详尽的描写。甚至,如果可能,还可注明该动词使用的条件和所组成的句型、句模组合体在语用上的选择性”[1]。《组合词典》可以说是部分地实现了这一理想。
《组合词典》至少在以下几个方面可以为汉语语义词典提供借鉴:
(一)以义项为单位,进行自然语义元语言释义
语言精细化研究要求对词义作出更加细致的分辨,反映在词典中就是描写单位由“词”转变为“词义”,即通常所说的“义项”。莫斯科语义学派常把多义词的一个义项叫作词汇语义单位(лексико-семантический вариант)[2],本文简称词汇单位)多义词就是一个语义变体集。“以义项为描写单位描绘词的语义特征,建构语言知识库,正受到人们的高度重视”[3]。《组合词典》把义项而不是词作为描写单位。
在给词汇单位(义项)进行释义时,《组合词典》采用自然语义元语言,将词汇语义分解成具有典型特征的语义元素,使语义的分解和表述更能够反映人们言语活动的心理表征和自然语感。元语言由语义单子和过渡语义元素构成,不仅使解释明确,而且简化了释文,更符合词典的编撰原则,例如:《组合词典》中учиться“学习”的释义为:X учится Y-у(у Z-a/по Z-у(в W-е))=X有意识地付出努力获取(Z在W传授的)Y。[4]面向人的学习词典还是面向机器的语义词典,采用元语言释义是当今词典学释义的发展趋势。
目前汉语语义词典没有对释义给予应有的重视,一般都采用同义词释义的方式,且选择性地进行。如知网使用的是同义义原释义的方式,它把4000个汉字的所有义项统统列出来,用手工的方法一一观察、挑选、合并同类项,最后提取了2000个义原,如从“医”、“治”、“疗”,提取出“医治”这样一个义原。《现代汉语语义词典》同样采用同义词释义的方法[5],如对“找”的释义为“寻找”。这种做法的缺陷体现在:一方面,“找”与“寻找”、“医”、“治”、“疗”与“医治”意义上不能完全对等;另一方面,无法揭示词汇复杂的概念结构,这样的义原提取更类似传统词典学中对“基础词汇”的提取,而不是真正意义上的元语言。对于汉语词典学、词汇学、语义学以及中文信息处理等领域,多年来之所以难以出现重大突破,主要原因在于“尚未对现代汉语元语言系统这一基础性工作进行深入研究”[6]。构建一个成熟的、可操作的符合自身研究目的和特点的元语言系统可以看成是编纂汉语语义词典的首要任务,我们对动词“挖”用《组合词典》的方式进行尝试性的元语言释义:X挖Y/Z=X用工具或手从Y的表面向里用力,取出Y的一部分,形成中空结构Z或取出Y中包藏的东西Z。释文清晰地提供了以下几方面信息:词汇单位基本的句法框架,词汇单位所描写的概念结构及其构成要素,即词汇单位的配价(数目及其性质),这些信息可为更重要的动词配价结构的确定提供依据。
(二)多层级配价结构描写体系
配价结构(диатеза)指特定谓词的语义配价和句法配价之间的对应关系[7],在《组合词典》中莫斯科语义学派使用术语支配模式(модель управления)代替,以表格形式体现其语义配价、深层句法配价和表层句法配价这种多层级配价体系,力求对影响句法、语义对应关系中的各个层级进行细致、准确的描写。语义配价、深层句法配价、表层句法配价三个层级既相互独立,又彼此联系、相互对应,每个层级都有各自的描写手段和规则及主要解决的问题,同时整个配价系统又作为一个整体发挥作用。通常情况下,有多少个语义配价就有多少个深层句法配价,但在实际中深层句法配价的数目可能多于、少于语义配价的数目,即发生配价分裂、配价合并等特殊的句法、语义对应现象。在《组合词典》中,表格第一横栏为深层句法配价(1,2,3…)和对应语义配价变项(X,Y,Z…)。第二横栏是表层句法配价,是深层句法配价在表层句法的体现方式。深层句法配价1,2,3等是对深层句法结构图示中节点 1,2,3等的抽象。语义配价变项从词汇单位的释义中得出。
下面是俄语动词 учиться(学习)的支配模式,如表格所示:
УЧИТЬСЯ1.X учится Y-у(у Z-а(в W-е))=X有意识地付出努力获取(Z在 W传授的)Y。
1=X谁获取知识或技能2=Y力求做到(学会)什么3=Z谁(什么)传授知识或技能4=W在什么机构动物名词短语 1.三格名词短语2.未完成体动词不定式3.на+四格名词短语4.по+三格名词短语1.у+二格名词短语2.под руководством+二格名词短语3.по+三格名词短语1.в+六格名词短语2.на+六格名词短语
汉语配价语义词典中对句法、语义信息大多未分层级描写,一般只注重语义层面的配价框架的描写,而对配价成分在表层中的具体表现形式不予关注,对句法语义对应中的配价分裂、合并等特殊现象更是从不描写。如知网的必要角色框架中只描写词汇语义层面的信息,且语义信息描写的颗粒度较大,例如,buy的必要角色框架为:<a⁃gent,possession,source,cost,beneficiary>,由这个配价框架,我们只知道必须有agent,这个agent表层有哪些表现手段,知网没有给出。《现代汉语语义词典》同样缺少对配价成分在表层中具体表现形式的描写,例如在对“找”进行描写时只指明其配价数、语义角色、语义搭配限制。中国人民大学语言文字研究所编著的《动词大词典》中只给出每个动词的必要配价和语义角色[8],《中文概念词典》只对动词句子框架作简单描述。词典最重要的目的是通过对词汇语义、句法信息的标注,最大限度地预测其在句子中的使用情况,这一目的与目前句法—语义界面理论研究目标相一致。《组合词典》中词汇单位的释义揭示词汇单位的语义结构;支配模式表格第一横栏表示语义配价变项X,Y,Z和深层句法配价1,2,3之间的对应关系,它可看成是实现词汇语义和句法接口的工具,是句法、语义接口概念的一种变体和具体应用;第二横栏是深层句法配价在文本中的表达方法。从释义到支配模式第一横栏,再到第二横栏,词汇语义逐步实现了同句法配价的链接。《组合词典》配价结构的这种设置符合学者们对句法、语义界面研究的普遍认识:“通常认为句法—语义界面研究需要考虑三个表征层面,一个是词汇语义结构,一个是论元结构(配价结构),最后一个是句法结构。”[9]在自己的语言学理论基础上构建语义词库,如框架网构建的语言学理论基础是框架语义学,《组合词典》构建的语言学理论基础是“意思⇔文本”模式理论,国内语义词典界还没有这样先例,成熟语言学理论作为基础将使词典更具有理论价值和应用前景。
(三)词汇函数理论
词汇函数[10]是《组合词典》与其他词典相比最具新意的地方。我们知道一个词汇单位与其他单位会有各种组合、聚合关系。各种聚合、组合关系,《组合词典》中用词汇函数表示。词汇函数指一个词汇单位(或其集合)与另一个词汇单位Y之间的选择对应关系f,表示为Y=f(X)。f表示特定的抽象概念,如“极端特征”、“同义”、“开始”、“使不存在”等,用拉丁语缩略形式标记:Magn,Syn,Incep,Liqu等,如无微不至=Маgn(关怀),妻子=Syn(老婆),入睡=Incep(睡觉),取消=Liqu(限制)。X是词汇函数f的自变项,Y是因变项,Y因具体X的变化而异。例如:《组合词典》中учиться1的词汇函数有:Syn(учиться1)= изучать1,учить2,брать уроки等等;S0=учеба;Magn=настойчиво,упорно,прилежно,систематически;Incep=идти[учиться]等30种。《组合词典》通过词汇函数全面、系统地展现了词汇单位与其他词之间的各种依存关系。词汇函数在词典中的应用可以说是词典学上的一个创举[11]。我们将词汇函数系统用于描写汉语词汇搭配规律时,可以发现一些有趣的现象,从中可见俄汉两种语言词汇体系的不同,如函数perf表示行为达到的内在界限,俄语中一般表现为持续结果完成体动词,但在汉语中除了用 “动词+了”的语法形式,还可以用动结式、动趋式动词短语表达,如完=perf(读),好,完/建,上/穿,下/摘,起来/站,碎/打;再如俄语中数次与名词连用中间一般不加量词,但汉语中量词通常因名词的变化而变化,如匹=Sing(马),头/牛,床/被,杆/秤,支/笔,如果各自语义词典中对这些具有熟语性特征的词汇函数进行丰富的描写,定会提高机器翻译的准确性和质量。
(四)对句子“核心成分”和“非核心成分”进行全面研究与标注
《组合词典》对动词语义结构的描写突破了“核心成分”的限制,实现了对“处所”、“工具”、“时间”等非核心成分的描写。如对учиься词库中“配价结构”既描写了所谓的核心配价成分X(施事),Y(对象),Z(客体),又描写了非核心成分W(地点),实现对句子“核心成分”和“非核心成分”的全面研究与标注。“因为我们所需要的信息没有核心与非核心之分,信息处理系统对核心和非核心框架元素的操作过程是完全相同的。”[12]“核心”、“非核心”是句法概念,判断的依据是是否为句子句法上的主要成分。动词配价结构描写的应是其语义上的配价成分,莫斯科语义学派的配价成分指的是构成特定情景的充分必要条件,其中任何一项的变化都会导致情景的变更或解体,如“租赁”的配价结构描写的成分有承租人、出租人、租赁物、租金和期限,缺少其中任何一项都会使词汇单位所描绘的概念情景发生变化:缺少期限变成“买卖”,缺少租金变成“借用”,缺少期限和租金变成“转交”等。汉语中,有些动词配价成分的句法位置灵活,这里主要指时间、处所、原因、目的、条件、行为方式等成分,大多数情况在句中是非核心成分,但也可作为核心成分出现在主语、宾语位置,如动词“坐”,可以坐在椅子上,也可以坐前排;动词“吃”,可以说吃饭,也可以吃食堂、吃大碗。对非核心成分的描写仅限于那些从动词的词汇意义上可以推导出来,并且是在一定的句法结构的主语、宾语位置中实现了的从属成分。这样,那些几乎可以跟所有的动词共现的时间、处所等成分就应该排除在动词的配价结构之外。
二、《组合词典》需要完善之处
《组合词典》编写始于20世纪60年代,几十年间各种语言学理论层出不穷、语言学知识不断更新,即使是其所涉及的“意思⇔文本”模式理论也在不断完善。在与国内外主要语义词典进行比较,结合相关理论分析后,以下几方面是《组合词典》需要完善之处,同时有些也是汉语相关词典描写的薄弱环节。通过对《组合词典》的补充,可为汉语相关方面的研究提供思路。
(一)标注语义角色
《组合词典》在语义配价与深层句法配价的对应上,不标注出相应的语义配价的角色类型,这虽然省去了划分语义角色类别的麻烦,但却无助于揭示词汇深层的语义关系。语义角色在大多数大型词库中多有应用,语义角色标注已成为了语言信息处理中的一个重要课题。加州大学的框架网络[13]项目通过基于场景的语义框架来定义语义角色,框架中的框架元素便是框架网中的角色;俄语版的框架网(Russian FrameBank)[14]使用了87种语义角色;知网对于语义角色的策略是尽量挖掘,共采用了90个语义角色[15]。《中文概念词典》中使用26个角色定义动词概念C的句子框架(sentence frame)[16]。关于语义角色对语言信息处理的作用,袁毓林曾指出:“开发了一个400万词规模的汉语语义骨架标注语料库,对每个句子标注有面向语义的因事(S)、中心谓词(V)和果事(O)块信息。结果,对于‘咬死了猎人的狗’一类歧义格式的消歧起了很好的作用。如此看来,语义角色方面的信息对于语言信息处理是极为重要的,哪怕只是比较粗放的宏观层次上的语义角色。”[17]莫斯科语义学派在《组合词典》后的发展中逐渐将语义角色纳入配价结构理论中,如Апресян(2004,2010)[18][19]《词汇语义学》、Падучева(2004)[20]列出了近百种语义角色。在语义角色的确定方面,与汉语界大多采用语义角色的句法—语义观不同,莫斯科语义学派更强调语义角色的语义基础,强调语义角色系统与动词语义类别及题元名词的语义分类系统相互协调、制约,而不是抛开二者独自探讨语义角色。
(二)描写词汇单位的各种语义搭配限制
动词的语义会对题元名词的语义类别有一定的限制,反过来,名词的语义类别,如物质、行为、非离散性质、活物、自然力、事件等对动词的语义描写有重要作用。《组合词典》对词汇单位的各种语义搭配限制描写得比较笼统、模糊,并没有一个完整的语义分类系统作参考。名词的分类类别无法开出一张完整的清单,它的数量会随着动词语义规模的扩大而增长。正确的做法是“以述语动词对有关语义角色所施加的语义制约为标准,用动态的描写方法,来建立汉语名词性概念分类体系”[21]。汉语界已有多部词典对词汇单位的语义搭配限制进行系统的描写,例如《中文概念词典》“吃”的施事和受事的语义限制分别是“动物;人,人类”和“食物,可吃物”;《现代汉语语义词典》中“找”的2个配价“主体”和“客体”的语义选择限制分别是“人”和“具体事物”。目前,汉语语义词典中《现代汉语语义词典》和《现代汉语述语动词机器词典》已经尝试建立完整的语义分类体系,下一步要做的可能是对其进一步细化、修补,使其实用性更强。
(三)增强对不以动词意义为基础的构式的描写
《组合词典》是以配价结构为基础的语义词典,这种词典存在自身的缺陷,即配价结构从根本上是“动词中心论”的产物,这决定了其在处理语义和句法关系方面的不足:一方面,远非所有语言、所有句式都是以动词为中心的;另一方面,这过分强调了词汇语义对句法结构的决定性作用。目前兴起的构式语法可以弥补这方面的不足,动词语义和句式互动关系是今后语义研究的方向。词库中尽可能准确地预见动词所能出现的句法环境就要做到既要准确地对动词的配价结构进行描写,又要对不以动词意义为基础的句式进行描写。句法构式(句式)具有比较固定的格式,比较容易进行形式化的描写和处理。俄语框架网做了这方面的尝试,词库涵盖俄语2200个常用动词,以词汇单位的句式为描写对象,描写内容包括句式的形态句法特征、参项的交际地位、参项语义角色及填充句法位题元的语义限制几个方面。语义词典如果能把基于词汇的配价结构描写和构式语法结合起来,才能对语义结构和句法结构之间的映射关系进行全面系统的描写,才能更好地为语言及语言间的信息处理服务。
结 语
《组合词典》以义项为单位,对词汇单位进行自然语义元语言释义,多层级的配价结构中涉及动词的语义类别、配价模式、配价数目、语义角色、语义搭配限制等描写,词汇函数描写像一张大网将与词汇单位发生组合、聚合关系的其他词汇囊括其中,补充了的构式描写可以使句式获得独立地位,不再只是词汇语义的衍生品。清华大学和中国人民大学语言文字研究所共建的《现代汉语述语动词机器词典》被专家评价是语言工程上的一个新突破,而就研究方法及描写内容来说,《组合词典》与其基本相同,而它的每个部分有自己独特的语言学理论做支撑,如果能在《组合词典》的基础上研发汉语语义词典,相信一定会推动汉语相关方面的研究。
[1]范晓.动词的配价与句子的生成[J].汉语学习,1996,(1):7.
[2]ВАСИЛЬЕВЛМ.СовременнаяЛингвистическая Семантика[M].М.:Высшая школа,1990.
[3]苏新春,王惠.等.语言知识库的内化与细化——完善词义知识库之设想[C].第六届汉语词汇语义学研讨会,2005:162.
[4]МЕЛЬЧУК И А,ЖОЛКОВСКИЙ А К.ТолковокомбинаторныйСловарь СовременногоРусского Языка[M].Wien:Wiener Slavistischer Almanach,1984:917.
[5]现代汉语语义词典[K/OL].http://ccl.pku.edu.cn/ccl_ sem_dict/
[6]李葆嘉.汉语元语言系统研究的理论建构及应用价值[J].南京师大学报:社会科学版,2002,(4):143.
[7]МЕЛЬЧУК И А.Курс Общей Морфологии[M].Т.2. М.:ЯРК,1997-2000:163.
[8]鲁川,等.动词大词典[K].北京:中国物资出版社,1994.
[9]沈园.句法—语义界面研究[M].上海:上海教育出版社,2007:25.
[10]张家骅.俄罗斯语义学——理论与研究[M].北京:中国社会科学出版社,2011:195-207.
[11]蒋本蓉.《现代俄语详解组合词典》述评[J].辞书研究,2008,(3):109.
[12]陶明忠,马玉蕾.框架网络与汉语信息处理[J].语言文字应用,2007,(4):123.
[13]框架网络.https://framenet.icsi.berkeley.edu/fndrupal/
[14]俄语框架网络.https://framenet.icsi.berkeley.edu/fn⁃drupal/framenets_in_other_languages
[15]董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,(4):7.
[16]于江生,俞士汶.中文概念词典[J].中文信息学报,2007,(4):72.
[17]袁毓林.语义角色的精细等级及其在信息处理中的应用[J].中文信息学报,2007,(4):11.
[18]АПРЕСЯНЮ Д.Новый Объяснительный Словарь Синонимов Русского Языка[M].Москва-Вена:Языки Славянской Культуры,2004.
[19]АПРЕСЯНЮ Д,БОГУСЛАВСКИЙ И.М.и др. Теоретические Проблемы Русского Синтаксиса[M]. Взаимодействие Грамматики и Словаря.М.:Языки Славянских Культур,2010.
[20]ПАДУЧЕВАЕВ.Динамические Моделив Семантике Лексики[M].М.:Языки Славянской Культуры,2004:343.
[21]林杏光.词汇语义和计算语言学[M].北京:语文出版社,1999:204.
Modern Russian Detailed Combination Dictionary and Its Value for Chinese Semantic Dictionaries
LI Xia
(Center for Russian Language,Literature and Culture Studies of Heilongjiang University,Harbin 150080,China)
Modern Russian Detailed Combination Dictionary is a thesaurus of the theory“Meaning⇔Text”Model of Moscow Semantic School.It is based on the theories of diathesis(government pattern),lexical functions and metalanguage.The paper tries to compare Modern Russian Detailed Combination Dictionary with Chinese seman⁃tic dictionaries,analyzing its value on the lexical units classification,dictionary definition and diathesis settling,and at the same time,we can see its shortcomings.Key words:semantic dictionary;diathesis;lexical unit;lexical function;semantic role.
semantic dictionary;diathesis;lexical unit;lexical function;semantic role
H35
A
1009-1971(2016)04-0091-05
[责任编辑:郑红翠]
2016-03-05
黑龙江省高校人文社科项目“配价结构与语义词典”(1252b016)
李侠(1981—),女,黑龙江讷河人,博士,助理研究员,从事俄语语义学研究。