APP下载

基于树库的概念语法隐喻依存距离对比研究

2015-01-07叶芙蓉

卷宗 2015年12期

叶芙蓉

摘 要:基于依存语法中的依存距离理论,本文采用了人工标注的树库,对英语中的概念语法隐喻与一致性表达进行了定量对比分析。手动计算依存距离(DD)和依存距离绝对值(ADD),依存距离均值(MDD),并且分析支配词与被支配词的词性以及过程类别。初步研究结果显示,概念语法隐喻多用名词少用动词和连接词作为支配词,DD和ADD均相较一致性表达较小且概念语法隐喻一般会涉及过程类别的转变。两者在MDD和DD正负值上差别不大,能以英文的句子中片段套片段,各片段中有自我支配的结构得以解释。

关键词:概念语法隐喻;一致式;非一致式;依存距离;树库

1 引言

语言的隐喻性促进人类认识的发展。韩礼德早在1978年就提出隐喻思想,而且他认为隐喻并不仅限于词汇,且常发生在语法层面。语法隐喻最初是由韩礼德于1985年提出以区分自下而上的词汇隐喻,前者是形式变体后者则是意义变体。韩礼德定义表达层与意义层的分离为非一致式,即表达并非现实的自然陈述,而语义与词汇-语法间的转义就带来了语法隐喻,通常所说的平白体对应的是一致式。他把语言的元功能分成概念、人际和语篇功能,并据此划分语法隐喻,语法单位语法域或子语法域间的转移就是隐喻式或非一致式。

韩礼德认为语法隐喻是朝着事物性方向发展,即从过程朝个体方向发展直至最终出现了某一可以指称此类个体的名词,说明他的重点在概念隐喻,故也是本文的研究对象。韩礼德首先把人类社会的各种活动经历划分为物质、心理、关系、言语、行为和存在6个过程,而过程与功能的相互隐喻化最终也会体现在可以考察的词汇语法层的转换。(Halliday,1985)

从功能语法出发研究语法隐喻历来以久,但大多是限于法律等文本的比较主观的从理论到理论,尤其缺乏较为客观的数据分析,而本文引入依存距离的理论对一致式和非一致式进行基于树库的量化对比分析。

2 研究方法

本文收集相关教材中的一致以及概念语法隐喻的各50句子建成两个树库,在用treetagger进行标记过后,采用Excel手动分析依存距离、支配词、从属词的词类,以及依存类型,最后进行数据分析及讨论。Hudson定义依存距离为支配词语从属词的线型距离。本文为进一步分析这两种句型,计算了依存距离(DD),绝对依存距离(ADD),平均依存距离(MDD),假设句列为Na, Nb...Ni..Nn,Nb由Na支配,那DD=a-b, 如果为正数则说明支配词在从属词右边,反之亦然。为更好的观察词间的关系,引入ADD=|a-b|, 而MDD==,DDi即为第i个词的依存距离。 (刘,2009)而下文会出现的PDD与PADD则为将受标点支配的依存距离设为单位1后的平均值。

3 数据与讨论

3.1 相似性

虽然两种句型在表层有所不同,但也具有一定相似性。由表1可见依存距离正数均略高于负数,说明支配词都在右边,是支配后置为主,语法隐喻句作为英语中为实现特殊沟通目的的用法也符合语言使用者的认知期待。且句例分析发现两种句型都是首先由像名词词组、介词短语等的词段支配,而这些词段由标点或句子的主要动词支配,所以两者相似的正负数比例分布也可由英语中的词段套词段的自我支配结构得以解释。这一点也可在平均依存距离中得以进一步呈现。表中MDD的数值非常接近,其排除了支配前置或后置的区分,更能说明问题。

3.2 差异性

1)表层词排列特征

前文提过由标点符号支配的依存距离与词间关系甚少,故本文引入依存距离和绝对依存距离的平均值即表2中的PDD、PADD概念,按照学术惯例,将受标点支配的依存距离设为单位1,排除其对数据的影响。表2可见一致表达数值较大,本文假设一致表达试图反应事物的自然发展,而IGM是带着目的的表达,需要首先根据沟通目的指出重点,故其的词列更紧凑而一致表达的句长及词列更松散。由表三可知总体接近的分布中,IGM表达中距离大于5的很少,主要集中在1和2,而一致性表达在5以上的比例较大(见表3):

2)支配词类型

树库分析中涉及到支配词类型,通过从词性的对比可以进一步观察两种表达在表层结构上的不同。

从表4可见IGM表达中名词比例最大,而一致表达中则为动词。正如Thompson所言,在概念隐喻中为满足说话者的目的,尤其是在带有“事物性”的科学写作中,“对象化”经常使用以达一定的客观性。同时,连接词使用率在一致性表达中更高,这一点可以从一致性表达符合自然规律,故需要更多词语单位以及衔接工具来实现事件的发展,而IGM表达则得益于其紧凑表达更具逻辑性,降低了对连接词的需求。

3)过程类型

语法隐喻从定义上来看,是涉及语法单位从一个域到另一个基本域或子域的不一致的实现。这里的域指的不仅是词性而是及物性中的不同过程,鉴于论文篇幅有限,只会涵盖个别例子:

1)一致性: The guest ate ice cream and then swam gently.

IGM: The guests supper of ice cream was followed by a gentle swim.

此例中ate与swam两个物质过程连续发生,guest与ice cream分别作为施动者与目标,而and 及gently为时间与方式。而IGM表达之中supper与swim则转变为价值与标记,构成关系过程。

2)一致性:They danced in Hungarian style.

IGM:They did a Hungarian dance.

此例中实现了从行为到物质的转换,过程类型的转变代表性突出已被作为考察句子是否为语法隐喻的参考,如过程分析不能充分反映事物状态,则很可能发生了隐喻化表达。

4 结语

本文采用树库的量化分析方法探讨了一致性表达与IGM表达的相似性与差异性,概念语法隐喻多用名词少用动词和连接词作为支配詞,DD和ADD均相较一致性表达较小且概念语法隐喻一般会涉及过程类别的转变。两者在MDD和DD正负值上差别不大,能以英文的句子中片段套片段,各片段中有自我支配的结构得以解释。同时,结合了过程类型的质的分析,IGM表达多会涉及从一个基本域或子域的转换。

但本文自建的手动分析树库规模不够大仅包涵3000类符,此外语料来自关于语法隐喻的一致性表达与语法隐喻表达的例句,从某种程度可以保证权威性,但无论是隐喻还是一致性表达都是度而非绝对的,而且教科书式的例句不能全面反映自然语言的特征,故建议进一步研究可以涵盖语法隐喻高频使用的科技写作以及日常口语录音转录的大型树库,验证并得出结论。