APP下载

基于语料库的德语时事新闻词汇的语义韵研究

2021-05-17

无锡职业技术学院学报 2021年2期
关键词:频数语言学语料库

雷 蕾

(无锡职业技术学院 外语与旅游学院,江苏 无锡 214121)

翻译古来有之,从有语言开始就有翻译。翻译不但跨越了多个学科,在语言、哲学、文化等多个领域都有所涉猎;还跨越了人类社会文化交际的各个层面,同时也是原作者、译者、译文读者三者相互作用的结果,译者在翻译过程中要努力分析并处理好几者之间的制约与互动关系才能建立“解释的合理性”,做到“创而有度”,并实现“翻译的和谐性”。

人类科学的发展随着人们对客观世界的深入理解,从综合向高度专门化进行这类似螺旋式的分化,然后又在更高的层次上进行新的综合。计算机技术的出现为翻译提供了强大的技术支持。语料库翻译学就是在这一背景下产生的一门新兴的交叉学科。Sara Laviosa在其著作《语料库翻译研究:理论、发现和应用》中指出:“语料库翻译学的产生主要受两个研究领域的影响,一个是语料库语言学,另一个是描写性译学研究。”[1]

1 语料库翻译学

语料库翻译学,指以语料库为基础,以真实的语言数据为研究对象,以宏观的角度对大量语言事实进行分析,从中寻找翻译使用的规律,系统分析翻译本质、翻译过程和翻译现象等内容的研究。在语言分析方面采用概率法,以实际使用中语言现象的出现概率为依据建立模型或对其语法现象进行分析。语料库语言学从一个新的角度揭示自然语言的复杂性。Mona Baker的论文《语料库语言学与翻译研究:启示与运用》被认为是语料库翻译学的开山之作。

计算机化的语料库是语言研究的强大工具,可以服务于翻译的研究领域,为语料库翻译学提供了强有力的手段,用来对自然语言进行定量分析。这种从真实语料出发,对大量的语料进行宏观研究的做法有可能产生新的研究方法、建立新的语言学模型,因此计算机语料库又是各种语言学模型的试验田,可用来检验语言学模型的正确性。在当下大数据的背景下,语料库发挥的作用越来越重要。无论是双语平行语料库、单语语料库,还是其它形式的语料库都为翻译教学、翻译研究和翻译实践等搭建起了极好的应用研究。

2 词汇语义趋向和语义韵研究

2.1 研究方向

词语搭配是语料库翻译学中最常见的研究对象之一,是语料库研究中至关重要的研究领域。其指的是一个词和另一些词同时出现时,所展现出来的一定的规律,或称之为共现关系。Firth指出“搭配是词的一种习惯性的结伴使用”,他又进一步指出“从词的搭配可以知道词的意义”,因此研究词汇搭配可以具体深入研究词义变化[2]。词语搭配是词与词的有限组合,与自由组合的情况不同,构成有限组合词的搭配力受诸多因素的制约,只能和有限范围的词结合在一起使用。对搭配的研究可以与语义趋向和语义韵的研究相结合,语义趋向和语义韵是对搭配研究的延伸与扩展。语义趋向就是由词之搭配行为的共同特点所构成的,具有某种相同语义特点的搭配词与关键词共现所展示出来的某种语义氛围被称为语义韵[3]。

搭配研究有如下常见研究内容:① 关键词和搭配词的确定;② 跨距长度;③ 搭配词的提取和统计[4]。

(1) 关键词的确定,也就是如何选择关键词。关键词作为搭配研究的研究对象,关键词出现的频次不能太低,如果出现频次太低,则很难生成有效的数据,就难以进行分析研究。

(2) 跨距长度。语料库中的跨距一般是指关键词和所提取的搭配词之间相隔的词数。这个长度不宜过长,一般在4~5个词数之内。同时用正负(+/-)来表示左右的位置,-1,-2,-3表示位于关键词左边的第一到第三的三个位置;+1,+2,+3则表示位于关键词右边的第一到第三的三个位置。

(3) 搭配词的提取和统计。在语料库中输入关键词,显示出来的以关键词为中心,其往左往右的就是其所搭配的搭配词。

2.2 实证研究

2.2.1动词的实证研究 以常见动词kümmern为例,作为文本从1972年至2017年在常见著名杂志、报纸中出现频次为241 721次,其中仅2017就出现了11 214次,2017年在几份德国知名报纸、杂志上的出现频次如下[5]:

表1 2017年kümmern在著名杂志、报纸出现频次

从表1中可以总结出在动词kümmern的常见搭配中,与介词um和代副词darum(drum)的搭配几乎达到100%,可以认为这已经约定俗成固定下来,这一搭配是一种固定搭配,而在德语字典中也的确有sich um etw. kümmern的固定搭配。除此以外的与名词的常见搭配(即宾语的搭配),也就是上文提及的常规搭配如下(前5名):

在此我们主要讨论动词宾语的搭配,忽略了否定词、形容词以及副词的常见搭配。在这5个出现频次最多的名词中,Kinder是孩子、儿童的意思;Belang是利害关系、利益的意思;Wohl是福利、也有利益的意思,Schaden是损害、损失;Nachwuchs是下一代,接班人,也有孩子的意思。从图1中可以看到与Kinder的搭配远远高于其他搭配,可见此项是kümmern这个词的最主要的搭配用法,从这五个高频搭配中,kümmern的最常见的意思可以翻译为:照顾、照料(孩子、下一代);关心(利益)。

图1 kümmern常见搭配

在此以2017年最新的《明镜周刊》中的具体文本,来看一下kümmern这个动词的具体搭配与用法。

例1:Natürlich birgt es ein monetäres Risiko, sich stärker um Kinder als um Karriere zukümmern. Der andere Weg aber auch: am Ende des Lebens zu bereuen, zu wenig Zeit mit den Kindern verbracht zu haben. (Quelle: S17/JAN. 00297 Der Spiegel, 21.01.2017, S. 136; Unterm Rüschenrock)

这段文字是摘自2017年1月21日版的《明镜周刊》中第136页上的一段,这段文字主要是在讨论工作与家庭(尤其是照顾孩子)如何平衡,如何取舍,如果更倾向于照顾孩子,那么在收入上就会有危机;但是如果选择职业,将来又会后悔陪伴孩子的时间太少。在此,我们看到了kümmern这个动词的一个经典常见搭配。

例2:Aber klar ist: Elke Büdenbender will sich als Richterin beurlauben lassen und zusammen mit ihrem Mann ins Schloss Bellevue ziehen. Büdenbender will Schirmherrschaften übernehmen und sich vor allem um soziale Belangekümmern. Was das betrifft, läuft also alles nach Plan, den klassischen Weg, mit Steinmeier gibt es da keine Revolution. (Quelle: S17/FEB.00133 Der Spiegel, 11.02.2017, S. 30; Der Bescheidenheitsprotz)

这段文字是摘自2017年2月11日版的《明镜周刊》中第30页上的一段,提及对于Büdenbender来说,是很明确的,他要关注公众利益,要做民众的保护伞,维护广大民众的利益。

从上面的两个例子,可以看到kümmern这个动词,出现频次、经典以及常见搭配。

2.2.2名词研究的实证研究 以名词Platz为例,Platz是广场的意思,从1772年至2017年在书面文本中出现频次为2 860 402,近三百万次。一般与介词auf搭配,auf den/dem Platz(到广场上去/在广场上);与动词的常见搭配有:Platz belegen(占座、占位),Platz nehmen(就坐、坐下)。

除上述以外,Platz比较特殊的常见搭配还有:① 专有名词:Postdamer Platz(波茨坦广场)出现频次甚至远超上述例子。② 与数词的搭配:a.与序数词的搭配,表示第几位,zweiten Platz(第二位);b.与基数词的搭配有两种情况:如果基数词后置,相当于序数词的用法,auf Platz drei(第三位);如果基数词前置,就是多少座位、几个座位的意思,drei Plätze(三个座位、位置)。

2.2.3形容词的实证研究 再以形容词groß为例,在德语中groß是非常常见的一个形容词,其基本含义就是大。作为文本从1772年至2017年在常见著名杂志、报纸中作为表语和状语出现频次就已经达到1 154 058次,远远高于kümmern出现的频次。其中仅2017年在《明镜周刊》就出现了837次,而在这837次中作为状语(副词)出现的情况不到150次,其余都是与“是”动词连用的系表结构。其他常见搭配见表2:

表2 groß常见搭配

groß还可以与单位(米、厘米、平方米、平方厘米等数量单位)连用,表示多高、多大:

Er ist etwa 25 Jahre alt, 180 cm groß. 他大约25岁,高180公分。

Die Halle ist 1 200 Quadratmeter groß. 这个大厅有1 200平米(大)。

groß作为定语修饰名词,出现的频次非常高,将近五百万次,其中较为常见的搭配有:Teil/Teile(部分)、Koalition(联盟)、Rolle(角色、作用)、Gefahr(危险)等。

3 统计搭配的显著性

搭配显著性的统计方法有:搭配序列频数与关键词频数之比、搭配词的相对频数、T值以及MI值。搭配序列频数与关键词频数之比指具体搭配出现的总频数除以关键词频数所得到的商。从这个数值直接能看出搭配的出现概率,此数值越大,概率越大。搭配词的相对频数指该搭配词出现的总频数与该词的期望频数之比。期望频数的计算方法如下:E=C×(2S+1)×N÷T,其中T是语料库中形符数的总和,C为搭配词与关键词共现的频数,S为跨距,N为关键词出现频数。T值指搭配词出现总频数与该搭配词和关键词共现频数之比。MI值是体现词汇之间的搭配强度和具体搭配的显著程度,具体公式为:在此公式中,n和c为任意词汇,f(n,c)是这两个词汇共现频数,f(n)和f(c)代表的是这两个词分别出现的频数,T为语料库库容。一般普遍认为MI值大于3就可以认为是显著搭配。以动词kümmern这个关键词为例,经过计算其与Kinder搭配的MI值为27;而Belang的搭配仅为4.2;由此可见两者都属于显著搭配[6]。

(1)

4 结论

研究语义趋向和语义韵对于研究语篇有着非同寻常的意义。利用语料库在分析大量具体文本实例的基础上,确定词与词之间的常见搭配及其使用规律,可以帮助提高翻译质量和翻译速率,可以帮助减少翻译错误的出现,可以帮助确定对应词、对应短语。

在翻译教学方面,基于语料库的语义趋向和语义韵研究为翻译教学提供了大量真实语境中常见搭配,为学生提供了源语语境的参考指导,为学生翻译学习提供了大量丰富的一手学习资料,尤其提供了一个词常见搭配的历时和共时演变,更是为翻译的学习打开了方便快捷之门。

猜你喜欢

频数语言学语料库
体认社会语言学刍议
《复制性研究在应用语言学中的实践》评介
《语料库翻译文体学》评介
《神经语言学和心理语言学视角下的二语习得》述评
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
频数和频率
基于JAVAEE的维吾尔中介语语料库开发与实现
语篇元功能的语料库支撑范式介入
盗汗病治疗药物性味归经频数分析