《古英语词典》的编纂与启示
2012-08-07杨开泛
杨开泛
(华东师范大学英语系 上海 200241)
一、引 言
《古英语词典》(Dictionary of Old English)(Cameron 2007)在国内辞书界很少受到关注,只有《辞书研究》1979年第2辑署名为华的人编译了《编写中的〈古英语词典〉》一文,向国内读者介绍了《古英语词典》,从那以后,《古英语词典》在国内学术界几乎销声匿迹。但是《古英语词典》的编纂一直是英美国家辞书界的一件大事,它不仅与《牛津英语词典》(Oxford English Dictionary)、《中古英语词典》(Middle English Dictionary)一起并称为英语语言的三大词典,而且还是词典编纂与计算机技术结合的一个典范,为历时词典的编写提供了一个可借鉴的模式。本文从古英语词典编纂历史、语料库使用、出版形式、词条编写等方面评析《古英语词典》的优势和不足,以期引起国内辞书界对《古英语词典》的重视。
二、《古英语词典》的由来和现状
古英语词典的编纂可以追溯到16世纪,到今天已经有四百多年的历史。约在1567年,英国学者劳伦斯·诺威尔(Laurence Nowell)编写了《撒克逊词汇》(Vocabularium Saxonicum),该词典按字母顺序罗列古英语词汇,并提供相应的现代英文解释,可算是古英语词典编纂的缘起。虽然17、18世纪都有不同的古英语词典面世,但古英语词典编纂的高峰期出现在19世纪。古英语研究专家约瑟夫·博斯沃思(Joseph Bosworth),以及后来的特勒尔(T.N.Toller)等编写的《盎格鲁—撒克逊词典》(An Anglo-Saxon Dictionary)至今还是古英语学习和研究者的案头参考书。
而多伦多大学中世纪研究中心主持编纂的《古英语词典》则是20世纪的产物。1968年,刚从牛津大学毕业到多伦多大学任教的安格斯·卡梅伦(Angus Cameron)博士,也就是《古英语词典》主编之一,提出编写一部新的古英语词典的想法。他的想法在1969年得到了国际古英语研究学者的认同。1969年,在多伦多大学举行的第一次古英语词典编纂会议上,与会专家探讨了编写一部新的古英语词典的可行性。1970年举行的第二次古英语词典编纂会议上,与会专家制订了《古英语词典》的编纂计划和步骤,这次会议决定将《古英语词典》的编纂分为三个阶段:第一阶段编辑和整理所有的古英语文本;第二阶段整理和编辑古英语语词索引(concordance);第三阶段编写古英语词条。(Frank&Cameron 1997:11-12)至1983年,《古英语词典》编写组完成了第一阶段的工作,并进入了第二、三阶段的工作。至2007年,《古英语词典》从A到G的词条已经编写完成。
《古英语词典》的编纂定位是描述和定义公元600年到1150年间约600年的英语,与《中古英语词典》和《牛津英语词典》配套以达到描述和记录英语从公元600年至今1400多年英语发展与变化的目标。因而无论是从学术研究角度,还是从传承历史传统角度,《古英语词典》的编纂都是一项了不起的事业。该词典以《古英语词典》为名,旨在强调古英语、中古英语和现代英语之间的联系。
三、《古英语词典》的优势
《古英语词典》第一次全面而系统地描述了公元600年到1150年间英语发展的状况,这在很大程度上弥补了《牛津英语词典》和《中古英语词典》的不足。《牛津英语词典》定义和描述的是自1150年以来的英语词汇,而对于那些1150年以后不再使用的古英语词汇则不收录。因而《古英语词典》一方面可以展示从古代到现代英语词汇语义和语域的变化,另一方面则可以反映出哪些古英语词汇到1150年后退出了历史舞台。比如说古英语的hús(house)一词本是一个泛指词汇,不仅指普通人居住的房子,也指贵族居住的宏伟的宅邸,到了1150年后,hús的词义缩小,它的后一层意义由来自古法语的中古英语词汇mansion来表达;又如古英语中的形容词ēadiglic(blessed,happy),到了1150年后就很少使用,由来自古挪威语(Old Norse)的词根happ所构成的形容词取代。目前《牛津英语词典》第二版收录的词汇中可以追溯到古英语时期的有7500个,根据词典编写专家埃里克·斯坦利(Eric Stanley)的估计,如果《牛津英语词典》第二版收录所有的古英语词汇,那么《牛津英语词典》的规模将增加十分之一,大概是在二十卷的基础上增加两卷(Mugglestone 2000:132)。目前已经完成的《古英语词典》A到G部分收录12568个古英语词汇,因而可以推断,还有很大一部分古英语词汇《牛津英语词典》是没有收录的。《古英语词典》对这部分《牛津英语词典》未收录的古英语词汇的描述和定义对于理解英语语言的历史演变是有很大帮助的。
《古英语词典》的编纂自一开始就与计算机技术紧密结合,而这也是词典主编卡梅伦的初衷。这种与现代科学技术的紧密结合首先体现在词典的出版形式上。目前已完成编写的《古英语词典》分别以三种形式出版:微缩胶片形式、光盘形式和网络形式。这三种出版形式与传统的纸质出版形式相比有很大的优势。首先是便于携带和查询。比如说《牛津英语词典》的第二版20卷加上3卷补编共23卷,携带和查询十分不便,一般读者只能在图书馆中查阅和使用;而《古英语词典》的微缩胶片形式、光盘形式和网络形式体积都不大,易于携带和传播,查询起来也比较方便,其中的网络出版形式更是随处可用。另外,纸质出版形式检索方式也比较单一,只能通过首词来查询,而新的出版形式则提供了更多的词汇检索方式。比如说光盘和网络形式的《古英语词典》都为读者提供了首词、例证等方式的检索途径。第三是便于更新。纸质版的词典更新周期和出版周期都很长,但是光盘和网络出版的词典则易于更新。《古英语词典》网络版即一般一年更新一次,出版者把最新编写的词条添加到词典之中。不仅是《古英语词典》,《牛津英语词典》的第三版也通过网络版发行,不仅对第二版的词条进行更新,还及时把一些新词纳入词典。这种新的出版形式很大程度上方便了读者的查询和使用。
《古英语词典》与计算机技术结合的另外一个方面是语料库的使用。《古英语词典》编纂的第二步是编写古英语词汇索引,词典编写组前后花了大约十年的时间编写完成《微缩胶片古英语词汇索引》(A Microfiche Concordance to Old English)(Venezky&Healey 1980),该索引包括所有的古英语词汇以及每个词汇的所有出处。词汇索引的编写需要把所有古英语文本都输入计算机,制成语料库,然后利用语料库技术,生成每一个词的所有出处。但是由于古英语词形的特殊性,编写人员还需要逐条阅读每一个出处,以确定其准确性。该索引后来成为网络版《古英语词典语料库》(Dictionary of Old English Corpus)(Healey 1980)。与一般的语料库不同,《古英语词典语料库》中的每一条语料是以完整的句子为单位的,也就是说某一词汇的出处都是完整的句子,而《古英语词典》的引文也出自该语料库,选取某一词汇的代表性语料作为释义的佐证。如果没有计算机技术的发展,这样的编写过程是无法完成的,而《古英语词典》的编写也无法如此严谨和准确。
由于语料库的使用,《古英语词典》的词条信息具备了其他词典所不具备的一些特点。《古英语词典》的词条由首词(Headword)、语法信息(Grammatical Information)、拼写形式(Attested Spellings)、词频与用法(Occurrences and Usage)、语义总结(Schema)、定义(Definitions)、引文(Citations)、对应拉丁文词汇(Latin Equivalents in Manuscript)、参照信息(Old English References)、其他信息(Secondary References)等十个部分组成。以古英语名词goldsmi?为例,《古英语词典》对其语法信息、拼写形式、词频与用法信息描述如下:
从上述描述,读者可以知道gold-smi?在古英语中为第一组阴性名词(m.,cl.1);另外该词在《古英语词典语料库》共有6种拼写形式,其中golsmi?词形出现在古英语散文家埃尔弗里克(AElfric)的作品《对话》(Colloquy)中,而goldsmiðes这一词形则是主格复数形式(nom.pl.),且该词形只现于古英语碑文之中(Rec 20.1);最后该词在《古英语词典语料库》中共出现了15次。
《古英语词典》对首词的处理很有特色。与一般的英语词典一样,《古英语词典》区分不同词源的同形词。以gād为例,该词形有两个语源,分别为“goad,sharp point”(尖端、尖头)和“lack,want”(缺少,缺乏),因此gād这一词形有两个词条。但是《古英语词典》的特色在于对同一语源词汇的不同语法形式也做不同词条处理。如glæd有形容词和名词两种词性,因而在《古英语词典》中有两个词条。这样做的目的是为了更好地描述和解释古英语词汇。与现代英语不同,古英语保留了很多词形变化,且英语的名词和形容词有着完全不同的词形变化,如古英语名词、代词和形容词有性、数、格的屈折变化,而现代英语只保留了部分的数和格的变化,性的特征只体现在代词之中,名词和形容词已经没有性的变化。
《古英语词典》词条的最大特色在于词频信息。词频信息提供每一个词在整个古英语中出现的频率,这里的频率不是统计学上的抽样频率,而是绝对频率。通过词频信息,读者不仅可以知道某一首词在古英语中出现的频率,而且还可以词频信息了解某一首词的语域信息。以gōdlic(good,splendid,beautiful)为例,该词的词频信息为“5 occ.(in poetry and glosses)”,这就告诉读者该词在古英语语料库中出现了5次,且主要出现在古英语诗歌和拉丁文注释中。词频信息对读者进一步理解古英语词汇有很大的帮助,而这也是一般词典所不具备的。
《古英语词典》在词条编写方面已经超越了传统的文本概念,成为超文本(hypertext)。传统的纸质版词典也提供了超文本的元素,如词条里的参见信息。但是这样的参见信息仅限于同一词典之内,且需要读者翻阅方可获得。而《古英语词典》的词条编写则充分利用超文本技术,不仅实现词典内部的链接,还实现不同词典间的链接。《古英语词典》的超文本链接体现在三个层面:第一层面是出处链接,《古英语词典》对所有的例证都提供出处链接,读者只需点击链接,便可获取例证的出处信息。以古英语词汇gold-smi?的出现链接为例,该词条共有15个例证,限于篇幅,本文选取前面的3个:
Met 10.33:hwær sint nu?æs wisan Welandes ban,?æs goldsmiðes,?e wæs geo mærost?(Bo 19.46.16?æs foremeran&?æs wisan goldsmiðes ban Welondes;cf.BOETH.Cons.Phil.metr.2.7.15ubi nunc fidelis ossa Fabricii manent?).
(Where are now the wise Welande's bones,the goldsmith,who was formerly the most famous?)
ÆCHom I,4 209.92:ealle?as goldsmiðas secgað ?æt hi næfre ær swa clæne gold ne swa read ne gesawon(cf.Vit.Iohan.2.57.2omnium aurificum〈officinas〉circuiuimus,et omnes dixerunt tam purum...se nunquam uidisse aurum).
(All these goldsmiths say that they never before saw such pure and red gold.)
Gen 4.22:be Sellan he gestrynde Tubalcain,se wæsægðer ge goldsmið ge irensmið (Lslecgwirhta&smiðon eallum weorcum〈æres&ysenes〉[MSærest of ysene];cf.Gn:malleator et faber in cuncta opera aeris et ferri).
(Around Sella,he got Tubalcain,who was both the goldsmith and ironsmith.)
出处信息由每一例证的句首部分代码体现出来,如Met 10.33表示下面的引文出自《波伊提乌诗文》(The Meters of Boethius)第10首33行;ÆCHom I,4 209.92表示引文出自《埃尔弗里克天主教布道文·系列1》(Ælfric's Catholic Homilies:The First Series)第4篇,第209页,第92行;Gen 4.22表示引文出自古英语《创世记》(Genesis)第4章第22节。另外,在网络版的《古英语词典》中,这些代码还链接到详细的出处信息。第二层面是词汇链接,即某一词汇会提供相关词汇链接。以gold-smi?为例,《古英语词典》提供的信息为:“See also:gold,smi?”,这就表明gold-smi?与gold和smi?词义相关。第三层面是不同词典间链接,即《古英语词典》与《中古英语词典》、《牛津英语词典》、《古苏格兰语词典》(Dictionary of the Older Scottish Tongue)、《英语方言词典》(English Dialect Dictionary)等相关词典间的关涉信息。以gōdlic为例,该词条的不同词典间链接信息如下:
MED gō·dlīadj.(2).OED2 goodlya.DOST gudelya.EDD goodly sense 1.
通过不同词典间的链接,读者可以知道该词与《中古英语词典》中gō·dlī,《牛津英语词典》中的形容词goodly,《古苏格兰语词典》中gudely词义相关。另外,读者通过点击OED2 goodly就可以直接链接到网络版《牛津英语词典》goodly条。《古英语词典》的超文本词条给读者提供的是每一个词发展和演变的历史。
四、《古英语词典》的不足
当然,《古英语词典》并非十全十美。首先,它的定位是学术型历史词典,读者对象是专门的古英语研究者,因而对于没有经过专门古英语训练的读者来说,查阅和使用《古英语词条》还是有一定的难度的。《古英语词典》对词条中引用的例句不提供翻译,这也增加了使用难度。
其次,虽然《古英语词典》提供了多种途径的检索方式,但是在检索使用方面,还存在一些问题。长音和短音在古英语的音系系统中是一个区别特征,因而godlic和gōdlic在古英语中是两个词,但是问题在于古英语手稿中对这两个词的词形是不做区别的,之所以用godlic和gōdlic这两种不同的书写形式来体现这两个词在读音上的差异,那都是古英语学者对古英语词汇的修正。此外,不同的古英语学者对于在印刷体中使用哪一种符号体现不同的读音也有不同的意见。而这些都给读者的查询都造成了不便。还有就是《古英语词典》没有提供模糊检索的功能,这样就会造成某些词由于细微的拼写差异而无法在词典中查询到。
最后,《古英语词典》最大的亮点在于语料库的使用,但是它最大的不足也在于语料库。《古英语词典》语料的来源是保存到现在的古英语手稿,在由手稿转变为机读语料的过程中,会出现很多人为的失误。目前《古英语词典》编写人员已经对《古英语词典语料库》进行勘误,不过这个过程需要比较长的时间。语料上的失误在一定程度上对《古英语词典》词条信息的准确性造成了影响。
五、结 语
《古英语词典》的编纂对国内辞书界的启示是不言而喻的。首先,该词典从规划到编写词条的过程非常严谨,且充分利用了现代计算机技术以及语料库分析技术,这对于国内的辞书编纂有很大的借鉴意义。其次,《古英语词典》的出版形式也给国内的辞书出版提供了一些参考。《古英语词典》的三种出版形式无论从使用方面还是研究方面,都提供了很大的便利。但是以网络形式出版的词典在国内并不多见。辞书编写应该跟随时代的变化,或许以网络形式出版的词典更有利于辞书的使用和传播,这也是辞书出版的一个新方向。再者,《古英语词典》是超文本词条编写的范例。超文本词条为每一个词建立起横向与纵向的联系,这对于读者理解词的历史演变是有很大帮助的。最后,《古英语词典》也是历史词典编写的一个范例。
1.华.编写中的《古英语词典》.辞书研究,1979(2):192.
2.Cameron,A,Amos A C,Healey A D P.eds.Dictionary of Old English DOE Online.Toronto:University of Toronto Press,2007.
3.Frank R,Cameron A.A Plan for the Dictionary of Old English.Toronto:University of Toronto Press,1973.
4.Healey A D P.ed.Dictionary of Old English,Old English Corpus;Complete Corpus of Old English in Machine Readable Form.Toronto:University of Toronto Press,1998.
5.Mugglestone L.ed.Lexicography and the OED:Pioneers in the Untrodden Forest;Lexicography and the Oxford English Dictionary.Oxford;New York:Oxford University Press,2000:132.
6.Venezky R L,Healey A D P.eds.A Microfiche Concordance to Old English.Newark:University of Delaware,1980.