APP下载

预流于新 宜理尚实
——《字书字料库的理论、实践与应用》评介

2022-03-01

关键词:字书语料库汉字

秦 冕

(渤海大学 文学院,辽宁 锦州 121013)

字料库这一概念是汉字学与信息科学交叉融合后形成的崭新事物,最早由李国英、周晓文于2009年提出[1]。21世纪以来,学科交叉的研究方法在学界得到广泛应用,语料库及语料库语言学的建设为字料库研究提供了大量可资借鉴的成熟经验,加之信息化的发展对汉字的整理研究提出了更高的要求,字料库作为一种以真实文本为基础的大规模文字资源库,其建设已是箭在弦上,蓄势待发。在此背景下,柳建钰以李国英、周晓文关于字料库建构的设想为基础,将语料库建设的相关经验与自身深厚的文字学理论基础相结合,逐步形成了字料库建设的整体构想,并于2014年成功研发出渤海大学CCFD字书字料库。从最初的1.0版本到目前正在研发的4.0版本,字书字料库经历了从无到有、从有到精的逐步完善的过程。近10年来,柳建钰一直深耕于汉字字料库研究的相关领域,将多年心血汇聚成《字书字料库的理论、实践与应用》一书,堪称字料库研究领域中一项具有重大意义的最新研究成果。笔者将从特点、内容和语言三个方面来评述《字书字料库的理论、实践与应用》的重要价值。

一、预流于新 勇立学术潮头

《字书字料库的理论、实践与应用》扉页题有陈寅恪在《陈垣〈敦煌劫余录〉序》中的名言:“一时代之学术,必有其新材料与新问题。取用此材料,以研究问题,则为此时代学术之新潮流。治学之士,得预于此潮流者,谓之预流。”[2]1此语是《字书字料库的理论、实践与应用》最核心的特点——预流于新——的真实写照。《字书字料库的理论、实践与应用》作为第一部系统研究汉字字料库及字料库汉字学理论的著作,其创新之处主要表现在以下几个方面。

(一)学科属性新

纵观中国两千年学术发展史,可以发现,以文字、音韵、训诂为核心的小学研究成果汗牛充栋,研究材料更是浩如烟海。但随着研究的深入发展,文字、音韵、训诂三科之间的壁垒渐厚,继续运用以往的研究手段与研究方法已经很难产生新的突破,基于信息技术的汉字整理与汉字学理论研究势在必行。在这种背景下,柳建钰提出应当建立一门崭新的交叉学科——字料库汉字学。

字料库汉字学既有社会科学和自然科学的双重属性,又有理论科学和应用科学的双重属性。字料库汉字学的出现,标志着汉字学与信息科学之间的边界被打破,实现了知识的跨学科流动。

(二)研究方法新

语言学研究主要依靠三种方法:内省法、诱导法、基于语料库的方法[3]6-10。其中内省法、基于字料库的研究方法同样适用于汉字学研究。

依赖直觉的内省法虽是传统研究的主要方法,但其弊端是显而易见的。 Francis Gill与Sinclair John曾指出:“语言学家的直觉一经提出,常常给人一种似乎合理的感觉,然而正是这种语言直觉使得我们无法观察到一些重要的语言事实。”[4]文字学中亦是如此。此外,学者自身经验的局限性亦会对其研究成果的可靠性产生或多或少的损害。而字料库以大批量数据为支撑,既可以使以往内省式研究成果所遗漏的现象浮出水面,又可以削弱研究结论的主观色彩。

以往由于技术的限制,学者只能依靠卡片式的整理方式从浩如烟海的文献中择取和处理文字材料,难以做到全数采集,只能依靠内省。随着计算机技术的日臻成熟,字料的采集、贮存、整理、加工都变得十分容易,这是现代化社会赋予学者的天然优势。当然,我们亦不能否定内省方法,毕竟内省是发现问题的基础,没有内省我们可能连问题都没有了。因此字料库汉字学采用字料库与内省相结合的研究方法,不主张单纯依靠内省理论或单纯依靠事实数据进行汉字学研究。

(三)研究内容新

《字书字料库的理论、实践与应用》指出,字料库的研究内容主要包括4个方面,每个方面下又可细分出数个不同的研究方向,具体总结如图1所示。

可见,字料库汉字学的研究内容不仅可以涵盖传统汉字学研究的各个方面,而且具有独特与创新之处。既为以往的汉字学研究提供更为科学高效的研究手段,又进一步拓宽了汉字学的研究领域,丰富汉字学的研究内容,促进汉字学向纵深化发展。

二、宜理尚实(1)题中“宜理”“尚实”二词引自曹丕《典论·论文》:“盖奏议宜雅,书论宜理,铭诔尚实,诗赋欲丽。”内容细致全面

《字书字料库的理论、实践与应用》全书近30万字,除绪论外共13章,可分为三大部分:理论篇、实践篇和应用篇。全书内容细致全面,具有鲜明的“三结合”“两支撑”的特色。

(一)理论、实践、应用三位一体,有机结合

《字书字料库的理论、实践与应用》的三大部分并不是论文集式的简单罗列或叠加,而是三位一体,有机结合,从而形成了严密的三结合体系。

理论篇主要对字料库的一系列相关概念、理论成果进行阐释。在对当前字料库的主要理论成果进行综述之后,该书介绍字料库及其相关概念,讨论字料库与语料库的区别,阐明字料库理论的提出背景及主要价值,并提出一门崭新的交叉学科——字料库汉字学,对字料库汉字学的相关理论进行了全面阐述。

在实践篇中,首先,作者对当前国内外12个主要字料库及类字料库进行简要介绍;其次,作者总结字书字料库系统建设的主要原则与基本流程以及字书字料库软件的设计与实现方案;再次,作者对字书字料库的4个功能界面进行全面介绍,对不同字料的标注原则、内容、方式、层次进行详细的讨论,并对字料库的字际关系系联工作进行阐释;最后,作者论述字书字料库的日常维护管理问题。

在应用篇中,作者举例展示基于字书字料库而产生的一系列研究新成果,包括基于字书字料库进行的疑难字考辨、字书汉字基层流变状况的调查研究以及通用规范汉字构形属性调查研究,证明了字书字料库在解决汉字学实际问题方面的巨大潜力。

(二)宜理尚实,理论实践互相支撑

总体来说,《字书字料库的理论、实践与应用》的内容既注重理论又崇尚实践,形成了理论实践互相支撑的特色。

一方面,作者重视理论基础的建设,这一点可以从理论篇与实践篇中得以体现。例如,在理论篇的《字料库汉字学概说》一章中,作者为字料库汉字学这一崭新的学科建设了系统全面的理论体系,涵盖了字料库汉字学的学科定义、研究领域等7个方面,将一门具体学科需要满足的基本条件囊括在内;再如,在实践篇《字料字际关系界面属性库》一节中,作者根据汉字的形、音、义、用将字际关系分为异体关系、同源关系等7类,每一字际关系界面字段的设计都广泛参考了学界的优秀理论成果。

另一方面,作者在实践方面亦有突出的成就。总体上说,整本书的形成均来源于字料库的实体建构经验。具体来说,实践篇是依据理论篇的相关理论而进行的字料库建设的实践,并由此证明了字料库理论的可行性;应用篇又是依据实践篇的建设成果“字书字料库”而进行的一系列文字学研究,验证了实践篇成果的可用性以及科学性。

实践出真知,《字书字料库的理论、实践与应用》的相关理论既来源于字料库建设的实践经验,反过来又能指导运用字书字料库解决实际问题,真正地将“理”与“实”结合起来,推动汉字学的纵深化发展。

三、述而不艰 表达有如混成

作为一部探索和总结字料库基础理论的专著,《字书字料库的理论、实践与应用》不但在内容上具备科学性和技术性,而且在语言的锤炼上用力尤勤,使全书内容兼具可读性。

(一)去艰涩,求平易

王宁曾说:总结基础理论是一种不易被承认的工作……凡是总结得成功的规律都是十分平易的,不像解读一个生僻字那样显得功夫深[5]。实际上,若没有丰厚的知识储备与实践经验,是做不好基础理论的总结工作的。

语言文字的古今巨变,赋予汉字学艰涩难通的特性,再加上计算机科学是一门专业性极强的学科,这两门学科融合在一起所形成的理论必然难以为常人所理解,如果不在语言表达上去其艰涩、求其平易,那么字料库汉字学的相关理论恐怕只能待在象牙塔中,离普通民众越来越远。故而,《字书字料库的理论、实践与应用》在总结汉字字料库相关理论的同时,尽可能地将基础的理论与方法讲明白、说通透,让字料库汉字学放下身段,尽量贴近普通读者,这有利于字书字料库及字料库汉字学的理论体系被学界普遍接受。

(二)旁征博引,例证翔实

汉字字料库是一个崭新的研究领域,从产生至今不过十几年。要想使字料库及字料库汉字学的相关理论经得起时间检验,其每一步建设均要有理可依,要充分借鉴语料库及语料库语言学的成熟经验,避免走弯路、走错路,但又不能完全照搬语料库,需将语料库的建设经验与文字学的理论体系相融合,才能避免语料库的相关经验应用在字料库建设时产生“水土不服”的现象。因此,《字书字料库的理论、实践与应用》中每一个观点的提出,均有切实的例证为支撑,并严格遵守语料库语言学以及文字学的重要理论成果。

(三)图文结合,举重若轻

《字书字料库的理论、实践与应用》的服务对象,主要为对字料库基本理论及建设经验存在需求的文字学学者,因此对书中计算机科学的相关理论以及内容十分庞杂的论述部分均有较高的表达需求。要使内容简单易懂,除了在语言表达上下功夫外,该书还制作了大量图表,用来拆解那些或艰深或庞杂的文本内容,图文结合,举重若轻,使表达更具艺术性。此外,该书对图表的观赏性与设计感要求很高,在表达明晰的同时能给读者带来赏心悦目之感。

总体来看,在语言表达上,该书能够采取论述平易、例论相宜、图文结合等方式来克服文本内容的艰深庞杂,真正地做到了述而不艰,有如混成。

结 语

在那个汉字学研究被打压为“厚古薄今”、汉在字学理论尚未与现代科学的理论总结方法接轨、研究材料浩如烟海却只能依靠手工整理来获取的年代,尚有一批前辈先生心怀守护传统文化的高度责任感,奋不顾身地投入汉字学研究中。如今,汉字学理论体系逐渐科学化与系统化,研究方法、研究手段都获得了长足进步,这一切都为现代汉字学研究奠定了坚实的基础,搭建了前所未有的新平台。在这个平台上,亦不乏踏踏实实治学之人,他们以一己之力继续深耕于汉字学的沃土之中,推动汉字学不断向纵深化、细密化、科学化发展。柳建钰《字书字料库的理论、实践与应用》一书的出版,是现代汉字学者持续探索并推动汉字学产生新突破的重要成果之一,符合汉字学与计算机科学深度融合的学科发展大趋势,预示着汉字字料库研究的光明前景和强大生命力。谨以此文表达对柳建钰及《字书字料库的理论、实践与应用》的敬意,同时热切盼望学界能有更多优秀的学者投身到字料库汉字学的研究当中,推动字料库汉字学的深入良性发展。

猜你喜欢

字书语料库汉字
《语料库翻译文体学》评介
大型字书疑难字新考
无字书图书馆(节选)
汉字这样记
汉字这样记
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现
雁字书
祖昌教孙读“无字书”