基于用法的“词”与“语”的异同辨析*
2018-07-04张永怀
傅 瑛 张永怀
(安徽黄山学院 外国语学院, 安徽 黄山 245041)
一、引言
先看如下三个例子:
例1:从词源学角度看,语素与词素这两个名称来源于英语的morpheme。在早期的语言研究中,人们均译为“词素”,将它看作是词要素。六十年代初,朱德熙在《说“的”》一文中采用了“语素”这一名称,其理由是如果将morpheme译作词素,“会让人感到先有词,从词里头再分析出词素来”的疑惑。
例2:根据《办法(草案)》,汉语文出版物、国家机关公文、学校教育教学不得使用不符合现代汉语词汇和语法规范的网络语汇。
例3:我们可以说传统的词源学在其变革伊始就遇到了以平面系为其本质特征的旧理论范畴和方法同以历时系统推沿流为其本质特征的语源学科学理想的深刻冲突。
细读以上三例,词素与语素、词汇与语汇、词源与语源的区别说不清道不明,语义可划等号。词和语除了和其他词素构成相同含义的词,也可一起构成并列结构的名词——词语。这两种情况中,词与语同义,词即语,语即词。尽管如此,但我们仍有疑问,intensifier翻译成强化词还是强化语?marker翻译成标记词还是标记语?determinative翻译成限定词还是限定语?modifier翻译成修饰词还是修饰语?euphemism是委婉词还是委婉语?类似词和语同义的问题特别多,这些问题告诉人们词和语看似同义,但仍有差异。
同义词研究一直是语义学的研究焦点,早期的研究聚焦于同义词的定义,特别是与近义词、等义词的区分。池昌海[1]59-64,[2]77-84将同义词的定义归结为“意义同、近”说、“概念同一”说、“对象同一”说和“义位同一”说等四说。需要指出的是,无论是哪一学说, 都赞同同义词有同有异。有关同义词有同有异有很多很有影响力的界说,按照时间顺序列举如下几个有代表性的观点。王力认为:“所谓同义,是说这个词的某一意义和那个词的某一意义相同,不是说这个词的所有意义和那个词的所有意义都相同。”[3]24洪成玉认为:“同义词实际上是词义有同有异的近义词。它不等于等义词。确定同义词的依据是部分意义相同或在一定语言环境中意义相同。”[4]457-463曹先摧认为:“同义词是指那些表示同一概念而相互间在语义上或感情色彩上有细微差别的词。”[5]44-45蒋绍愚认为:“所谓同义,是指一个或几个义位相同而不可能是各个义位都相通。”[6]94赵克勤认为:“两个或两个以上的词,它们所包含的一个意义相同,而在其他意义、风格特征、感情色彩或用法上存在着细微的差别,就叫同义词。”[7]121以上说法都能看出同义四说的踪影,且同义四说并不是孤立的,不少有交叉。不管学界如何对同义词界定,但有一点是非常明确的,即同义词有同有异。先前的同义研究多从内省法入手,根据直觉和经验进行同义定性分析,没能用数据展示同义词的同和异。
基于用法的模式[8]46[9]220认为语言能力(competence)和语言运用(performance)之间没有根本区别,所有的语言单位由用法产生。用法是可观察、可收集、可测量的,且可科学分析的[10]5-6。我们的研究基于用法,内省法和实证法相结合探讨词和语的同异。先从权威的词典释义入手,接着检索CCL语料库和BCC语料库词和语在不同语域中的词频分布,特别是不同语域的不同搭配特征,绘制出各自的用法使用图。实际使用中的语言是否与词典释义吻合?哪些词典释义使用得多?哪些使用得少?词和语在不同语域的使用情况如何?每个语域有哪些使用偏好?这些都是我们要回答的问题。本文所有的实例均摘自BCC语料库。因CCL的语域分类更细致,需要细分语域时,使用了CCL语料库的数据,文中会做标注。语料库检索的截止日期为2017年10月30日。
二、词与语的词典释义
无论是纸质的《汉代汉语词典》,还是电子词典,对词与语的释义大同小异。
(一)词
《说文解字》对词的阐释为“意内而言外也”,本义言词。《现代汉语词典》对词的释义为语言里最小的可以独立运用的单位,如词汇、词组、词句、词序、词典、词书。词与言有关,言辞,话语,说话或诗歌、文章、戏曲中的语句,如戏词、歌词、演讲词、誓词等。词还是个语法单位,表词性,诸如名词、动词、形容词等。词既可指具体的一个词,也可指统称,我们经常可以看到夸大其词、慷慨陈词、大放厥词、念念有词、词不达意、理屈词穷、陈词滥调、含糊其词、各执一词、不赞一词、强词夺理、义正词严等。
(二)语
《说文解字》对语的释义为“语,论也”,《广雅》对语的释义为“语,言也”。也就是说,语就是言、论,即说话。这是动词释义。语的名词释义来自动词,言即语,语即言。语,表示说的话,例如片言只语、尖言尖语、千言万语、好言好语、不言不语、轻言细语、风言醋语、谗言佞语。基于基本释义,语还可表词语,如语不惊人死不休、语惊四座、语妙天下等。这一层释义是基本释义的变体。第三种释义涵盖前两者,表示语言,如汉语、外语等。第四种释义用以示意的动作或信号,如目语、手语、灯语、旗语等。第五种释义是语法学科用来表示句子成分的术语,如主语、谓语、宾语、表语、状语。
(三)词与语的同与异
根据以上词典释义,首先,尽管词典非常明确地说词是最小的独立使用的语言单位,但词和语表示言语的时候是同义的,这也是为什么很多词语可以混用,诸如词素与语素、词汇与语汇、词源与语源、用词与用语、言词与言语等。其次,尽管词与语表示言语内涵同义,但外延不同,词多指具体的一个词,语多指统称,即语比词大,语包含词。最后,词和语还有各自独立的语义。由上可见,词与语的语义关系有重叠、有包含、还有独立。总体而言,语比词大。
三、基于用法的词与语辨析
根据词典释义可知词与语的语义关系有重叠、有包含、还有独立。但重叠多少?包含多大?实际使用的语言是否和词典释义展示的情况一致?有没有变化?我们首先检索了BCC语料库,看看词与语的历时语言学的词频分布是否与内省法的语义阐释吻合;接着,检索了CCL语料库,查看了词与语在不同语域中的频次分布,并选取了两个最具代表性的语域查看了词与语的搭配频次分布。然后,不分语域检索了BCC语料库词与语的搭配频次分布,看看词与语的搭配总体分布是否与不同语域中的分布吻合。
(一)词与语的历时频次分布
BCC语料库最大的特色,与CCL语料库最大的区别在于BCC语料库能提供历时语言学检索,可提供1946年至2015年的语言使用频次。我们分别检索了词与语的历时使用频次,对比折线图如下:
图1词与语的历时语言学频次分布对比
图1的折线非常清晰地展示了语的使用频次在任何年代都远远大于词的使用频次,这与词典释义语大于词吻合。整体上来说,70年间语的使用波动性大,词相对平缓;语的波动性大于词的波动性。
(二)词与语在不同语域中的使用情况
按照语域分类,我们检索了CCL语料库,并按照CCL语料库的检索规则,分别输入type:语域词、type:语域语,排名前十的语域的数据对比如图2所示。
词与语在不同语域的频次分布与词典释义基本吻合,即语比词大。但也不是每个语域都是语比词大,最显著的语域就是词典,词的频次远远大于语的频次。除此之外,也有语域的词与语的频次大致持平。但总体上仍旧是语的使用远超词的使用。
图2词与语在不同语域的频次分布
以上是词与语使用频次最高的语域,但CCL语料库中,出人意料的是社论、广告、来函摘登、读书笔记、微型小说、儿童文学语域中词与语的使用频次均为0。一些严肃语域,如法律、科技词与语的使用频次很少。这与我们的直觉和经验有很大的出入。
我们选取了两个最具代表性的语域——词典和法律,因为词典是唯一一个词的用法远超语的用法的语域,法律用语要求客观、公正、准确。CCL语料库检索type:词典词、type:词典语和type:法律词、type:法律语,然后按照词与语的搭配绘制用法饼状图。词典中词的使用频次总数R=1 359,语的总数R=1 004,结果如图3。
图3非常清楚地表明词典中词的用法主要体现在语法的具体词性,与我们的直觉和经验有出入,即虚词的频次远超实词,诸如量词、象声词的使用远远大于动词、名词的使用。词典中语的搭配频次基本遵循了语的释义,搭配频次的分布从大到小显示了语的语义。
法律中词的使用频次总数R=18,语的总数R=38,具体分布如图4:
图3词典中词与语的搭配频次分布
图4法律中词与语的搭配频次分布
法律中词的搭配完全不同于词典中词的搭配。词典中词的搭配关注的是语法的词性,而法律中词的搭配与词的本义接近,表示言词居多。法律中语的搭配与词典中语的搭配频次大致相同,也是基本上从大到小地显示了语的词典释义。
由以上的数据,可以看出在现实的使用中,首先,词没有语用得多。其次,词在不同的语域中的搭配不尽相同,有的注重词性、有的注重词的本义;而语在不同语域中的使用情况大致相同,搭配频次与词典释义吻合,基本遵从从大到小的语义分布。
(三)词与语的搭配频次总体分布
尽管BCC语料库语域分类不及CCL,但BCC语料库的语料相对比较新,数目大。我们不分语域检索了BCC语料库词与语的使用情况,词的总数R=4 526,语的总数R=11 857。我们将其搭配频次按照从大到小的顺序绘制了柱状图。词的使用总数相对小,图5只绘制了R≥50的词的搭配频次。
图5词的搭配频次总体分布
图5告诉我们词单独使用频次远远大于任何其他搭配使用频次。词在现实运用中独立成词的几率非常高,这也是词的基本释义的体现,即词是语言最小独立使用单位。紧接着的搭配情况与词典中的搭配情况有很大的差别,词典关注的是具体词性,而总体上来说,言词、话语的语义频次大于具体词性。即实际使用的语言中,词的释义和词典释义吻合。
由于词的搭配频次大于或等于50的词语有16个,所以语的搭配频次在绘图的时候也选取了16个使用最多的词语,尽管语的搭配大于或等于50的词汇远远不止16个。BCC语料库显示的数据为35类,除了图6中所列的搭配,使用频次大于或等于50以上的搭配还有自言自语、标语、语句、语境、成语、主语、语言学家、自语、语调、谓语、语词、俄语、宾语、法语、国语、用语、不语、短语及共同语。
图6语的搭配频次总体分布
语的搭配频次总体分布图跟词的搭配频次特别像,有一个搭配,即“语言”,一枝独秀,远超其他搭配。“语言”的频次无论是分语域还是不分语域永远都是最多的。语的总体搭配频次大于或等于50的搭配太多,这些搭配和之前分语域的搭配有很大的出入,且语义也没有遵循词典从大到小的释义。这只能说明“语”的实际使用多,且非常灵活,语义涵盖面广。
语料库词与语的使用频次总体上展示的是词与语的异,无论是历时语言使用,还是不同语域,亦或不分语域的语言使用,语的使用频次远远大于词的使用频次。词的使用在不同语域情况各不相同,有的注重词作为最小独立使用的语言单位的释义,有的注重词作为言词的释义,有的注重的是词性。而语的使用不同语域的情况大致相同,遵循语的词典释义,使用频次也基本按照从大到小的词典释义顺序。从搭配来看,无论什么语域,“词”“名词”“词语”这三个词的使用频次比其他词高;而语的搭配,无论分不分语域,“语言”总是“语”使用最多的搭配,“言语”“词语”的搭配也明显高于其他搭配。由此可以说,基于语料库的词与语的使用情况和词典内省法释义基本吻合,但也各具特色。
四、词与语的同辨析
学界对同义词的争论由来已久,且各有千秋,但共识是绝对同义的同义词并不多[11]105。同义词有同有异。同义词的差异性是语言词汇的丰富性和精确性的体现,差别性是同义词中最主要、最有价值的东西[12]62-75。语言是一个经济高效的规则系统,是不允许冗余信息的存在的,同义词的差异性是它们作为语言词汇系统中的独立一员而存在的客观基础。同义词在表达风格、地域差异、情感等方面存在很多差异,特别是语境对同义关系的建立起至关重要的作用。在一定语境下所建立的同义关系,在另一语境下未必同义[13]21-25。
词典释义词与语的语义关系有重叠、有包含、还有独立。语料库词与语的使用频次与词典释义吻合,也有重叠、有包含、有独立。语料库揭示的多为包含和独立关系,那么重叠现象体现在哪些词汇?这些重叠词汇是否仍然存在语义差异?我们先检索了BCC语料库使用频次高且经常混用的词和语的搭配,包括词汇/语汇、用词/用语、词素/语素、词源/语源、词序/语序、模糊词/模糊语。总体使用频次按照从多到少如表1所示。我们又检索了一些英文词汇的翻译,当然即使没有英文,这些词汇在汉语中也被广泛使用,并将使用频次列在了表2中。
表1 词与语同义搭配频次列表
表2 英文词语翻译的词与语同义搭配频次列表
基于用法的数据分析揭示了语的使用远远大于词的使用。但词与语同义的搭配跟总体展现的情况不同,表1并未显示词与语谁的使用更占优势。但词汇、词源、模糊词比语汇、语源和模糊语使用得多;用语、语素、语序比用词、词素及词序使用得多。
英文中,intensifier、marker、determinative、modifier、euphemism这样的词汇无论在什么语境下,形式都是一样的。但汉语就不一样了,不同的语境使用哪个词汇还是有差异的。表2中,修饰词和限定词的使用频次大于修饰语和限定语,而强化语、标记语和委婉语的使用频次大于强化词、标记词和委婉词。
为什么词汇、词源、模糊词比语汇、语源和模糊语使用得多,修饰词和限定词的使用频次大于修饰语和限定语?首先,词汇、词源、模糊词重的是词作为最小的独立使用的语言单位的语义,这也是词最广泛使用的语义。当我们关注的是单一的词汇运用时,人们习惯用词多于语。其次,限定词、修饰词都是从语法功能上给予词的分类,注重的是语法。当我们关注语法功能时,人们也习惯用词,多于语的使用。
为什么用语、语素、语序比用词、词素及词序使用得多,强化语、标记语和委婉语的使用频次大于强化词、标记词和委婉词?首先,用语、语素、语序关注的是语作为语言语义层面,这与上一部分中语的总体频次分布一致。无论分不分语域,语作为语言的语义总是使用最多的。其次,强化语、标记语和委婉语强调的是语用功能,即在具体的语境中,这些词汇能起到强化、标记及委婉的语用功能。当我们关注语用功能时,多用语。
我们再次检索词,会发现很多词汇只有词用法,没有语用法,这些词表达的都是词作为最小使用的语言单位的释义,强调的是语法或者语义,诸如字母词、关键词、叠字词、单义词、多义词、音译词、方言词、同音词、同义词、反义词、复合词等。现实使用的词汇还不止这些,这都与图7中词的语义相同。而语的用法也一样,诸如语境、语句、语态、语气、语调、语序、语用、语感、语言、语音、语种、语系等,都是语作为“语言”这一语义的表现,更注重语用功能。
五、结语
基于用法的词与语的使用频次和词典内省法释义基本吻合,语义关系有重叠、有包含,还有独立。总体而言,语比词大。实际使用也有其独有特色。基于用法的词与语的使用频次总体上展示的是词与语的异。词的使用不同语域情况各不相同,有的注重词作为最小独立使用的语言单位的释义,有的注重词作为言词的释义,有的注重的是词性。而语的使用不同语域的情况大致相同,遵循语的词典释义,使用频次也基本按照从大到小的词典释义顺序。从搭配来看,无论什么语域,“词”“名词”“词语”这三个词的使用频次比其他词高;而语的搭配,无论分不分语域,“语言”总是“语”使用最多的搭配,“言语”“词语”的搭配也明显高于其他搭配。当词与语同义并混用时,词与语没有明显优势,只能说词表达的是词作为最小使用的语言单位的释义,强调的是语法或者语义;而语则是作为“语言”这一语义的表现,更注重语用功能。
同义词的辨析一直都是以内省法为主。我们的研究以词与语在实际生活中的用法为切入点,并结合了内省法,更加科学、客观、系统地阐释了词与语的异同。研究告诉我们在经验和直觉的基础上,同义词的使用频次有助于我们在不同语域、不同语境之中游刃有余地正确使用词汇。当然研究中仍有不足,例如语料库语域分类使得语域出现了重叠,有的分类又太宽泛。且语料库不稳定,如果总是开放,我们的研究会做得更好。再有就是统计分析方法的欠缺,使得数据分析不能深入。统计方法是每个语言研究者应该掌握的技能。基于频次的多因子分析方法[10]1-42,[14]89-119,[15]89是新的语义分析方法。本文只是抛砖引玉,以期更多的研究者关注并使用语料库及统计方法来研究语言现象。
参考文献:
[1]池昌海.五十年汉语同义词研究焦点概述与认识[J].杭州大学学报(哲学社会科学版),1998(2):59-64.
[2]池昌海.对汉语同义词研究重要分歧的再认识[J].浙江大学学报(人文社会科学版),1999(1):77-84.
[3]王力.同源字典[Z].北京:商务印书馆,1982.
[4]洪成玉.古汉语同义词及其辨析方法[J].中国语文,1983(6):457-463.
[5]曹先摧.谈古汉语同义词辨析[J].文科月刊,1988(1):44-45.
[6]蒋绍愚.古汉语词汇学纲要[M].北京.北京大学出版社,1989.
[7]赵克勤.古代汉语词汇学[M].北京:商务印书馆,1994.
[8]Langacker,R.W.Foundations of Cognitive Grammar.V.1.Theoretical Prerequisites[M].Stanford:Stanford University Press,1987.
[9]Langacker,R.W.Cognitive Grammar:A Basic Introduction[M].Oxford:Oxford University Press,2008.
[10]Glynn,D.Corpus-Driven Cognitive Semantics Introduction to the Field[C]//Dylan Glynn & Kerstin Fischer(eds.) Quantitative Methods in Cognitive Semantics:Corpus-Driven Approach.Berlin:Mouton de Gruyter,2010a:1-42.
[11]Crystal,D.The Cambridge of Encyclopedia of Language[Z].Cambridge:CUP,1987.
[12]张志毅.确定同义词的几个基本观点[J].吉林师大学报,1965(1):62-79.
[13]庞杨,杨玉晨.语料库对同义词触发模式的解释:以begin,start,commence为例[J].外语与外语教学,2012(6):21-25.
[14]Glynn,D.Synonymy,Lexical Fields,and Grammatical Constructions,a Study in Usage-Based Cognitive Semantics[C]//Hans-Jorg Schmid and Susanne Handl(eds.) Cognitive Foundations of Linguistic Usage-Patterns.Berlin/New York:Mouton de Gruyter,2010(b):89-118.
[15]傅瑛.以cone为例看多义词语义网络[J].成都大学学报(社会科学版),2017(3):84-91.