从词素来源看现代汉语词素同一性问题
2017-05-22刘伟
刘伟
摘要:文章针对《现代汉语词典》第7版同音同形的字头分合情况,提出汉语词素的来源(原生词素、移用词素和移植词素)会影响词素同一性的判定。在此基础上,立足“音义相同”原则,总结了判定词素同一性的具体标准。
关键词:词素同一性词素来源划分标准
一、 绪论
众所周知,词素是最小的音义结合的语言单位。如果仅从语言层面分析汉语词素的同一性问题,涉及的因素或许少一些,但汉字这一要素一旦牵扯进来,问题就显得比较复杂。较早进行深入研究的是吕叔湘,他在《汉语语法分析问题》(1979: 16—17)提出“语音、语义、字形这三样的异同互相搭配,共有八种”,“(这八种)都是在一定程度上简化了的,实际情况比这复杂,疑难问题是不少的”。此外,张志公(1981)、葛本仪(1985)、高更生(1990;1996)也都探讨过词素同一性问题中比较特殊的情况。尹斌庸(1984)则运用统计的方法,提出汉语中90%左右的汉字是一个字对应一个语素。
总结前人研究成果,可以看出,由于汉字在记录汉语中所起的独特作用,词素与音节、汉字等要素有时并不呈现一一对应关系。在汉语的发展过程中,有些词汇意义实在的词素发生了语法化,同时词素的来源也更趋多样化。语法化导致了词素意义虚化,是否应该将分化的原词素视为同音同形词素?音译外来词的音节成分是否可以实现词素化?[1]进入普通话的方言词,它们的构词成分与共同语中同音同形的构词成分是否算是同一个语素?这些方面理论研究相对不足,给汉语辞书的字头设立造成了一定影响。本文针对这些问题,结合《现代汉语词典》(以下简称《现汉》)[2]单字条目中音形相同的字头(或合为一个或分为几个字头的情况)进行讨论,谈谈我们的看法。
二、 词素的来源与词素的同一性
通过共时与历时的考察,孙银新(2003: 66)认为现代汉语词素的来源主要有三类——原生词素、移用词素、移植词素。原生词素是根植于汉语词汇系统内部,在历史的发展过程中依靠不断构词从而延续到现代汉语中的词素。移用词素是指从方言吸收进入共同语的词素。移植词素借用生物学术语,指的是从其他民族语言吸收进来的词素。三类词素都可以在现代汉语中作为构词词素进行构词,实现其在词素集(词素系统)中的价值。这三类词素集作为一个开放的系统,一方面不断地吸纳新成员,同时也会有一些词素随着构词能力的降低而退出原来的词素集。另一方面,移用词素集、移植词素集中的词素,若构词能力比较强且比较稳定,也可以进入原生词素集,因此三个集合处于互动状态。
由于三类词素集之间有互动,所以每个词素意义系统内部都可能会有它类词素意义进入或退出等情况;或者由于多义词素内部引申断裂而促成新的语音形式(如变调)或者新字形,从而使原来的词素分化为不同的词素。这些都涉及词素同一性问题。现从三个方面分析《现汉》中同音同形字頭的处理情况。
(一) 原生词素的处理
第一类,从历时角度着眼,语法化而导致实词意义虚化的词素,仍设为一个字头,即作为同一个词素处理。例如(为节约篇幅,引例中的例证予以省略,下同):
被1被子。
被2① 遮盖。② 遭遇。
被3① 用在句子中表示主语是受事(施事放在被字后,但往往省略)。② 用在动词前构成被动词组。(《现汉》第4版)
《现汉》第4版将“被”三分,而第六版则将三个“被”进行了合并,说明对词素“被”的同一性认识不断深化。“被1”到“被3”发生了语法化(意义逐渐由实变虚),当属同一个词素。
在① 动 存在;生存。② 动 表示人或事物的位置。③ 动 留在。④ 动 参加(某团体);属于(某团体)。⑤ 动 在于;决定于。⑥ “在”和“所”连用,表示强调,后面多跟“不”。⑦ 介 表示时间、处所、范围、条件等。⑧ 副 正在。
“在”的语法化是由表示空间义到时间义的虚化过程,符合语言类型学词义演变的普遍规律。①~⑤是实词义,⑥无实义,主要用于固定短语中表强调,而⑦~⑧则是虚词义,词类范畴并不相同但相近(动词与介词、副词处于词类的连续统中),且意义之间的联系还是比较紧密的,当属同一词素。
第二类,从共时层面着眼,音形皆同,但意义之间看不出联系的词素,作为不同的词素处理,分设字头。
北1① 名 方位词。四个主要方向之一,清晨面对太阳时左手的一边(跟“南”相对)。② 北部地区,在我国通常指黄河流域及其以北的地区。
北2〈书〉打败仗。
载1① 动 装载。② 运输工具所装的东西。③ 充满(道路)。
载2〈书〉又;且。
以上两组词素,立足共时层面来观察,已经看不出相互之间的意义联系,故《现汉》将其分列。立足历时层面的《汉语大词典》,则基于词义(词素义)历时的延续性,将“北1”和“北2”归为一个词素。“载2”是由文字上的假借造成与“载1”音形相同,其实“载2”通“再”,《汉语大词典》将之附列在“载1”条末尾。
第三类,将表“姓氏”义的义项统归于某个字头之下。
臣① 君主时代的官吏,有时也包括百姓。② 官吏对皇帝上书或说话时的自称。③ 名 姓。
这样处理主要是为了节省辞书的空间,但“姓氏”义与前几个意义没有联系,不符合词素同一性的要求。
第四类,由汉字简化造成的同音同形字,分设字头。
汉字简化在减少汉字数量的同时,也造就了一批同音同形字。
后1(後)① 名 方位词。背面的部分;人或物背面所朝的方向(跟“前”相对,下⑥同)。……⑥ 名 方位词。指某事物产生之后。
后2① 君主的妻子。……③ 名 姓。
秋1(①⑤ 秌、①⑤ )① 名 秋季。……⑥ 名 姓。
秋2(鞦)见【秋千】。
第一例,与“后1”相对的繁体字是“後”,“后2”属于非简化字。将“後”简化为“后1”,造成了同音同形不同义的两个词素。
第二例,“秋千”简化之前写作“鞦韆”,汉字简化之后,“秋1”和“秋2”两字成了同音同形字,故设为两个字头。
除了因汉字简化的情况外,在判断原生词素的同一性时,遇到的最大麻烦就是如何看待意义之间的联系问题。如果仅仅立足于现代人的语感,会面临引申义列断裂的问题,在共时性的语文辞书编纂中也将会多立一些字头;而从历时的角度对原生词素意义间的联系进行判定,尽可能地遵照词素义的演变规律,通过引申义列的系联,找出不同引申义列之间的联结点,则会大大减少原生词素字头的数量。
(二) 移用词素的处理
“由于汉民族共同語与其方言之间有着相互依存、相互影响的关系,这就使二者在语音形式、语义内容、语法性质等方面具有比较多的同一性。”(孙银新2003: 96)这种情况往往伴有词素义的移用——单义移用和多义移用。(孙银新2003: 101—103)在处理同音同形的移用词素和原生词素时,有时会将它们作为同一个词素处理,但有时则将其处理为两个词素。
1. 作为同一个词素处理
同一种语言的共同语部分和方言部分,区别主要在于使用的区域大小和使用者人数的多少。属于同一个民族的各个群体,在认知心理、语言的历史传承等方面必然会有种种联系。这样,方言中的许多词素义移用到共同语中后,有可能显现出与原生词素的语义联系,给作为同一个词素处理提供了基础。
方言词素意义的移用是一个逐渐进行的过程。主要有两种情况:
第一,单义移用后明显表现出与同音同形原生词素的意义联系,故将它们归为同一个词素。例如:
渍① 动 浸;沤;沾。……④ 积在物体上面难以除去的油泥等。
抠① 动 用手指或细小的东西从里面往外挖。……④ 形 吝啬。
坝① 名 拦水的构筑物。……③ 〈方〉名 沙滩;沙洲。④ 坝子(多用于地名)。
“渍”的第④个义项,“抠”的第④个义项,“坝”的第③个义项都是由方言进入共同语,因其与同音同形的原生词素显示出意义上的联系,故词典编纂者最终将其视为同一个词素。通过比较发现:“渍”的义项④在《现汉》第4版中还标注“方”,但第5版将“〈方〉”删去。“抠”的义项④在不同版本的比较中也发生了这种变化。这充分说明,只要方言词素义移用进共同语的时间足够长且构词频率较高,其方言词素义的身份就会逐渐淡化,最终成为原生词素的义项。而“坝”的方言义项③ 移用到共同语之后,虽然显现出同原生词素“坝”的意义联系而共聚于一个字头下,但它的方言陪义仍然比较浓重,仍保留移用词素的特征,用〈方〉予以标注。
第二,将方言词素的几个义项同时移用到共同语,或者一个义项引入共同语后,由于不能满足语言交际的需要,会将这个方言词素的其他义项也移用进来。当然,移用词素的几个义项是在方言词义系统中本身就存在的,可以视为它们自身所形成的一个引申途径,因而不能将原生词素和移用词素的全部义项直接视为具有引申关系。但只要移用词素的义项之一与原生词素有关,就可将它们归为同一个词素,放到一个字头下。例如:
肉① 人或动物体内接近皮的部分的柔韧的物质。某些动物的肉可以吃。……③ 〈方〉不脆;不酥。④ 〈方〉性子缓慢,动作迟钝。(《现汉》第2版)
瞎① 丧失视觉;失明。……④ 〈方〉农作物种子没有发芽出土或农作物子粒不饱满。⑤ 〈方〉动 糟蹋;损失;丢掉。⑥ 〈方〉没有头绪;乱。(《现汉》第2版)
移用词素“肉”的方言(义项③④)同时进入普通话。且义项③能够同原生词素“肉”的原有意义(义项①)建立联系,因而可以视为同一个词素。移用词素“瞎”先有一个方言意义(义项④)进入原生词素“瞎”的意义系统之中,使用一段时间之后,又有两个方言义(义项⑤⑥)一起进入原生词素“瞎”的义项群。这主要是移用词素“瞎”的方言义(义项④)与原生词素“瞎”的原有义项(义项①)在意义上有一定联系。
柴① 柴火。② 〈方〉干瘦;不松软。③ 姓。(《现汉》第2版)
“柴”在移用方言词素义“干瘦;不松软”之后,又根据实际需要移用了“质量低或品质、能力差”(《现汉》第3版),两个词素在意义上存在联系,故视为同一个词素。
2. 作为几个不同词素处理
方言有一定的区域性限制。在历史发展的长河中,相对封闭的某个方言区域的人们,也可能为了表达某种新的概念或指称某种新的现象而自行创造一些词素,并约定俗成地在该区域内流传使用。这些词素往往与共同语没有直接关系,有的甚至仅仅是借用某个汉字来记载读音。对这些与原生词素在意义上没有或难以判明联系的移用词素。则分立字头。例如:
贫1① 穷(跟“富”相对)。……④ 姓。
贫2〈方〉形 絮叨可厌。
侃1〈书〉① 刚直。② 和乐的样子。
侃2〈方〉动 闲谈;闲聊。
从“音义同一”的原则来看,“贫1”与“贫2”、“侃1”与“侃2”在意义上没有联系,因此原生词素和移用词素并未融合为同一个词素,词典自然分立字头。
(三) 移植词素的处理
移植词素是随着外来词的引入而进入汉语中的。纵观汉语词汇发展的历史,外来词大规模进入汉语的时期共有六次。这些不同时期的外来词,大大丰富了汉语的词汇系统。移植词素不同于原生词素和移用词素,它们进入汉语之后,在语音形式、构词方式、意义上要适应汉语的要求,因此同化程度不一。在语音形式上,汉语一般是一个字对应一个音节,而英语等印欧系语言则是多音节词为主的语言。在利用汉字进行音译的时候,往往并不是严格地一一对应,这样就会造成音节的脱落、增加、替换等现象。在构词方式上,也要适应汉语的特点。一部分外来词进入汉语之后,往往会在音译的成分之后加上表示义类的词素,以起到提示作用。另一部分往往会将外来词进行简化,让其中的一个代表性汉字作为这个外来词的更为简洁的表现形式。在意义上,汉语对移植词素的同化方式主要是对意义的调整,而对意义的调整,往往会显示同化程度的差异。从时间上看,移植词素进入汉语的时间有早晚之分,也会造成同化程度不一。因此,这些因素都会导致词素同一性问题。《现汉》的处理也相应地主要分为三类。
第一,对于从不同语言移植进入汉语的纯音译成分,用同一个汉字记录下来,处理为同一个词素。例如:
卡① 量 卡路里的简称。……② 卡片。③ 名 磁卡。④ 录音机上放置盒式磁带的仓式装置[英cassette]。⑤ 卡车。
义项①来源于法语词calorie的音译“卡路里”,选取一个音节的对应汉字“卡”作为整个移植词素的代表。义项②③都是来源于英语词card的音译“卡”。当然义项③是从义项②引申出来的。义项④来源于英语词cassette的音译“卡”。义项⑤虽然也来源于英语(“car”的音译),但实际上两者所指并不是同一种运输工具。
可见,《现汉》是将分别源自法语、英语的不同移植词素放到了一个字头之下。这就导致字头“卡”未能体现出词素的同一性。根据《现汉》在凡例中的规定,笔者建议将“卡”做如下处理:
卡1量 卡路里的简称。使1克纯水的温度升高1℃所需要的热量就是1卡。[法calorie]
卡2① 卡片。② 名 磁卡。[英card]
卡3录音机上放置盒式磁带的仓式装置。[英cassette]
卡4卡车。[car]
从词素的同一性角度来说,来源不同的词素,虽然音同形同,但是意义之间毫无联系,分立字头会更加科学。
再如:
吧1① 〈方〉动 抽(旱烟)。② 同“叭”。
吧2① 酒吧。② 供人从事某些休闲活动的场所,有的兼售酒水、食品。[英bar]
虽然“吧2”作为移植词素进入汉语后显出非常强的构词能力,使用频率极高,已经完全实现了词素化。但是,它与“吧1”毕竟来源不同且意义之间并无联系,故将其分列。从词素的同一性角度考虑,《现汉》这样处理是合适的。
第二,对于从其他语言移植进入汉语的音译兼意译成分,与同音同形原生词素分立。例如:
晒1动 ① 太阳把光和热照射到物体上。② 在阳光下吸收光和热。③ 〈方〉比喻置之不理;慢待。
晒2动 展示自己的东西或信息供大家分享(多指在互联网上)。[英share]
《现汉》的这一处理方式可以商榷。“晒2”是对“share”的音译兼意译,它在“不加遮掩地置于……”这一点上与“晒1”有一定的语义相似性。因此,笔者认为可以将其处理为同一个词素。
第三,对于音译成分尚未实现词素化的和已经实现词素化的,理论上应该分开处理,但实际贯彻不到位。
如果音译成分尚未实现词素化,不单列字头是可以的(《现代汉语规范词典》则单独列为字头)。但如果目前已经实现了词素化,应该加以适当说明。例如:
奥① 含义深,不容易理解。② 古时指房屋的西南角,也泛指房屋的深处。
《现汉》未对Olympic的音译成分“奥”单列字头,但是在下面的复合词中却出现了“奥运村”和“奥运会”两个词。一般读者如果要想通过字头去寻找词素义的话,根本找不到。《现汉》未注意到“奥运村”和“奥运会”两个词广泛使用且“奥”已经实现了词素化的现状。如果不单独将其列为一个词素,至少应该补上义项③“奥运会的简称: 申奥|奥运会。[英Olympic]”。
通过对《现汉》不同来源词素的考察,并结合前人的相关研究,现将判定词素同一性的标准加以归纳,如表1所示。
我们首先根据是否有音有义将现代汉字分为词素和非词素。然后,将多义一音一形类归为同一词素,音义形不全同类则归为不同词素(含六种小类)。其后,再将多义一音一形类同一词素根据意义来源是否单一分为同质词素和异质词素(我们将另外撰文探讨同质词素和异质词素与词素同一性问题)。
结语
以上,从词素的来源——原生词素、移用词素和移植词素这一角度,针对《现汉》中的同音同形字头,分析了现代汉语词素同一性问题,提出词素的不同来源会影响词素同一性的判定,在此基础上,立足音义相同的原则,总结了划分现代汉语词素的具体标准。
附注
[1]一般来说,音译外来词分为纯音译和音兼义两种形式。前者如“巴士”(bus)的音节成分“巴”已经实现了词素化,也有一部分有争议,如“奥林匹克”(Olympic)的“奥”,从目前构词能力来看,可以构成“申奥、奥委会、奥赛”等词,已經实现了词素化,但《现代汉语词典》第7版尚未单独将其作为一个词素处理。后者如“模特儿”(model)中的“模”已经实现了词素化,但绝大部分尚未实现词素化,如“幽默”中的“幽”,只是代表一个音节。
[2]本文以《现代汉语词典》第7版为主,如果是第7版则不做标注,其他版本则加以标注。下同。
参考文献
1. 高更生.汉语语法专题研究.济南: 山东教育出版社,1990: 80—82.
2. 葛本仪.汉语词汇研究.济南: 山东教育出版社,1985: 55—56.
3. 吕叔湘.汉语语法分析问题.北京: 商务印书馆,1979: 16—17.
4. 孙银新.现代汉语词素研究.北京: 中国文史出版社,2003.
5. 尹斌庸.汉语语素的定量研究.中国语文,1984(5).
6. 张志公.谈汉语的语素.语言教学与研究,1981(4).
7. 中国社会科学院语言研究所词典编辑室.现代汉语词典(第2—7版).北京: 商务印书馆,1983,1996,2002,2005,2012,2016.
(北京师范大学文学院北京100875)
(责任编辑郎晶晶)