基于中文信息处理的汉语词汇逻辑语义分析
——以“红+N”二字组合为例秦亮
2014-03-28中国传媒大学文法学部北京100024
(中国传媒大学文法学部,北京100024)
基于中文信息处理的汉语词汇逻辑语义分析
——以“红+N”二字组合为例秦亮
(中国传媒大学文法学部,北京100024)
“红”是现代汉语中典型的表事物颜色属性的单音节形容词,而且是单音节形容词中很重要且特征较为明显的一类。在传统词汇语义分析的基础上,运用逻辑语义学理论,以“红”为个案,考察“红+N”二字组合的语义结构关系,能初步建立汉语单音节形容词和后现名词性成分组合的逻辑语义模型及理解模式,为进一步形式化提供语义信息和知识,从而为中文信息处理的词义分析提供一种新的思路。
“红”;内涵逻辑;语义结构
汉语的合成词绝大多数是“词根+词根”的复合词,还有少数“词根+词缀”的加缀式合成词,这些都是词表面的形式组合方式,无法直接体现词内部的语义组合方式。其次,汉语和印欧语不同,不分词连写,也没有严格意义的形态变化等,且汉语从古至今一直处于不断的变化和发展之中,词汇化现象使得汉语的理据性变得越来越不明显,汉语词汇的形式和意义之间变得更加复杂和隐晦,语义缺省现象较多,在句法层面上无法直接看出构词成分之间的语义关系,这些都给中文信息处理增加了困难。因此,语义分析及研究在汉语研究中起着重要的作用。此外,传统语法一直以研究形名组合的句法关系为重点,努力探求形容词在形名组合中的句法功能(如分类、限定、修饰、描写等句法功能)。这些研究还未能揭示形名组合内部的语义组合关系,这就促使我们思考如何从意义的角度去分析合成词内部的语义结构。
形容词“红”表示事物的颜色,是单音节形容词中很重要且特征较为明显的一类。在我们的日常生活中,“红”的使用频率较高,在《现代汉语常用词表》中的频率序号为537。文章以“红”为例,建立“红+N”二字组合①的内涵逻辑语义分析的研究模式,并辅以句法加以验证,努力探求句法和语义的同构关系。以期为汉语进一步形式化提供更多的语义信息,也为中文信息处理提供一种“可理解”的语义组合模式。
意义的“叠置原理”,即语言表达式的意义是其直接组成成分的意义的函项,简言之,一个复合表达式的意义是由它的直接成分的意义组合而成,直接成分的意义决定了复合表达式的意义。将“叠置原理”运用到现代汉语的构词中,即:︱AB︱=︱A︱+︱B︱。表达为:“A”和“B”分别是词或语素,它们构成双音词AB时,它的语义︱AB︱就是“A”语义︱A︱和“B”语义︱B︱的合成。从句法“组合”的层面来看,很难直接体现出这种“合成”关系,但只要对其构成成分进行抽象类义提取后,就能合理、自动地得出合成的意义。运用内涵逻辑的方法来对“红”本身所具有的内涵意义进行分析,并自动提取,既能抓住其本质特征,又能了解它的外延指称。
一、通用词典释义
对于“红”的词典释义,文章以《现代汉语词典》(第5版)中的释义和词项作为考察对象。《现代汉语词典》中“红”共列出了6个义项:
①形像鲜血的颜色:~枣︱~领巾。
②象征喜庆的红布:披~︱挂~。
③形象征顺利、成功或受人重视、欢迎:~运︱开门~︱满堂~︱他唱戏唱~了。
④象征革命或政治觉悟高:~军︱又~又专。
⑤红利:分~。
⑥(Hóng)名姓。
在对词典中“红”的6个义项进行分析考察的基础上,穷尽性地归纳出词典中“红+N”二字组合:
红案 红榜 红包 红茶 红潮 红尘 红蛋红豆 红股 红净 红生 红货 红角 红军红脸 红磷 红柳 红棉 红木 红牌 红盘 红票 红旗 红契 红区 红壤 红人 红色红薯 红糖 红心 红星 红颜 红眼 红样红叶 红云 红运 红晕 红妆 红装
以上每一个“红+N”二字组合相应地对应着“红”的①③④义项,除这三个义项以外都是用“红”来解释“红”所构成的二字组合,这属于循环式自我解释,这样的词义解释不管对计算机的语义自动标注或生成还是对留学生的汉语学习,都是很不利的,这就需要我们通过内含逻辑的分析方法抽象概括出其最内涵的意义表达。
二、组合的语义结构分析
上文所归纳出的“红+N”二字组合中,“红”的意义并不一致,若机械地根据词典释义将这些形名组合进行分类,得出的分类结果不仅种类繁杂,而且因这些释义的循环论证,导致有些组合无法确定分类。为了清晰地表达出“红”的意义差别,根据“红”本身的意义,文章将“红+N”二字组合②分成以下5类:
ⅰ红案红榜红包红茶红潮红尘红蛋红豆红净红磷红柳红棉红木红牌红盘红旗红壤红色红薯红糖红星红生红叶红云红晕红妆红装红样
ⅱ红契 红颜
ⅲ红脸 红眼
ⅳ红货 红角 红票 红人 红运
Ⅴ红军 红区 红心
对这5组词的意义进行仔细考察,最后将这5组形名组合的意义归纳成3种,分析如下:
第ⅰ、ⅱ和ⅲ三类,主要从视觉感受来描写事物的属性,“红”表事物颜色,描写事物的颜色像鲜血的颜色。其中“红案、红榜、红包、红潮、红尘、红火、红股、红脸、红柳、红颜、红眼”等都已经成词,意义专指且固定,有的有转喻或隐喻义。如“红包”已成词,指“包着钱的红纸包”,意义固定且专指“用于馈赠或奖励”,而不是指“红色的包”。例如:
(1)专家们告诫说:小孩子的新年红包,不管是多是少,都是教育他们储蓄理财的最好教材。(新华社2004年新闻稿)
(2)在他的带动影响下,近年来,其他员工对一些外协单位送来的礼品、红包都主动上交党支部处理,并已形成一种良好的风气。(1994年报刊精选)
(3)不料送客回来,却发现茶几上放着一个红包,原来母子俩还是悄悄地把医药费给留下了。(1994年报刊精选)
以上3个例句中的“红包”都是指“包着钱的红纸包”,而不是“红色的包”。
“红契”指“(旧时)买田地房产时经过纳税而由官厅盖印的契约”,在契约中,只有官厅盖的印章是红色的,由部分指代整体,意义由“红的印章”(部分)发生转喻后,指代“整个契约”(整体)。转喻是基于事物的相关性,由一个认知域向另一个相关认知域过渡。这一语言发展机制和“隐喻”在语言发展中都起了很大的作用。例如:
(4)我家虽有地二三百顷,然或为祖上所遗,或为近世所买,均有红契文约,来路清楚,并无强占民田之事。(姚雪垠《李自成》)
(5)朱老巩一见四十八亩官地的红契文书,眼里冒出火星子,啪地一声,向红契文书抓过去。(梁斌《红旗谱》)
例(4)、例(5)中的“红契”很显然不是用红色的纸写的契约,只是在契约上有红色的盖章或手指印,部分转指整体,所以“红契”已经成词。
“红脸”或“红眼”已经成词,而不是词组义“红色的脸或红色的眼睛”,由“生气或害羞时所产生的脸部或眼部表情”转指“生气或害羞”。例如:
(6)胖菊子很安详的笑了笑。他们俩是应运而生的乱世男女,所以不会红脸与害羞。(老舍《四世同堂》)
(7)不同了,爆炸越来越多,……,好几个中国工人被炸死了。现在,都红眼了。(新华社2004年新闻稿)
例(6)、例(7)中,“红脸”“红眼”词义表“生气或害羞”。
但除了上一类“红+N”二字组合(红包、红契、红脸、红眼)之外,像“红茶、红蛋、红豆、红磷、红糖、红叶、红云、红晕、红妆”这一类词,因为“红”本身表示颜色,造词能力比较强,所以一旦新事物出现,而且颜色是红的,那么就可以用“红+N”生成新词语,且随着使用频率的增加或凝固性的增强,也可能成词,因此“红+N”这一结构能产性很强,是根据事物的颜色对事物进行的概念分类,理据性较强。
第ⅳ类,主要从心理感受来刻画事物的属性。如“红角”指“受广大观众欢迎的演员”,“红人”指“受宠或重用的人”或“走红的人”。例如:
(8)他很兴奋,能够“带”这位红角儿来会多位朋友,不啻往自己脸上擦粉、贴金。来前,他打过电话,……(陈建功、赵大年《皇城根》)
(9)田光知道夜袭队是日本宪兵队的宝贝蛋,刘魁胜是老松田的大红人。(冯志《敌后武工队》)
从例(8)、例(9)可知,这里的“红”已经不是描写事物的颜色了,而是从人的心理角度描写人或事物“受欢迎或重视”,“红角”和“红人”的义项有相似之处,都有“受欢迎的”义素在内,这跟“红”的抽象要素是分不开的。
第Ⅴ类,这一类属于专业的政治词汇,在此不作具体分析。因为在计算机信息处理中,我们会采用大词表小规则的方法,将自然科学、社会科学、地名等各种专业术语制成词表,并加以规则,通过一定的模型并以一定的算法将其编入程序,以达到运用、理解和储存语言信息的目的。
根据以上形名组合的具体分类,我们将“红”的意义进行了更为细致和准确的概括,这些分类和概括,对中文信息处理和留学生的词汇教学都有基础性的作用。
三、抽象类义的提取
(10)君子不以绀、纟取饰,红、紫不以为亵服。(《论语·乡党》)
(11)红壁沙版,玄玉梁些。(《楚辞·招魂》)
其次,考察《现代汉语词典》与《倒序现代汉语词典》中所有“红”的双音节构词(包括“红”所有的前后位构词)。
最后,根据内涵逻辑语义学方法,通过抽象类化,提出了“红”的抽象类义,包括外延指称义、外延转指义以及内涵特征义。
外延指称义:颜色为红色的相关事物。例如:披红、祁红。
外延转指义:红利。例如:红利、红股、分红。
逻辑学认为“概念”是反映思维对象及其特有属性的思维形态,且“思维对象”是指一切能被人类认识或思考的客体,既可以是有形的也可以是无形的,因此概念是通过反映思维对象的特有属性来反映思维对象的。概念包含内涵和外延这两类特征,内涵指概念所反映的对象的特有属性或本质属性,外延则指具有概念所反映对象的特有属性的对象,即概念的适用范围。
语词是概念的载体,概念的形成和存在依赖于语词,语词表达着概念,现代汉语中主要依据词的语法功能来对词进行语法分类,但是名词、动词、形容词、数词等的原始分类,就是根据它们表达概念性质的不同划分的。现代汉语中,形容词大都表达属性概念,从逻辑语义角度看,形容词有两个重要的逻辑特征:1.决定一事物之所以成为该事物而区别于其他事物的属性的本质属性,即形容词的内涵义;2.这种特有属性转指表达实体概念的外延意义。基于此,下文对“红”作内涵逻辑分析。
首先,考察“红”的本义,《说文解字》中,“红”的释义:“红”,从糸工声,户公切,帛赤白色,本义为粉红色。例如:
内涵特征义:a.顺利、成功;心理趋向喜欢,受人欢迎。例如:红运、红人。b.革命的、有政治觉悟。例如:红军、红区。
将“红”的语义、词性和构词形式对应关系归纳如下:
第一,这一类“红”的前后位构词,都是使用其本义(粉红色)构成的,组合成词后,其整体词性为形容词性,这些词按其内部构词方式可分为:
1.“‘红’+后现名词性成分”的前位构词
1)“红”+名词性语素(偏正式构词法),根据这一构词法组合成词,且被词典收入的词有:红案、红榜、红包、红茶、红潮、红尘、红蛋、红豆、红火、红净、红脸、红磷、红柳、红棉、红木、红牌、红盘、红旗、红契、红壤、红色、红薯、红糖、红星、红颜、红眼、红生、红叶、红云、红晕、红妆、红装。
2)“红”+形容词性语素(偏正式构词法),这一构词法所构成的二字组合中,已经成词,且被词典收入的只有一个:红热。
3)“红”+形容词性语素(并列式构词法),这一构词法所构成的二字组合中,已经成词,且被词典收入的只有一个:红润。
4)“红”+动词性语素(偏正式构词法),这一构词法所构成的二字组合中,已经成词,且被词典收入的只有一个:红烧。
2.“后现名词性成分+‘红’”的后位构词
1)形容词性语素+“红”(偏正式构词法),根据这一构词法组合成词,且被词典收入的词有:赤红、大红、绯红、粉红、鲜红、殷红、嫣红、朱红、紫红。
2)动词性语素+“红”(述补式构词法),这一构词法所构成的二字组合中,已经成词,且被词典收入的只有一个:剔红。
3)副词性语素+“红”(偏正式构词法),这一构词法所构成的二字组合中,已经成词,且被词典收入的只有一个:通红。
4)名词性语素+“红”(偏正式构词法),根据这一构词法组合成词,且被词典收入的词有:潮红、川红、花红、火红、橘红、口红、品红、肉红、水红、桃红、杏红、血红、银红、枣红、洋红。
第二,这一类“红”的前后位构词,是根据“红”的外延转指义构成的,这一外延转指义的意义已经体现为人心理趋向于想要得到的东西,而且其转指的事物是抽象的,不是具体的,这一点区别于使用“红”外延指称义得到的构词,转指词整体为名词性。此外,“红”的外延转指义虽然体现了其内涵特征义,但因其是名词性的,所以有别于其内涵特征义,这一类词有:红利、红股、分红。
第三,这一类全是“红”的后位构词。调查发现,只有“红”的后位构词是使用其外延指称义(颜色为红色的相关事物)构成的,因“红”的本义到外延指称义的演变,使得“红”词性从形容词性转化为名词性,因此,这一类“红”的后位构词的整体词性为名词性。这些词按其内部构词方式可分为:
1)动词性语素+“红”指称义(述宾式构词法),这一构词法所构成的二字组合中,已经成词,且被词典收入的只有一个:披红。
2)名词性语素+“红”指称义(偏正式构词法),这一构词法所构成的二字组合中,已经成词,且被词典收入的只有一个:祁红。
第四,这一类“红”的前后位构词,都是根据其内涵特征义构成的,其内涵特征义有两种:顺利、成功,受人欢迎、重视;革命的、有政治觉悟。用这两种内涵特征义得到的构词,其整体词性为形容词性,具体分析如下:
1)“红”内涵义+名词性语素(偏正式构词法),根据这一构词法组合成词,且被词典收入的词有:红货、红角、红票、红人、红运;红军、红区、红心。
2)名词性语素+“红”内涵义(主谓式构词法),这一构词法所构成的二字组合中,已经成词,且被词典收入的只有一个:眼红。
四、形式化及其描述
内涵逻辑把内涵看作一个选项,它的定义域是所有可能世界的集合。值域是一个语言表达式在各个可能世界的外延所组成的集合。个体词项的外延是所指称的对象。根据上文归纳出的意义分类、“红+N”的组合分类,以及第三部分对“红”的抽象类义的提取,文章选取“红+N”组合中的典型案例来分析,尝试抽取“红+N”组合的形式化规则,具体表现如下。
1.红糖
F1为一个集合,F1={红棉、红木、红糖、红茶、红豆、红磷……}
F1为函数值,红是一个函数,函数式为:F1=红{NX},NX为自变量,且为名素变量。
红糖∈{名词}∧{红(N)},then[∣红+糖∣=∣红∣+∣糖∣]∧“红”的作用是描写、限制“糖”的颜色,以便与其他颜色的“糖”区别。规则的语言描述:当“红糖”为名词并且“糖”为名词时,“红糖”的值就是“红”的值加上“糖”的值,即“红色的糖”,此时“红”的作用是描述、限制“糖”的颜色。
这一类词的语义可以总结为:
If NX∈{N}∧{红(NX)},then[∣红+NX∣=∣红∣+∣NX∣=红色的NX]∧“红”的作用是描写、限制“NX”的颜色。
2.红脸
F2为一个集合,F2={红脸、红眼}
F2为函数值,红是一个函数,函数式为:F2=红{NX},NX为自变量,且为名素变量。
红脸∈{动词}∧{红(N)},then[∣红+脸∣=∣红∣+∣脸∣=红红的脸色]∧整体转指“生气或害羞”。规则的语言描述:当“红脸”为动词并且“脸”为名词时,“红脸”的值就是“红”的值加上“脸”的值(“红红的脸色”),再进一步转指为“生气或害羞”。
这一类词的语义可以总结为:
If NX∈{V}∧{红(NX)},then[∣红+NX∣=∣红∣+∣NX∣=红色的NX]∧整体转指“生气或害羞”。
3.红颜
F3为一个集合,F3={红颜、红契……}
F3为函数值,红是一个函数,函数式为:F3=红{NX},NX为自变量,且为名素变量。
红颜∈{名词}∧{红(N)},then[∣红+颜∣=∣红∣+∣颜∣=红的脸色]∧“颜”是女人身体的一部分∧[部分转指整体=貌美的女子]。规则的语言描述:当“红颜”为名词并且“颜”为名词时,“红颜”的值就是“红”的值加上“颜”的值(“貌美的女子”)部分转指整体。
这一类词的语义可以总结为:
If NX∈{N}∧{红(NX)},then[∣红+NX∣=∣红∣+∣NX∣=红色的NX]∧N是上位/下位概念∧[部分转指整体]
4.红人
F4为一个集合,F4={红角,红人,红运……}
F4为函数值,红是一个函数,函数式为:F4=红{NX},NX为自变量,且为名素变量。
红人∈{名词}∧{红(N)},then[∣红+人∣=∣红∣+∣人∣]∧“红”的作用是描述“人”成功或受人重视、欢迎。规则的语言描述:当“红人”为名词并且“人”为名词时,“红人”的值就是“红”的值加上“人”的值,即“成功的或受人欢迎的人”,此时“红”的作用是描述“人”成功或受人重视、欢迎。
这一类词的语义可以总结为:
If NX∈{N}∧{红(NX)},then[∣红+NX∣=∣红∣+∣NX∣=顺利、成功或受人重视、欢迎的NX]∧“红”的作用是描述“NX”成功或受人重视、欢迎。
以上所作的具有代表性的“红+N”组合的内涵逻辑的形式化数理语言表达,为计算机中文信息处理相关程序编译提供了基础性的语义信息,也为中文信息处理提供了更为科学的客观语言依据,是计算机中文信息处理必须跨出的形式化第一步。
五、结语
文章分析了“红”作为颜色类形容词的逻辑语义,主要就“红”前后位的双音节构词进行了分析,并提取了“红”的内涵特征义,建立了“红+N”的语义模型。就汉语来说,目前语义自动分析还有重重困难,基础也极为薄弱。这就需要根据计算机的要求加强词汇语义分析,尤其需要运用现代逻辑语言学的方法对词的构成进行分析研究。文章选取了“红”作为个案探索性状形容词的语义结构,建立分析模型,旨在为其他类形容词,尤其是颜色类形容词建立分析模型。
注释:
①汉语语言研究中在词与词组的划分问题上仍然存在着很大的分歧,文章借鉴了王洪君(1994)“以字和字组为基点观察字组中成分字间的语法和语义关系”思想,绕开汉语词切分的问题,使用“‘红+N’二字组合”这一提法,将“红”看作形容词性的“字”,“红”的意义可以是能单独使用的、自由的形容词词义,也可以是不能单独使用的、粘着的形素义,“N”看作名词性的“字”或“字组”,“N”可以是不能单独成词的、粘着的名素,能单独成词的、可自由使用的单音节名词,双音节名词以及少量的三音节名词,但汉语中的词绝大多数都是双音节的,双音化是现代汉语中词的典型特征,对双音节词的组合研究足以揭示词内部的语义组合问题(熟语除外),而且现代汉语多音节词中,有很多都是形名组合作定语的定中式复合词或定中式短语。文章只考察典型的“红+N”二字组合的语义组合关系。
②“红股”这一组合中“红”已经转指为“红利”,为名词性语素,已不是形名二字组合,因此,这部分暂不讨论。
[1]郭曙纶.汉语动词的类义与逻辑配价研究[D].上海:上海师范大学,2001.
[2]王洪君.从字和字组看词和短语[J].中国语文,1994(2): 102-112.
[3]吴颖.现代汉语单音节形容词语义结构研究[D].上海:上海师范大学,2002.
[4]吴颖.时间形容词的逻辑语义分析[J].语言文字应用,2008 (3):134-141.
[5]《现代汉语常用词表》课题组.现代汉语常用词表:草案[M].北京:商务印书馆,2008.
[6]中国社会科学院语言研究所词典编辑室.现代汉语词典[M].5版.北京:商务印书馆,2005.
[7]中国社会科学院语言研究所词典编辑室.倒序现代汉语词典[M].北京:商务印书馆,2002.
责任编辑:赵青
H136
A
1673-0887(2014)05-0084-06
10.3969/j.issn.1673-0887.2014.05.18
2014-05-08
秦亮(1984—),男,博士研究生。
2011年度上海市教育委员会科研创新重点项目(11ZS128)