APP下载

从汉字的功能单位看汉字构字法

2015-03-28陈艺骞

海外华文教育 2015年1期
关键词:形符构字记号

陈艺骞

(北京语言大学语言科学院,中国 北京100083)

一、引 言

汉字到底是意音文字,还是语素—音节文字,或者是意音记号文字等,一直存在争论。已有的讨论因为标准、角度多样,许多是名同实异,名异实同(参见:郑振峰,2002;唐剑锋,2010)。要回答这个问题,首先须进行汉字构字法的研究。构字法是对结构的研究,即对成分及其关系作出合理的说明,以此为基础,我们才能进而认识汉字的性质。

我们知道,汉字书写系统的单位自下而上有三个层次:笔画、部件及整字。其中最小的不可拆解的单位是笔画。汉字的笔画一般没有“意义”(特殊情况我们将在后文说明)。所谓有意义,是指有符号意义,即该成分在心理上被作为整体识解、有固定的形体、能够指称某个(些)语言成分(即“对象”)。比如“困”这个字,单拿出任何一个笔画,都说不出它有什么意义。而如果我们拆分出“囗”和“木”这两个部件,则可以看出它们与这个字所代表的语素有直接的意义联系。因此看起来,整字似乎是以部件为基础搭建起来的。但“部件”这个术语只有结构性意义(是汉字的一级组构单位),而不具有功能性的意义。而要讨论汉字成分的性质,则必须从功能的角度着眼。尽管当下的字本位理论认为,“字”是汉语的基本单位,但这是在另一个层面的意义上讨论的“字”,我们在研究汉字构字法时必须明确,“字”的本质仍然是记录语言的工具。用形体记录汉语这一功能是汉字的本质属性,形体如何构造以实现这一功能,将是汉字构字法所要研究的核心问题。而如果探究汉字基础单位的功能,问题马上变得棘手起来。传统文字学和现代汉字学已有的分析已经指出,汉字的构字单位,不仅可以象形、表义,还有表音成分,甚至有与形音义皆无关的记号。但已有的研究往往在分析具体汉字时,遇到许多困难,如记号的性质、独体字的范围、形声字的认定等问题。其深层次的原因,是对形体和功能两方面未作区分或区分得不够清楚,从而导致许多问题不好解决。本文将首先介绍学界切分汉字一般所用的方法,并指出这种切分方式所得到的“部件”其实并非汉字的基本功能单位,因此不能以之作为讨论汉字成分功能的基础。我们将针对现代汉字学的主要创新——记号理论,谈一谈我们的看法,在反思已有讨论的基础上提出汉字的功能单位是“字素”,进而依据字素的组合方式归纳出汉字的四种基本构字法。

二、汉字构字单位的切分

我们首先明确关于汉字结构单位的几个术语的含义。首先,“笔画”是汉字书写的最小单位,“整字”也叫“成字”,等于我们一般所说的“一个字”,是书写时独立运用的个体,一般具有特定的读音和意义。而“部件”是一个还比较年轻的术语,最早出现于倪海曙1965年发表的《汉字部件应该规定名称》一文中。他从工业领域借来这样一个概念,原意是“机器的一个组成部分”,借而指称汉字介于笔画和偏旁之间的一层中间结构。关于这个概念,我们取费锦昌(1996)的定义,即“部件是现代汉字字形中具有独立组字能力的构字单位,它大于或等于笔画,小于或等于整字”。部件是汉字的基础构字单位,“‘部件’理论是现代汉字结构研究的核心,它在汉字识字教学、汉字排序检索、汉字信息处理等领域有着广泛的用途(刘靖年,2011)。”

对部件的研究,有两大中心问题。其一,部件的拆分原则和方法;其二,汉语中的部件数量和构字情况。由于部件是构字法而非造字法的问题,部件拆分必须严格遵循共时的方法。如费锦昌(1996)所采用的切分原则是:不必刻意追求部件的音义联系,主要从现代汉字字形出发,追求合理合用的部件切分,以现代汉字的规范字形为主要依据,保持切分的合理性、一贯性和可操作性。据此,他规定了六条切分方法,并从3500 个常用字切分出了384 个部件,其中基础部件290 个(单笔8 个,多笔282 个,成字162 个),常用复合部件94 个(后者是一个开放集,随应用的需要增减)。而邢红兵(2005)所采用的切分原则有所不同,归纳起来有三条:(1)字形合理据的按理据拆分,层次结构的按层次拆分,如“想”,平面结构的一次性拆分,如“暴”。(2)无法分析理据的依形拆分,如“朋”。(3)交重不拆,如“串”;拆分后各部分均不成字或不再构字的不拆,如“隶”;独体字构字时相离的,拆分时还原,如“裹”中的“衣”。据此,他从《(汉语水平)汉字等级大纲》中的2905 个汉字中,拆分出了基础部件515 个,成字部件285 个。

相比而言,费先生对汉字部件的切分更为彻底,因此得出的基础部件更少。比如他切分“口”为“丨”和“コ”两个基础部件,“木”字则切出“十”和“八”两个基础部件。而“各”、“林”等字中的“口”、“木”则被称作“复合部件”。严格的切分有利之处在于保持了原则的一致性,但弊端在于太彻底的切分使所有的汉字都变成散乱的零件,而不利于我们看出这些材料原本是以什么样的层次和途径搭建在一起的。我们认为,传统对汉字或严或宽的部件切分方法,都是在“部件”这个“机器”隐喻下将汉字作为一个机器所进行的拆解,所切分出的是单纯的结构性部件。这固然在我们书写汉字、汉字教学、汉字信息处理等方面都是必要的基础性工作,但对汉字性质的研究来说,采用这种部件拆分法则会因其机械性而导致对汉字认识的局限性。

下面我们将首先阐明对汉字基础单位的认识,然后提出我们在拆分汉字时所主张的方法,作为进一步讨论的基础。

三、关于汉字的基础结构单位和功能单位的再认识

汉字构字法研究,一般都以“部件”为基本的构字单位展开,要认识部件的性质,首先要给它们分类。汉字部件的类型,学界已有多种角度的分类研究。如上文已经提及的基础部件和复合部件之分,还有成字与非成字部件、孤立部件和通用部件等,但最常提及和最重要的分类,是近年来记号理论所倡导的,将汉字的构字单位分为形符、音符(声符)、义符和记号四类。其中形符指的是以汉字形体象事物形体的部件,音符(或声符)指在合体字中起提示字音作用的部件,义符指提示字义作用的部件,这三类是自“六书”理论由来已久的概念,这里只对较新的“记号”概念作简要介绍。

记号理论始于唐兰(1949)的《中国文字学》,他首次提出汉字中存在“记号”的观点,“图画文字和记号文字本是衔接起来的,图画演化得过于简单,就只是一个记号”。这个概念由裘锡圭(1986)进一步阐发,他明确指出记号是与意符、音符并列的汉字字符,并称现代汉字为一种意音记号文字。由此掀起了关于汉字“记号性”的讨论,且基于此产生了各种更新传统“六书”的理论,从“三书说”到“七书说”都有各家著述。从80年代末至今,记号研究的主要关注点有:1)记号的判定标准;2)记号的类型和来源;3)记号在汉字中的比例是多少,及汉字的记号化问题;4)记号理论在教学方面的应用。而关于记号性质的根本观点,自裘锡圭至今没有大的改变,学界共识是“记号是与汉字整字没有形音义联系的构字成分”(王凤阳,1989;苏培成,1994 等)。记号可以分为字记号和部件记号,其来源主要是两次汉字大变革——小篆的隶楷化和繁体字简化。记号在现代汉字中的比例,各家的统计由于标准不一结果也不尽相同。如柳建裕(2005)的统计是在3500 常用字中,记号字、半记号字占38.97%,在500 高频字中占73%。楼兰(2007)统计的3500 常用字中,记号字、半记号字占36.54%。杜鹃(2010)统计《通用规范汉字表》得到:一级字表3500 字有42.25%的记号字和半记号字,二级字表3000 字有24.42%记号字、半记号字。因此总的结论是,记号字和半记号字在现代汉语常用字中大约占三成,且在使用频率越高的字中比例越大。[1]教学方面,已有的研究主要是提出了一些汉字教学上对记号字的处理方式和方案构想。(郑继娥,1998;沙宗元,2011;何翔宏,2012 等)

“记号”的提出,其实是传统“六书”研究的延伸。传统“六书”提出汉字的结构类型包括“会意”和“形声”,在小篆阶段,形声字和会意字占全部汉字的90%以上。(李运富,2012)但随着汉字演变,学者们发现汉字越来越多的成分不能表音表意,这些成分被命名为记号。在运用记号理论分析具体汉字的时候,常常要面临部件切分和记号认定的困难。已有的记号研究分析汉字所做的第一步工作是进行部件切分,区分开独体字和合体字。对于“总”和“轰”这样的合体字,认识比较统一,即将“总”这样的字看作是记号字,而且其各个部件(“丷”、“口”、“心”)也都是记号,将“轰”这样的字看作是半记号字,其下部的两个“又”也都是记号。而“串”和“言”这样的字,因为通常被视作独体字,而被有的学者统一直接归入记号字(王凤阳,1989;苏培成,1994;柳建裕,2005)。但这样的处理方式有不少问题。首先,如何框定“独体字”的范围,标准是什么?虽然有现行的国家语委颁布的《现代常用独体字规范》(2009)作为参考标准,但有的所谓的独体字,若按照构字法理论,是可以拆出有意义的部分的。如“言”可以拆出义符“口”,“百”可以拆出音符“白”。这其中可能遇到的问题可能相当复杂。其次,独体字的性质是什么?对于传统的将其一致认定为记号字的做法,近年来开始有质疑的声音:独体字独立成字时看作记号(如“心”),作为构件参与构字时又看作义符或声符(如“意”的下部),这种区分会导致概念的不统一(高怀志,2004)。因此从独体字独立表达音义来看,有的学者把独体字看作由“词符”充当构字单位的字(王贵元,2005;谢泽荣,2005),有的则称独体字为“全功能字”(何翔宏,2012)。我们认为两种处理都有其不足。一方面,给独体字单设一类的,说它们是“词符”或是“全功能字”,即兼表音义的构件(字),这个定义几乎把所有的构件和汉字都囊括进去了,何谈区别?另一方面,如前文所述,传统的做法也会不可避免地遇到质疑独体字划定标准的问题。再次,成字的记号和构字的记号有无区别、有何区别?把成字的“总”和“口、心”以及不成字的“丷”都看作是记号,难免让人觉得“记号”内部现象繁杂,归类不当。不可否认的是,具有构字能力的独体字,和那些不成字的记号是有区别的。比如“总、心、口”和“丷”相比,后者永远不会独立成字,不会具有独立的读音和意义,不能充当音符和义符,即具有依附性,不具有独立的符号性。这样的区别怎么在理论中得到反映,是需要进一步思考的问题。最后,不仅有的部件和整字的性质不好认定,笔画有时也会带来问题。笔画作为部件的下层单位,往往不作为讨论对象,但有时笔画也具有特定意义,比如数字“二”,每一个笔画都代表抽象的“1”,再如“串”的中间一竖等。

我们先对汉语部件四分法的合理性搁置不议,至少这种分类的依据是汉字部件在功能上的多样性和复杂性,即同一个部件可能不止具有一种功能,同一个部件在不同的环境中具有的功能可能不同。如果将形符、音符、义符都放在部件层次(以部件切分为基础),记号也应该属于部件的一种。但当我们说音符提示字的读音,义符提示字的意义时,这里所说的“字”已并非由笔画搭建的符号形体本身,而指的是作为记录语素的符号的字,因为语素才是音义结合体。这一点在同形字上反映得很清楚。比如“苏”这个字形代表了六个同形字,对表示植物名的“苏”,“艹”部件可以看作义符,而对于苏醒义的“苏”、作为地名的“苏”等,“艹”和整字的意义联系就不那么一目了然了。因此不管是形符、音符、义符,还是记号,都是相对于语素而言的,即和语素有联系的是非记号,没有联系的是记号。这样就带来了不少问题。其一,导致了概念内部的混乱,即部件既是相对于整字的结构概念,又是相对于语素的功能概念,术语概念的冲突实际上是许多问题产生的根源之一。其二,理论价值可疑。根据这样的标准所归纳出的记号,只是初步进行了分类的任务,除了与语素没有联系这个“无”的论断,即说明了记号“不是”什么,没有“有”的认识,即记号有无功能、功能为何?其三,不好处理独体字的问题。正如我们上文所提到的,按照标准,独体字的部件(等于它本身)与独体字记录的语素的形音义一般都谈不上联系,应该看作记号,但这里存在一个双重标准。形符和记号既可以是合体字或合体字的一部分,也可以是独体字或独体字的一部分,而音符和义符却只能出现在合体字中,为什么独体字不能存在音符和义符?作为字的部件和作为构字成分的成字部件,都代表语言中的某个语素,却存在本质区别?由于存在这些问题,将汉字称为意音记号文字等提法,实际上是有待商榷的。任何文字都可能存在所谓的与语素没有联系的成分,但是汉字的特殊之处在哪里?

这里最核心的问题应当是:汉字是如何构造形体以实现其记录汉语功能的,换一个角度来说,即汉字形体的基本功能单位是什么。上文已经提出,“部件”这个概念存在内部矛盾性,我们认为处理办法要么是区分两个“部件”——部件1 和部件2,要么给其中一个另立新名,并说明二者的本质区别。我们采取后一种,称汉字的结构单位为部件,称汉字的功能性单位为字素。“字素”这个术语本身由来已久,但内涵并不统一。1984年周一农就提到了“字素”,指的是作为合体字构成要素的独体字。余延(1998)也使用了“字素”的概念,指构成汉字形体的基本元素,即点、横、竖等七种基本笔画。系统阐发这个概念的是李玲璞(1993,笔名李圃)。他通过分析甲骨文字形,提出了“字素”和“字缀”这一对概念,其中前者是“汉字的结构要素,是形与音义结合的最小造字单位”,后者是只有形而无音义的缀加成分。李文最初所称的“字素”属于造字法的范畴,分为具有独立造字功能和义符造字功能两类。(李玲璞,1993;李圃,1995)后来扩展到构字法层面,认为字素是具有直接显示语素音义层面的构字单位。(李圃,2001)也有的学者认为字素就是对字的基本结构单位的分解,将分析汉字形体构造的研究称为字素分析法,对应于字源分析法。字素分析根据不同的拆解方式,可以分析到笔画、偏旁、部首或者部件。(傅永和,1991)也即笔画、偏旁、部件等都可以看作某种意义上的字素。但我们所说的“字素”与前人有所不同,我们是从结合字形结构和汉字功能的构字法分析角度提出的,指的是作为功能单位的汉字构形成分。构字法的讨论范围应当包括这两个方面,即:搭建汉字的单位这个形体问题,及汉字的功能单位这个性质问题。字素包括汉字的形符、音符、义符和记号,它们既可以是笔画,也可以是部件,甚至整字。讨论字素的基础,仍然是对汉字的切分。由于我们讨论的出发点是寻找汉字的功能性结构成分,而一个笔画结构组发挥什么功能要看它在具体的字中的具体作用。一个结构在A 字中有某种功能,不一定在B 字中还具有这个功能。因此我们的切分原则是:在切分出所有与整字有形、音、义联系的笔画及笔画组后停止切分,切分得到的成分称为字素,其中有形、音、义联系的部分是形符、音符或义符,没有联系的部分是记号。这样切分的结果,是汉字中有理据性的部分和没有理据性的部分可以分开,且各类功能明确。下面举例说明:

1.单字素字。如“雨”。由于切分不出部件,故保留整字不切。再如“自”。虽然可以切分出“丿”和“目”两个部件,但它们都和“自”这个字没有形音义的联系,故亦保留整字不切。

2.多字素字。如“舌”。切分为“口”和“千”,因为“口”和整字有意义联系,而“千”由于没有形音义联系,采取剩余法,保留整体不切。

四、字素的组合及汉字的构字类型

构字法,一般与造字法相区别。造字法是历时分析,着眼于造字理据,推求结构来源,阐明音形义变化规律等。而构字法是共时分析,着眼于形体,说明形音义的关系。(黄维,2011)。构字法的研究既包括汉字形体如何解析和搭建,也包括汉字功能如何组构,前者主要应用于汉字信息处理和汉字教学,后者则对我们理解汉字的性质和发展规律比较重要。后一种意义是本文试图着重说明和强调的。以往的研究往往对这两方面不作区分或混淆不明,本文试图明确讨论范围,凸显功能在汉字构字法中的根本性地位,从功能性单位字素出发,重新构建汉字构字法的框架。

(一)字素的组合类型

上文已经提出汉字基本的功能单位是字素,那么字素是如何构建汉字的?四种功能单位的组合方式理论上可以有14 种(这里仅讨论由1 个和2 个字素构成的字,其他组合类推分析可得),下面我们逐一分析这些组合的性质。

A 类:由形符直接构成的类,根据单字中的形符数量多少,可以分为:A1 类:形符,指由单个形符组成的字;A2 类:形符+形符,指由两个形符复合而成的字。它们可以归为一类,因为它们的不同仅在于形体上是否有交贯,可否拆分,而构字单位在功能上没有本质区别,这两类我们统一称作“象形字”。形符的特征是以笔画为基本单位,其字形取决于人们观察到的自然事物的形状或特征。象形字包括绘形字和代形字,前者指“凹、凸、丫、囧”这样的古象形字和新象形字,及“丁、田”这样可以临时象形的字(如在“丁字尺”、“田字格”中);后者指“一、二、三”这样以线条代表抽象化的实体的字。

B 类:形符+义符,指象形和表义的字符复合而成的字,主要由指事字和小部分传统分析为会意的字而来,我们统一命名为“指事字”。如“旦”字上部“日”为义符,下部“一”以线条形状表示地平面的形状,为形符。“灭”下部“火”为义符,上部“一”代表盖在火上的水、毯子等物体,是以线条表示抽象化的实体,为形符。“刃”义符为“刀”,“丶”以点状代表一个抽象的空间位置,为形符。

C 类:形符+音符,指象形和表音的字符复合而成的字。这类字数量极少,“丛”或许可以算:以“从”表音,以“一”代表地面。但“一”也可能只是为了与“从”相区别而加的记号。(李乐毅,1996)

D 类:形符+记号,指形符和记号复合而成的字,往往是部分字形失去理据而造成的。这类字数量较少,如“韭”,上部“非”为记号,下部“一”代表地面,为形符。

E 类:由音符直接构成的类,根据单字中的音符数量多少,可以分为:E1 类:音符,指由单个音符组成的字;E2 类:音符+音符,指由两个音符复合而成的字。我们称这类字为“记音字”。和A1、A2 的形符不同的是,音符不以笔画为基本单位,因为“(汉字表音)在语素的层面或者字的层面”(赵元任,1973),所以当我们说某个单位是音符时,这个单位一般而言要是成字的单位。因此E1是将某个字当做整体去代表一个同音语素,E2 则是两个字组合起来共同代表或拼合一个语素的读音。理论上E1 可以是单一部件也可以是复合部件,而E2 必须含有两个部件。E1 是传统所说的同(近)音假借字,但这种假借关系必须在当下的汉字系统中有“遗迹”或线索,这就要求该字必须同时代表几个意义不相关的同形字,且这些语素是这个字“活着的”而非“死去的”用法。如“曲”,代表“弯曲”的“曲1”借为表“酒曲”的“曲2”,“曲2”是一个由音符构成的字。而“灵”,本义是“烤手”,但现存的用法只是作为“靈”的假借字,假借的线索断了,我们就认定“灵”是一个记号字。考虑假借字源,或许会带来混淆共时和历时分析的批评。我们认为单纯分析汉字形态或许还可以完全在同一平面进行,功能分析则必须有一定的历时参照。要“知其然”,得通过“知其所以然”,完全割裂字源和构字法的关系,对我们全面考察和发现汉字的系统性无益。对“曲2”和“灵”两个字的不同定性,看起来似乎矛盾,实则不然。因为共时的文字系统实际上是历时文字使用的积淀,其中可能包含了复杂的不同时段的“文字层次”。同是假借,反映在我们当前的文字系统中,有的是临时借用,有的是久借不还,有的假借字和本字和平共处产生同形字,有的假借字“吞噬”了本字等等。不同的使用情况,有着不同的发展趋势,且我们不仅关注单字的性质,还要反映字与字之间的关系。因此与其将“曲2”和“灵”都看作记号字,不如考虑“曲1、曲2”的关系,将“曲2”看作音符构造的字。譬如当下网络中的许多假借字,如“偶(我)、表(不要)”等假借字和本字同形共用的情况,也属于此类,可以认定为临时的音符构字。网络语言的环境中,汉字字音和共同语/方言语音的关系表现出新的特点,音符构字似乎展现出强劲的生命力。而E2 类我们尚未发现合格的实例。这类很难构字的根本原因是赵元任所说的汉字表音不在音位的层面,故这种拼合法很难实现。有的合体合音字(如“甭”)或许比较接近这类,但“合音”只是“合义”的副产品,且语音的“合”不是“加合”而是“糅合”,与拼音有本质不同,因此它根本上还是会意字。

F 类:由义符直接构成的类,理论上,根据单字中的义符数量多少,可以分为:F1 类:义符,指由单个义符组成的字;F2 类:义符+义符,指由两个表义的单位复合而成的字。但属于F1 类的汉字实际上不存在,因为同义同形要么就是一个字,要么是多音字,且严格的同形多音字(意义完全相同)极少,如表“显露”的“露”书面读lù,口语读lòu(虽然同义,但仍有语体色彩的差别)。这样的字我们认定为是同一个语素,不作构字上的区分。F2 类包括传统的会意字,及一些部分字符音义兼表的形声字。由于汉字表义是比表音更基本的构字功能,声符示源功能是主要的、起决定性作用的,示音功能是次要的、派生的(李国英,1996;郑振峰,2002),我们将它们统称作会意字。例如“林、信、拱”这样的古会意字,及“帘、尘、宝”这样的新会意字。

G 类:义符+音符,指由表义和表音的字素复合而成的字,即传统所说的形声字,是最具能产性的一类。典型的形声字是义符提示类属义,声符只提示发音,如“糖”。赵元任(1968)在介绍汉字构字法时将“糖”这类字称为“语音复合字(phonetic compound)”,这样的命名给了我们一个思考的线索:传统所说的形声字实际上有两类不同的情况。一类是薛祥绥(1919)在《中国言语文字说略》中所归纳的“根系造字”。如古人以“仑”为根,以“人、言、丝、车、水”为系,造出了“伦、论、纶、轮、沦”等字,“仑”的“条理”义是这一组字共同的意义基础。“仑”这样的字,陆宗达、王宁(1984)称之为字根。字根记录的是同源派生词的根词,从一个字根派生出来的字族,内部大多意义相通。并且由于存在这种同源关系,它们的读音也往往相近,不过音近关系是由派生关系附带产生的,这就是我们上文提到的属于F2 类的形声字。第二类是赵元任所说的“语音复合字”,这类字以一个表音的字素为基础,加上表类义的字素构成,记录的是一组同音语素。如以“唐”为音符,有“糖(食糖)、塘(堤岸)、瑭(玉名)、搪(抵挡)、溏(泥浆)、磄(怪石)”等同音字。这类字的音符只提示字的读音,与字义基本上没有联系,更不是所谓的“字根”,也即属于G 类的形声字。当然,“根系形声字”和“复合形声字”的区别是造字上的,构字上我们的区分原则是,表义的字素都归入义符,只表音的字素才归入音符。F 类的形声字我们都归入会意字,G 类的仍沿用旧称“形声字”。

H 类:义符+记号,指部分表义、部分是记号的字。

I 类:音符+记号,指部分表音、部分是记号的字。

H 类和I 类这两类与D 类一起,合称为“半记号字”。这两类字最大的来源是原形声字。如“江”有义符“氵”,“工”则不再表音,成为记号。其中“根系形声字”的义符或音符变为记号的原因有以下几种情况:1)字根消亡,导致不再表义,表音功能也同时丧失;2)派生字的意义经过引申,和字根的关系变得疏远,字根表义功能退化;同时表类义的义符也会有功能退化趋势;3)由于语音系统的演变,音近关系变得脆弱,尤其是那些派生得越来越疏远,或成员消亡而导致“亲缘关系”削弱或断裂的,同族字音近的踪迹更难寻觅。“形声字”与之相似,也有字义引申导致义符不表义,语音改变或表音字消亡导致不表音,以及使用中的字形和语素对应关系的改变等情况。H 和I 类字还有其他来源,如会意字,“扫(掃)、轰(轟)”是“义符+记号”字,“历(歷、曆)、板(闆)”是“音符+记号”字。还有假借字,如果本字是形声字,假借后一般音符可以继续表音,形符则多不再表义。如“松木”的“松1”借为“松动”的“松2”,成为“音符+记号”字。总的来说,“义符+记号”字比“音符+记号”字的数量要多,因为语音是语言更为活跃的因素,且汉字表音本就不是它最有效、最普遍的功能。

J 类:由记号直接构成的类,根据单字中的记号数量多少,可以分为:J1 类:记号,指单个记号构成的字;J2 类:记号+记号,指含有两个记号的字。但J1、J2 是从形体上区别的,前者由一个基础部件构成,后者由多个基础部件构成,二者在来源(造字)上也有所差异,但功能(构字)上没有本质差别,因此放入同一大类,统称为“记号字”。J1 类一般来自于独体象形字(如“牙、走”),形体演变而笔画交贯的会意字(如“及、史”)、指事字(如“上、甘”),这些字主要由于字形变革而失去理据;也有单一部件的假借字(如“也、我”),则因为本字消亡而成为记号;还有把繁难的旧字形糅省而造出的新字(如“卜(蔔)”)。J2 类的来源更加多样,除了J1 的各种来源,即合体的象形字(如“胃”)、会意字(如“化、奔”)、指事字(如“叉”)、假借字(如“莫、圣”)、糅省字(“总(總)”),还有部分来自于形声字(如“叶(葉)、适1(适合)”)。根据我们的分析原则,无论是单个部件还是多个部件的记号字,都不再进行拆分,因为记号字整字不管个体来看,还是和同时期系统中的其他汉字比较,都没有什么理据,它们不过是同一种构字法的简单式和复杂式。

(二)汉字的四种构字法

总结起来,汉语的功能性结构单位有四种:形符、音符、义符和记号,合称汉字的“字素”。由字素构成的字,分为单字素字和多字素字。单字素字指只由一种字素构成的字,不等于传统所称的独体字。单字素字包括:A.形符,E.音符,J.记号三类。多字素字指一个以上字素构成的字,包括:B.形符+义符,C.形符+音符,D.形符+记号,F.义符+义符G.义符+音符,H.义符+记号,I.音符+记号七类。这十种组合方式,构成了我们所使用的象形字、指事字、会意字、形声字、半记号字、记号字等各种类型的汉字。需要说明的是,所谓“象形字”等名称,只是对汉字呈现方式的分类,不对应于汉字构字法的分类,更不对应于造字法的分类。

据此,我们将汉语的构字法分为四类:象形构字、示义构字、记音构字和约定构字,这几种构字方式可以单独运用也可以互相组合。“象形构字”指以线条(笔画)摹拟或抽象语素所指对象的形体构字,只能构成单字符字。“示义构字”是用字素义提示部分语素义构字,只能构成多字符字。“记音构字”是用字素的读音记语素的读音,但只能记录或提示读音,而不能拼音。“约定构字”是用直接约定的方法在笔画结构组和语素间建立“符号-对象”关系,或用记号帮助形符、音符、义符构字,再约定该组合与语素间的“符号-对象”关系。我们所称的“约定”不等于约定俗成,而是指字素与语素建立关系的一种方式。比如交通中使用红灯代表“停”,绿灯代表“行”,这种关系就是用约定建立起来的。四种构字方式的主要不同在于它们的基础单位,即所用的元素。象形构字的基本单位是笔画,示义和记音构字运用的是字(或字的变形),约定构字则是用笔画结构组(当然也包括笔画和成字的结构,但这些成分与它们用作象形构字和示义、记音构字时的功能是完全不同的)。汉语最普遍的构字方式是示义构字,其次是约定构字。因为示义构字只能构成多字符字,因此在单字素字,尤其是高频字、基础字中,约定构字所占的比例是最高的。这与我们上文所引的各家关于记号的量化研究结果也是一致的。记音构字因其灵活性也有很广泛的应用,但最受当前语言的语音系统的制约。最后象形构字因所能表达的事物比较有限,故而只占汉字的很小一部分。

值得一提的是,当下的研究中,有学者强调汉字存在记号化的发展趋势,并根据对现代汉语常用字的统计,指出汉字的(半)记号字已占到三分之一强(柳建裕,2005;楼兰,2007 等)。对此,我们以1986年重新发布的《简化字总表》为基础,对其中的简化字进行了记号的量化统计。《总表》共计2252 字,分三个子表。第一表361 字,是不作简化偏旁用的简化字;第二表138 字是可作简化偏旁用的简化字,但不含简化偏旁;第三表1753 字,是应用第二表中的简化字及简化偏旁类推出来的简化字。统计结果显示,第一表的(半)记号字的比例高达87%,到第二表就迅速下降,占49%,在第三表则只占6.4%,三表合计,(半)记号字的比例为18.2%。简化字是最近一次的汉字变革,其中很多字的简化形体来自于群众已经长期习用的字形,在一定程度上反映了汉字在其前数百年间使用演变的发展趋势。可以看出,约定构字只是基础汉字的主要构字方式,对多字素字而言,约定构字则逊于其他构字方式。

(三)与字素相关的几个问题

上文我们在理论上提出了汉字构字的若干方法,并进行了举例分析,但在实际操作中,还会遇到一些具体问题,这些问题有的是原则性的,有的是策略性的,下面我们对其作补充说明,同时也回答我们在第二部分提出的一些问题。

1.字素的切分问题。切分以构字方式为基础,如果整个字只用了一种构字方式,就不切分,如果运用了两种以上的构字方式,就按相应方式切分出象形的部分、示义的部分、记音的部分和约定的部分。其中据上文陈述的理由,我们主张示义的部分优先于记音的部分切分,约定的部分最后切分。

2.独体字问题。通过将汉字分为单字素字和多字素字,实际上就避免了使用独体字和合体字这两个概念。一方面是不用在讨论汉字字符性质的时候,陷入到形体如何拆分的漩涡中去,另一方面也保持了概念的统一性,将形体单位与功能单位区别开来。

3.声符问题。判定字素是否记音的标准问题,我们的主张是以现代汉字读音为规范,同时照顾同字素字间的关系,参考字源,最后在具体应用时灵活处理。如“犮”已经不是现代汉语通用字,但作为音符,“犮”构成了一大批音近字,如音“bá”的有“拔、跋、妭、魃、胈”等,音“fú”的有“绂、祓、黻、韨”等。以单个字看,它们都可以看作记号字或半记号字,但参考字源和照顾同字素字的关系,可以把“犮”视作音符。按标准的严格程度不同,可以有不同的划分结果,对应于不同的应用需要。对语言现象分类,往往会存在标准的粗细问题,分出的类别内部也会存在较合格的成员与不太合格的成员之分。

4.省声字和省形字问题。省声字是指构字时声符(即音符)被省略了一部分的字,省形字是指形符(即义符)被省略了一部分的字。如:

累:纍省形 岛:鸟省形 扫(掃):帚省形 标(標):票省声

鲞:养省声 鮺:差省声 荦:劳省声 赛:塞省声

这类字数量比较少,被省的字素往往是为配合字形大小、空间组合、笔画多少而变形。这种变形与作为义符的“氵、讠、灬”等字素的变形不同,后者是统一的、可类推的变形:即有一定的条件,满足条件必须变。而省形、省声是个别的、不可类推的变形,因此我们把被省的义符、音符统一视作记号。

5.异体字问题。异体字有的是在历史沿用中出现的错配,有的是同一个字形体的讹变。我们认为应当以异体字规范为标准,以现代汉语通用字为限,对目前通行的字体按原则标准进行分析,而不必视异体字之间有构字上的关系。

五、从构字法和构词法的一致性看汉字的性质

构字法和构词法的一致性表现在两个方面。一方面,二者在组合层次上具有连贯性;另一方面,二者在组合规律上具有象似性。

汉字所记录的语言单位是语素,而不是音节甚至音位。即使是记录音节,也是用一个成字的音去代表,而且这种代表关系是临时的而非固定的,整体的而非拼合的。古代汉语的书面系统中,语素是由字和字素记录的,词是由字和字组记录的。现代汉语的情况亦然,但由于字素记录语素的能力下降,语素更多地用单个的字来记录,我们言谈口说的词则更多地用多字组来记录。因此,汉语用笔画搭建成字素,字素直接记录语素或组合成字来记录语素,语素进一步组合成词,构字法和构词法呈现出一种连贯性。汉语现代构词法研究的先驱薛祥绥(1919)在讨论构词法时,就无意识地结合了构字法和构词法。他把汉字当做像“单纯词”一样的单位,区别于两个字以上的复合式。如他指出“撤、澈、辙”是构词成分不能分析的词,“武、信、巴且、芙蕖”是两个字合成一义的词。姚亚平(1980)也明确提出:汉语字法和词法具有一致性。他以会意字为例,分析了会意字两个字素之间的结构关系、语义关系,甚至字素的顺序问题。

而在组合规律上,我们也可以借鉴构词法的研究来重新审视构字法。在构字法中,分析出“记号”的方法,本质上是与构词法中剩余语素的分析方法是一致的。如“蝴蝶”中提取出具有语素地位的“蝶”后,剩下的“蝴”就成为了剩余语素。类似的,“扫”字中,提取了作为义符的“扌”后,“彐”虽不联系整字的形、音、义,但因为被剩余,而获得了“剩余字素”的地位,也即我们所称的记号。汉字的单字素字,包括仅用象形、记音和约定构成的字,为单纯字。它们具有特定的音和义,且一般有着简单的形体结构,构字能力普遍较强,是基础汉字。多字素字中的“义符+形符/义符”为复合字,即意义的复合;“音符+形符/义符”为衍生字,即同一个音符的衍生。而“记号+形符/音符/义符”(半记号字)可以看作派生字,记号作为附加成分,在其中不提示音或者义,只辅助构建字形,整个字的理据性趋于降低,约定性趋于增强。派生字中的某些记号,如某些词缀一样,具有较强的构字能力和较高的复现率,它们和单纯字一起组成整个汉字系统的基础。单纯字、派生字、复合字和衍生字这四类,尤其是复合字,内部还可以细分:字素之间怎么组合,字素的组合顺序有无规律,字素组合怎么浮现出字义,都是可以再考察的问题。

因此对于汉字的性质问题,我们比较认同赵元任(1980)的观点:“用一个文字单位写一个词素,中国文字是一个典型的最重要的例子。”汉字是一种语素文字的结论大体是正确的,不管是象形还是示义,不管是记音还是约定,都是记录语素的途径而非目的。这种记录语素的倾向有很多表现,如无意义的音节常常被重新分析为语素。譬如从英语“card”译来的“卡”本来没有意义,加个字构成“卡片”一词。不过“磨合期”一过,人们便又重新赋予“卡”这个字以意义,构造出“贺卡、资料卡、银行卡”等词。

六、余 论

汉字系统是一个经济有效的系统,虽然语素和词汇数量庞大,但常用汉字仍可以保持在较小的范围内。其原因,一是字素的高利用率拓展了汉字的功能,我们不仅可以重复使用字素来“建构”汉字,还可以将汉字“解构”为基础字素。建构是非常常见的现象,如用“又”可以构成“对、凤、汉、圣”等字,而解构是一种破坏汉字的旧有架构,重新分析而阐发新义的用字现象,如“叒、叕”被重新解读为“多次”的意思,“焱、燚”则指“非常火爆”的意思。对汉字的解构随着网络媒体的盛兴而愈加常见,文字不仅是文本内容的载体,也开始充当图画、声音、情感的载体,甚至产生了用单独的字来报道事件和观点的新型媒体形式(即“字新闻”)。这很大程度上得益于汉字基本构字单位“字素”的弹性和高效。另一方面,记录语言的职能和作为符号的本质两方面的制约平衡,使汉字保持了一个良性的代谢更新机制。汉字作为一个整体,内部透明度在造字时最高,用字中会不断降低,但不会一直低下去,在适当的时间又会通过字形变革或文字孳乳提高透明度。除了一批基础字的约定性持续增强外(不过基础字的数量总不会太大),复合字总是能保持恰当的理据性和约定性,寻求汉字系统在合理和合用之间的平衡。

注释:

[1]对于汉字而言,越是常用的字,其结构单位越有可能变为记号,导致字的透明度降低,不再能通过部分的音或义推知整字的音或义。这一点具有语言共性,即语言单位的使用频率与透明度之间存在相关性,譬如习语性构式就是高频使用使得理据性磨损的典型例子。

杜 鹃:《现代汉字构字法探析》,四川外语学院硕士论文,2010年。

高怀志:《从“新六书”看学术创新的误区》,《呼伦贝尔学院学报》,2004年第2 期。

费锦昌:《现代汉字部件探究》,《语言文字应用》,1996年第2 期。

冯玉涛:《记号、记号的使用与汉字的记号化》,《宁夏大学学报》,2004年第3 期。

傅永和:《汉字的部件》,《语文建设》,1991年第12 期。

何翔宏:《对外汉语教学中的含记号字研究》,安徽大学硕士学位论文,2012年。

黄 维:《现代汉字记号字研究》,河北大学硕士学位论文,2011年。

李国英:《小篆中的形声字》,北京:北京师范大学出版社,1996年。

李乐毅:《简化字源》,北京:华语教学出版社,1999年。

李玲璞:《说字素》,《语文研究》,1993年第1 期。

李 圃:《甲骨文文字学》,上海:学林出版社,1995年。

李 圃:《字素理论与汉字分析问题》,刊于《中国文字研究》第二辑,南宁:广西教育出版社,2001年。

李运富:《“六书”性质及价值的重新认识》,《世界汉语教学》,2012年第1 期。

柳建钰:《记号字、半记号字及其在现代汉字中基本情况探讨》,《宁夏大学学报》,2005年第4 期。

刘靖年:《汉字结构研究》,吉林大学博士学位论文,2011年。

楼 兰:《现代3500 常用字中的记号字及半记号字调查——兼论现代汉字记号化的成因及影响》,《渤海大学学报》,2007年第4 期。

陆宗达、王 宁:《浅论传统字源学》,刊于《陆宗达语言学论文集》,北京:北京师范大学出版社,1984年。

裘锡圭:《文字学概要》,北京:商务印书馆,2010年。

苏培成:《现代汉字的构字法》,《语言文字应用》,1994年第3 期。

苏培成:《现代汉字学纲要》,北京:北京大学出版社,2001年。

唐剑锋:《汉字性质研究综述》,《淮海工学院学报》,2010年第9 期。

唐 兰:《中国文字学》,上海:上海古籍出版社,1979年。

王凤阳:《汉字学》,吉林:吉林文史出版社,1989年。

王贵元:《现代汉字字形三论》,《语言文字应用》,2005年第2 期。

谢泽荣:《独体字是记号吗?》,《重庆师范大学学报》,2005年第4 期。

邢红兵:《<(汉语水平)汉字等级大纲>汉字部件统计分析》,《世界汉语教学》,2005年第2 期。

薛祥绥:《中国言语文字说略》,《国故》,1919年第4 期。

姚亚平:《从会意字的构成看汉语字法和词法的一致性》,《南昌大学学报》,1980年第3 期。

余 延:《汉字学与生态学结合的理论思考》,《汉字文化》,1998年第2 期。

张书岩等:《简化字溯源》,北京:语文出版社,1997年。

赵元任:Chinese as a Symbolic System.Papers of the CIC Far Eastern Language Institute:1 –9;Also in Aspects of Chinese Sociolinguistics,Essays by Yuen Ren Chao,ed.By Anwar S.Dil,Stanford University Press,1976.刊于:叶蜚声译,谈谈汉语这个符号系统[C],《中国现代语言学的开拓和发展——赵元任语言学论文选》,袁毓林主编,清华大学出版社,1992年,1973年。

赵元任:《语言问题》,北京:商务印书馆,1980年。

郑继娥:《汉字的理据性与汉字教学》,《华东师范大学学报》,1998年第6 期。

郑振峰:《20 世纪关于汉字性质问题的研究》,《河北师范大学学报》,2002年第3 期。

周一农:《从字法与词法的对应看汉字语素与文字的一致性——答潘绍典同志》,《丽水师专学报》,1984年第1 期。

Chao,Yuen Ren,Language and symbolic systems,New York:Cambridge University Press,1968.

猜你喜欢

形符构字记号
近二十年形声字形符研究综述
从形符与字义的关系角度论《说文解字》中形声字分类
——以“人”“彳”字部为例
留学生形声字教学实践研究
——以满洲里学院为例
记号
“彡”的类意义在构字中对“彡”部字的影响
脏记号
墙上的记号
“形符”在小学数学课堂中的教学困境、功能与应用策略
塔克拉玛干的记号
根字练习(一)