APP下载

试 论 现 代 汉 字 的 类 型

2012-05-28□张

山西广播电视大学学报 2012年1期
关键词:常用字用字记号

□张 景

( 山西广播电视大学,山西 太原 030027)

类型是有共同特征的事物所形成的种类,是人们主观地以某个标准对各种事物进行梳理后而得到的结果的描述。也就是人们根据一个主观的标准对客观事物分类的结果的反映。由于人们分析和观察现代汉字的角度不同,所以对现代汉字的分类也就有很多不同的结果。现代汉字是经过规范化和整理的汉字,其基本性质没有改变,但在字量、字音、字义和字形方面都发生了变化,对它的研究应着重于现状。所以现代汉字的分类研究就要分别从字形、字音、字义、字频四个方面入手考察。

一、从现代汉字的字形来看

现代汉字的字形分析重在现状分析,现状分析可分为外部结构分析和内部结构分析。

(一)外部结构分析。外部结构分析指既不涉及字音和字义,也不涉及构字理据,只关注汉字字形的外观结构,着重研究现代汉字的组合成分和组合方式。从现代汉字的构形方法来看,现代汉字的基本构形单位有笔画、部件和整字三个层次,笔画是汉字构形的最小单位,部件是构字单位,整字是使用单位,是现代汉字的单个字。从这个角度可以把现代汉字分为独体字和合体字两类。

1.独体字——由一个基础部件构成的汉字是独体字。

如:“山、石、水、火、风、雨、人、身、事、史、中、四、世”等。《现代常用独体字规范》规定了现代汉字中256个常用的独体字,给出了《现代常用独体字表》。

2.合体字——由两个或两个以上基础部件构成的现代汉字是合体字。如:“灿、矿、冰、疯、霏、仄、躬、使、种、罢、泄、霜、煜、彬、意”等。所谓基础部件就是最小的不能再拆分的部件,一个汉字如果有多个层次的部件,那么末级部件就是不能再拆分的,就是基础部件。如上述合体字中“灿”,有“火、山”两个基础部件构成;“意”,有“立、日、心”三个基础部件构成。

现代汉字的独体字和合体字都是从古代汉字的象形字、指事字、会意字、形声字发展而来的。需要注意的是:所谓独体、合体是就现代汉字而言的,有些字在古代本是独体,到了现代却成了合体,如“泉”。反之,有些字在古代本是合体,到了现代却成了独体,如 “及”;独体字在现代汉字中约占3%至5%,绝对数量为300上下,但却是构成汉字的基础。因而学习和掌握独体字十分重要。

(二)内部结构分析。内部结构分析是指现代汉字与字音和字义有联系的构字成分的组合,是从汉字的现状着眼,研究字形和字音、字义的关系,说明构字理据来得到现代汉字的构字类型。分析汉字的内部结构得到的基本构字单位是字符,分析汉字的外部结构得到的基本构字单位是部件。由于分析的角度不同,字符与部件之间没有对应关系,字符不一定是部件,部件也不一定是字符。就一个汉字而言,字符分析只分析一次,不再往下继续切分,字符所指范围要比部件小得多,字符和传统汉字学的偏旁相当。字符根据它与整字的音义关系分为意符、音符、记号三类。字符和整字在意义上有联系的称作意符;字符和整字在读音上有联系的称作音符;字符和整字在意义和读音上都没有联系的称作记号。要注意的是,由于现代汉字在音、形、义方面都发生了变化,这里说的整字的意义和读音都是指现代汉字的意义和读音,而不是古义和古音。

从汉字内部结构分析,现代汉字是由意符、音符和记号构成,三类字符搭配构成现代汉字的六种结构,也就是现代汉字的六种类型,分别是:会意字、形声字、半意符半记号字、半音符半记号字、独体记号字、合体记号字。

1.会意字——是由两个或两个以上意符构成的字,其中的字符都是意符,没有音符或记号,并且所有的字符与字义都有一定的联系。如:“尘”由意符“小”、“土”汇合成义,表示灰尘;“从”由两个意符“人”汇合成义,表示一个人跟随另一个人;“拿”由意符“合、手”汇合成义,表示合手为拿;“磊”由三个意符“石”汇合成义,表示石头多;“泪”由意符“氵、目”汇合成义,表示目中水是泪。等等。

2.形声字——现代汉字的形声字由意符和音符两部分构成。但意符表示类属意义,因为意符和字义十分接近的字比较少。音符表示读音,有的音符和整字读音相同,有的音符和整字的声韵母相同。如:“柏”由意符“木”和声符“白”构成,指柏树;“鲤”由意符“鱼”和音符“里”构成,指一种鱼。等等。要注意的是,现代汉字的形声字与传统意义上的形声字有了很大的不同,现代汉字形声字的音符表音率大大降低,大部分已失去表音功能,成为构字记号,凡是音符与整字的字音声韵母不同的,就不能算作是形声字,如“甸、佃、钿”中的“田”就不是音符而是记号;同样,现代汉字的意符如果不能表示字的类属意义,即便是音符表音准确,也不能称为形声字,如“纸”在过去是用丝做原料制造,而今天的纸主要用竹子和木料等做原料制造,与丝没有了关系,因此“纟”在这里只能是记号而不是意符了。

3.半意符半记号字——是指由意符和记号构成的字。从溯源分析看这类字主要是形声字,但由于种种原因音符不能表示字音,只能算作是记号。如“灿”繁体作燦,意符“火”,音符“粲”。粲简化为山,“山”只能是记号。又如“鸭、切、穹、鹰”中的“甲、七、弓、雁”原来都是音符,现在都作记号。还如“鸡、汉、欢、戏” 中“又” 是由原来“鷄、漢、歡、戲”繁体中形状各异的音符简化而来,“又”已经不表音,成为记号了。

4.半音符半记号字——由音符和记号构成的字。大部分是古代形声字发展而来,音符可以较准确地表音,但意符由于种种原因已经不能表示字的类属意义。如“漠、僻、究、职、泯、织、华、巩”等字的意符,由于古今意义的差别不能表义都成为记号。

5.独体记号字——由一个记号构成的字。独体记号字从现代汉字的字形上看不出意义和读音,成为纯粹的记号字。具体情况有所不同:有的是古代的象形字和指事字,如“日、月、山、水、人、上、下、本、口”等,有的是会意字和形声字简化形成,如“币、办、及、开、了、丑、击、关、发、里”等。

6.合体记号字——由几个记号构成的字。来源于古代象形字、形声字、会意字,由于种种变化,现代汉字的字形上也看不出字义和字音,如“快、旧、射、沙、别、笑、夸、点、法、这、忙”等。

从字形来给现代汉字分类,可分别从外部结构分析和内部结构分析入手。从字形的外部结构可把现代汉字分为独体字与合体字两类;从字形的内部结构可把现代汉字分为会意字、形声字、半意符半记号字、半音符半记号字、独体记号字与合体记号字六类。

现代汉字的字形分析除了从其自身结构分析外,还应从其社会应用角度来分析,这就涉及到现代汉字的规范化问题。

(三)社会应用分析。从现代汉字的社会应用来看,《中华人民共和国国家通用语言文字法》规定:“国家推广普通话。推行规范汉字”。汉字规范化的内容包括:汉字要有统一的形体标准;书写和运用汉字要规范。因此,现代汉字可分为规范汉字和不规范汉字两类。

1.规范汉字——是指新中国成立以来经过整理简化的汉字以及未经过整理简化的部分汉字,并且这些汉字是经过国家主管部门公布加以推行的法定文字,也叫正体字。包括简化字(《简化字总表》规定的)、选用字(《第一批异体字整理表》里选用的)、计量单位名称用字(《关于部分计量单位名称统一用字的通知》为准)、生僻地名用字(经国务院批准共更改县级以上地名35个共计37个)、传承字(未经整理简化,从古至今一直沿用的汉字,是古今通用的汉字,如:人、手、口、水、日、月、上、下、从、戴、鏊、灌、囊、纛、爨等)。

2.不规范汉字——是与规范汉字相对的,包括已被简化的繁体字、已经被废除的异体字、已经被废弃的“二简字”,和乱造的不规范的简体字、错别字以及方言用字。

二、从现代汉字形、音、义的关系来看

文字的载体是它的形,文字的内涵是它的声音和意义。现代汉字是音、形、义的统一体,但三者关系错综复杂,从这个角度考察现代汉字的分类,有以下几种情况:

(一)从同一个字形的角度分析

1.单音单义字(也叫单义字)——即一形对一音、一义。 现代汉字中这样的字多半不是常用字,而是专用字或较冷僻的字。如:“詈—lì” “耨—nòu”“耍—shuǎ” “甩—shuǎi” “您—nín”

2.一音多义字——即一形一音对多义。如:幂:①覆盖东西的巾;覆盖、遮盖。幂首、幂篱;幂历。②表示一个数字自乘若干次的形式。乘幂、幂零、幂级数。派:① 一个系统的分支。流派、派别、派生;②作风,风度。正派、气派、派头;③分配、指定。派遣、分派;④一种西式的带馅点心。苹果派、巧克力派。黑:①颜色跟“白”相对。黑布;②光线不足。天黑、屋里太黑;③秘密的,隐蔽的。黑活、黑书;④恶毒。黑心。

3.多音多义字(也叫多音字)——即一形对多音多义。如:量—liáng,动词;liàng,名词。/ 宿—sù,动词;xiǔ,量词;xiù,名词;/ 差—chà,形容词;chā,副词; chāi,动词;cī,参cēn差。/和—hé,名词;和平,连词,你和我;hè动词,唱和;huó,动词,和面;huò,动词,和稀泥,量词,选项了两积,hú,麻将和了。

4.异读字——即一形、一义对多音。不同读音之间没有语义和语用差别,完全是不同的读音习惯所致。如:“械”有xiè和jiè两种读法,经过审音,统读为xiè。异读字原则上应该统读,但对于少数文白异读则采取了灵活的态度。例如:“熟”有两个读音(shóu、shú)前者是白读音,后者是文读音。在“熟悉”、“成熟”、“熟练”中读文读音,在“葡萄熟了”、“我和他不熟”中读白读音。

(二)从同一个字音角度分析

1.同音字——广义的同音字指一音异形数义字。如:(zhāng)—张、章、彰、樟。狭义的同音字指同音同形异义字,如:打(动词)—打(介词)、花(花朵)—花(花费);

2.异体字(也叫异形字)——即一音、一义对数形。不同字形之间没有任何音义差别。如“鞍—鞌”、“采—寀、採”“杯—盃、桮”、“刨—鉋、鑤”、“窗—窓、窻、牕、牎”等,直线前的字形属于规范字形,直线后的字形都属于汉字整理的对象。

(三)从字义角度分析

1.同义字——字音、字形都不同,但意义相同或相近的一组字。如“巨—大”、“喜—悦”、“朋—友”、“明—亮”、“道—路”、“打—击”、“语—言”等。

2.反义字——字音、字形都不同,但意义相反或相对的一组字。如“出—纳”、“深—浅”、“好—恶”、“呼—吸”、“缓—急”、“开—关”、“反—正”、“生—死”、“始—终”、“是—非”等。

另外,仅从字形的演变看还有繁体字、简化字——即一为笔画较多的字,一为笔画较少的字,字音和字义都相同。如“礙—碍”、“骯—肮”、“襖—袄”。大陆现在使用的都是简体字,只有在一些特殊场合才使用繁体字。

三、从现代汉字的使用频率来看

汉字的字频是指在一定历史时期内经抽样取得的文字资料里,每一个汉字的使用次数与抽样资料总字数的比例。每个汉字都有其使用的频度,而根据字频和使用度,一般把现代汉字分为通用字、常用字和罕用字三类。

(一)现代汉字通用字

通用字——是指书写现代汉语一般要使用的字,包括出版印刷、辞书编撰、信息处理以及教育用字。它不包括特定范围使用的专用字和罕用的生僻字。

1.现代汉字通用字的数量。动态上看,实际使用的汉字在不同的时代基本上稳定在一定的数量上。这是因为,一是新字在不断产生,旧字也在不断退出历史舞台,二者相抵,字数的变化就不大了;二是时代越晚,新词增加得越快,由于复合词在汉语里越来越占优势,音译外来词又大多用假借字来记录,因此需要为它们造新字的新词并不是越来越多,所以一般使用的汉字数量就稳定在一定的数量上了。据有关资料统计,从古代到现代,一般使用的汉字数量在五六千左右。现代制订的具有通用字表性质的汉字标准,基本上维持或略微超过这一数目。如1955年《通用学表(初稿)》收字5709个,1965年《印刷通用汉字字形录》收字6196个。1981年国家标准局发布《信息交换用汉字编码字符集》(基本集)收字6763个。1983年,标准电码本收字7292个。中小学语文课本中的汉字数有5600个。从上述收字量来看,现代通用汉字的数量大约有六七千字。这个数量基本上反映了我国当前通用汉字的大致情况。

2.《现代汉语通用字表》。为了进一步满足出版印刷、信息处理以及其他方面的用字需要,为了促进语言文字规范化,国家语言文字工作委员会和新闻出版署于1988年3月联合发布了《现代汉语通用字表》。《现代汉语通用字表》的收字量确定为7000个,它是以《印刷通用汉字字形表》为基础,经过科学的测定、计量和研究并参考了国家标准局颁布的《信息交换用汉字编码字符集<基本集>》制定的,其中包括《现代汉语常用字表》中的3 500个汉字。 《现代汉语通用字表》及原来的《印刷通用汉字字形表》的规范性作用主要有:对表中每个汉字的结构、笔画数、笔顺进行了规范;对现代汉字字形进行了规范;对现代汉语书面语的基本用字量进行了规范。为识字教学、编制笔画索引和汉字信息处理工作提供了便利。《现代汉语通用字表》是一份很有实用价值的规范字表,为推动全社会规范地进行现代汉字的使用和教学做出了很大的贡献。

2006年开始教育部和国家语委每年发布年度语言生活状况报告。报告数据证明,随着语言的发展,现在掌握1万多词条、900多个汉字,就可以阅读90%左右的汉语出版物。

(二)现代汉字常用字

常用字——是指经常要用到的字,也就是频度和使用度高的字,根据使用的程度分为一级常用字、二级常用字等。常用字主要是识字教学用字。常用字包括在通用字之中。

1.现代汉字常用字的字量。汉字总数虽然多达几万,但是常用字却不算太多,据统计,许多古今中外名著用到不同单字不过是两三千字。见先秦经书和子书所用单字数、现代著作所用单字数的柱状图:

尽管这些著作用到的具体的单字并不完全相同,但是相同部分占有很大的比例。这些相同的部分构成了现代的常用字,这就说明人们写作时经常使用的汉字字种数是很有限的。这反映了文艺作品中的用字情况。有关部门根据文艺作品、新闻通讯和杂志、口语材料、自然科学管理和技术、社会科学和哲学五个方面的材料作了抽样统计,发现现代汉语用字比较集中,而且有如下规律,最高频1000字的覆盖率大约90%,以后每增加1400字大约提高覆盖率十分之一,这叫做汉字效用递减率。表示如下:

字种数增加字数合计字数覆盖率%欠缺率%1000100090101000+1400=24009912400+1400=380099.90.13800+1400=520099.990.015200+1400=660099.9990.001

这个规律是:最高频1000字的覆盖率大约是90%,以后每增加1400字大约提高覆盖率十分之一。也就是说,如果一个人掌握了出现频率较高的1000字,那么,它们就能覆盖一般书报中90%的字,若要掌握了3800字,就能覆盖99.9%的字。这说明汉字常用字非常集中。当字频统计6600以后的字,无论有多少字种数,总的覆盖率不超过0.001%。对于现代汉语来说,6600个汉字在一般出版物中的覆盖率是99.999%,此外不论多少汉字的作用只有十万分之一了。这个规律对汉字的定量有很大的启示作用。

2.《现代汉语常用字表》。国家语言文字工作委员会和国家教育委员会于1986年1月26日联合发布了《现代汉语常用字表》,收常用字3500个。分为两级,一级常用字(常用字)2500个,二级常用字(次常用字)1000个。《现代汉语常用字表》的研制从过程到结果的科学性得到了验证。统计研究表明,汉字的常用字和非常用字的使用频率差别很大,在常用的1500个汉字的使用频率统计中,发现占全部出版物及日常用字的95.898%,次常用的1500个字占3.699%,不常用的2991个汉字仅占0.4%。由此可见,人们只要掌握了这3000—3500个常用汉字,读书看报,满足日常用字需求是没有问题的。常用性、能产性、稳定性、简易性是现代汉字常用字的特点。《现代汉语常用字表》的研制,是当时条件下的一项重要成果。字表收字以字频统计为主要依据,参与字频统计材料的范围大、类别全、抽样均衡,保证了统计的科学性,最大程度地反映了汉字常用字的实际状态。

总的来说,《现代汉语通用字表》和《现代汉语常用字表》经过时间的考验和实践应用的检验,表现出了较高的稳定性和适用性,但是由于现代社会迅速发展,在有些地方跟现在的用字实际存在出入,这就需要修订。在修订字表时应该综合考虑多种因素,包括构字能力和构词能力、构字能力和构词能力的计算方法以及它们与流通度、通用度、频度的关系等等,并且所有这些工作应该建立在数据驱动的基础上,而不是人为的主观分析。另外,在高速发展的信息社会,字表的适用性越来越重要,可利用大规模的动态语料库对语言运用的跟踪与检测来实现字表调整和修改的适用性问题。当然字表的稳定性和权威性是重要属性,因为字表在语文教学、对外汉语教学、辞书编纂以及汉字处理和信息处理方面都有着至关重要的作用。

(三)现代汉字罕用字

罕用字——与通用字相对的是罕用字,也就是频度和使用度都很低的字。全部现代汉字除去通用字就是罕用字,其中大部分是生僻的专业用字。包括特定行业(专业)用字和特定领域的教育用字。

1.特定行业(专业)用字分类

按照意义、行业(专业)不同,分为6类:

(1)文言色彩字:多由古汉语用字发展来,多用于书面:迨、齑、薨、恪

(2)方言色彩字:馍、啥、旮、旯

(3)人名地名用字:姓氏用字有两类:一般用字充当的,如“王、张、周、黄”;专作姓氏字,如“刘、赵、冯、廖、谭”。有些字专作名字用,如“鑫、娜、骞、熹、钊、琛”,其中有些专作女性名用,有些专作男性名用。地名用字包括山、水、县、乡、村名用字,如“邯、郸、濮、岷、堡、泾、郢”。

(4)古代名物用字:历史名词、古代器物、古代典章制度等,如“杞、簋、卣、朕”。

(5)科技用字:化学用字:“钾、氯、酶、酯”;动植物名称:“狮、蜥、蜴、豹、蚂、蚁、苔、藓、茴、芫、荽”等;其他学科:幂、腺、癌。

(6)民族宗教用字:訇、傣、佤、稣、彝、馕

2.特定领域的教育用字

(1)扫盲用字表。1991年国家语委语用所开始研制《扫盲用字表》。该字表收字2000,分甲乙两表。甲表收学字1800,乙表收参考字200。据统计,2000字累积频率达97.273%。(周晓文、王晓明《梳理统计方法在汉字规范中的应用》,《语言文字应用》2008年第2期)此比例看作是当前使用的一般书刊用字的覆盖率。

(2)对外汉语教学用字表。1991年国家汉办汉语水平考试部与北语汉语水平考试中心联合研制了《汉语水平 词汇与汉字等级大纲》。《大纲》是汉语水平考试的依据,也是对外汉语教学总体设计、教材编写、教学、测试等的依据。汉字大纲收字2905字,分为四级:甲级字800个;乙级字804个;丙级字601个;丁级字700个。其中有2485字是《常用字表》中的一级常用字。

(3)基础教育用字表(研制中)。

通用字之外还有一部分专用字,因此通用字的数量确定后,还要研究各种专业用字的字量,并根据专业的门类制订各种专用字表。专业用字可分为姓名专用字、史地专用字、科技专用字、宗教专用字、民族专用字、译音专用字、方言专用字等。制订现代汉字的各种专业用字表,合理控制专业用字的数量,将是语言文字工作者今后一个相当重要的任务。

参考文献:

[1]周有光著.周有光语言学论文集[M].北京:商务印书馆,2004.

[2]高家莺等.现代汉字学[M].北京:高等教育出版社,1993.

[3]苏培成.现代汉字学纲要[M].北京:北京大学出版社,2001.

猜你喜欢

常用字用字记号
容易混淆的词语
《汉语大字典》“人名用字”考误举隅
记号
科技论文表格的编排要求(五):用线和用字
关于常用字覆盖率统计算法的研究
脏记号
墙上的记号
辽代避讳用字“元”
谈常用字词的选取及其等级划分
塔克拉玛干的记号