APP下载

东南亚主要华文媒体非通用汉字的类型研究①

2013-10-13徐新伟张述娟

华文教学与研究 2013年1期
关键词:异体字用字华文

徐新伟,张述娟

(1.2.暨南大学华文学院,广东,广州 510610)

1.非通用汉字概说

汉语在国际化,域外汉语可以看作是一种新兴方言,但是这种方言与过去的其他方言不同。汉语原有的方言大多没有书面语,因此它们的传播和发展受到一定的限制,而今天的域外汉语大多有自己的传播媒体。华文网页、华文网站对不同华社之间的沟通都会产生积极的影响。

《现代汉语通用字形表》 (以下简称 《通用字形表》)发布已经有几十年的历史了,它基本上反映了我国当时的书面用字实际,基本满足了当时出版印刷要求,对推动我国语言文字走向规范化具有深远的意义。然而语言是动态发展的,从历时层面来看,它存在以下局限性: (1)收字不全,尤其是姓氏取名用字、地名用字和方言常用字; (2)通用汉字字形代表字不规范,如 “新”,左下所从为 “木”, 而非 “朩”; (3)汉字简化方面哪些可以类推、哪些不能类推存在混乱。通用字形的改变会影响人们的交际, 《通用字形表》字种的增减、字形的改变要顺应历史潮流,合乎国家需要,满足人民的渴望。确立标准并非一己之力,所以在没有更成熟的标准的前提下,我们暂以现行的大陆 《通用字形表》为依据确立非通用汉字的标准。

本次调查的主要华文媒体语料仅限于较有代表性的新加坡、马来西亚、泰国的主要华文媒体的语料②东南亚华文媒体语料网络访问地址:http: //www.globalhuayu.com/corpus.htm,对暨南大学海外华语研究中心的帮助表示衷心感谢。。 《东南亚汉字字种表》字种共计8778个, 《通用字形表》单字字种8300个,本文立足于大陆 《现代汉语通用字形表》中规定的汉字,非通用汉字指没有出现在《现代汉语通用字形表》中的汉字。通过数据库查询不匹配项目,我们发现两者不匹配的汉字字种为2149个③刘华 (2011)得出的非通用的汉字是2109个。。

为什么选择2149个非通用汉字作为分析的对象呢?通用汉字和通用汉语类似,它们是语言中稳固坚实的核心部分,在域外汉语中变异比较小,非通用汉字作为较特殊的部分,能更清楚地发现汉字在域外的变异;大型字典、词典中所收的字很多都意义未详,通过梳理这些语言中的 “活化石”,能对大型字典、词典的个别义项作有益的补充;域外的异体字体现了汉字传播和发展过程中的流变,对汉字的断代也是非常有价值的材料;华文测试等汉字大纲的设定也有赖于非通用汉字和通用汉字的深入研究;其研究结果亦对华文教材的编写有着指导作用。

2.非通用汉字的类型分析

2149个非通用单字字种包括41个日本汉字、6个南方方言字,149个别字,以及与大陆异体字关系的243组和与大陆繁简字关系的1198组。

2.1 日本汉字

41个日本汉字又可以分为两类,一类是日本和字 (10个),一类是日本简体汉字 (31个)。

2.1.1 日本和字

和字是日造汉字。在唐朝时期,大量的中国汉字传入日本以后,日本民族在借用中国汉字的基础上自己又创造了一些方块字,日本自称和字 (或国字),和字有时候也指日文假名。日本和字共计10个,这10个和字主要是人名和地名用字,在 《汉语大词典》中其义项显示未详或者没有解释。10个日本和字如下:

辻 人名字

畑 人名字

俤 人名字

彅 人名字 (如:草彅刚),义未详

椛 椛园=花园

榊 人名字

蛯 人名字

栃 地名字

笹 人名字 (如:笹川尧),义未详

挘 挘开大嘴=咧开大嘴

笹,在东南亚语料库中用为人名或地名,人名如 “笹川尧”、 “笹井芳树”, “笹川”和 “笹井”为日本地名。笹川尧 (1935-),是日本的政治家,担任自由民主党总务会长及自由民主党群马县联合会会长,原众议院议员,日本船舶振兴会创办者笹川良一的次子。 《汉语大词典》中未收 “笹” 义项,《新华字典》认为是 “屉”的异体字。笹,日语中本音读 “sasa”,义项为 “祭祀时用来参拜愿望用小竹、细竹”。

传世文献中没有 “笹”和 “屉”异体关系的材料明证。 “笹”,甲骨文中已见该字,辞例 “贞令卢笹”, 《殷周金文集成》中“用笹享孝”,金文中用为 “世”字。 《生冷僻字汇编》 (《Unicode大字典》之一)中其义项为: “矮竹”。 王桐龄 (1936b)在 《水户观梅记》中有一段记载: “园内有古梅数千株,多烈公时所栽。其西南隅有竹数千竿,松杉各数百株,备高逾五丈。下有业生,宽扁叶,似竹,似芦之草,日语名笹”。最后一句是 “笹”的结论。因此, 《汉语大词典》中除应指出 “笹”为日本和字外,其义项当有如下补充: “①用为 “世”字;②似竹的一种植物。” 《新华字典》认为是 “屉”的异体字是一种错误。

椛, 《汉语大词典》和 《新华字典》都认为是一个日本和字,且读音为huā。 《新华字典》释义 “椛岛”,在岩手县和长崎县。日本地名用字。 《Unicode字典》 (下编)认为其意义为 “红叶,桦树”。王桐龄 (1936a)指出: “椛,枫红叶”。在东南亚华文媒体中“椛园”即 “花园”,有可能音近而误。

挘, 《汉语大词典》认为是日本和字,《新华字典》认为是韩国汉字 “裂”,传统的字书均未见该字。王桐龄 (1936a)指出 “挘,拔下,抓起”。在东南亚媒体语料中, “挘开大嘴”即 “咧开大嘴”。

类似于 “椛园” 写成 “花园”, “挘开大嘴”写成 “咧开大嘴”这些情况的原因是:第一,作为网络报刊,音同而误在所难免;第二,汉字文化圈内,汉字的使用标准和规范不一致。

2.1.2 日本简体汉字

1946年日本内阁公布了 《当用汉字表》,收字1850个,其中除了有131个是简体汉字(即为一般民间流行常用的笔画简化字,日本称为略字),其余汉字为传统正体汉字 (未简化汉字)。这131个略字与中国简体字相同的有53个,差不多相同的有9个,这些略字在出版物中限制使用。

由于 《当用汉字表》存在一些问题,于是日本内阁在1981年公布 《常用汉字表》(1945字)后,废止了当用汉字。这算是 “汉字限用”与 “简化政策”的缓和化。此外,他们还公布了 《人名用汉字表》,其中包含数百个仅用于人名中的汉字。日本 《常用汉字表》公布了356个简体字;日本 《人名用汉字表》公布了11个简体字;日本 《表外汉字字体表》公布了22个简体字。综合上面3个字表得知,日本的简化字总数不到400字。以下为东南亚非通用汉字中日本用简体汉字。31个日本简体汉字如下 (左为日本简体汉字):

塩 “鹽”, 人名

曽 “曾”,曽荫权=曾荫权

増 “增”,増加=增加

様 “樣”,多様化=多样化

厳 “嚴”,地名,厳岛=严岛

荘 “莊”,康荘=康庄

験 “驗”,经験=经验

歳 “歲”, 歳 = 岁

剰 “剩”

穣 “穰”, 人名

権 “權”,霸権=霸权

売 “賣”, 人名

経 “經”,圣経=圣经

撃 “擊”,攻撃=攻击

帯 “帶”

変 “變”

隠 “隱”,隠私=隐私

渉 “涉”,义未详。渉嫌=涉嫌

舎 “舍”,舎本地员工而聘外劳=舍本地员工

穂 “穗”, 人名。

転 “轉”,名词,展転株式会社=展转株式会社

勲 “勳”,勲=勋,勲衔=勋衔

実 “實”,実施=实施

渋 “澁 (涩)”, 东京地名

巻 “卷”

満 “滿”

両 “两”

継 “繼”

読 “讀”

巣 “巢”

抜 “拔”,自抜=自拔

2.2 方言用字

中国的 “语”和 “文”脱节。在书写体系上,南方方言往往牵就使用以北方话为基础的白话文,这就是汉语中的 “牵南就北”现象。粤语、吴语和闽南语等方言也有一些各自特有的汉字,东南亚因其地缘关系,因此华文媒体中也存在不少方言用字。此次调查非通用汉字共发现6个方言用字,这些用字也是韩文吏读字。至于这6个方言用字与韩文吏读字的关系在以后的研究中我们将继续讨论。6个方言字如下:

啲,在语料中有两个用法:①店名(“GOD”,音译 “住好啲”,家具产品的音译词);②啲 =的,曾荫权笑言: “饮完今天这批贵酒以后,希望下星期以后啲酒会平些”。似暗示减酒税有望。 “啲”在粤语方言中还有两个用法:①表数量,若干:畀~钱佢 (给他些钱); ②方言,少许;一点 (大致有个确定数量):落 ~胡椒粉 (洒点胡椒面)。

畓,地名。闽南人说的 “沓田仔”,指的是低洼的湿地,相似地貌在不同方言有不同的叫法。畓,为闽语方言用字。如: “畓田仔警局”。

裇,裇衫,借自英语shirt。裇即 “恤”。裇衫在粤语广州话中读为ʃøt53ʃam53,在闽语中读为 suk5sa213。 “T裇衫” = “T恤衫”, 《汉语大字典》中未收该字, “裇”可能是受到衫字意义的影响而更换义符的别字。

筽, “大懵,粪桶,长枪背勿动,子弹打勿出,摸摸股臀头筽是血”,为赣方言童谣。筽可能为赣方言用字。东南亚语料例句 “筽年选举,眼看败局已定。” 《新华字典》:“筽”,竹名,可制笔。据此义例句意义不通。筽当为 “期jī”。义项为 “一周年; 一整月”。文言文中的例子: “不期年,千里之马至者三” (不到一年,就得到了三匹千里马);“期年之后,虽欲言,无可进者” (一年以后,即使有人想进言,也没有什么可进谏的了)。 “筽”可能与 “箕”形近似而误写。

啱,东南亚语料例: “呢段时间,系最脆弱嘅时候,佢嚟特击搜查系好唔啱。”唔,方言,不。啱 yán,方言,其意义 “合;合适”。呢种款式 ~心水 (这种款式合她的心意)。我讲两句,唔知~唔~(我说两句,不知道合适不合适)。 “啱”在粤语方言中意思大致是“对,行,恰好,刚”等。如:对;行;可以:你讲得 ~(你说得对)。~啦 (行,可以)。 恰巧;刚好:佢 ~撞到个老友 (他恰巧碰到一个老朋友)。 才;刚:~食完饭 (刚吃完饭)。

踎,①方言,蹲:佢哋习惯~往食嘅(他们习惯蹲着吃)。 ②方言 (在某处)混日子,找生活:呢排系边度~(这段在哪混)?“踎”在这里是混日子的意思,字形上写成韩文吏读字其实也是一个方言字。

2.3 异体字

异体字整理是延续多年的一个复杂问题。学术层面与应用层面的认识有所不同。

对异体字的定义:

A.“异体字就是彼此音义相同而外形不同的字。” (裘锡圭,1988:205)

B.“异体字指汉字通常写法之外的一种写法,也称或体。” (《中国大百科全书·语言文字卷》)

C.“异体字是跟规定的正体字同音同义而写法不同的字。” (《现代汉语词典》)

裘锡圭 (1988)则进一步提出了广狭之分,他在 《文字学概要》中指出: “异体字就是彼此音义相同而外形不同的字。严格地说,只有用法完全相同的字,也就是一字的异体,才能称为异体字。但是一般所说的异体字往往包括只有部分用法相同的字。严格意义的异体字可以成为狭义异体字,部分用法相同的字可以成为部分异体字,二者合在一起就是广义的异体字。李国英 (2007)从构形和功能两个方面给异体字下了定义: “异体字必须同时满足构形和功能两个方面的条件,两个条件缺一不可。构形方面的条件,不仅可以揭示异体字的形体特征,而且可以把异体字和通假字区别开来。功能的条件则可以把异体字和分化字区别开来。”这种定义兼顾构形和功能两个方面,并且还指出了应与通假字、分化字相互区别,比较全面和准确。

从学术的角度判读一个字是不是异体字相当严苛,然而应用层面碰到的一个问题是很多汉字是多音多义字, “或体”的意义是“正体” 的部分, 如 “崐” 亦作 “ 崑”。“昆”的古字。其义:① “崑崙”的省称。②指昆山县 (今属江苏省 )。③ 指西昆体。④高。 《后汉书·荀爽传》: “察法于地,则崐山象夫,卑泽象妻。” 李贤注: “崐,猶高也。”关于第4个义项, “昆”是不具备的,“昆”在 《汉语大词典》中也是个多音字,即可以同 “崐”,亦可以通 “混”。因而 “崐” 和“昆”不能看作是 “音同义同”的 “或体”关系。因此要从学术层面判断异体字,需要廓清一个字的源流,明白字的全部读音和全部意义,否则容易出现 “包容异体字” (两个或者几个汉字在某一意义或者用法上是可以互换的)。所以分清学术层面和应用层面是处理东南亚非通用汉字异体字的关键。

对异体字的处理,我们参考了3个方面的材料:一是国家有关部门颁布的 《异体字表》(如中华人民共和国文化部、中国文字改革委员会1955年发布的 “第一批异体字整理表”);二是大型字典作为附录的 《异体字表》(如 《汉语大字典》附录 《异体字表》);三是语言文字学概论类书籍中举例式的异体字概念演绎。共得出异体字243组。 (详见下页。)

2.4 错别字

现在的报刊书籍,大多采用微机输入,电脑制版,过去那些因笔形写错、位置换移等错字大为减少。东南亚错别字的类型主要是形体近似而误和音同而误。个别错别字反映了东南亚华人在汉字上的认知。

如:衪们=他们。衪,裳裙下端的边缘。故字从衣。 《汉书·司马相如传上》: “揚衪戌削。” 王先谦补注: “‘衪’ 《史记》、 《文选》並作 ‘袘’。”一说为衣袖。

祂, 《汉语大字典》中义未详。 《新华字典》称上帝、耶稣或神的第三人称代词,也就是 “他”。 看来媒体是将 “衪”、 “祂”、“他”三者等同了。衪”与 “祂”形体近似而误。表示 “上帝、耶稣或神”的第三人称代词怎么写成了 “他”呢?甲骨文本作 “示”,象祭台形。 “示”是汉字的一个部首,其义多与祭祀、礼仪有关,如:神、祈等。上帝、耶稣或神多是我们祭祀、崇拜、祈福的对象,因此,将 “祂”替代了 “他”,又因与 “衪”形近似而误写。

困睠 =困倦。睠,同眷,形声。本义:回头看,顾念,爱恋。困了自然先反应在眼睛上,所以就选了义符 “目”。音近而误。

欮,东南亚语料库例句: “按阴阳学说,每个月的欮望 (即初一与十五)均为阴阳交感的日子,而月圆的望日则是阴气最盛的一天。” “欮”通 “蹶”,跌倒;挫折。马王堆汉墓帛书乙本 《老子·德经》: “侯王毋已贵以高将恐欮。”今本 《老子》作 “侯王无以贵高将恐蹶”。 “欮”字典义项:①跌倒;挫折。②欮,气逆病。

朔:月相名。旧历每月初一,月球运行到地球和太阳之间,和太阳同时出没,地球上看不到月光的月相。 《说文·月部》: “朔,月一日始苏也。” 《后汉书·律历志下》: “日月相推,日舒月速,当其同所,谓之合朔。” 晋郭璞《游仙诗》之七: “晦朔如循环,月盈已见魄。”

语料库中表示 “初一”应是 “朔”而非“欮”。语料库中其他别字如下:

3.结语

本文研究的语料仅限于较有代表性的新加坡、马来西亚、泰国的主要华文媒体的语料,因此存在一定的局限性。作为网络媒体的语料也没有达到出版的要求,因此可能一定程度上影响着统计的字种数,但正是由于没有经过规范化处理,所以这些媒体语料较好地保留了域外文字的使用特点,真实地反映了汉字在使用和传播过程中的变异。此次研究的非通用字种的数量达到2149个,个别网络语料的乱码相对于整个字种量来说影响还是比较有限的。

海外华社的情况千差万别。不同国家的华社因形成时代、人口数量、所处环境、社会经济、政治、地位等的不同,对汉语的态度也不同。这些都影响到相关华社的语言面貌。

汉语有域内域外之分,既然汉语在国际化,那么,汉语必须进一步丰富自己。我们过去已经指出,普通话要以方言为源泉。我们很难想像一个世界性的汉语而不通过它在世界各地的变体来丰富自己。因此,我们还要思考:

(1)汉字是否要规范?这种规范是域内的规范,还是域内规范 (规范是一种强制关系)域外协调 (几乎是平等的条件下展开)?这其中既会有国际关系问题,也会有语言政策问题,还会有敏感的民族问题和宗教问题。

(2)字库字符集如何规范完善? 《通用字表》在 《字符集·基本集》8年后才姗姗来迟。21世纪初,GBK大字库出版了,现在,扩展A、扩展B、扩展C均已出版,宋体方正超大字符能显示六万多汉字,我们的规范汉字有多少,是哪些?如果不加规范,如何保证字符集内 “字”的唯一性?如何实现数字化时代的检索?

郭 熙 2002 域内外汉语协调问题刍议 [J].语言文字应用(3):33-37.

———2006论华语视角下的中国语言规划 [J].语文研究(1):13-17.

何华珍 2003 日本简体字探源[J].语言研究(4):88-91.

李国英 2007 异体字的定义与类型[J].北京师范大学学报(社会科学版)(3):46-50.

刘 华 2010 东南亚主要华文媒体用字情况调查[J].华文教学与研究(1):16-23.

———2011东南亚主要华文媒体非通用汉字使用情况调查研究 [J].华文教学与研究(1):1-5.

罗竹风 1989 汉语大词典[Z].上海:汉语大词典出版社.

裘锡圭 1988 文字学概要[M].北京:商务印书馆.

邵文利,杜丽荣 2005 中日韩常用汉字规范异同考[J].学术界(5):135-139.

徐中舒 1991 汉语大字典(缩印本)[Z].武汉:湖北辞书出版社,成都:四川辞书出版社(联合出版).

王宏源 2008 Unicode字典 (经部集成.小学类)[Z].电子版网址:http: //www.hytung.cn /Default.aspx.

———2008生冷僻字汇编[Z].北京:社会科学文献出版社.

王桐龄 1936a 留学生之日语问题[N].近代报刊·L.ㄌ·留东学报: V.1,No.2_3(合刊)

———1936b水户观梅记[N].近代报刊·L.ㄌ·留东学报: V.2,No.5.

张国强 2001 关于工具书数字化发展趋势的几点思考 [J].辞书研究(3):20-28.

中国大百科全书总编辑委员会(编)1988 中国大百科全书·语言文字卷[Z].北京:中国大百科全书出版社.

中国社会科学院考古研究所(编)1990 殷周金文集成[Z].北京:中华书局.

中国社会科学院语言研究所词典编辑室(编)2005现代汉语词典[Z].北京:商务印书馆.

中国语言研究所(编)1993 新华字典[Z].北京:商务印书馆.

朱 城 2004 《汉语大字典》单字释义小议 [J].语文研究(4):44-46 .

猜你喜欢

异体字用字华文
“和而不同”的华文教育
容易混淆的词语
异体字字形类似偏旁的互用类型综合字图构建
《汉语大字典》“人名用字”考误举隅
科技论文表格的编排要求(五):用线和用字
偏旁省略异体字研究
常用隶书异体字表(二)
华文教育中的汉字文化教育
《音同》中的异体字与讹体字
华文智慧教学探索