方块壮字的性质与特点
2022-06-20林亦
林 亦
(广西大学文学院,广西南宁530004)
一、方块壮字的性质
(一)方块壮字是语言接触的产物
与古代中国对周边国家的语言文化影响不同,壮族是中华民族大家庭之中的一员,壮汉接触是地缘的接触、民族的交融、语言的融合。方块壮字又被称为“古壮字”,是相对于现代新创的拼音壮文而言的壮字,是语言接触的产物,其语言接触涉及方块壮字产生的时代背景和条件。
1.移民改变了岭南的人口格局,带来了中原的华夏文明
岭南本为百越故地,中原汉族大量移民岭南,并逐渐成为当地主流民系,移民时间当在唐宋,尤其是宋以后。虽然安史之乱后南方人口数已多于北方,但唐元和年间,大面积人口密集区是在淮河以南和江南一带,这里拥有全国1/3的人口,其中江南道人口的增长以江西和福建为最。“岭南在唐时经济和文化相当落后,被中原人认为是‘炎蒸结作虫虺毒’,不甚适宜居住的瘴疠之地。”“在安史之乱和藩镇割据这两个阶段,迁入岭南的北方移民人数更少,在当地的影响极其有限。到了唐末,具有一定规模的移民潮始冲击到岭南。”[1]324即便是广东地区,移民也并不多。明叶盛的《水东日记·卷十四》有载:“广东人言其地有宋坟无唐坟,盖自宋南渡后衣冠冢多流落至此,始变其族事丧葬也。”“两宋之际和南宋末迁入广东的氏族最多。”[2]406“直到明清时期,岭南的经济面貌才有根本的改观,唐末五代只有某些交通较为方便的州府有一定的发展,广大地区仍相对原始。”[1]369由于广西腹地许多地区地理环境恶劣,历史上多属“为声教不被”的蛮荒之地,大小官吏更视为畏途。能给“负山险阻”的广西中西部地区带来汉语方言的群体主要是唐宋时期的军事移民,尤其是宋代以后南征或屯戍的军事移民。“从粤语与中古汉语的密切关系来看,粤语的最后形成就有唐宋时期大量北方移民的背景。”[3]106宋代因北方辽金的侵袭,大量汉人南下广东避难。“据北宋《元丰九域志》记载,客户占广东总户口的39%。不少州的客户数高于主户数。如南思州客户占78%、雷州占70%、广州和端州各占55%、梅州占52%。广东全境总户数为584 284户,为唐代的2.7倍。在全国的人口比重也由唐代的2.2%增至3.5%。看来正是宋代大量北方移民带来的北方方言最后奠定了粤语的基础。”[3]106军事移民具有移民人数和移民时间相对集中且移民过程短(中途不停留)的特点,这是保持原有方言的必要条件。“广西是南宋人口增长最快的路,北宋神宗元丰三年(1080年)为242 109户,南宋宁宗嘉定十六年(1223年)为528 229户,后者较前者增加118%。同期户数有所增加的南方各路,上升幅度分别在3.4%—5.6%,皆不及广西路。”[2]206广西至今罕有发现唐宋时期的墓葬,广西中西部地区可信的汉族移民记载,就连旧方志和家谱族谱都明确为宋代以后。明清后更有大量移民从北部、东部进入广西。
2.教育是壮字产生的必要条件,壮族自古有语无文,谈不上本族教育
中原汉族移民的南迁,带来语言的同时,也带来了汉族的文化教育。广西的书院教育始于南宋,且分布在桂北、桂东这些汉族集中的地区。明清后,书院、学塾教育才逐渐进入桂西壮族聚居区。壮族地区的教育纳入中央王朝的国民教育体系,壮族人识的是汉字,读的是汉文典籍,参加朝廷的科举考试。懂汉语、识汉字的壮族人,他们的双语背景加上从汉语大量借词的基础条件,共同成就了对多姿多彩的方块壮字的创造。
3.记录壮语的长篇语料的出现,是方块壮字成为本族文字体系的标志
“文字不是孤立的字符,它的总体是成系统的,是按一定的区别原则和组构手段结合而形成的体系。”[4]20文字既然是记录语言的符号系统,对“方块壮字”的判定需要满足两个条件:一是有记录壮语的长篇语料,即文献;二是成系统,即字符有一定的构形规律(造字方式),哪怕异体字众多,但构形模式可以满足绝大多数字符。
真正用于记录壮语长篇语料的方块字才能称为“壮字”。由于方块壮字文献有年代记录的很少见,不少抄本的年代是据书写者、流传者的辈分推断的,因此,方块壮字产生的确切时代难以断定。多数学者比较接受方块壮字产生于唐代的观点,很重要的理由是,认为广西上林县发现的唐碑《澄洲无虞县清泰乡都万里六合坚固大宅颂》(682年)碑文中个别与壮字同形的字符是最早的方块壮字实物。这一结论值得商榷:首先,碑文用汉语写成,是壮族人写的汉语;其次,碑文中个别与方块壮字同形的字符,不仅在《龙龛手镜》中有收录,也与广西汉语方言俗字重合。覃晓航认为:“方块壮字产生于秦汉,发展于南北朝,流行于两宋,兴盛于明清,延续到现代。”[5]61壮字有如此漫长的发展历史,与其“借源”的身份不符。
宋代后一些汉族文献已有关于广西境土俗字的记载,自范成大的《桂海虞衡志》、庄禅的《鸡肋篇》、周去非的《岭外代答》到清代沈日霖的《粤西琐记》,所记几同。足见其风尚之流存,孳乳之繁衍。但所举字例多为会意字(无音字),难以作为壮字的确证。“惟性质上言之,此诸字者,皆为晚期之会意,与《龙龛手镜》以下诸书所收者略同。又所表现者仍皆为汉语,故不长则曰矮,门坐则曰稳。”[6]
历史上的方块壮字为民间用字,主要用于以下几方面:抄写宗教典籍,如壮族麽经、师公道公经书、鸡卜经的抄写等;进行民间文学创作,如民歌山歌、神话传说、壮剧剧本的创作等;用于谱牒、契约、楹联、碑刻、乡规民约、地名的记写等。前两种就是长篇语料。例见图1。
系统的方块壮字文献主要出现在明清时代。清代是方块壮字的盛行期,流行区域遍及各壮族聚居地。这一时期与前面所说的国民教育在壮族地区推行的时代相吻合。目前少数民族古籍办搜集的壮字文献没有明代的记录。北京故宫博物院图书馆藏有广西境内的“华夷译语”共三种,为《广西庆远土司译语》《广西太平土司译语》《广西镇安土司译语》(各一册),为清乾隆十三年至十五年(1748—1750年)期间对当地壮语的采集记录,当中的“土文”就是方块壮字。《壮族麽经布洛陀影印译注》(2004年出版)收录的最早文献及覃晓航《方块壮字研究》附录中的壮字文献均为清代抄本。另外有广西河池宜州区安马乡古育村的廖士宽墓,其墓门所刊刻的墓主生前撰写的五言勒脚体壮歌15首共120行、600字,刻于清道光十一年(1831年),为目前所见到的内容最多的方块壮字碑刻资料,见图2。故保守地说,方块壮字成为记录壮语的符号系统不应早于宋代。
图2 广西河池宜州区安马乡古育村廖士宽墓墓门刊刻的五言壮歌方块壮字
《古壮字字典》(1989年出版)所收录的字符几乎囊括了1980年以前在各地收集的方块壮字。其材料来源就是大量的壮族民间抄本,尤其是来源于有悠久历史的壮族创世史诗《布洛陀》《布伯》及英雄史诗《莫一大王》等古本名篇。从对《古壮字字典》所收字符的考察来看,方块壮字已经具备一定的构形规律,其构形模式可以满足绝大多数壮字字符的需要。
4.方块壮字的字体与表音
壮字的字体属楷体。汉字的楷书形成于汉魏之际,成为主流字体是在进入南北朝之后,至唐初才真正成熟。《古壮字字典》所收字符,有相当数量的简化字,甚至出现二简字(不排除编纂者有意使用简化字),即高频用作音符的汉字,以及一些常用词用字,有的字出现较晚,不见于《广韵》。如“卡丢怎碰歹愣”等字,还有粤方言字“冇”。又如“兰”是“蘭”的简化字,读[la:n2](国际音标[]内的数字表示调类,下同),蓝姓是壮族的大姓之一,读[la:m2],汉语的北方方言已经混同。在《古壮字字典》中,字符“兰”也算是一个高频形素,能对应[lan][lam]两个音节,如[lan1](孙子)、[lam5](遗漏)。
在汉语方言中,粤方言的语音系统与中古音最为接近。从方块壮字的借音系统来看,反映的汉语音绝大部分为现代粤方言音,尤其是以宾阳话为核心的桂南平话(粤方言的西端)音系,甚至还能反映粤方言动态的音变过程,这些语音并不古老。
5.如何看待壮字与非常用汉字重形的问题
中国古代的字书、韵书,包括较为晚近的俗字字典,其收字都非常丰富。清代的《康熙字典》收字就达47 043个(其中重见字110个),但历代的常用字数量变化不大。《现代汉语通用字表》收字7 000个,《现代汉语常用字表》收字3 500个,掌握3 000多个字即可阅读一般书刊内容的99%。大型字典、辞典收录的字许多是不用的死字、僻字。无论是哪个时代,人们熟悉的是常用字,日常喜欢用的是笔画简单的俗字。
一些壮字字符不是常用汉字,有人就认为是自造的方块壮字。例如“炁”“竜”二字,汉字文献不常用,倒是广泛见于《壮族麽经布洛陀影印译注》中,因此,有学者便认为这两个字是自造字,“炁”是利用汉字“既”的省形与部首“灬”结合而成。实际上,汉字“炁”是“气”的异体字。壮语空气、气体的“气”是汉借词,读[hei5],《古壮字字典》正体字作“”,12个异体字中就有“炁”。覃晓航认为“竜”是“省偏旁型的形声字”:“上声‘立’是‘童’字的省略形式……但仍念‘童’,标记壮语词[tu:6](拉)的读音;下形‘电’是‘曳’的省略形式……该字省偏旁后被误写为‘电’,但仍表示‘曳’的意思(即‘拉’),以注释‘竜’的字义。”[5]186汉字早有“竜”,它是“龙”的古文,今天日本还使用“竜”字,如“恐龙”写作“恐竜”、“芥川龙之介”写作“芥川竜之介”、“龙宫仙女”写作“竜宫の乙姬”。方块壮字中,“竜”比“龍”易写,除了作汉借词[lu2]“龙”的用字,也成为音符用字。壮语词[tu:6](拉)是本族词,《古壮字字典》正体作“”,异体即有“竜”。又如,壮语的“飞”[bin1]是常用词,正体字作“”,从“飞”省,“品”声,在19个异体字中就有“”。《广韵·真韵》载:“,飞皃。”匹宾切。汉语表示“飞皃”,“”已经不是常用字。此外,壮字中有不少是汉字的旧字形,笔画与现代规范汉字稍异。
至于壮字有些字形与汉字的非常用字重合的字符,也应当视为偶合。壮字利用汉字作为构形部件,一般用的是常用字,不用生僻字。壮族造字者文化水平不一,参加科举考试且熟悉字书、韵书的人是少数。汉字形声的义音组合方式是能产性极强的造字方法,可以造出表示不同汉语方言甚至不同语言的字符。例如 “伝”“忐”“忑”等字。
“伝”,古字书、韵书不收,现代字典亦无。网络可查到“伝伝”指“行走、飘移不停的样子”,如“魂犹伝伝也,行不休于外也”。在日文中,汉字“伝(でん den)”相当于汉语“传记”的“传”,如“外伝”。壮字“伝[wun2]”:人。是形声字,从“亻”,“云”声,借粤方言音。可判断为造字。
倒是有些与汉语常用字同形的合体字,我们不应轻易判断是借字,而是应该结合其异体字作出判断。这一问题将在笔者《基于〈古壮字字典〉方块壮字的构形学研究》一文中讨论。
(二)方块壮字的性质
1.方块壮字是仿汉字的借源文字,属表意体系的音节文字
著名语言学家索绪尔认为世界上有两种文字体系:“(1)表意体系。一个词只用一个符号表示,而这个符号不取决于词赖以构成的声音。这个符号和整个词发生关系,因此也就间接地和它所表达的观念发生关系。这种体系的典范例子就是汉字。(2)通常所说的‘表音’体系。它的目的是要把词中一串连续的声音摹写出来。表音文字有时是音节的,有时是字母的,即以言语中不能再缩减的要素为基础。”[7]裘锡圭先生认为:“汉字应该称为语素——音节文字。”[8]王宁先生认为:“为了不把文字记录语言的职能和它构形的依据混淆,更准确的称谓应当说,英文是拼音文字,汉字是构意文字。”[9]3两位先生的观点均侧重于汉字的表意性质。作为记录语言的符号,表意文字同样是要和整个词发生关系,只是连接词的纽带是意义。
2.方块壮字的仿汉字特征
名称。方块壮字之名称点明它与汉字的密切关系,“方块”是汉字二维平面结构的俗称。汉字的方块布局是汉字的表意性带来的特点。“无论是早期汉字大多采用形合方式,还是发展到义合组字和义音组字方式,汉字均保持了上下、左右的二维的平面结构,而非线性的。”[9]34壮字无论是借字还是造字,除极个别象形字、指事字外,均保持二维平面方块的特点。
借源。“借源文字则是直接借用其他族群的文字形体,或者借用其他族群的文字后又进行改造的文字。”[4]34壮字以汉字或汉字偏旁为构形部件,仿照汉字的构形方法造字。
采用SPSS13.0统计分析软件。计量资料均以±s表示。采用配对t检验比较不同测量方法所得的数据,P<0.05为差异具有统计学意义。
书写元素。方块壮字使用汉字楷书的书写元素。“汉字发展到楷书,笔画已经定型,变为可以称说、可以论序、可以计数的书写单位。”[4]78笔画按笔形来定名称。楷书的基本笔形有横、竖、撇、捺、提、折、点等几类,汉语的现代字典辞书只归纳为横、竖、撇、点、折5种笔形。《古壮字字典》所附的“古壮字笔画检字表”就是使用这5种笔形顺序。
具有汉字的基本特点——表意。壮字的字符从总体来说是表意的,表现在:构件是表意的汉字。虽然无音字(构件不表语素音)不及字符总数的3%,但无意字(构件不表语素义)也只有约16%。有意符的形声字(含亦声字)约占78%。
国际标准的归类。本项目组向国际标准(IRG)提供的两批经过整理的方块壮字字符(第一批1 068字,第二批1 204字),已经进入了中日韩越统一表意文字系统,即国际标准ISO/IEC10646的中日韩越统一汉字(CJKV Unified Ideographs)。
二、方块壮字的特点
方块壮字的特点同样是与汉字相比较而言的。
(一)造字行为显示自发性与无序性
方块壮字是活文字,但它只活在民间。壮族自古有语无文,没有产生传统的、统一的记录本族语的文字。这与其历史上是以分散的族群部落存在、没有产生统一的政权有关。随着社会的发展,接受过汉语、汉字教育的壮族人,利用汉字的形、音、义创制表示和记录壮语的符号——方块壮字,以满足书写壮语的需求。这种需求也只局限在民间社会生活的范围。造字行为是民间自发的,因人而异、因地而异、因时而异,无文字规范约束。
(二)具有汉语俗字的特点
“俗”是与“正”相对而言的,俗字多指流行于民间的笔画较少的简体字。旧时认为俗字为非正统字。许多俗字由于写法简单而被广泛使用,有的逐渐取得正字的地位。“凡是区别于正字的异体字,都可以认为是俗字。俗字可以是简化字,也可以是繁化字,可以是后起字,也可以是古体字。正俗的界限是随时代变化而不断变化的。”[10]汉语历代有字典辞书,还有作为用字规范的字样书,是为“正”。唐代颜元孙的《干禄字书》是现存最早的订正汉字形体的专书,其命名即告诉人们要写正字、求禄位,其序言:“所谓俗者,例皆浅近,唯籍账、文案、券契、药方,非涉雅言,用亦无爽,傥能改革,善不可加……所谓正者,并有凭据,可以施著述文章、对策、碑碣,将为允当。”俗字是日常生活中人们共同使用的字,正字是有来历、有凭据可以垂久远、写入著作中的字。有文字必然有俗书,尤其是抄本文献,因此汉语俗字研究也源远流长,在汉字发展史上占有重要地位。方块壮字是民间用字,用作构件的是汉字,由于不存在语言文字规范的条件,只要稍有汉语汉字知识,谁都可以将汉字信手拈来作为造字的构件,无需翻阅字书、韵书。汉语的俗字也会影响到壮字。笔者发现,汉语俗字中出现的相对于正字的异写或讹误的类型,不少与壮字十分相似。例如汉语俗字中“月”“肉”同用,“手”“扌”同用,“扌”“木”相混,增繁与减省、形似讹变等情形同样出现在方块壮字中。
由于以“正”为参照,方块壮字与汉字俗字研究一样,支持对那些已变形、讹误而变得无理据的字形进行有理分析。汉字构形学理论和俗字研究理论对整理汉字系文字的方块壮字具有指导作用。方块壮字研究可以汉字俗字研究和汉字构形学理论为支撑,以方块壮字字音为重心,进行个体考证,探讨方块壮字构形的一般规律。欲正确辨明方块壮字内部的造字理据,必须以方块壮字的形、音、义三者的综合运用为基础,兼顾壮、汉语的同时也要探寻它与汉字及俗字的关系。过分偏重方块壮字的民族性,忽视它与汉字的传承关系,往往会一叶障目,导致方块壮字字形分析的偏误。
(三)借源与自源交互发展
方块壮字是汉字文化圈的文字,属借源文字,但因为壮汉民族融合的特殊背景,仿汉字的方块壮字在自身的发展过程中融入了本民族的文化理念,借源中包含了许多自源的因素,不一其时,不一其地,不一其手,文化程度不一,精粗之程度不一,带来的结果有以下情况。
1.由借字向造字发展
方块壮字的构形反映阶段性特征。相比较而言,早期文献借汉字多,有全借字,形音义全借自汉语。有假借字,把汉字作为表音的符号,对壮语进行音译。一些口语常用词几乎都是用借字。如在《古壮字字典》中,“我”读[ku1]是早期层次,4个壮字“古、估、故、沽”全是假借字,读[kou1]是后期的演变,9个壮字有4个是造字。“村,寨”[pa:n3],5个壮字“板、坂、扳、挽、晚”也全是假借字。
借字带来的后果就是字符与汉语无别,认得出却读不懂。随着社会的发展,壮字书写与阅读的需求使人们造字的意识越来越强。造字体现了独立的民族意识和文化理念,壮字后期文献出现的自造字多,构件用简体字多。
统一码(unicode)和ISO/IEC 10646字符集涵盖了世界上主要语言的字符,其中包括简体汉字和繁体汉字。在统一码(unicode)5.1已收录的70 195个汉字中,包括大部分常用的汉字,还包括中国香港及日本、韩国、越南所使用的汉字。从方块壮字文献所用字符与统一码字符的重合率可以反映其借字与造字的比率。
《壮族麽经布洛陀影印译注》(2004)是根据民间搜集的手抄本影印并译注的,收集的抄本尽可能是用早期的抄本,最早的有清代的抄本,借字多,繁体字多。总字数209 278个(不重复字符3 907个),其中非统一码字符8 893个(不重复字符210个),不到字符总数的5%,这就是说,在《壮族麽经布洛陀影印译注》收录的方块壮字中95%是借字。
《古壮字字典》(1989)是为壮语而编的字典,虽字字皆有所本,但编者在收字上坚持收“壮字”的理念,所收录的13 392字中,非统一码字占48%,即48%是造字,而且借字不作为字头,只作为异体。《平果嘹歌》(2006)是21世纪经由歌手收集到的抄本,歌手按照自己使用的方块壮字重新抄写,造字最多,与统一码字形重合的字只有45.3%,即造字超过54%。97.4%的字符是汉字简体字,甚至出现以拉丁字母作为声旁的现象。如“[ke5]:老”,“老”为形符,“K”表音;“身N[e: n3]:腆肚”,“身”为形符,“N”表音。
2.以汉语常用字为构件
用作构件的汉字,一般不用生僻字,一般用汉语的常用字,常用字易认、易用。所以,虽然壮字异体字繁多,但壮字的“形素”不是无限的。
3.合体字多,独体字少
壮字是借源文字,所以象形字、指事字极少。《古壮字字典》仅收录了10多个象形字和指事字,如:
凵[waːu5]:崩;缺;豁;
壮字所谓的“合体”“独体”又可以是相对于汉字而言的:一个汉字可作为“独体”使用(此字在汉字可以是独体,也可以是合体),记录壮语的音(类似六书的假借)或义(借义字,或称训读),如“眉[mi2]:有”“约[jo3]:看”“布[pou4]:个,人的量词”“雨[ph:n1]:雨”,也可以作为壮字的偏旁,与另一汉字构成合体字,如:“[tai6]:袋”“雬[mok7]:雾”“[i1]:牵”等。类似汉字的会意、形声,以及双声、反切、释义等构形方式的,都是合体字。
4.同形字与异形字多
同形字指一字可能多音多义。汉字在方块壮字中是作为表音或表义符号使用的,同一形体的字,在不同的读音和意义下有不同的构形归类。
异形字即异体字,即一个词有多个字表示。异体字多是方块壮字的突出特点。《古壮字字典》是字符集成,书中的异体字超过总字符数的50%。有的词或语素异体字多达20多个。
从韵文文本看,不重复的字符数与其出现的频率成反比,即出现的次数越低,它占有的字数就越多。如《壮族麽经布洛陀影印译注》(1—2卷),总字数有2 680个,其中出现9次以下的字数有1 943个,占总字数的72.5%;出现10—99次的字数有633个,占总字数的23.62%;出现100—999次的字数有103个,占总字数的3.84%;出现1 000次以上的字数只有1个,占总字数的0.04%。由此可见,出现9次以下的不重复方块壮字就占了七成。
再看右江流域的文献,总字数有16 625个,出现1次的字数有6 965个,占总字数的41.9%;出现2—9次的字数有6 066个,占总字数的36.5%;出现10—99次的字数有2 442个,占总字数的14.7%;出现100—999次的字数有1 009个,占总字数的6.1%;出现1 000次以上的字数有143个,占总字数的0.8%。仅出现1次的字就占了四成多,这说明方块壮字缺乏统一规范,造字的随意性很大,这是异体字产生的根本原因。
借用汉字的音义构形,原则上任何一个汉字都有可能成为音符或意符。造字者的双语背景、本族词与汉借词的交融,都使方块壮字的造字理据远比传统汉字的“六书”复杂得多。由于壮族没有文字,也就没有像汉语那样具有3 000多年不间断的文献示范,同时也没有字书、韵书的约束。在汉语的强势影响下,壮族的本族语已经退缩到日常生活的口语中,越是常用词,异体字越多。
5.平面组合为主,字形结构不稳定
汉字是从原始的象形文字逐步发展起来的,由有限的形素组成数以万计的单字,用两种不同的组合类型:平面结构和层次结构。汉字大量组合是层次组合,全字是由形素或构件分作若干层次逐步累加构成。方块壮字把汉字作为构件,利用其音其义,组合关系相对简单,平面组合占绝对优势。例如:
出现层次组合的一般是壮音声符的形声字,而且只有两个层次,不像汉字有多层次的构形。例如:
[pja1]:山,石山。壮字“岜”,从“山”,“巴”声,用汉语的近似音,汉语无[pja]音。[pja1]:鱼。壮字作“魚岜、氵岜”。[pja3]:雷。壮字作“雷岜”,“岜”读[pja1],作为壮音声符,两字完全同音。
右江流域的壮字文献也有不少字例。例如:
方块壮字壮文汉意分析haemh晚从“日”,“”声。“”是方块壮字,为“含”之讹,读[ham2],意为:恨,苦。氵罧gumz坑从“氵”,“罧”声。“罧”作方块壮字,读[lum3],意为:像。形声字。扌岜byaz涂污从“扌”,“岜”声。“岜”是方块壮字,读[pja1],意为:山。形声字。月昋ndwen月(亮)从“月”,“昋”声。“昋”是方块壮字,读[ŋon2],意为:天,日。会意字。扌笈gyaeb扎,追从“扌”,“笈”声。“笈”是方块壮字,读[kjap7],意为:斗笠。形声字,反映标准音的[kj-]在右江流域演变为[ɕ-]的特点。
由于原来汉字元素所代表的功能淡化或消失,为加强方块壮字音义的识别,人们需要强化这一功能而造成字形各元素的累增,所以方块壮字中常出现部件累增现象。例如:
[jou4]:情人,朋友。汉借词,壮字正体字作“伖”,异体字有“酉、伷、友”。
构形系统的不稳定性,表现在字形不稳定,构件的位置有一定随意性。这在本族词用字中最为典型。例如:
6.构形方法丰富
以汉字为构件,音义兼采,这是借源。利用多种构形模式构建一套系统的独特文字,这是造字理据自源的创新。方块壮字除了有仿汉字“六书”造出的象形字、指事字、会意字、假借字、形声字,还有自创的全借、双声、反切、训读、释义等构形方法。
(四)表音是方块壮字的主要功能
1.方块壮字字符本体属于表意文字体系,表意是其主要功能
“汉字属于表意文字体系,表音是其主要功能,汉字结构的最大特点是它要根据汉语中与之相应的某一个词的意义来构形,因此,汉字的形体总是携带着可供分析的意义信息。”[4]21-22故有“望文生义”这一成语。汉字起源于图画文字,在数千年的历史发展中,字形由图形变为义符,始终维护表意的特点,成为世界上最古老且具有严密系统的表意文字,这也得益于占汉字90%的形声字与词的语音关联。汉字的形声字是以义符为纲、义化的意符,这些特点以及其位移变体都体现了一定的系统性。汉字的声符并不能准确标音,更多的是反映音类的范畴,而汉语的历史发展、方言演变均反映音类之间的对应规律,所以汉字能超越时代、超越方言而存在。
就字符本体而言,壮字属于表意体系文字,从记录语言的职能而言,表音是方块壮字的最主要功能。《古壮字字典》所收录的13 392多个字符中,有音字达97%。
同样以形声字为主流,汉字的形声字是以义符为纲,而壮字的形声字以音为重。因为是借源文字,壮字是通过作为构件的汉字的音和义与壮语的语素或词联系的,因为是不同的语言,尤其是壮语中有大量的汉语借词,而其中音的作用是最主要的,故必须遵守近似原则。
2.方块壮字的表音特点
汉字“六书”中与造字相关的四书,唯形声字、假借字是有音字。根据对方块壮字构形方法的研究,可对方块壮字进行如下分类。
第一层次分类——来源分类。根据其借源的性质,从来源分为借字与造字。借字属用字行为,造字是构形行为。
第二层次分类——功能分类。根据使用功能分为有音字和无音字。有音字指字符整体表音或部分表音,有全借字、假借字、形声字、双声字、反切字等。无音字指字符本身不反映与词或语素的语音联系,有象形字、指事字、会意字、训读字等。可以看出,方块壮字的有音字是主流。具体表现在以下三个方面。
第一,形声壮字的声符用字,既不违背汉语的音类,也遵守与壮语音类相近的原则。
每种语言的语音系统,其音素及组合规则是有限的。汉语的语音系统以音类形式体现在汉字上。清代文字学家段玉裁在对《说文解字》进行研究时发现,如果两个形声字有相同的声符,那么这两个字必定属于相同的韵部。他在《六书音韵表》中提出“同声必同部”的论述,认为“一声可谐万字,万字而必同部”,“同声必同部”指同一个声符的谐声字在上古同属于一个韵部。这是对古韵学的最大贡献,也符合上古形声造字法的基本原理,形声字之声,当用与被造字同音的字表示。但汉字是据意而造的,同音不同形的字根自古就有,汉语经过数千年的历史演变,声符对形声字的直接表音作用更趋弱化。汉字的声符已不能准确标音,但仍能反映音类范畴。
同样是属于表意文字体系的壮字,其结构的最大特点就是:它要用所借汉字的音与壮语中与之相应的某一个词的音构形,用作声符的汉字可以有多个,但须同属某一音类。所以覃晓航认为“方块壮字是一种以注音为主、释义为辅的借源文字”[5]61,这观点是有道理的。方块壮字的历史并不长,借汉字表音遵循语音近似的原则,从直接接触的汉语方言借音,主要反映两个层次:从粤方言借音是主流,尤其是桂南平话片;从官话借音较少,主要是书面语。
第二,壮字表音为主的功能反映本族词与汉借词的差异。
方块壮字与汉字一样,音节与字基本是对等的。汉语借词采用严式标音,声符字音与汉语保持声、韵、调的音类对应(折合本族语音系统),即音节的对应。由于粤方言的语音系统与壮语较为接近,所以在音值上也多能保持较高的相似度。例如:
因为是不同的语言,本族词只能采用宽式标音,有音节整体音值的对应,例如:
还有音节中声、韵、调所起的表音作用的强与弱的不同,音类与音值的侧重不同等。如假借字“那”一字多义,表示多个语素,读[na2]时表示“田”,读[na3]时表示“脸或前面”,读[na4]时表示“舅母”,读[na5]时表示“箭”。据对近百万方块壮字资料数据的考察,在本族词用字中,谐声偏旁的表音作用、韵母的近似值是必不可缺的,声母次之,声调是最可忽略的。
第三,出现以拉丁字母作声旁的形声字。
2006年整理出版的《平果嘹歌》,书中5卷都出现以拉丁字母与汉字组合构成的形声字。例如:“疒A”[ai1]:咳嗽。“身N”[en3]:腆肚。这种以汉字或汉字部首表意、以拉丁字母表音的构形方式是现代出现的事,也更能证明壮字以表音的近似为重的特点。但从文字体系来说,这种构形模式已经破坏了方块壮字的结构系统,《古壮字字典》未收录此类字符。
3.方块壮字的意符体现造字理据的主观性
形声壮字的形符是不成系统的,可以是汉字的部首、汉字的偏旁或整个汉字,可以从不同的角度选取形符。还产生了约定俗成的与本义无关的汉字作形符,如“口”“门”。形符的丰富多样是壮字的特点,这与其自主无序的造字行为有关,也与避免和汉字过多重形的意识有关。以“手”为例。
(五)方块壮字字符的时间层次和地域层次
1.方块壮字字符的时间层次
方块壮字产生的时间不算长,其反映的时间层次主要表现在两方面。
第一,在字形上,由借字向造字发展,假借字向形声字转化。早期的壮字文献,假借字很多,如客歌《唱文隆·唱英台·唱唐皇》(1998年由广西民族古籍办公室编印,内部发行),在1 555个不重复单字中借字达1 118个,其所占比例是去重后方块壮字总数的71.9%。越是后期的文献,用形声构形的自造字越占优势。甚至出现以拉丁字母作为声旁的现象,如《平果嘹歌》(2009)。《古壮字字典》的形声字约占总字数的78%,正体字头基本不用假借字,反映了《古壮字字典》为壮字而编的意识。
简化字大量出现。1956年1月国务院公布的《汉字简化方案》,第一表和第二表共简化繁体字544个,简化后归并成515个简化字。方块壮字中出现许多繁简对应的构件,可以说明两点:一是繁体字符一般是早期壮字,有了简体字后,人们再使用这个字符就不再写繁体;二是有的壮字就是产生于《汉字简化方案》之后。我们注意到《古壮字字典》的一个特点是:汉字的常用部首在《古壮字字典》中坚持用繁体,如“言、釒、糹、食、貝、魚、馬、鳥”等。异体字可以出现简化字,但一般不用简化字作为字头。这大概也是为了与现代汉字相区别。
第二,字符的谐声偏旁反映的语音层次,这与以下论述的“方块壮字的地域层次”是一个问题的两个方面。详见下文分析。
2.方块壮字字符的地域层次
方块壮字字符的地域层次反映在两个方面。
一是字符表音反映方言的差异。方言的分布是语言的历时演变在地域上的投射,方言的差异反映的是语言演变的历时轨迹。《古壮字字典》对方言用字只注明〈方〉,没有具体的方言信息,但只要将壮字谐声系统与现代壮语方言对照,即可判定其流行的区域。另外,从壮字的谐声偏旁可以观察其借音来源。贺大卫(David Holm,2013)通过对壮字表音情况的分析,认为可以明显分为两大地域:①广西中部、西南部和越南,这一区域造字的依据是平话(粤语的次方言)的读音,是超壮语方言区的。平话与壮语接触早,但最早也是在1800年左右(平话进入广西时),之前不可能分析具体的时间层次,因为没有接触。②广西的北部、中北部、西北部及贵州,这一区域造字的依据是西南官话的读音。最早也只能是在1390年以后,约600年时间(2)资料来源:HOLM D.Mapping the Old Zhuang Character Script:A Vernacular Writing System from Southern China[M].Leiden:Brill,2013.。
根据20多年的广西汉语方言研究成果,粤方言是最早入桂的汉语方言, 桂南平话是粤语的西端,进入壮族聚居区。汉语对壮语的影响,早期是通过与桂南平话的接触实现的。《古壮字字典》基本不收录反映新借词读音的字符,即是确证。
《古壮字字典》是集成性质的,同一语素的用字,凡例推荐“选择使用较普遍、结构较合理的4 918个字为正体字,其余同音同义异形的字列为异体字”。根据考察发现,异体字多的语素,不仅包括了不同地域的约定俗成的字符,还收入了语音已经发生演变、不再同音的字符。例如:
三、结语
仿汉字的借源文字性质,使方块壮字省去了漫长的创造文字的原始阶段。方块壮字在其发展演变的过程中,加入了本民族的文化理念,是自源的创新,是其生命力所在。正是借源与自源的结合,使方块壮字发展成为记录、传承壮语的文字系统。
汉语汉字是我国国家通用语言文字,我国南方的少数民族多有语无文,在强势的汉语言文字影响下,民间往往通过借源方式记录自己的语言,因而产生了仿汉字的方块民族文字。“中华字库工程”第18包“少数民族文字搜集与整理”收录了5种南方仿汉字,具体字符数为:方块壮文7 351字,方块白文700字,方块瑶文239字,方块布依文145字,方块侗文34字。
中华字库是信息化工程,字符属性数据是字符信息化的核心,是申请国际标准的必备条件。方块布依文属性数据不全的字符达50%,方块瑶文属性数据不全的字符近67%。符合国际标准的“壮字属性表-7 351字”于2020年通过了中华字库总体组的成果核查。这一数据是对方块壮字已经发展成为记录、传承壮语的文字系统的有力证明,因为字符属性数据来自文献。在诸多仿汉字的少数民族文字中,方块壮字相较历史较长、覆盖面最广、使用人口最多、文献最为丰富。
“意音文字民族性更强,表音文字易学易读,更容易在国际上通行,两种文字并存,既保护了各民族的文化,可以使各民族完整地记录自己的历史,存留自己言语类的文化遗产,又可以便利于双语教学,对普及教育和民族和谐共处,都有很大的好处。”[4]23拼音壮文与方块壮文的关系好比汉语的拼音方案与汉字的功能与分工,前者用于正音,后者用于书写。
作为中华民族文字的一员,方块壮字的使用为语言接触环境下的普通民众提供了便利,有一定的群众基础,一些地名用字也已进入《现代汉语词典》,如“岜、、垌”等。只要对其进行整理、研究,通过文字信息技术实现“个人创造→社会通行→推介规范”的过程,并且与拼音壮文方案密切结合,就可以成为便于壮族人民“我手写我口”的书写工具。