基于声旁的字根排检法创新研究
2023-12-22胡湘宇
胡湘宇
1. 汉字辞书发展概况
1.1 辞书及排检法相关概念
辞书是以条目为形式,为人们提供词语解释和相关概念的工具书。它伴随文字和书面文明的出现,成为人类文明社会中无声的教师。书面语系统建立在复杂的语言内容和文字符号上,辞书要解释清楚这个系统,不可避免地需要解决条目排序和检索问题。汉语辞书的排检方案历史悠久、种类繁多,即便发展到如今,也存在多种排检方案在各类辞书中共存的现象。据当前中国辞书学界的定义,本文研究的辞书指字典、词典、百科词典等解释语言单位的工具书,不包含百科全书。
排字法和检字法合称排检法。前者是辞书安排条目次序的方案,后者是辞书检索的方案。排检法是记录、汇编、整理资料不可或缺的重要工具。排检法需要依据汉字某部分特点以区分类别,排列次第。而在汉语辞书的历史上,书面语的三要素——形、音、义都曾被作为排检法标准。
1.2 汉字辞书历史概况
对汉语辞书编辑的研究形形色色,最早可以追溯至汉代。袁世旭、郑振峰(2014)指出《尔雅》《方言》就是最早一批实践先于理论产生的满足人们语言文字需求的辞书。而辞书编辑相关理论不断丰富,直到20世纪才形成完整的学科体系并独立成学科。辞书研究没有确定独立学科地位之前依附于“小学”,早期研究通常是文字、音韵和训诂的综合进行。后期才从“小学”中演变出比较成体系且独立的辞书。因此,《汉书·艺文志》也把文字学相关的古籍统一划入“小学”。
隋、唐以后,“小学”逐渐发展成文字学、训诂学和音韵学的总称。清代《四库全书总目提要·经部·小学类一》也说:“唯以《尔雅》以下编为训诂,《说文解字》以下编为字书,《广韵》以下编为韵书。”尽管这样对古书的分类太过宽泛,但是从语言学的角度来看,《四库全书总目提要》对“小学”的分类存在合理的地方。
钱剑夫(1986)认为现代的词典学研究对辞书的分类大体上也对应以上三大类:第一类研究文字形体结构和字记录的音义,例如《说文解字》首创“部首”分类并被众多辞书沿用;第二类研究语音(音韵)为主也兼释义,例如《广韵》通过“韵目”归类,同样启发了后世众多辞书;第三类研究训诂名物,例如《尔雅》的条目按照语义分类。
2. 字根视域下的汉字辞书归类
2.1 字根理论相关概念
罗健(2020)针对汉字的衍生关系,提出“汉字字根理论”,认为汉字发展的基础是象形字。象形字是独体字,又是基础字根字。由此拓展出系列理论,其中在通过对汉字造字方法和各级部件的归纳、比较基础上,他提出“以根归属,据形定部”作为原则的汉字字根排检方法。汉字字根排检方法认为汉字是由数量有限的字根不断衍生形成的文字系统。它根据汉字形体结构进行拆解归类,属于形序排检法。它根据构字的能力从小到大分析出笔画层次、不成字部件层次、成字部件层次,以此组合构成所有汉字。
(1)笔画层次,它是最小的文字形体单位和具有构字功能的最小单位,例如“一、丨、丿、丶、乛”。
(2)不成字部件层次,它是从笔画到字的结构过程中的中间单位,是一种在结构中不成字的笔画块。这个笔画块具有重复出现并与其他部件组合成字的能力,包括整字变形的结果,例如“亻、扌、彳、氵、犭”。
(3)成字部件层次,同时也是最基础的字根字。从单位功能来看,它可以独立记录语言单位的音义;从系统功能来看,它具有衍生更多汉字的能力。独体字通常有较强衍生能力,例如“月(阴、明、朋、胡、钥)”“山(仙、讪、汕、疝、灿)”,但是合体字同样有衍生功能,例如“胡(湖、糊、蝴、葫、瑚)”“音(暗、黯、谙、愔、歆)”等。
汉字字根既是构成汉字的最大部件,也是汉字衍生的基础。在基础字根,也称主字根(170个)的基础上,增减笔画还能得到形近的副字根(257个)。主、副字根和笔画、不成字部件、成字部件组合衍生成系列汉字。
2.2 《中华字根字典》排检方案
《中华字根字典》(华语教学出版社)正是依据汉字字根理论进行排序,并设有“字根目录”“检字表”“无字根字表”等检字方式。全书共计1.3万个条目(包括繁体字、异体字、多音字重复使用条目等),实际收录8500多个汉字。如图1所示。
图1 《中华字根字典》字根目录(部分)
在排字方案上,《中华字根字典》正文根据“字根目录”进行排序,主、副字根衍生的汉字按照笔画由少到多的顺序排列,笔画相同时按起笔笔形(一丨丿丶乛)顺序排列,第一笔相同的,按照第二笔,以此类推。多字根字按照“先上后下、先左后右、先内后外”的取根原则排序。这样的排序使条目呈现出极大的规律性,形体相近和主要特征一致的字得以集中排列,便于对形声字、形近字、多音字、生僻字的比较学习。
在检字方案上,“检字表”(见图2)在“字根目录”的基础上收录主、副字根,并可以根据汉字中出现的任意字根定位目标汉字。针对部分不可拆分字根、难以归类的字,该字典设有“无字根字表”(例如丌、书、凸、年等)。该字典也适应国家九年制义务教育,补充拼音、部首检字方案。
形体结构相对简单的基础字被选取作为字根,从语言使用角度,它们多数源于造字早期就稳定了的象形字,被长期广泛地使用;从辞书编撰的角度看,它们也是辞书中高频复现的单位。
图2 《中华字根字典》检字表(部分)
2.3 字根理论视域下的辞书归类
当前,从排检法出发对辞书分类的共识是,根据特点将排检法分成三大类:音序排检法、形序排检法、其他排检法。这样的分类颗粒度太大,造成许多排检方式被笼统归为一类,尤其在形序排检法中忽略了汉字形体结构的层次性。
在字根理论视域下,根据设计排检方案依据的标准进行分类,现行汉语辞书排检方案的一级分类是:音序排检法(依靠文字记录的语音)、形序排检法(依靠文字使用的形体)、分类排检法(依靠文字记录的语义)。其中,对音序排检法进行二级分类得到:传统音韵排检和拉丁字母排检;对形序排检法进行二级分类得到:形旁排检法(依靠形旁)和声旁排检法(依靠声旁)。如表1所示。
表1 根据排检方案依据标准的辞书归类
笔者搜罗目前市面上的汉语类工具书,采用音序排检法的代表有《现代汉语词典》《新华字典》,采用形序排检法的代表有《辞源》《辞海》。其中,音序排字在学习型的初级语言工具书中的使用远远多于形序排字。而作为中国传统排检法的形序排检法,尽管相关研究、创新不胜枚举,但总体上缺乏对其边界、核心特点的共识。回顾中国辞书发展的历程,层出不穷的创新排检方案集中在对形序排检法的创新,其中有值得借鉴的,也有值得反思的地方。缺乏对排检方案归类的客观标准,让从汉字形体结构出发的为数众多的排检新方案都被归入形序排检法。更好地梳理它们,并对形序排检法内部再进行科学分类,能帮助我们更深入地理解形序排检法的得失。
需要明确的是,汉字字根排检方法本质上是基于声旁的排检方法,其最大创新也在于科学化、规范化地补充了形序排检法的细分方案。这种以整字为逻辑对整个汉字系统进行分类和集中排列,内核就是把字中空间地位更高的声旁作为编排标准(字根),以符合语言文字科学认识的方式寻找汉字形体结构的规律,后文也将详细论述。
3. 现行汉字辞书编排的比较研究
3.1 第一阶段:分类排检
词典排检体例的雏形是义类体例,主要是类书根据语义进行主题分类的编排方式。类书并不符合现代词典的严格定义,它源于先秦字表“分别部居”按主题分类的总体思想。该体例延续千年核心不变,例如现当代的《同义词词林》,尽管收录范围更广、内容更完善,但是仍采用分类编排体例。
3.2 第二阶段:形序排检
《说文解字》的问世标志着部首体例的诞生。“以类相从”是《说文解字》以前辞书的编排主流,它的弊端是极低的检字效率。而许慎根据汉字的形体结构,从偏旁出发采用在字形中反复出现的部分归类。这种被归纳出的“部首”既是在总结当时汉字的形体特征,也是为后世造字法提供范例。部首排检法的创制极大地提高了检字效率,并为从形序编排汉字辞书提供了思路。后世《字汇》《正字通》再到《康熙字典》不断在检字体例上进行完善,540个部首优化到214个部首,完成了形义部首向检字部首的初步转化,再到《现代汉语词典》《新华字典》仅仅是对形序排检方案的微调。其间无论是着手细节规则的“多个部首的字分别出现在不同部的方法”,还是针对宏观方案的“明代《字汇》中的笔画检字法”“民国时期四角号码检字法”等,都没有使形序排检方案产生根本性变化。
3.3 第三阶段:音序排检
音序法大致可分成以中国源生的音韵学研究中韵目为分类标准的传统音序法和借鉴拉丁文字创制的表音文字记录的现代音序法。传统音韵学的发展逐渐形成了以《广韵》为代表的按照韵部编排的音序排检法。相比形序排检法,音序排检法在检字的便利性上有优势。不足的是韵部过多、专业性强。尽管韵部不断精简合并,从《广韵》206韵、《切韵》193韵到106平水韵,专业壁垒仍然存在,难以在大众中普及。随着中国语言学学科受到外国辞书的启发,民国时期直到中华人民共和国成立,采用音素文字(主要是拉丁字母)的辞书音序排检体例层出不穷:国语罗马字、注音字母、《汉语拼音方案》。凭借单字数量少、检索方式简单、学习成本低等特点,音序排检方案很快地全面取代了传统韵书的音序排检原则,并且进一步超越形序排检方案,成为当前辞书排检的主流。
对于古代汉语的辞书或者兼收古今的大型辞书,一是这些辞书的编辑难以确定古代语音的准确读音,二是读者对语音的不熟悉,不是做专业研究的学者难以完全掌握,所以这些辞书通常仍然采用形序为主要排检方案。所以准确地说,音序排检方案在共时性、学习型的辞书中成为首选方案。例如《现代汉语词典》这类权威性、规范性的共时词典,给读者提供的是当代国家通用语言文字的语文信息,所以采用音序排序,音序为主、形序辅助的检字方案。
3.4 对比研究
现行的汉语工具书排检法的主流是拼音排检法,部首排检、笔画笔顺排检都存在一定的应用场景而被保留。将其与字根排检进行全面比较,可以得出各自的特点、优势和适用场景。
音序排检法以其科学、便捷等特点,逐步统一规范后成了辞书排检中最为重要的一类方式方法。同时我们也需要关注到形序排检法的需求仍然存在,专业领域的大型辞书、古辞书,以及其他类型的工具书,尤其是面向汉语初级学习者的工具书,都仍需要形序排检法支撑。根据对比,我们尤其需要注意的是以部首排检法为代表的“形旁排检法”和字根排检法代表的“声旁排检法”在形序排检法大类中的不同。只有深入研究声旁和形旁适应辞书排检法的情况,才能明确形序排检法在辞书应用中的必要性。现行汉语工具书排检法比较见表2。
表2 现行汉语工具书排检法比较
4. 声旁和形旁适应排检法的对比研究
4.1 声旁和形旁在汉字系统中空间地位的比较
汉字的偏旁、部首结构多样,声旁、形旁都可以占据上下左右、里外包围的各个方位。其中又以形声字表现出最多的组合可能,且具有一定的规律性。
形旁在形体空间中通常只占有20%—30%,相反,声旁在汉字中的空间占比很大。李燕等(1992)对国家语言文字工作委员会和中华人民共和国新闻出版署联合发布的《现代汉语通用字表》中的形声字进行了量化分析。研究得出7000个通用汉字中有5636个字属于形声结构,形声结构中共计有1326种声符。其中1116个声符(占声符总数的84%)不仅能在形声结构中做提示语音的部件,而且单独出来也是收录在《现代汉语通用字表》里的字。也就是说汉字中的声旁,独立成字的就有84%。
字根几乎都是整字,并且通过在汉字中的主体地位来衍生其他字。实际上就是通过声旁来使汉字成群出现,形成汉字家族,大大地提高汉字形体结构相似率。这是因为声旁源于基础字(通常是由象形造字法创造的独体字),衍生能力强。朱泽东(2022)从书法构型角度分析了形声字中声旁和形旁的空间占比问题,指出汉字字根排检方案是一种创新型排检方案,它基于声旁和成字部件来归纳汉字之间的衍生关系。字根是汉字形体的主体。形旁字的空间地位小,一般要变形压缩成20%的字空间;声旁字的空间地位大,一般不会变形且自由占领80%的字空间,是汉字的主体。所谓“把不成字的‘部首’更新成‘字根’(也就是成字部件)”的创新,从功能上说就是通过声旁来检索汉字。
4.2 串联汉字能力的比较
因声旁和形旁代表了不同的理据层面,所以它们串联汉字的能力不同。无论声旁还是形旁,都可以类推一批汉字。形旁只能提示事物大类,声旁在提示语音的同时,也在字串中表现出提示整体意义的功能。朱泽东认为《说文解字》拆解、归纳汉字偏旁部首,是抓住语素意义来分析汉字,是单层的串联。罗健的汉字字根理论是抓住语素声音的理据特征来多层串联汉字,表现出“字滚字”的衍生功能。
通过表3,我们可以直观地比较基于声旁和形旁的串联汉字能力。形旁(传统汉字编排)串联汉字的时候只是抓住字的空间占有比率小的形旁,可以用小的串联大的,但是只能串联一次:木—权。如果形旁作为字根,在第一次串联中就退缩到整个汉字中较小的一侧,之后就失去了继续串联的能力。新开发的声旁串联抓住字的空间占有比率大(大约80%)的声旁,可以用滚雪球的方式多层串联:木—林—麻—磨—蘑。这组字串展现出字根串联汉字的广度和深度。不但能衍生出一众汉字,其中很大部分还会成为下属字根并进行二次衍生。这样更有利于揭示汉字层层递归关系背后的形体结构规律。同时,也证明了声旁在汉字结构中的地位。基于声旁的空间主体地位,添加其他笔画、部件、字根就能由结构简单的字衍生出系列相对复杂的汉字。
表3 以“木”为例对比基于形旁和声旁的串联汉字能力
4.3 理据性比较
形旁串联的字只有意义上的局部关联,即形旁通常只提示意义大类,如,波(只是跟水有关)。而实际上通过声旁串联的汉字在意义上往往也有关联:波(水的皮)、坡(土的皮)、被(身体保暖的皮)、破(首先是皮裂开)。宋代王圣美的“右文说”,清代段玉裁的“声与义同源”,直到现当代裘锡圭先生的《文字学概要》,都提出过声旁表音兼表意的功能的观点。从造字理据上,无论声符作为整体表意,还是其他情况,都可见声旁不单是提示声音的视觉载体。这和汉语语源、汉字的表意造字原理有密不可分的关系。
汉字系统有180个形符,1116个声符。两相对比,我们可知形符为何数量偏少,它通常只提示意义大类。而基数庞大的声旁,能记录更精细的语义。字根理论表层上是整字串联汉字,而这些整字、基础字通常在复杂字中充当声旁。其深层原理则是汉字和意义难以分开,这是“六书”时代就明晰的造字理据。即使汉字经历简化,也从未真正地走上极端的符号化道路,而是始终围绕理据性做调整和重构。“六书”时代的汉字理据基础在今天仍适用分析绝大多数汉字。字根理论正是直接传承“六书”理论对汉字的分析,遵循“方以类聚,物以群分,同牵条属,共理相贯,杂而不越,据形系联”的原则排列条目,以此展示这种源于汉字内部构件的关联性。
5. 结论
本文一方面根据设计排检方案依据的标准对辞书进行了系统归纳、分类比较;另一方面,创新性地提出了基于声旁排检的字根理论,并且研究、对比了基于形旁和声旁的形序排检方案在辞书中的适配度。在面向汉语汉字学习者时,形序排检方案仍有其不可替代性,字根理论正是为了探索形序排检研究长期只关注形旁导致对声旁研究的疏漏。有人尝试过用声旁集中识字,但是用声旁串联所有汉字、编排辞书,《中华字根字典》和字根理论算是第一次。
展望字根理论在辞书编辑的应用前景,字根排检方案有潜力成为汉语辞书排检体例的新选择。根据已落地的纸质(《中华字根字典》)、电子端(字根书法字典App)字根辞书的应用情况,字根理论能很好地优化识字教学,满足汉语学习者的需求。可以说,字根类辞书,既是工具书,又是学习书,具备双重属性。一方面,它能简便地解决读者在识字和实际语言生活中的问题。另一方面,它又有培养读者汉字学习兴趣和引导读者汉字学习的派生功能。随着后续系列辞书的扩展,以及学者对汉语辞书排检体例的深入研究,字根理论大有可为。