字料库在汉字教学中的应用初探
——以渤海大学CCFD为例
2022-01-14娄力文柳建钰
娄力文,柳建钰
(渤海大学 文学院,辽宁 锦州 121013)
字料库(Chinese Character Form Database, CCFD.)最早是由李国英、周晓文提出的,指的是“以文字的整理和文字学的研究为目标,按照语言学和文字学的原则,收集实际使用中能够代表特定文字或文字变体的真实出现过的文字书写形态,运用计算机技术建成的具有一定规模的大型电子文字资源库。字料库是在大规模真实文本的基础上生成的真实的文字书写形态的有序集合,是利用计算机对文字形体进行各种分类、统计、检索、综合、比较等研究的基础。”〔1〕在处理文字信息方面,字料库无论是建设目的、理论基础还是原则方法都比语料库更具有针对性与专业性。
截至目前,与字料库直接相关的研究文章有近三十篇,国内外字料库和类字料库的建设成果有十余种。从目前字料库的发展情况来看,大多数基于字料库的研究成果仍以汉字学本体研究为主,但其价值远不止于此。结合长期以来汉字教学的现状来看,当下我们更应该积极探索新路径,将数字化技术主动应用到汉字教育领域,以更先进的方式服务汉字教育工作。文章拟以渤海大学字书字料库(CCFD)平台为对象,对字料库在汉字教学方面的应用价值进行初步探索,力图为现代汉字教学提供一些可供参考的方法。
1 汉字教育研究概说
汉字教育主要包括学校教育、社会教育与专业教育〔2〕,其中学校教育重点体现在汉字教学工作上。长期以来,汉字教学过程中的主要问题在于如何推进其科学化,而这既关乎教师对汉字学等专业知识的掌握能力,又关乎学生的汉字领悟能力。近年来,有关汉字教学研究的成果也十分丰富,可以大致分为两类:
第一类是专业理论指导型。该类型研究成果以汉字学理论指导为主,多鉴于传统的“六书”、汉字构形学理论等。早在21世纪初,王宁就曾重点强调过要依据汉字构形规律科学地讲解字理,重视汉字教学的科学性和理据性。王宁在《汉字教学的原理与各类教学方法的科学运用(上)》〔3〕和《汉字教学的原理与各类教学方法的科学运用(下)》〔4〕中提出了当时国内基础教育领域中汉字教学存在的几个重要问题并给出了相应的解决办法。这些观点时至今日仍具有宝贵的借鉴意义。同时,近年来一些学者利用汉字学等理论进行汉字教学已颇有成效,例如徐磊在《初中语文现代文汉字教学策略研究》〔5〕中运用汉语认知规律进行全方位教学。强丹丹在《字形分析法在初中文言词汇教学中的运用研究》〔6〕中指出利用字形分析法可以有效地进行汉字教学。相比于传统的教学方法,将汉字学与教育学等理论结合的方式在指导实际工作时更具有专业性与创新性。
第二类是数据库应用型。这类研究成果多借助数据库的方式对实际教学中的汉字进行计量分析,通过定量定性的研究方法提出可参考的指导建议。李国英〔7〕曾提出要从汉字教学的定义与分类入手,重点从字量确定、字种选择、字序编排和字的讲解等方面促进汉字教学的科学化。而目前这种数据化研究多见于语料库的研究成果中,例如张瑜珂的《基于语料库的日本学生汉字书写偏误分析及应对策略》〔8〕、刘春晓的《韩国留学生汉字书写偏误与中国小学生错别字对比分析》〔9〕、褚少尉的《基于语料库的中小学生词语偏误类型解析》〔10〕等。上述文章都展现了在汉字教学中借助语料库的形式积极探索更为科学化的对策,这种将实际教学中出现的情况进行计量化统计分析的研究方法对汉字教学更具有针对性的指导意义。
综合上文所述的两类研究,可以看到目前汉字教学正以“理论型”和“应用型”的方式并驾齐驱,以多元化的方式逐步深入。因此,在促进汉字教学专业化、科学化的进程中,不仅要加强汉字学等理论的学习,更要利用数据库等形式积极开拓新道路。
2 字书字料库在汉字教学中的应用构想
汉字教学是一项综合性较强的工作,“汉字教学要想由难变易,必须在教学方法、教学程序、教材编写等方面,做好多方的协调工作”〔3〕。同时,更要清楚“科学的汉字教育是两种规律的综合体现:一种是汉字本体构造和使用规律,另一种是学习者接受汉字教育的心理认知规律,二者舍其一就谈不到科学化。”〔11〕在汉字教学中,各阶段有其不同的认知心理,例如小学一阶段的学生和外国留学生看似都处于识字的初始阶段,但“对于未成年的儿童来说,简单模仿的教学方法是适合他们的年龄特点的;但对于成年人来说,他们的理性思维已经发展成熟,因此他们更易于从理性分析的角度学习知识。”〔12〕因此,针对不同学习群体的特点,渤海大学CCFD可基本满足汉字教学需求,现对字料库在汉字教学中的应用作初步探讨,并提出以下构想。
2.1 提供字频统计和字典查询功能
首先,字频统计是汉字教学得以科学化进行的依托。邢红兵〔13〕认为汉字习得包括三个过程:汉字数量逐渐增多、学习的汉字从单一化到系统化、逐步建立汉字形音义联结关系。而这三个过程都离不开汉字的字频统计。利用字料库可以调查各阶段基础字、高频字以及同偏旁部首汉字类聚等情况,结合用字频率与当下学生的心理特点,不断调整识字教学的字量和字表,进行有规律、有组织、有层次的汉字教学。李国英〔14〕曾提出基于语料库的字频统计可能会造成统计结果失真的问题,其解决方法则在于建立满足文字统计要求的字料库,统一字频统计的标准以保障其科学性。但由于目前渤海大学CCFD开发尚不完善以及字频统计功能开发难度较大,该功能尚不能实现。但现阶段可以先在一定的用字范围内批量导出字头,再进行二次加工得出所需数据,在此方面也已经有了许多成果。例如单志鹏的《基于字料库的<正字通>新收字测查报告》〔15〕、柳建钰的《基于字料库的通用规范汉字构形属性调查研究》〔16〕等。
其次,字典查询功能作为常用检索工具更应该具备详尽的筛选菜单以满足各种汉字教学者以及学习者的需要。而字书字料库建设以汉字构形学理论为指导,在分类方面的条件详实且丰富。在信息查询界面共分为六大模块,包括:字头字样信息查询、字头公用信息查询、字头基本信息查询、字头构形信息查询、字头字际关系查询、字头书写信息查询。在这六大版块中又具体分为若干小类,以字头构形信息查询选项为例,该模块下又包括构形模式、直接构件数、间接构件数、构件组合类型、构件组合层数、布局图示等18种在内的查询小类。对于汉字教学而言,这六大类的查询模块基本可以满足各阶段不同程度的汉字教学需求。
2.2 提供构形信息参考
汉字构形学理论提出后,利用汉字构形构意的特点进行科学字理讲解的做法早已成为学界的共识。但目前仍存在抛开理据、主观臆断汉字形体的现象,为减少此类问题,可参考字书字料库所提供的构形信息来合理认识汉字形体的科学性、历史性和多样性,为汉字教学提供启发和指导。
2.2.1 合理认识汉字构形理据的科学性
正确认识汉字的形体结构是每个汉字教学阶段都应该注重的内容。所谓的汉字形体结构,包括汉字的构件组合类型、构形模式、布局结构及笔顺等。正确地把握汉字的形体结构可以为日后树立正确的汉字观和科学运用汉字打下坚实的基础。字书字料库“字头构形信息”界面则为构形理据查询提供了渠道。
“字头构形信息”界面中共包含三项主要功能:依理拆分、依形拆分、同形字拆分。其中“依理拆分”的功能包括了汉字的构形模式、笔画数、笔顺、构件组合类型、构件组合层数、布局图式以及构件拆分示意图。其中,在依理拆分界面中可直接查询构件理据是否留存的信息,帮助教师更客观地了解一部分已经失去理据的汉字,避免对汉字理据进行主观臆断。例如,结构较为繁难的“藏”字,借助构件拆分示意图就可以直观看出该字是由“艹”“爿”“戈”“臣”这些构件按照层级一步一步组成的,如图1所示。如果不进行专业的构形分析,很可能将“藏”字误拆出构件“戊”。因此,在汉字教学的过程中更需要对汉字误解、误拆等情况加以重视,以免影响到对汉字形音义的理解。
图1 字书字料库中“藏”字构形信息
2.2.2 合理认识汉字形体的历史性
现在大部分的通用规范汉字都由历史上的字形演变而来,在讲解汉字时,如果部分学生不理解其中的构意构形,可尝试检索该字的历史源流以帮助理解。字书字料库可以提供两种查询渠道:一为字头书写信息界面的字形源流,可查询该字形体的古今历史变化。二为字头基本信息界面中的图文备注,可查询到有关该字的历史演变的图文说解,包括《汉字文化解读》《汉语多功能字库》《字源》《汉字字源系统研究》等四种字源的解释。将两种方式结合运用到教学中可以帮助学生更好的理解汉字在发展演变过程中形体因粘合、省简、变形、错讹等发生变化的现象。例如“获”字,在字书字料库查找出相关资料后可以发现,简化字“获”的繁体字为“獲”和“穫”,而两字分别表示狩猎义和庄稼收获的含义,而其中“獲”的初文又来源于简化字“只”的繁体“隻”。教师可以通过一系列的讲解帮助学生理顺汉字的源流关系,有利于让学生更好地了解汉字的历史演变规律。
2.2.3 合理认识汉字形体的多样性
书法教学是汉字教学的重要组成部分。字书字料库可以为书法教学提供各种古今字书中的各种真实字形。随着字书字料库收录字书种类不断增加,历代汉字的各种字形数量与种类也会持续增长,这就为汉字教学提供了大量的真实字形以资参考。图2展示了“水”字在字书字料库中收录的部分字形,其中包括甲骨文、金文、战国文字、隶书等书体。字书字料库在未来还会不断扩充,在书法教学方面也将会发挥更大的作用。
图2 字书字料库中“水”字形查询部分结果
2.3 提供语音信息等辅助
字音教学是汉字教学的重要内容。形声字大都可以通过示音构件判断出该字的基本读音,而一些因形体演变不能示音的形声字直接判定其读音则比较困难。通过对字书字料库的检索,可以查询到该字上古、中古、近代和现代的读音信息,为汉字学习提供有力支持。对于基础教育阶段的学生来讲,字书字料库提供的信息较为专业,教师可以把这些信息作为教学辅助材料,结合具体的教学经验引导学生认识字音。对于大学教育阶段的汉字学习,字书字料库所提供的语音信息模块无疑是一个很好的音韵学辅助工具。如图3所示的“江”字,从字书字料库中收录的信息可以看到,上古音、中古音所属声、韵、调等信息与现代并不相同,但仔细辨别可以发现其古音与该字示音构件“工”读音相近。通过这种简单的讲解与串联可以让学生更加了解汉字的形音演变规律。
图3 字书字料库中“江”字读音信息
2.4 提供字义参考
字书字料库的建设由汉字构形学理论、字书编纂理论和语料库理论作为支撑,现已录入《说文解字》《玉篇》《康熙字典》《汉语大字典》等六十多种字书,总体而言具有很高的专业性和真实性。因此,字书字料库可以看作是集多种字书为一体的“大字典”,它能够为教师提供字义方面的参考,把师生从搜集汉字释义的繁琐工作中解放出来。例如查询“拓”字,可出现多种字书结果,选取《汉语大字典》中的信息可得到三种不同的音义信息,包括:(1)拾取(zhí);(2)开辟,扩充(tuò);(3)摹印(tà)等含义,同时还显示了该字信息所在的具体卷号、页码以方便核实查找,如图4所示。
图4 “拓”字在《汉语大字典》中的信息显示
2.5 提供多种字际关系信息
王宁曾明确指出:“构形系统的重要标志是关系的有序性。每一个字都居于其他与之发生关系的字的联系中,如何讲解一个字,要由它的各种关系决定,解释是否正确,要用它的各种关系证明,这些关系制约了汉字构形理据的解释。”〔17〕因此,无论是在基础的识字阶段,还是在更为深入的阅读使用阶段,汉字教学必须要在相应的字际关系中逐步展开,形成系统性的学习。这种字际关系不仅要依存于语篇环境,也要依存于汉字学习者的“心理词典”。字书字料库可以为字际关系信息的获取提供助力。例如在文言文的教学中,异体字、通假字、古今异义字等都是教学重点内容,而字书字料库提供的七种汉字字际关系(异体关系、同源关系、同形关系、分化关系、本借关系、繁简关系和正讹关系)都可以为文言文教学提供诸多资料支持。以“被”为例,该字在文言文中常通假为“披”,如“将军身被坚执锐”(《史记·陈涉世家》),在字书字料库中查询二字便可得到图5所示结果,即“被”通假为“披”是单向通假,二字声韵关系紧密为同音借用,其中的相关参证文献也可以提供参考。诸如此类信息的展示在字书字料库中大量存在,为汉字教学提供了丰富的资源。
图5 字书字料库中的字头字际关系信息栏
3 结语
综上,渤海大学字书字料库的建设目的、依据理论、开发内容等都决定其本身的专业性和科学性,业已展现出了其巨大的潜力和价值,可以为汉字教学提供极大的便利。虽然目前渤海大学字书字料库仍存在很多不足,但随着字书字料库的不断完善,未来一定会为汉字教学提供更加有力的支持。