APP下载

基于HSK动态作文语料库的留学生错字成因分析及教学建议

2018-06-16张晓春

教育界·下旬 2018年1期

张晓春

【摘要】文章探讨了在留学生汉字识别中是否存在“笔画数效应”和“部件数效应”,思考影响留学生汉字学习的重要因素,认为在编写对外汉字教材时不可只考虑汉字笔画数、部件数等常见因素,还应着重考虑汉字结构特点和笔画复杂度等因素,更应该根据语料库统计分析留学生的书写错误来选择教学汉字,平时多注意学生常常写错的汉字的收录。

【关键词】HSK动态作文语料库;笔画数;错字频次;对外汉字教材

一、引言

汉字是迄今为止连续使用时间最长的文字,是汉语的书写符号,也是各大文字体系中唯一传承至今的文字。无论是汉字文化圈还是非汉字文化圈的留学生,汉字都是他们学习汉语的一大难关。由于语言系统和文化的巨大差异,那些来自表音文字体系国家的汉语学习者学习汉字十分艰难,再加上对外汉字教学实践及理论的不成熟,导致汉字成为汉语学习者的主要障碍。

本文采用数据统计的方法对HSK动态作文语料库中留学生使用的汉字进行统计,使用图表法分析留学生汉字错字成因。笔者在HSK动态作文语料库ver1.1中收集到2173条错字记录,将这2173个字建立了数据库,主要字段包括汉字、笔画数、部件数、结构方式和错误频次。在错别字记录中去掉标点符号、英语大写字母、拼音、常用的数字号码、大写数字标号及实心方格、下划线等特殊符号后,统计剩下的漢字共为2162个,即统计的数据为2162个汉字。本文旨在为对外汉字教材的编写、对外汉字教学提供一些启示。

二、留学生汉字错误频次和笔画数相关性的统计情况

前人有做过相似的统计,从HSK动态作文语料库中筛选出3748个汉字,其中写错的汉字共1946个,按照错字率的分段和笔画平均数来统计,随着错误频率的减少,汉字的平均笔画数呈现明显的递减趋势。

笔者并没有采取分段计算错误率的方法,而是求取相同笔画数汉字错误频次的平均值,再将它与笔画数做比较,由此出现了图1。可以说,这张图已经较为直观地显示了汉字笔画数和汉字错误频次的关系。

从图1中可以看出,2162个错字,以7画为界限,1-7画的汉字错误率呈增长趋势,7画汉字平均错误频次达到最大值,为37.10次。在8-28画之间,汉字平均错误频次逐步呈现递减趋势。按照笔者的计算方法得出的结果与我们的常识不同,汉字笔画数越多,并不会造成更高错误率;相反的,从总体线性趋势看,汉字笔画数对汉字错误频次并没有明显的影响。为什么和前人研究的结论不一样呢?这个问题值得我们仔细分析。

三、关于汉字笔画数效应的研究

笔画是组成汉字的最小结构单位,笔画数的多少标志着字的繁简。现代常用汉字最简单的只有1画,最复杂的有36画。因而,笔画数就成为汉字字形整体特征的一种描述。有关笔画对汉字识别的影响研究较早。但是综合已有的一些研究发现,对笔画数是否影响汉字识别和书写,学者持完全不同的两种态度。还有一点需要注意,这些已有的研究都是针对母语学习者的,适用范围能否扩大至留学生呢?

汉字的笔画数到底对留学生记忆汉字有多大影响?从图中已经可以看出,当笔画增至7画时,留学生的书写错误不是越来越多,而是渐趋减少。可见,汉字的笔画数对留学生的书写影响并不像我们想象的那样明显。据笔者统计,按照笔画数从1画到7画,统计汉字共有631个,占总汉字数2162个的29.19%。这不到三分之一的笔画数相对较少的汉字,总错误频次共为19055,占总错误频次41538的45.87%,几乎占总错误频次的一半。所以,汉字笔画数确实会影响留学生的汉字认知,但过分强调“笔画数效应”,单纯认为汉字笔画数越多则书写错误越多是不合适的。笔者根据数据推断,在习惯书写拼音文字的非汉字圈学习者中,还有其他因素影响汉字的错误频次。

四、对影响留学生汉字学习重要因素的探究

如果汉字的笔画数并不是导致留学生汉字书写错误的直接因素,那是什么因素影响着它?为了研究此问题,笔者做出了假设。

假设1:留学生汉字错误频次与汉字的部件数有关,即存在“部件数”效应。

如图2所示,并不是汉字部件数越多,留学生书写错误频次越高。

但是为什么在统计中,留学生错字频次和部件数呈反比关系?笔者认为,汉字圈内学习者是拥有部件意识的,这种意识在细水长流的汉字学习和使用中得以巩固。但是不得不承认,母语学习者确实有部件意识,但这种意识具有一定的模糊性,一个汉字有几个部件大家的说法不一定一致。既然在母语学习者眼里一个汉字有几个部件都不能确定,那对于正在塑造汉字部件意识的非汉字圈内学习者来说,语言学意义上的部件不一定会成为影响汉字认知的直接因素。因此,本假设不成立。

假设2:留学生汉字错误频次与汉字结构方式有关,即存在“汉字结构方式效应”。

以HSK动态作文语料库中2162个错字为数据,笔者统计了汉字结构(简化五种)与书写平均错误频次的关系。其中,包围结构汉字239个,占总错字数的11.1%,错误频次8653,错误率达20.83%;穿插结构汉字2个,占总错字数的0.09%,错误频次47,错误率达0.10%;单一结构汉字172个,占总错字数的7.96%,错误频次4639,错误率达11.17%;上下结构汉字585个,占总错字数的27.06%,错误频次9068,错误率达21.83%;左右结构汉字1164个,占总错字数的53.83%,错误频次19176,错误率达46.16%。结果表明,确实是上下结构汉字的识别优于左右结构的汉字,因为它的错误率最低。这与尤浩杰等人以留学生为对象进行实验的结论基本一致。但是我们也应该注意包围结构的平均错字频次也是极高的,在这2162个汉字中,错误频次最高,达2273次的“这”,就是包围结构。笔者认为,上下结构的汉字,笔画间多相离,比笔画的相接或相交更容易分辨。为了清楚看出三种结构对留学生汉字认知的影响,笔者从所收集的基于HSK动态语料库的留学生错字中挑选了笔画数相同(7画),但结构方式不同的三个汉字“每”(120)、“这”(2273)、“我”(1375)。在同等笔画数条件下,字形的分散对汉字识别有促进作用。由此也可以看出,对汉字结构关系与错误频次的分析,与上文提到的汉字笔画数对留学生汉字识别的结果是相关联的,汉字笔画数、部件数的多少并不是造成留学生汉字书写错误的直接原因,汉字的结构、笔型的复杂度才是影响留学生汉字学习的重要原因。至此,本假设成立。

五、反思与建议

本文通过对“HSK 动态作文语料库”中的汉字使用情况进行统计分析发现,在外国汉字学习者的书写情况中,笔画数效应不明显,部件数效应不明显,结构效应比较明显,上下结构、左右结构和包围结构字的错误率依次递增。笔者认为,对外汉字教学及教材的编写需要考虑以下因素。

第一,注意收集留学生书写汉字常犯的错误问题,编写教材时要注意吸收留学生汉字偏误的研究。

第二,汉字的选取注意考虑1-7画的汉字。除了注意收录错误频次较高的汉字外,还应考虑汉字的常用度,体现汉字教学的实用性。

第三,因材施教。对汉字文化圈留学生,教学重点是与母语汉字的字形对比和字体对照,规范汉字书写。对于没有汉字教育背景的留学生,应充分考虑来自非汉字圈的留学生自身的学习认知特点,在学习初期可以采用传统汉字教学方法,通过练习来区分汉字的笔画笔形,强化汉字结构意识,进行部首和汉字笔画、笔顺和结构的教学。

【参考文献】

[1]张武田,冯玲.关于汉字识别加工单位的研究[J].心理学报,1992,24(04):379-385.

[2]喻柏林,曹河圻.汉字识别中的笔划数效应新探——兼论字频效应[J].心理学报,1992,24(04):10-16.

[3]崔永华,陈小荷.影响非汉字圈汉语学习者汉字学习因素的分析[J].海外华文教育,2000(01):50-53.

[4]尤浩杰.笔画数、部件数和拓扑结构类型对非汉字文化圈学习者汉字掌握的影响[J].世界汉语教学,2003(02):72-81.

[5]王爱丽.汉字的笔画数和结构方式对中度智力落后学生汉字字形识别影响的研究[D].上海:华东师范大学,2005.