欧美初级留学生汉字习得状况与偏误分析
2021-02-08杨同用李林林
杨同用 李林林
(浙江科技学院 浙江 杭州 310023)
汉字是学习汉语者最大的困难所在,汉字难认、难写、难记不仅是学生的共识,甚至也为有些教学者所承认[1]。许多教学者把汉字学习简单地理解为机械性记忆及背写,大大降低了汉字教学的效率,也把学习者挡在学习汉语的大门之外。同时,对于学习者的汉字书写我们似乎不太重视。以零起点的学习者为例,学界通常认为学习完800个甲级汉字就是成功的,但研究者较少对学生能自主输出多少汉字做研究。学习者认识了多少汉字和他会使用多少汉字是不同的概念,认识汉字可能只是机械性地记忆了汉字,而汉字教学最终还是要让学习者使用汉字。为了使汉字教学更具有针对性,有必要调查研究初级阶段留学生的汉字习得状况,了解学习者在学习汉字中面临的问题和难点,分析学习者在书写汉字中容易出现的偏误等。本文拟结合计量研究的方法,通过抽样调查和测试对上述问题进行讨论。
一、调查方式
1.确定汉字学习数量
分析留学生的汉字输出状况,首先要圈定一个汉字学习的目标数量,然后才能测算出被试的汉字量在总目标量中的比例[2]。汉字的数量是庞大的,根据已经出版的字书看,汉字的数量从9000到90000不等。如《说文解字》收字9353个,《中华大字典》收录48000多字,《汉语大字典》共计收列单字约56000个,号称目前收录汉字最多的《中华字海》共计收录汉字85568个。这些庞大的数字显然不适合作为教师的教学目标。在1988年国家语委发布的《现代汉语常用字表》中有3500个汉字,其中常用字2500个,次常用字1000个[3]。根据统计,“2500个常用字就覆盖了我们生活用字的约98%”[4],这可以作为我们教学的后期目标。根据北京语言大学出版的《对外汉语教学初级阶段教学大纲》(以下简称《初级教学大纲》),一个学期下来初学者基本要完成《汉语水平词汇与汉字等级大纲》[5](以下简称《汉字大纲》)800个甲级字的学习[6]。800左右的识字目标基本也是教学界的共识,在没有其他权威指导性文件的情况下,本文把《汉字大纲》所收800个汉字作为初级阶段的汉字学习目标。
2.资料来源
本文中,偏误的材料主要源于期末考试的试卷。笔者将以期末考试的“看图说话题”和“命题作文”为对象分析留学生的汉字书写状况。
3.调查对象
笔者随机选取了浙江科技学院汉语言文学专业商务汉语方向一年级学生16人作为调查对象(调查对象皆为欧美国家的学习者),占总调查人数的57%。选取的调查对象中,3人母语为俄语,2人母语为德语,2人母语为罗马尼亚语,其余学生母语皆为英语。这些学生由同一位老师教学。
4.确定偏误类型
通常情况下,判断学习者是否掌握了某汉字主要有两种方法。一是给出汉字让学习者加拼音,二是给出汉字让学习者组词,较为严格的测试还会将两种方式结合起来考查学习者[7]。考虑到研究的时间和测试形式的限制,本文主要考察学习者是否书写正确及是否组词正确。为了批改的准确性,我们以较为严格的规则批改学生所写的内容。为此本文尽可能全面地对学生的书写偏误进行分析并分为以下八种[8]:
(1)错字:如笔画书写错误、部件组合错误等都计入错字。
(2)别字:即该写甲字却写成乙字的情况,如“题高”的“题”为别字。
(3)繁体字:为了统一标准,本文将学生书写的繁体字一律计为书写偏误。
(4)异体字:即音同、义同而形体不同的字,这些字已经废除,所以本文也按偏误处理。
(5)拼音字:为了使标准能严格有效地执行,本文将该写汉字却写成拼音的也计入偏误。
(6)多字:多字表示一个词的某个构成语素出现了重复现象,如“后悔悔”。
(7)复合偏误字:指一个字同时存在两种偏误的现象,如“俭僕”的“僕”是别字的同时又是繁体字。
(8)存疑字:写的让人无法识别的字本文记为偏误。
5.测试
测试以期末考试的形式进行,本文主要在两种题型中观察学习者的书写状况:一是“看图说话题”,一是“命题作文”题。“看图说话题”是通过给出乘地铁或火车相关的四幅图让学习者进行描述,图片中没有任何提示性文字。“命题作文”给出的题目是《我喜欢的人》,这个题目对于绝大多数学习者来说都是可以写出东西的。作文题要求写500字左右,基本符合本文让学习者展示汉字书写能力的需要。为了保持评判标准的统一性,所有试卷由同一位老师批改,这有利于保证数据的准确性和可靠性。从测试结果看,以上两种类型题对本文判断测试者汉字习得状况总体上是有效的,但试卷的设计仍然存在一些问题,这些将在后文具体分析。
二、测试结果
1.书写数量统计
分析测试结果时,除了书写正确外,学习者组成词或短语的意义也正确时才认定为他掌握了该汉字。以下是笔者得到的数据:
图1 图片题汉字书写量
图1展示了在“看图说话题”中学习者书写的汉字量。根据统计,在“看图说话题”中16位学习者共写出1334个汉字,平均每人输出83个,平均到每幅图上就是约20个汉字。去掉1334个汉字中重复使用的,实际使用汉字207个。“看图说话题”并没有规定要书写的字数,这可能是学习者书写字数差距过大的原因,今后测试应注意规定字数。
图2 作文题汉字书写量
图2展示了在“命题作文”中学习者书写的汉字数量。根据统计,在作文题中学习者共输出汉字3600个,平均每人书写225字。去掉3600字中重复使用的汉字,学习者在作文题中实际使用汉字597个,与我们的教学目标接近但低于我们的预期,学习者的汉字习得水平还较低,需加强汉字学习。
2.书写偏误统计
以下是本文对测试者书写偏误的统计数据:
图3 图片题书写汉字正误对比
图3中“系列1”是学习者在“看图说话题”中输出的字数,“系列2”是输出的汉字偏误数量。从数据看,在“看图说话题”中,16位测试者共写错62个汉字,其中“错字”33个,“别字”18个,“拼音字”11个。去掉重复书写错误的14个汉字,实际写错48个汉字。
图4 作文题书写汉字正误对比
图4中“系列1”是学习者在“作文题”中输出的字数,“系列2”是输出的汉字偏误数量。从数据看,在“作文题”中,16位学习者共写错163个汉字,去掉重复出现的36个错字,实际写错127个汉字。其中“错字”100个,“别字”23个,“拼音字”4个。
三、结语
1.输出数量“达标”
根据《初级教学大纲》的要求,第一学期我们基本要完成《汉字等级大纲》800个甲级字的教学目标。从测试的结果看,学习者在“看图说话题”和“作文题”共输出汉字4934个,去掉重复书写的汉字实际输出642字。这个数量与本文的教学目标基本接近,但仍有欠缺。而且,从图1和图2的趋势看,测试者的汉字输出水平并不相同。在“看图说话题中”,没有规定字数,学习者书写的字数从40字到198字不等。“作文题”即使规定了要写500字,但学习者答题字数最多的是318字,与规定字数相去甚远。需要承认的是,考虑到题型及内容的限制,可能有些汉字学习者在这里并没有使用出来。在之后的研究中可以设计其他题型与输出型题型相互补充以全面测试学习者的汉字输出能力。
2.偏误现象普遍
从“看图说话题”和“命题作文”的测试结果看,在“看图说话题”中有两位测试者没有出现偏误,但他们在“作文题”中出现了偏误,而其余的每位测试者都或多或少出现了书写偏误。以上结果表明,欧美学习者在初级阶段普遍容易出现汉字书写偏误。
3.偏误数量与书写总数没有直接关系
在笔者的预期中,学习者书写的汉字越多错字也会随之而增加。但是通过图3和图4的数据我们可以观察到,错字的数量和书写字数的多少没有直接关系。
4.错字占书写偏误的大部分
根据图3和图4的数据,“看图说话题”和“命题作文”的偏误汉字共175个(该数据已经剔除那些重复的偏误)。其中“错字”有133个,占76%。“别字”有41个,占32.2%。“拼音字”有15个,占11.8%。
毫无疑问,“错字”占了偏误的大部分,即学生在笔画或部件及其组合上最容易出现问题。由此笔者认为,在教学中还是要加强汉字的书写训练,尤其要加强笔画的训练。
5.高频率偏误
根据统计,以下几个汉字出现偏误的次数最多,而且是不同测试者的相同偏误:
(9)“的”字出现偏误最多,最常见的是少了第一笔“撇”。
(10)“晚”字。大多学习者都把最后一笔的“竖弯钩”写成“捺”或“竖钩”。
(11)“喜”字。学习者把部件“士”写成“土”的情况最多。
(12)“人”或“入”字。因为分不清“人”和“入”,学习者普遍会采取一种投机策略把两个字都写成“∧”借此蒙混过关。
以上偏误表明,教师应加强部件的教学,在教学中强化训练容易出错的笔画和部件。
6.对学习者的写作能力预估过高
本次测试中,“命题作文”要求学习者写500字左右的文章,但测试结果(图4)表明学习者最多才写了318字,其余测试者的答题字数平均在225字,低于本文的预期要求。一方面笔者高估了学习者的水平,另一方面也表明出题者在出题前没有做好充分调查和预判,这是本文在之后的研究中需要注意的部分。