基于汉字应用水平测试的少数民族群体汉字能力调查
2021-09-18王淑华
王淑华
(上海大学 文学院,上海 200444)
随着信息化时代的到来,手机和电脑等电子产品日益普及,键盘输入和语音输入成为主流输入方式,传统纸笔书写方式的生存空间不断被压缩。社会上,写错字、提笔忘字、使用不规范汉字等现象随处可见,越来越多的学者认为我们的社会已经进入或即将迎来“汉字危机”。虽然偶尔有学者提出不同意见[1],但整个社会汉字应用能力普遍下滑是不争的事实。
我国是一个多民族国家,少数民族是中华民族不可分割的重要组成部分。根据2020年第7次全国人口普查数据,大陆31个省、自治区、直辖市和现役军人的人口中,各少数民族人口为12 547万人,占8.89%。这是一个不小的比例,这个群体的语言文字应用水平直接关系着整个社会语言文字应用水平的高低。然而,少数民族群体语言文字的使用情况极为复杂。有些民族既没有民族语言,也没有民族文字,所以通用的是汉语汉字;有些民族仅有民族语言,没有民族文字;还有些民族虽然有自己通用的语言和文字,但这些民族语言和文字的通用程度有较大差异。因此,在“汉字危机”这样一个大的社会背景下,对少数民族群体的语言文字应用水平进行调查具有重要的意义。
一、汉字能力与汉字应用水平测试
(一)何谓汉字能力?
施正宇将汉字能力定义为“用汉字进行记录、表达和交际的能力”,包括“写、念、认、说、查”等五个要素[2]。叶军指出汉字能力包括:(1)汉字的字量,包括识字量和写字量;(2)准确、恰当地在各种情况下运用汉字的能力;(3)汉字的字感,即汉字学习能力[3]。
我们认为,汉字能力可以区分为静态的汉字能力和动态的汉字能力两个层面。静态的汉字能力是就孤立的汉字而言的,汉字是形音义三位一体的单位,对孤立汉字的字音、字形、字义的掌握都属于静态的汉字能力这一层面,如“写、念、认、说”的能力。动态的汉字能力是就使用中的汉字而言的,如在阅读或写作时不了解某个汉字的形音义,能灵活运用音序、部首、笔画等不同检字法查检字典来解惑;能依据字形和上下文猜测不认识的汉字的字义或读音;在较大的语境如句子或语段中,能正确选择使用同音字、形近字、音近字、义近字等;能识别日常所见的语言景观中的繁体字,判断语言景观中的不规范字、二简字、错别字并知晓对应的正体字或正字;能运用一定的方法、技巧有意识地提高自己的汉字学习效率,具有一定的字感,能够区分非字(指生造的不符合汉字笔画或结构规律的字)与假字(指生造的符合汉字笔画或结构规律,实际上并不存在的字)[4]。这些汉字能力,可以总结为“查、猜、用、辨、学”的能力。
(二)汉字能力与汉字应用水平测试
汉字应用水平测试从2002年开始研发,2007年首次施测,至今已有十多年,目前已在全国14个省、市进行试点推行。该测试的目的是了解中等以上受教育程度人群在以规范汉字为媒介的阅读、书面表达等活动中,掌握和使用汉字所达到的水平。测试的卷面主要由字音辨读、字形辨误、汉字选用和汉字书写等四个部分组成。前三个部分以选择题的形式出现,最后一部分以填空的形式出现。
就对汉字能力的考察而言,测试对汉字静态层面的能力和动态层面的能力均有涉及。字音辨读部分,题干有汉字和词语两种类型,前者倾向于考察汉字静态层面的能力,后者则静态层面和动态层面的能力均有兼顾。字形辨误、汉字选用、汉字书写等部分,题干有词语和句子两种类型,这三个部分既考察了受测对象关于汉字字音、字形和字义的静态能力,也考察了动态的汉字应用能力。因此,通过观察受测者汉字应用水平测试的结果,可以在一定程度上了解他们的汉字能力。
有鉴于此,本文以2014年和2015年上海市参加汉字应用水平测试的少数民族群体为调查对象,统计其测试成绩,分析这一群体的汉字能力表现,了解他们与汉族相应群体汉字能力的差异以及不同民族内部之间的差异,并提出针对性的建议,期望能有效地提高整个少数民族群体的汉字应用水平。
二、少数民族受测群体汉字应用水平测试成绩分析
(一)少数民族受测群体特征分析
2014年和2015年,上海市汉字应用水平测试总参测人数分别为12 027、11 073。参测对象以汉族为主,也有少数民族参加。两年间共有30多个少数民族共767位受测对象参加了汉字应用水平测试。这些受测对象的性别、职业、学历等信息如表1所示。
表1 2014—2015年上海市汉字应用水平测试少数民族受测对象特征分布表n(%)
由于汉字应用水平测试目前仍处于试点阶段,因此上海市仅接受集体报名,主要是在大中小学中推广①。从表1可以看出,受测对象中,女性、学生、本科生占绝对优势。
就他们的具体民族分布来看,参测人数最多的是回族(132)和满族(93),超过70人以上的少数民族有土家族(81)、壮族(78)和蒙古族(74)。超过40人的有3个民族,分别是苗族(55)、维吾尔族(54)、藏族(45)。接下来依次是布依族(23)、侗族(24)、白族(17)、彝族(17)、瑶族(15)、朝鲜族(14)。布朗族(1)、达斡尔族(2)、傣族(3)、俄罗斯族(1)、仡佬族(3)、哈尼族(6)、哈萨克族(4)、黎族(7)、仫佬族(2)、纳西族(1)、羌族(1)、畲族(4)、水族(1)、土族(1)、锡伯族(2)、裕固族(1)等16个少数民族的参测人数均不足10人,另有2人民族信息不详。
(二)少数民族受测群体测试总体情况分析
1.少数民族受测群体测试入级分析
汉字应用水平测试分4个部分共120小题,卷面原始分为120分,进行标准化处理以后导出分数满分为800分。2014—2015年767名受测对象中,最高分605,最低分285,全距320,中位数是482,平均分472.85,总体分布呈左偏状态。
测试中,整份试卷获得的分数为600及以上且甲表测试内容作答正确率在80%(含)以上为一级,分数在500—599之间且甲表测试内容作答正确率在65%(含)以上为二级,分数在200—499之间甲表测试内容作答正确率在50%(含)以上为三级。2014—2015两年间767名少数民族受测对象总体入级情况如表2所示。
表2 2014—2015年少数民族受测对象总体入级情况n(%)
从表2可以看出,少数民族受测对象的汉字应用水平主要集中在三级,占比为50%左右;其次是二级,超过了1/3;而不入级的比例远高于一级比例。整个入级情况充分说明了这个群体的汉字应用水平尚有较大的提升空间。
2.少数民族受测群体和汉族受测群体的对比分析
为了了解少数民族受测群体的汉字应用水平,我们对2014—2015年767名少数民族受测对象和22 333名汉族受测对象的成绩进行了独立样本t检验②,结果如表3和表4所示。
表3 组统计量
表4 独立样本检验
从表3和表4可以看出,在显著性水平为0.05下,汉族和少数民族在总分和等级方面的独立样本t检验的Sig值均为0.000,小于0.05,所以可以认为汉族和少数民族在总分和等级方面均存在显著性差异,且由均值大小可知,汉族显著高于少数民族,即汉族群体的汉字应用水平高于少数民族群体汉字应用水平。
三、少数民族受测对象汉字能力影响因素分析
(一)性别、职业、学历对受测对象汉字能力的影响
2014—2015年的767位少数民族受测对象,不同性别、职业、学历测试者的入级情况如表5所示。
表5 2014-2015年少数民族受测对象具体入级情况n(%)
进一步的统计发现,不同性别的受测对象在测试成绩上有显著差异(Sig值为0.000)。女性群体均值为477.34,男性群体均值为452.05,女性显著高于男性,即女性的汉字水平高于男性的汉字水平,这一结论和王淑华、雷红波的观点一致[5]。
不同职业的受测对象在测试成绩上也有显著差异(Sig值为0.008),教师群体均值为487.72,学生群体均值为470.75,教师群体显著高于学生群体。
就学历因素来说,统计发现,学历为高中和大专的这一群体,其测试成绩与另两个群体的测试成绩之间有显著差异,但学历为本科和学历为硕士及以上的两个群体之间测试成绩没有显著性差异。三个群体均值分别为418.92、476.91、491.59,学历为高中或大专的群体汉字应用水平显著低于本科及以上的群体。
(二)民族因素对受测对象汉字能力的影响
上一节中,我们发现少数民族群体的汉字能力和汉族群体的汉字能力有差异,汉族高于少数民族。实际上,不同的少数民族在汉字测试中也表现出了较大的差异。为了了解差异的具体表现,我们统计了8个40人以上的少数民族受测群体的成绩和入级情况,结果如表6和表7所示。
表6 2014—2015年8个少数民族测试群体测试成绩情况
表7 2014—2015年8个少数民族测试群体入级情况
综合表6和表7可以看出,壮族、满族两个民族的受测对象在测试中成绩最好,最高分均在600以上,均数和中位数均超过500,入级情况以二级和三级为主,二级人数超过一半。维吾尔族和藏族的受测对象在汉字应用水平测试中成绩最低,均数和中位数均低于400,最低分在275左右,入级情况以不入级和三级为主,且两个民族的测试群体中均有超过一半的测试者未入级。
上述4个民族的入级趋势和少数民族群体总体入级趋势(见表2)有较大差异,不过其他民族的入级情况大致与总体趋势大体相同,以三级为主,其次为二级,最后是不入级和一级。
为了更清楚地挖掘出这8个少数民族汉字应用能力的差异,我们先采用单因素方差分析法确定了这8个少数民族在总分和入级情况方面均有显著性差异(p=0.000<0.01),再进行多重比较分析8个民族两两之间的差异。
根据比较结果,我们将8个少数民族分成如下4组:
A.壮族和满族;B.土家族和蒙古族;C.苗族和回族;D.维吾尔族和藏族
8个民族之间汉字能力异同情况表现如下:
(1)A、B、C等3组均与D组有显著性差异;A组和C组之间也有显著性差异。
(2)B组成员能力介于A组和C组之间,与A、C两组均无显著性差异;
(3)A、B、C、D等4组内部成员的汉字能力均无显著性差异。
维吾尔族和藏族群体的汉字能力与其他民族均有显著性的差异,这很容易理解。这两个民族有较为集中的本民族的聚居地,有本民族的语言文字,而且本民族的语言多是作为第一语言习得,日常使用频率较高,汉语是第二语言,所以其汉语汉字能力明显低于其他一些少数民族。A组和C组在日常语言文字的使用上虽然没有明显的差异,但此次测试有差异,说明一个人的语言文字能力是受多种因素作用的结果,本次可能是受测试对象性别、职业、学历等因素的影响。
四、提高少数民族群体汉字能力的措施
从上文可知,少数民族群体汉字应用水平测试的入级趋势以三级为主,其次是二级,再次是不入级,一级比例最低。少数民族的汉字应用能力显著低于汉族,不同民族内部也有较大的差异。考虑到2014—2015年的受测对象以大学生为主,且多集中在高等院校,这是一个汉字应用能力相对较高的群体,因此,自然、真实的少数民族群体,其汉字应用水平应该低于本次调查的水平。提高少数民族群体的汉字能力,可以从以下几个方面入手:
(一)加大宣传力度,提高汉字应用水平测试在少数民族群体中的社会知晓度和参与度
汉字应用水平测试目前仍处于试点测试阶段,未在整个社会全面推行,加之目前仅接受集体报名,因此其社会知晓度并不高,且远低于普通话水平测试。测试相关部门应该加大汉字应用水平测试宣传力度,同时发挥传统媒体和新媒体的作用,通过多种途径加强汉字应用水平测试的宣传推广工作,提高汉字应用水平测试的社会知晓度。
据第七次全国人口普查资料,2020年,上海市各少数民族人口为39.98万人,比2010年增长44.8%,占上海市总人口的1.6%。而2014—2015年参加汉字应用水平测试的少数民族群体,仅达少数民族总人口的0.19%,这是一个非常低的比例。考虑到最近10年,上海市少数民族人口呈非常明显的增长趋势,因此,在汉字应用水平测试的宣传过程中,可以采取针对性的措施,吸引人口数在1万以上的少数民族群体如回族、土家族、苗族、满族、朝鲜、壮族和蒙古族等参加测试,提高少数民族群体的整体受测比例。
(二)重点关注少数民族学生和教师两大群体的汉字能力,发挥学校的阵地和辐射作用
学校在教育过程中一直起着至关重要的阵地和辐射作用,立足学校,再分步辐射至整个社会。不同学校把好出口关,对提升社会语言文字使用的规范性可达正本清源之效。学生和教师无疑都是与汉字关系极为密切的群体,因此,就提升少数民族群体汉字能力这一任务而言,大力提升大中小学少数民族的教师和学生这两个群体的汉字能力,可起事半功倍之效。考虑到测试对象中,男性群体的汉字能力显著低于女性群体,学生群体的汉字能力显著低于教师群体,高中和大专学历群体的汉字能力显著低于本科及以上群体,因此,对具有男性、学生、高中和大专学历等特征的少数民族群体需尤为关注。
从少数民族师生这两个群体开始,辐射至工作与汉字关系较为密切的少数民族其他从业人员,再逐步辐射至与汉字关系不太密切或不密切的其他少数民族群体,最终达到提升整个族群汉字能力的目标,逐步推进,分步提高,这是一个较为切实可行的途径。
(三)加强对语言景观的监管,尤其确保少数民族聚居地社会用字的规范与正确
“公共路牌、广告牌、街名、地名、商铺招牌以及政府楼宇的公共标牌之上的语言,共同组成某个属地、地区或城市群的语言景观”[5]。语符的类型和搭配、文字的使用等是语言景观关注的重要方面。中国的语言景观,一般以汉语为优势语言,以汉字为优势文字,但汉字的使用中,常有不规范的情况发生,如使用繁体字、异体字、二简字、错别字等,这在一定程度上会起到误导作用。因此,应加强对语言景观的监管,尤其要确保少数民族聚居地语言景观中汉字使用的规范与正确。
(四)重视汉字的文化功能,激发少数民族群体的汉字自豪感
汉字是中华文化的重要载体,也是中华文化的基础要素和鲜明标志,有着丰富的文化内涵和审美价值,同时还具有文化塑造和传承功能。汉字本身携带并蕴含了丰富的文化信息,借助汉字,我们可以了解到特定时代的社会状况,如农牧渔猎、衣食住行、婚姻生育、风俗习惯和思想观念等。而汉字形音义三位一体的特征,又促使它在使用过程中孕育了丰富多彩的文化现象,如书法、篆刻、灯谜、避讳、民俗字和诗文楹联中的析字、联边、谐音、双关、回文等。
无论是加大汉字应用水平测试的宣传和推广力度,还是重视学校的阵地作用或语言景观的监管作用,这些都是外因。在“键盘时代”,激发全体国民尤其是少数民族群体的汉字自豪感,充分发挥汉字学习者和使用者的主观能动性,提高其学习汉字汉文化的热情,这是少数民族群体汉字能力得以提高的内因。外因通过内因起作用,内因和外因相结合,各途径并举,少数民族群体的汉字能力一定会得到提高。
注释:
①汉字应用水平测试在大学中同时面向教师和学生,中小学中仅面向教师。因此,表1的教师包括大中小学的教师,而学生仅指大专或本科院校的大学生。
②为了更好地体现汉族和少数民族在汉字应用水平等级上的差异,统计时我们将“一级、二级、三级、不入级”分别赋值为“4、3、2、1”。