汉字应用水平测试试卷用字报告*
2021-06-26王淑华
王淑华
(上海大学 文学院,上海 200444)
汉字应用水平测试(简称为“HZC”)是“由中华人民共和国教育部、国家语言文字工作委员会组织实施的一项语言类标准化水平测试”[1]194,旨在“通过测验的方式,衡量具有中等及以上受教育程度的人或文化程度与此相当的人在阅读、书面表达及其他相关活动中,是否掌握了汉字应用水平测试范围内汉字的规范字形、正确读音以及在权威工具书中所载的义项及用法,是否能在实践中正确运用,并据此评定他们掌握和使用汉字的水平及能力”[1]194-195。
汉字应用水平测试的规范文件《汉字应用水平等级及测试大纲》于2006年8月正式发布,2007年2月起试行,同年汉字应用水平测试进行首次试测。2014年,教育部根据国务院2013年发布的《通用规范汉字表》和历年测试结果,对规范进行了修订完善,形成了新的规范文件《汉字应用水平等级及测试大纲》。因此,2014年可以看作该测试实行新旧大纲的分界线。
汉字应用水平测试从2007年走到现在,不过十多年,相对而言比较年轻,故针对该项测试进行研究的专项研究并不多。常见的多为测前指导和工具书,如《汉字应用水平测试指导用书》[1]《汉字应用水平测试与训练》[2]《汉字应用水平测试字典》[3]等。研究性的论文主要涉及两个方面:一是介绍汉字应用水平测试的研制背景、目的、基础、过程、内容和意义[4]52-56[5]31-33[6]50-57,二是测试的阅卷规则、成绩报告、信度和效度等[7]91-97[8]101-108[9]169-176。基于测试卷面本身的研究并不多见。
对于一项以汉字的形、音、义和综合运用为考查内容的测试来说,卷面本身的用字情况将直接影响着试卷的质量高低,并进一步影响到测试的信度和效度。因此,对汉字应用水平测试试卷卷面的用字情况进行调查统计分析,不仅有助于提高测试的适切性,还有利于提高测试的规范性和科学性。有鉴于此,本文以2012年和2015年的卷面作为新旧大纲指导下的试卷样本,对其具体用字情况进行考查,期望借此了解汉字应用水平测试卷面的用字情况,在此基础上,对测试用字涉及的相关问题进行思考,并提出一些建议。
一、汉字应用水平测试卷面总体用字报告
新大纲规定的汉字应用水平测试的范围和试题题型均有变化,测试卷面的用字情况也随之发生了变化。
2012年汉字应用水平测试试卷卷面总字次为2 669,总字种为1 278。“的”频次最高,共104次;接下来依次为“是”(28),“一”(26),“人”(25),“不、了”(20),“过”(15),“和”(14),“时、为、物、在”(12),“国、来、我、心”(11),“大、地、个、能、三、有、中”(10)。频次为9~6之间的汉字如下:“才、出、动”(9),“将、门、气、生、体、通、行、以”(8),“长、成、程、风、画、就、开、可、里、流、上、者、自”(7),“称、到、对、精、酒、明、年、前、水、它、位、吸、下、小、新、要、也、这、之、重”(6)。频次为5及以下的汉字字种数较多,依次为33、62、86、252、792个(1)频次较低的汉字数量较多,因篇幅原因,不再一一列举。后同。。
2015年汉字应用水平测试试卷卷面总字次为1 318,总字种为956。“的”频次最高,共32次;接下来依次是“不”(14)、“人”(13)、“风、一”(11),“了、填、着”(8),“事、心、子”(7),“成、气、然、如、山、在”(6),“出、和、其、生、笑、意、自”(5),“别、发、海、经、声、时、是、为、要、有、中”(4),“并、藏、带、代、党、而、方、高、故、湖、花、苦、理、流、们、青、上、世、释、水、所、谈、同、我、远、云、之、装、总、作”(3)。频次为2和1的汉字字种数分别为95和796。
2012和2015年汉字应用水平测试卷面整体用字频次的对比见表1。
表1 2012年和2015年汉字应用水平测试卷面整体用字频次对比表
从表1可以看出,新大纲实行后,卷面总字种仅占到原来总字种的3/4,有较为明显的下降;就汉字的不同频次来说,也有较大差别,除频次为“40~31”的这个区间外,其他频次区间中,2012年试卷的字种数均明显高于2015年。当然,两年试卷的用字情况也有较为接近的地方:一是最高频使用的汉字均为“的”,二是使用频次靠前的汉字均是常用的甲表字,三是频次为1的汉字字种数量差别不大。
二、汉字应用水平测试试卷各部分用字报告
新旧《汉字应用水平等级及测试大纲》均明确指出,汉字应用水平测试试题卷由四个部分共120道试题构成(2)旧大纲规定试题卷由五个部分共130道试题组成。但实际上只有2007年的试卷是130道题,2008年及以后的试卷,都是由四个部分120道试题组成。。四个部分的试题内容均按以下比例选取:70%选自《汉字应用水平测试字表》甲表,20%选自乙表,10%选自丙表。因此,下文对测试试卷各部分用字情况的考查主要侧重于汉字的三表归属情况。
为便于统计,本文将题干中的汉字分为两种类型:一种是直接作为测试对象的测试字,在试卷中以加点字、备选项或填空项的形式出现,另一种是作为背景出现的背景字。测试字和背景字一起构成了试卷的全体用字(3)此处的全体用字跟上文的卷面用字略有不同。汉字应用水平测试试卷第四部分是汉字书写,要求受测者根据要求书写出正确的汉字。这些受测者书写的汉字属于测试字,但不在卷面用字范围之内。。
(一)汉字应用水平测试字音认读部分用字分析
2012年字音认读部分总字次为400,其中测试字总字次为180,背景字总字次为220。总字种为353,其中测试字总字种为159,背景字总字种为206,有部分汉字如“不、横、强、称、当、弱、血、笑”等既出现于测试字,也出现于背景字中,因此,总字种数少于背景字与测试字字种之和。
2015年字音认读部分总字次为184,总字种为183(测试字字种数为180、背景字字种数为3),其中“州”字频次为2。
本部分2012和2015两年度不同类型的汉字(按字种统计,下同)字表归属情况见表2。
表2 2012年和2015年汉字应用水平测试字音认读部分汉字字表归属情况
从表2可以看出,上述两个年度字音认读部分,无论是测试字还是总体用字,均未满足大纲“7∶2∶1”的要求,具体来说是甲表用字有余,乙表用字不足,丙表字有较大波动(一年有余、一年不足)。
(二)汉字应用水平测试字形辨误部分用字分析
字形辨误试题和字音认读部分略有不同。字音认读部分有明确的测试字和背景字之分,当题干是词语时,试卷采用字下加点的方式标明了测试字的身份。而在本部分中,对受测者而言,在选出正确答案以前,题干中出现的所有汉字机会均等,都有可能是误字。为了便于区分,本文将最后作为答案选项出现的汉字称为一级测试字,没有作为答案出现的汉字称为二级测试字。本题中没有背景字。
考虑到本部分只要求找出使用有误的那个汉字,并不要求书写正字,从客观上来说,受测者写不出对应的正字,或将题干备选项中另一个正字误判为错字,都不影响其正确完成该题。但就大部分受测者而言,一般是在知晓正字的情况下完成的。因此,本文在统计本题所用汉字字表归属情况时,也一并统计了对应的正字。
2012年本部分共有两种题型,第一种题型题干为词语,第二种题型题干为4个小句或句子组成的语段。第一种题型一共有20小题,本题中总字次为200,总字种为192;其中一级测试字20个,二级测试字172个。第二种题型是找出语段中有误的选项,本部分共10题,字次为896,字种为489。
2015年本部分仅保留了2012年的第一种题型,题干均为词语;总字次为372,总字种307。
本部分两年度不同类型的汉字字表归属情况见表3。
表3 2012年和2015年汉字应用水平测试字形辨误部分汉字字表归属情况
从表3可以看出,2012年字形辨误部分的用字情况无论是就一级测试字、二级测试字还是就所有对应的正字而言,均远未满足大纲对三表“7∶2∶1”的要求。2015年的用字比例优于2012年,虽然一级测试字、二级测试字和所有用字比例未达大纲要求,但就误字对应的正字而言,正好符合大纲的规定。本部分用字的总趋势是甲表字有余,乙丙二表不足。
(三)汉字应用水平测试汉字选用部分用字分析
本部分卷面中,本文将以答案选项形式出现的汉字规定为测试字,其他汉字规定为背景字。2012年度汉字选用部分共有两种题型,其题干分别为词语和句子。第一种题型总字次为60,总字种也为60;第二种题型总字次为600,总字种为391。
2015年度本部分共有三种题型。第一种题型以词语为题干,后两种题型虽都以句子为题干,但需填入汉字数量不同,分别为1和2。第一种题型总字次为60,总字种为59;其中测试字字种为40,背景字19。第二种题型总字次为230,总字种为193;其中测试字40,背景字153。第三种题型总字次为282,总字种为222;其中测试字40,背景字182。本部分两年度所用汉字字表归属情况见表4。
表4 2012年和2015年汉字应用水平测试汉字选用部分汉字字表归属情况
从表4可以看出,相对而言,2012年第一种题型的测试字用字比例与大纲要求最为接近。但2012年和2015年本部分无论是测试用字还是总体用字,均未达到大纲要求,总体趋势依然是甲表字偏多,乙表和丙表用字不足。
(四)汉字应用水平测试汉字书写部分用字分析
2012年本部分共三种题型:第一种题型以选择题的形式考查汉字的笔画笔顺;第二种根据拼音写出词语或句子中的汉字;第三种找出语段中的错别字并改正,与字形辨误一样,在受测者确定误字之前,本题题干中出现的所有汉字都有可能是误字。考虑到找出误字是前提,但写出对应的正字是根本,因此,本文将需要书写的正字称为一级测试字,需要找出的误字称为二级测试字,其他称为背景字。第一种题型总字次为27,总字种为20,测试字字种为3;第二种题型出现的均是背景字,总字次为110,总字种为94。第三种题型总字次为359,总字种为236,其中二级测试字字种为10。
2015年本部分共两种题型,都是书写汉字,区别在于第一种题型有拼音提示,第二种没有。卷面上出现的均为背景字,第一种题型中总字次为129,总字种为105;第二种题型中总字次和总字种均为30。本部分各题型所用汉字字表归属情况见表5。
表5 2012年和2015年汉字应用水平测试汉字书写部分汉字字表归属情况
2012年本部分三种题型合起来统计后发现,如果第三种题型仅统计一级测试字,甲乙丙三表用字的比例依次是:60%、23.3%、16.7%;如果统计包括二级测试字,甲乙丙三表比例依次是:67.5%、20%、12.5%,比例虽与大纲规定略有出入,但已较为接近。总的趋势是甲表字不足,丙表字有余。
2015年本部分中虽然第一种和第二种题型的测试字分开来看均不符合大纲要求,但作为一个整体来看,三表字的使用比例和大纲规定的“7∶2∶1”完全一致。
综上可以看出,新大纲实施前后,汉字应用水平测试试卷中第四部分汉字书写的测试字比例最接近大纲要求。
三、基于汉字应用水平测试用字情况的思考
(一)汉字应用水平测试试卷用字变化及其影响
旧大纲指导下的汉字应用水平测试试卷的题干有词语(60%左右)、句子(24%左右)和语段(16%左右)等三种类型,基本没有以孤立的汉字为题干的试题。而实行新大纲以后,试卷中不再出现以语段为题干的试题,题干有汉字、词语、句子三种类型,比例分别为24%、53%、23%,表现出较为明显的“去语境化”的趋势(4)虽然词语和句子也可看作语境,但句子较为简短,词语是作为静态单位出现的,所以与语段体现出来的语境不可相提并论。。测试题型变化了,测试卷面用字情况也随之发生了较大变化,同时,用字情况的变化反过来又对试题考查范围产生影响。
1.新大纲实施后卷面总体用字减少
2012年和2015年汉字应用水平测试试卷卷面总字次2 629和1 318,总字种分别为1 278和956。相较于2012年度,2015年卷面总字次减少了49.9%,总字种减少了25.2%。
新增的以汉字为题干的试题主要出现于试卷第一部分,或是找出注音有误的一项,或是找出读音不同的一项。新题型对汉字语音的考查更为直接,原来可以依词定音,现在题干是光杆汉字,更不容回避,无法猜测。
卷面用字数量减少,能有效避免不同题目之间无意的互相提示。例如,2012年在字形辨误部分考查了“启用”“报道”“品味”等词,而在汉字选用部分,再次考查了“启用”“报道”和“品味”。考点相同,题目之间相关度过高,不利于准确测出受测者的汉字能力。
2.测试试题考查范围发生变化
大纲修订了,题型变化了,卷面用字减少了,试题的考查范围也发生了变化。
汉语中有相当数量的多音字,这些多音字以不同的语音形式出现于不同的词语和句子中。实施旧大纲时,字音认读部分以词语为题干,无论是找出注音错误的题型,还是找出加点字读音不同的一项,均可以涉及对多音汉字的考查。以2012年为例,第一部分测试字中多音字有42个,占比达26.4%。但新大纲实施后,本部分的题干主要是孤立的汉字,多音问题几无涉及(5)新大纲实施后第15题是考查地名中一些汉字的读音,其中有一些是多音字。。
新旧大纲均明确规定,要考查受测者“顺畅阅读以规范汉字为媒介的现代文献资料”和“在实践中准确运用汉字”的综合能力。删除了以语段为载体的题干以后,前者无法考查,后者考查力度有限。
(二)关于汉字应用水平测试试卷用字问题的讨论
1.关于甲乙丙三表用字比例问题的讨论
新旧大纲都明确规定,汉字应用水平测试试卷各组成部分的试题按“7∶2∶1”的比例分别从甲、乙、丙三表中选取。这要求看似明确,但操作中有很多模棱两可之处。
这个比例针对的对象范围从小到大有如下四种可能:一是仅指多项选择题的正确答案选项用字和第四部分的书写用字,二是指上文中的测试字,三是指所有卷面用字,四是指卷面用字和书写用字。
新旧大纲指导下的测试试卷中均有字形辨误部分,“7∶2∶1”是针对题目中出现的误字而言,还是针对对应的正字而言?就2012年的试卷汉字书写部分而言,最后一种题型是找出语段中的错别字,如果找不出来就不可能写出对应的正字。那么这个比例应针对误字还是针对正字?或是两者都纳入统计范围?
一份试卷的构成需要考虑方方面面的因素,三表字的比例只是其中较为重要的一个。因此,让测试字和背景字同时满足“7∶2∶1”的要求可能有些难度,可以考虑在条件许可的情况下分层实现。
首先,每个部分的测试字均应满足“7∶2∶1”的要求。就第一部分字音认读和第三部分汉字选用来说,测试字都是作为备选项出现的汉字;就第二部分字形辨误来说,测试字指表3中的一级测试字,即用作正确答案选项的误字;就第四部分汉字书写来说,测试字指需要正确书写的汉字。2015年,汉字书写部分比例完全达标,如果字形辨误部分以正字计算的话,也符合要求,但字音认读和汉字选用部分离规定要求尚存一定距离,可见测试试卷仍有需要改进之处。
其次,字形辨误和汉字书写部分分别对应的正字和误字也应满足“7∶2∶1”的要求。字形辨误部分误字对应的正字,新大纲实施前的汉字书写部分第三种题型中所需书写汉字的对应误字,从整体上来说也都应满足“7∶2∶1”的要求,但无须要求每组“误字—正字”的字表属性完全相同。
最后,条件许可时卷面各部分用字和书写用字均满足三表字“7∶2∶1”的要求。这是一种比较理想的状态。虽说甲表中的汉字在日常生活中使用频次更高,但乙、丙两表中的汉字在日常的阅读和写作中同样发挥着重要的作用,尤其是从字种数上来说,更是不可轻视的重要组成部分。因此,乙丙两表用字应适当增加。
2.关于测试试卷表外字使用问题的讨论
从上文可知,2012年的测试卷中偶有表外字出现,一共3个,分别出现于字形辨误和汉字选用部分的测试字中。2015年的测试卷所用汉字均在甲乙丙三表范围之内。这是不是证明2015年的汉字应用水平试卷比2012年的规范呢?
本文认为,在测试试卷中的测试字和背景字中,均可以出现适当比例的表外字。原因有以下几点。
首先,汉字应用水平测试大纲收录的汉字数量不多,不能完全满足日常汉字使用的需要。
新旧汉字应用水平测试大纲收录的字表虽略有差异,但三表和总表汉字数量相同,都是甲表字4 000,乙表500,丙表1 000,一共5 500字。相对其他字表而言,这个字表数量较少。例如,《信息交换用汉字编码字符集·基本集》中收录了通用汉字6 763个,1988年完成的《现代汉语通用字表》收录汉字7 000个,2013年发布的《通用规范字表》收录汉字8 105个。对比可以看出,测试字表收录范围较《通用字表》和《通用规范字表》分别少收录1 500和2 605个。《通用规范字表》明确指出,其一、二级字表通过语料库统计和人工干预方法,主要依据字的使用度进行定量、收字和分级;三级字表主要通过向有关部门和群众征集用字等方法,收录音义俱全且有一定使用度的字。可见未见于测试字表的部分汉字,使用度也不低。
在平时的汉字应用过程中,也会经常遇到不认识的汉字。因此,能够根据上下文的语境,猜测不认识的汉字的读音和字义,对汉字使用者来说较为重要。
其次,适当增加表外字可以更全面地考查受测者的汉字能力。
本文认为,汉字能力是一个由多种特质构成的复合体(如发音、辨形、知义、书写、应用等),大致可以区分为静态和动态两个层面。静态的汉字能力可以细分为认、读、写、说、查、辨(形近字、音近字、义近字的辨别)等六个方面,动态的汉字能力包括在语境中正确、灵活运用汉字的能力和根据语境猜测不认识的汉字的读音和字义的能力。
就现在的汉字应用水平测试而言,较侧重于对汉字静态能力的考查,尤其是侧重对字音、字形的考查,对动态的运用汉字的能力有所涉及,但考查力度不够。在测试字和背景字中出现适当的表外字,如果受测者不熟悉,就需要联系上下文语境进行猜测并理解,这样能更全面地考查受测者在动态的语境中灵活运用汉字的综合能力。
最后,含有一定比例的超纲内容是语言类测试的常规做法。
以全国硕士研究生入学统一考试为例,其英语词汇大纲收录有5 500个单词,但同时明确指出,考生应能读懂选自各类书籍和报刊的不同类型的文字材料(生词量不超过所读材料总词汇量的3%)。此外,大学英语四六级考试的材料中也有3%左右的超纲率,英语高考中超纲的单词一般占5%左右。因此,汉字应用水平测试中含有适当比例的表外字,是可行且合理的。
四、关于汉字应用水平测试的建议
(一)细化大纲要求,探索更多适合测量汉字能力的新题型
大纲指出,汉字的综合运用主要表现为“具备顺畅地阅读以规范汉字为媒介的现代文献资料的汉字基础”和“在广泛领域用汉字进行书面表达”两个方面,并分别规定了达到一、二、三级等不同水平的具体表现。但对照新大纲实施前后的试题,可以看出,“用汉字进行书面表达”的能力自始至终没有被测到;删除了以语段为题干的试题以后,对“阅读以规范汉字为媒介的现代文献资料”能力的测量也非常有限。
汉字应用水平测试的试题难度受字表等级、汉字本身的形音义的特征、包含测试字的词语的使用频次、试题测试点是否单一等因素影响,但不可否认,字表等级是其中非常重要的一个因素。虽然目前甲表字考查比例最高,但甲表字数量最多,是乙表和丙表的几倍,且由于高频使用的原因,众多甲表字常常难以成为测试点,有时即使成为测试字,试题难度常常也达不到理想水平。因此,对于常用的,尤其是笔画简单的甲表字,应根据其特征,寻找恰当的测试方法。
总的来说,汉字应用水平测试大纲可以对如何考查汉字能力的不同侧面做出更为细致的要求,并尽量将能力、要求与卷面题型对应起来,探索更多适合测量汉字能力的新题型。
(二)加强对历年真题卷基础信息的统计工作,促进测试的科学化、规范化
加强对汉字应用水平测试历年真题卷字频、词频、测试成绩等的统计工作,有助于测试试卷朝着更规范、科学的方向发展。
1.字频和字表属性
分析历年试卷整体的用字情况(总字次、字频和字种等),分析每个部分所用汉字的字表属性,以此为基础,尽量确保汉字测试试卷能达到以下三点:各部分测试字按大纲要求的比例分布;每个测试字在本卷中的频次为1(多音字例外);试卷中的非测试字对甲乙丙三表均有一定的覆盖率。
2.词频
仅统计试卷中的汉字使用情况,是“只见树木”,很难对测试试卷有一个整体的认识。但对试卷中的用词情况进行统计,能帮助研究者发掘试卷的一些属性,譬如总词次、总词数、不同类型词语的频次、含有测试字的最小词语的使用频次等信息。汉字测试试卷应尽量达到以下三点要求:第一,一份试卷中包含测试字的最小词尽量只测量1次。例如,在2012年的试卷中,“启事、品味、报道”等词作为测试点,分别以改错和选字填空的形式出现了两次。因为测试点完全相同,所以对应试题的相关性非常高,其中一题做对了,另一题自然也对。完全相同的测试点没有必要在同一卷面中再次出现。第二,保持适当的同音词的比例。汉语中有较多同音字,而由一个相同的汉字与一组同音字组合形成同音词,会给受测者带来较大的干扰,这也是汉字应用中的一个难点。如“启用”与“起用”、“过渡”与“过度”、“切记”与“切忌”、“反应”与“反映”、“震荡”与“振荡”、“品味”与“品位”、“截流”与“截留”、“推托”与“推脱”、“考查”与“考查”、“事故”与“世故”等。适当地考查同音词,能更准确地反映受测者的汉字能力。第三,避免出现生造词和频次过低的词语。新大纲实施前后,词语都是重要的题干形式。为了准确地测量出受测者的汉字能力,应避免以一些生造词或频次过低的词语作为测试对象。
3.测试结果
对历年测试的结果进行统计,计算每份试卷和每道试题的难易程度,找出影响不同类型试题难度的各种因素,形成模型,能在测试之前即对试题难度有一个初步的认识。
(三)建立汉字应用水平测试题库,促进测试向自适应方向发展
对于大规模的标准化测试来说,题库建设是一项必不可少的工作,是提高测试质量、保证测试结果可靠性和有效性、达到测试目标的重要手段,更是测试走向专业化、客观化、科学化和规范化的必由之路。
汉字应用水平测试题库建设,应该严格按照测试大纲的要求,开展内容选择、属性标注(如难度、区分度、曝光度、回避参数等)[10]37-42、组卷规则设计等工作,由计算机根据规则自动生成符合大纲要求的试卷初稿,再进行人工干预,生成可用的试卷。
最近20年,计算机技术飞速发展,自适应测试逐渐成为一种趋势。题库可以不断更新,试题库中试题的属性参数也可以进行动态的调整修正。在此基础上,计算机可以根据受测者的水平,选择最合适的题目进行测试,对其汉字应用能力做出精确的评估,以适应不同工作的需要。