汉字应用水平测试字形辨误试题对比研究
2019-03-05王淑华
王淑华
摘 要:字形辨误试题是汉字应用水平测试试卷的一个重要组成部分。从首测到现在,字形辨误试题在题量和题干形式方面均有所调整。对比2012和2015年试卷本部分用字情况,发现2015年本部分总字次和总字种数量均远远低于2012年,两个年度所用汉字的字表属性与大纲规定的“7:2:1”的要求尚有距离,在试题的难度和区分度也均略有欠缺;不同题型和不同题干形式的试题在难度和区分度方面有较明显的差异。字形辨误试题难度和区分度主要受高频同音字、含有相同语素的同音词或近音词、含有共同部件的形近字、异体字等因素的影响。
关键词:汉字应用水平测试;字形辨误试题;对比分析
汉字应用水平测试(简称为“HZC”)是中华人民共和国教育部、国家语言文字工作委员会组织实施的一项国家通用语言文字的标准化水平测试,是我国语言文字立体化测试框架的构成要素之一,旨在衡量具有中等及以上受教育程度的人(或文化程度与此相当的人)掌握和使用汉字的水平和能力。汉字应用水平测试由四个部分构成:字音认读、字形辨误、汉字选用、汉字书写。字形辨误属于第二部分,一般以选择题的形式出现,通过找出词语或句子中使用有误的汉字,来考察受测者准确识别和使用汉字规范字形的能力、辨析并纠正汉字书写和使用中错误的能力。
本文以汉字应用水平测试中的字形辨误试题为对象,分析历年试题题型发生的变化,对比2012和2015年①卷面的用字情况、字表属性、难度和区分度等,探讨影响字形辨误试题难度和区分度的不同因素,为汉字应用水平测试培训和备考工作提供参考,也希望能在一定程度上促进汉字应用水平测试朝着规范化和科学化的方向发展。
一、汉字应用水平测试字形辨误试题的变化
自2007年汉字应用水平测试进行首测以来,字形辨误试题一直是该项测试试卷的重要组成部分,但题量和题干形式有一定的变化。
(一)2007年測试字形辨误试题题型
2007年汉字应用水平测试字形辨误位于试卷的第二部分,有两种题型。具体如下:
第二部分:选择题,在语境中判断字形正误,共40题。
样题 在下列各题的四个词语中,请找出用字有错误的一项。
A.磋商 B.急燥 C.修炼 D.严峻
样题 在下列各题的四句话中,请找出加点字使用错误的一项。
A.他费了半天工夫才把这几道题做出来。
B.这批出土竹简上的文字已经很难分辩了。
C.向筹委会提交论文的截止日期是星期一。
D.上半年工会开支一共是两千零六元整。
(二)2008~2013年测试字形辨误试题题型
2008年以后,本部分一直由30道小题组成。2008~2013年度本部分也是两种类型。以词语为题干的第一种题型继续沿用,第二种题型题干形式有所变化。具体如下:
样题 请找出以下各题中用字有错误的一项。
黎明,无边无垠的白云如丝棉被覆盖着群山,/只
A
有一个山峰好比巨人耸立在白云之上。/半年没有下雨
B
了,山民们受着干旱的煎熬,/山坡上的果树都枯萎了,
C D
牲口也喝不上水了。
两相比较,区别很明显。2007年作为题干的4个短句之间是没有联系的,而2008~2013年的试题是将一个完整的语段分为A、B、C、D四个组成部分,各部分由2个左右的小句组成。同时,2008~2013年的试题不再有加点字进行范围提示,语篇中的任何一个字都有可能是错字。
(三)2014年以后测试字形辨误试题题型
2014年以后,字形辨误部分试题仅有一种题型,沿用的是2007年及以后的第一种题型,即找出4个词语中用字错误的一项。词语有双音节、三音节的,也有四音节的,但以双音节和四音节为主。
综上可以看出,从2007年到现在,字形辨误试题的变化呈现出两个趋势:
1.去语境化
2013年及以前,有33.3%的试题以句子或语段为题干。但2014年以后,所有的试题均以词语为题干。虽然词语也可以和句子一样,看作汉字使用的语境,但词语是孤立的、较小的语境,和句子或语段存在较大的区别。
2.重视成语用字的考察
2014年以前,本部分中四音节的成语试题占比为16.7%;2014年以后,四音节的成语试题占比达50%甚至更多。
二、汉字应用水平测试字形辨误卷面用字情况对比分析
2012和2015年的字形辨误试题,无论题干是词语还是句子,均未通过加点等方式提示范围,所有出现的汉字理论上都有是误字的可能,均属于测试字。为了区分,我们将卷面用字分为两种,作为答案选项出现的称为一级测试字,没有作为答案出现的其他汉字称为二级测试字。
(一)2012年和2015年测试字形辨误试题用字频次分析
2012年度字形辨误部分卷面总字次为1096,总字种为632。在第一种题型中,卷面总字次200字,总字种为192(一级测试字20个,二级测试字172个),其中,“残、和、披、然、人、势、心、仗”等8字各出现2次,余者皆为1次。在第二种题型中,卷面总字次为896,字种为485(一级测试字10个,二级测试字475个),其中,“的”出现频率最高,为54;接下来依次是一(12)、是(10)、“过、人、在”(9)、“地、和、来”(8)、“不、大、物”(7)、“个、国、画、了、通”(6)、“成、将、里、它、我”(5)、“蝙、出、到、动、度、对、而、蝠、化、会、们、那、能、上、生、水、天、吸、行、要、重、最”(4)、“长、程、传、道、方、飞、风、家、间、精、开、可、类、林、流、内、女、千、亲、求、时、市、缩、体、为、位、心、新、学、以、鹰、这、之”(3)、“八、保、北、被、奔、标、表、哺、餐、产、沉、从、存、达、等、点、定、东、都、短、敦、多、父、感、刚、构、规、海、后、护、煌、记、甲、经、景、距、老、离、力、历、良、旅、美、命、目、南、年、品、起、情、拳、群、然、让、乳、山、深、失、食、史、始、式、松、岁、坛、特、替、外、文、西、息、细、下、现、翔、向、象、消、洋、样、野、夜、艺、游、与、再、展、张、征、制、质、中、逐、自”(2),余者皆出现1次。
2015年度字形辨误部分只有一种题型,总字次为372,总字种为307(一级测试字30个,二级测试字277个)。其中,“不”出现11次,接下来依次是“生、天、心、一、自”(4)、“发、风、人、谈、笑、子”(3)、“别、筹、出、高、故、过、花、结、经、口、苦、夸、马、其、气、情、求、如、声、事、释、守、同、言、异、意、怨、云”(2),余者皆出现1次。
两相比较,可以看出,新大纲实行后,卷面用字的总字次和总字种均大为减少,2015年卷面总字次为2012年的33.9%,总字种为2012年的48.6%。两个年度的高频用字情况也有较大区别,2012年使用最高频次的汉字达到54,使用频率大于等于5的汉字一共有22个;而2015年使用最高频次的汉字“不”为11,并且只有这一个汉字的频次超过5。由于2015年卷面总字种数量减少了很多,所以某一小题中的一级测试字在其他小题中以二级测试字出现的概率大大下降。
(二)2012年和2015年测试字形辨误试题汉字字表归属情况分析
《汉字应用水平等级及测试大纲》明确指出,汉字应用水平测试每个部分的试题内容有70%来自《汉字应用水平测试字表》甲表,20%来自乙表,10%来自丙表。下面我们来检验一下2012和2015年度字形辨误试题是否符合大纲要求。
本题只要求找出用字有误的那个词语,不要求订正。从客观上来说,受测者不会写对应的正字,或将备选答案中的另一个正字误判为错字,都不影响其顺利完成该题。不过就大部分受测者而言,是在知晓对应正字的情况下选出误字的,因此,我们在统计本题所用汉字字表归属情况时,也一并统计了对应的正字。
2012年度字形辨误试题所用汉字字表归属情况,如表1所示:
第一种题型的一级测试字中,18个甲表字为“摧、锋、沽、拔、侯、慌、萃、景、巢、楞、僻、婉、维、誊、叩、带、犹、碳”,1个丙表字为“盍”,1个超纲字为“剌”;对应的正字中,16个甲表字为“刺、催、烽、估、跋、候、荒、粹、憬、愣、惋、誉、扣、戴、尤、炭”,2个乙表字为“癖、帷”,2个丙表字为“窠、溘”。二级测试字中,5个乙表字分别为“枸、遴、挲、瘠、骈”,11个丙表字为“蟥、愠、燧、媾、啮、嗫、嚅、蚍、蜉、筚、儆”。
第二种题型中的10个一级测试字“溶、迷、到、起、划、振、退、流、位、飘”,都是甲表字;对应的正字“融、谜、道、启、画、震、蜕、留、味、漂”,也均是甲表字。二级测试字中,仅2个乙表字“籁、撷”,1个丙表字“喙”。
2015年度字形辨误试题所用汉字字表归属情况,如表2所示:
30个一级测试字中,28个甲表字为“抿、络、奕、仟、装、扼、授、合、做、悠、密、畔、克、负、弥、哀、缀、鸠、闻、筹、云、宛、忧、繁、逾、潭、接、事”,1个乙表字为“岐”,1个丙表字为“佗”。对应的正字中,21个甲表字为“歧、忏、妆、遏、和、作、幽、秘、衅、刻、敷、唉、辍、文、芸、尤、烦、喻、谭、截、世”,6个乙表字分别为“泯、恪、弈、绶、陀、莞”,3个丙表字分别是“弭、鸩、俦”。342个二级测试字中,16个乙表字为“邸、佚、莴、苣、伫、臾、诠、豉、涸、夙、苋、饴、庖、悱、恻、浃”,丙表字为“歃、觥、逑、衽、俎”。
两相比较,可以看出,2012年度和2015年度本部分所用漢字字表归属情况趋势相近,都是甲表字使用过多,乙表字和丙表字严重不足。
相对而言,2015年的指标略优于2012年度。因为就上表中的4项指标一级测试字、二级测试字、对应的正字、所有用字而言,2012年均不符合大纲规定,但2015年有一项指标(对应的正字)符合大纲要求。不过,对于字形辨误这一部分来说,受测者只要能找出词语中使用有误的汉字,即使不会写对应的正字,也不影响选出正确答案。因此,大纲对甲乙丙三表“7:2:1”的要求应该是针对题中的误字而言,还是针对对应的正字而言,这是一个可以继续讨论的问题。
三、汉字应用水平测试字形辨误试题难度和区分度对比分析
本文用失分率Q来表示难度,失分率越高则难度越大;用D表示区分度,用PH表示高分组的通过率,PL表示低分组的通过率。其中,难度Q=1-(PH+PL)/2,区分度D=(PH-PL)[1]。一般认为,难度指数在0.3~0.7之间比较合适,区分度在0.3以上则表明该题区分度较好。因此,我们将难度指数在0.3~0.7区间、区分度高于0.3的记为“+”,其他的记为“-”。我们对2012年和2015年字形辨误各小题的难度和区分度进行了计算,具体如表3所示:
从表3可以看出,虽然2012年度和2015年度本部分的题型有所变化,但从整卷的难度和区分度来看,变化不大。相对而言,2015年度的试题在难度和区分度方面的表现略优于2012年度,但也未处在理想区间内。
就难度而言,2012年,有8道试题比较理想,处于0.3~0.7之间,22道试题低于0.3,没有高于0.7的试题;2015年,有9道试题比较理想,处于0.3~0.7之间,20道试题低于0.3,1道试题难度高于0.7。
就区分度而言,2012年,有11道试题高于0.3,19道试题低于0.3;2015年,有14道试题高于0.3,16道试题低于0.3。2012年度的第51题尤其值得我们关注,其区分度为负数,即这道题低分组的通过率高于高分组,因此,这道试题有问题,应该删除。
2012年度有两种题型,第一种题型是以词语为题干找出用字有误的一项,第二种题型是以语段为题干找出用字有误的一项。第一种题型的平均难度为0.22,区分度为0.27;第二种题型的平均难度为0.31,区分度为0.30,均处于理想区间,这说明在语段中辨别字形正误是一种比较好的题型。
2015年度本部分只有一种题型,都是以词语作为题干。前13道试题以双音节词语为题干,第14道试题以三音节词语为题干,统计以后发现这14道试题的平均难度为0.21,区分度为0.24,均与整个试题的难度和区分度有较大差异。后16题均以四音节的成语为题干,它们的平均难度和区分度在0.33左右,处于比较理想的状态。对比可以看出,以四音节的成语为题干的试题,其难度和区分度均优于以双音节词语为题干的试题。
四、汉字应用水平测试字形辨误试题难度和区分度影响因素分析
我们以2012年度和2015年度字形辨误部分的试题为基础,又考察了其他几个年度的字形辨误试题,并对其错误类型进行了分析,从而发现字形辨误试题的难度和区分度主要受以下因素影响:
(一)高频同音字
在现代汉语中,声韵相拼可以组成400多个音节,加上声调可以组成1200多个不同的音节。同时,现代汉语常用汉字有3500个,2013年公布的《通用规范汉字表》收录有汉字8105个,而一般字典、词典要收录汉字8000~10000个。因此,汉字中不可避免地存在着大量同音现象,如“yi”这个音节在《现代汉语词典》中就有170个汉字。当一组同音字均为高频用字时,如:“做”和“作”、“画”和“划”、“成”和“呈”、“和”和“合”、“位”和“味”、“到”和“道”、“溶”和“融”、“现”和“献”、“查”和“察”、“托”和“拖”、“带”和“代”“戴”等,在使用中都会受到不同程度的影响。
(二)含有相同语素的同音词或近音词
同音字本身会给汉字学习带来很大的干扰,而由一组同音字与另一个相同的汉字组成同音词以后,无疑会形成更大的干扰。如:“启用”与“起用”、“报到”与“报道”、“过渡”与“过度”、“切记”与“切忌”、“反映”与“反应”、“震荡”与“振荡”、“品味”与“品位”、“截流”与“截留”、“推托”与“推脱”、“考察”与“考查”、“事故”与“世故”、“暗淡”与“黯淡”、“发奋”与“发愤”等。同样,一组读音相近的汉字与另一个相同的汉字组成近音词以后,也会形成同样的干扰。如:“映射”和“影射”、“纯真”和“纯正”、“遏制”与“遏止”、“合龙”与“合拢”、“抚养”与“扶养”、“异义”与“疑义等。遇到这种类型的词语,一定要注意从同音字或近音字出发来理解词语本身的意义,从常用搭配、使用范围、语义侧重等不同方面进行辨别。
(三)含有共同部件的形近字
我们统计了2012和2015年难度在0.4以上的题目,发现有不少试题测试字和对应的正字构成了一组含有共同部件的形近字,其共同部件多为形声字的声符。如:“迷”和“谜”、“度”和“渡”、“受”和“授”、“坐”与“座”、“分”和“份”、“锋”和“烽”、“僻”和“癖”、“俦”和“筹”、“飘”和“漂”、“壁”和“璧”等。可以说,这些含有共同部件的形近字对受测者形成了较大的干扰。
(四)废除后又重新启用的异体字
我们知道,曾经禁止又重新启用的异体字与代替字会在相当长的一段时间内并存。以“戮”和“勠”为例。张凤强指出,1955年发布的《第一批异体字整理表》,把“勠”规定为“戮”的异体字予以淘汰,因此,“戮”在承担自身意义的同时,又承担了“勠”“并力、合力”的意思,“戮力”于是成为一定时期通用的写法[2]。2013年,国务院公布《通用规范汉字表》,该表将“勠”调整为规范字,义为“合力、齐力”,与“戮”的用法有了明确分工。因此,现在规范的写法是“勠力”。又如“粘”和“黏”。薛志霞指出,溯源求本,“黏、 粘”本为一字,有正俗之分(“粘”为“黏”的俗字),无读音、 用法之别,明代这两个字分别有两读[3]。1955年,中华人民共和国文化部、中国文字改革委员会发布《第一批异体字整理表》,将“黏”视为是“粘”的异体字,予以停止使用;1988年,国家语言文字工作委员会和新闻出版署发布《现代汉语通用字表》,确认“黏”为规范字,得以重新启用。从此,两字在使用上各有分工:“黏”是形容词用法,如黏稠、黏附、黏着、黏结、黏豆包、黏着语等;“粘”读“nian2”时仅表示“姓”,读“zhan1”时为动词用法,如粘连、粘贴、粘信封等。虽然关于“黏”“粘”的规范用法已发布三十多年,但它们在使用时仍然存在一定的混乱。
五、结论
本文将2012年和2015年汉字应用水平测试试卷作为新旧大纲实施的代表,从命题变化、用字情况、难度和区分度及影响因素等方面,分析字形辨误部分的试题,结论如下:
1.字形辨误试题的命题变化
从2008年起,字形辨误试题题量一直是30道题,较2007年减少10道。题干形式先后有词语、没有联系的4个小句、分成4个部分的一个语段等三种形式;目前试题的题干仅有词语一种形式,主要是考察双音节词和四音节成语的用字情况,表现出较为明显的“去语境化”和“重视成语用字”的倾向。
2.字形辨误试题的用字情况
因试题题干形式发生了变化,导致新大纲实行后的试卷总字次和总字种均大为减少,2015年卷面总字次为2012年的33.9%,总字种为2012年的48.6%。就试卷一级测试字、二级测试字、对应的正字、所有用字四个指标而言,2012年的字形辨误试题均未达到大纲要求试题对甲乙丙三表的覆盖比例(“7:2:1”);2015年有且仅有对应的正字这一项指标达到要求。
3.字形辨误试题的难度和区分度
2012年度字形辨误试题的平均难度为0.25,平均区分度为0.28;2015年度平均难度为0.27,区分度为0.29,两个年度的整体难度和区分度均略有欠缺,未处于理想区间。就题型而言,以语段为题干的试题,其难度和区分度均优于以词语为题干的试题。就词語为题干的试题而言,以四音节词语为题干的试题的难度和区分度均优于以双音节词语为题干的试题。
4.字形辨误试题难度和区分度的影响因素
字形辨误试题的难度和区分度主要受高频同音字、含有相同语素的同音词或近音词、含有共同部件的形近字、废除后又重新启用的异体字等因素的影响。
我们认为,汉字应用水平测试应朝着规范化和科学化的方向发展。要使汉字应用水平测试字形辨误试题更加科学、客观,可以从以下几个方面入手:
1.尽量增加卷面字种数量,使测试能够覆盖更多数量的汉字;
2.卷面用字包括一级测试字、对应的正字、二级测试字等,对甲乙丙三表的覆盖比例能逐层满足大纲“7:2:1”的要求;
3.统计历年测试结果,标注难度、区分度等信息,以使测试结果能更好地指导今后的测试工作;
4.建立汉字应用水平测试用汉字属性库,标注字表等级、是否有异体字、易混淆的形近字、同音字等信息,为本部分的命题工作提供依据;
5.研发更多适合考察汉字字形的题型。
参考文献:
[1]黄光扬.教育测量与评价[M].上海:华东师范大学出版社,2012.
[2]张凤强.“戮力”应为“勠力”[J].咬文嚼字,2015,(6).
[3]薛志霞.黏、粘二字形音考[J].语言科学,2007,(4).