影响普通话水平测试信度的因素
2014-04-09杨秀芳
普通话水平测试对推广普通话具有极为重要的促进作用。它是促使推广普通话工作逐步走向科学化、规范化、制度化、常规化的一项非常重要的举措。普通话水平测试对维护我们母语的纯洁性、弘扬中华语言文化传统、传承民族精神、增强学生爱国情怀、提高全民的普通话水平将发挥重要作用。现代汉民族共同语——普通话,以北京语音为标准音,以北方话为基础方言,以典范的现代白话文著作为语法规范。普通话水平测试主要是检测应试者运用普通话(语音、词汇、语法)的规范程度和熟练程度,是一种口语形式的考试。普通话水平测试的构成要素有试题、测试员、应试者、评分标准。随着推广普通话工作的不断扩大,普通话测试的信度与效度也面临着考验。
1 试题质量
普通话水平测试是依据《普通话水平测试大纲》(教育部国家语委发教语用〔2003〕2号文件),以及普通话水平测试国家指导用书《普通话水平测试实施纲要》(国家语言文字工作委员会普通话培训测试中心编制,商务印书馆2004年1月版)的具体要求开展的。根据大纲的要求,普通话水平测试的试卷包括四部分内容:读单音节词语100个、读双音节词语50个、朗读短文、话题说话。
1.1 避免多音字
试题第一部分读单音节词语主要是测试应试者的语音基本功,也就是普通话中的声、韵、调发音是否正确、规范。由于普通话测试的大纲中没有对多音字做出特别的规定,所以在第一题中就出现了大量的多音字。多音字就是一个字有两个或两个以上的读音。在调查的十套试题中,平均每套试题第一题中的多音字平均出现6次。测试中的多音字数量较多,无论是测试者还是应试者在遇到多音字的时候,首先选择的是常用的读音。但是当应试者选择这个多音字不
1.2 避免生僻字
刘照雄《〈普通话水平测试大纲〉总论》:“普通话水平测试不是普通话系统知识的考试,不是文化水平的考核,也不是口才的评估,是应试人运用普通话所达到的标准程度的检测和评定。”可见,普通话水平是对应试者运用普通话的语音、词汇和语法的规范程度的检测,而不是对应试者文化水平高低的检测,所以试题中应该避免大量的生僻字。但实际测试中试卷第一部分、第二部分却出现了一些在现实生活中较少用到的一些偏字、难字、文言用字、方言用字等。在调查的十套试题中,生僻字列举如下:“邹”“舜”“槛”“沓”“苤”“稗”“佟”“襄”“簪”“侧歪”“押解”“熨帖”“蚌埠”“糜子”“女红”“倒嚼”等,而且这些生僻字在试题中分布不均衡,有的试卷生僻字多一些,有的试卷生僻字少一些。这样的试题并不能真实地反映受试者的普通话水平,只是反映了应试者某一方面的文字水平或者说是文化水平。在测试中发现,有些应试者普通话讲得很好,但只是因为第一部分遇到大量生僻字,不认识,没有读好,就直接影响了总的测试成绩。所以我们要在尽可能满足大纲要求的同时,尽量地采用实用的常见字来代替生僻字。这样既反映普通话的发音,又可以消除应试者遇到生字时的紧张状态,将会更公平、客观地反映应试者普通话的水平,不会因对生字生词的掌握偏差而影响考试成绩。
1.3 避免两读(轻声与非轻声)
试题第二部分读双音节词语中,常有3~5个轻声词。所谓轻声指的就是在一定的音节中读得又轻又短的调子。测试中发现试卷中经常会出现两读的情况,即同一词可以读轻声也可以读非轻声,这类词轻声与否有区别词义的作用。调查的十套试题中,轻声非轻声两读词平均出现2次。如:“兄弟”“对头”“编辑”“本事”“大爷”“买卖”“实在”“下水”“地道”“大意”等。这类两读词的存在必然会影响普通话测试的信度,因为测试员不可能全部掌握语言中的轻声和非轻声,在极短的时间里来判断这类词的读音是否正确必然会出现失误。解决的主要办法就是尽量不采用这种两读词,只选择一些必读轻声词。
2 测试员素质
各地的测试员由于个人素质有高有低,加之对推广普通话和语言文字工作重要性的认识不同,对有关规章制度、执行标准的熟悉程度不同,对业务理论的掌握程度以及业务能力的高低不同等等,这些不同的测试员间存在的差异,往往造成普通话水平测试工作评分的不客观、不公证的情况。有些测试员虽然口语基础比较好,但听音、辨音能力差,对一些语音缺陷、方音不够敏感,捕捉得不够准确;有的对自己不熟悉的方音敏感,但对自己所在地的方音不够敏感,于是造成评判时信度失效现象的出现。
由于普通话水平测试大纲中没有对普通话的各个音位在不同环境下的音位变体有一个统一明确有效的标准,所以测试员在实际测试时就有一定的灵活度。这个灵活度会产生对试题中的同一个音测试员定位标准不同的情况。如,很多测试员在测试过程中对上声字(第三声)、儿化、轻声现象比较敏感,所以对这类音的定位标准过于狭窄,比较严格、苛刻;而有时候由于某种原因测试员对某一类音又过于迟钝,从而造成对这类音的定位标准又过于宽泛;而对于那些比自己普通话水平还高的应试者测试员很难运用测试标准来正确评判,从而影响测试信度。
在具体测试过程中,测试员往往会带有一些主观评价。如对自己本专业的应试者的评判标准要比对非本专业的应试者宽松一些;对播音、主持、教师等相关领域的人员要比对其他人员严格一些等等。此外,应试者的年龄、身份、举止、着装、外貌、籍贯等因素也间接影响到测试员的评判。此外,测试员个人敬业程度的不同,也会造成评分的不客观。认真严谨,一丝不苟的测试员,打的分数也比较客观公正;相对随意,对应试者错误、缺陷的标记时有时无,甚至开小差的测试员,打的分数就不够准确。
以上这些不统一的标准会直接影响应试者的成绩,造成测试信度降低。解决这些问题的方法有以下几个:第一,在测试现场设置监控系统;第二,用障碍物把测试员和应试者隔开;第三,应试者信息完全由序号替代,测试过程中不允许出现和应试者有关的任何信息。我们希望通过这些方法能简单有效地解决测试过程中由主观原因造成的测试信度降低的问题。
3 评分标准
普通话水平测试的试题虽是统一的,但每个测试员对评分标准的理解把握却存在差异,也在一定程度上影响了评分的客观性、公正性。根据《普通话水平测试大纲》和《普通话水平测试实施纲要》的评分办法,对第一题和第二题对错误音节的评判,不同测试员在测试过程中基本上不会产生太多差异,但在“系统性”错误或缺陷的归类上却存在一定程度的差异。第四题朗读与第五题说话的标准,尤其是方言语调和语言面貌(语音标准程度)标准的把握上,各测试员之间的差异很大。《细则》对朗读题的方言语调(语调偏误)是这样规定的:“视程度扣0.5分、1分、2分(含字调、句调、变调、轻声、轻重音格式、逻辑重音)。”“视程度”,那么什么程度该扣0.5分,什么程度扣1分,什么程度又该扣2分呢?这种模糊的感觉判断使得不同测试员之间必然存在差异。于是出现了同一个考生的语调偏误,不同测试员有的扣2分,有的只扣1分的现象。
[1]国家语委普通话水平测试中心.普通话水平测试实施纲要[Z].北京:商务印书馆,2004.
[2]宋欣桥.普通话水平测试的评分差异[J].语文建设,1998,(9).
[3]屠国平.普通话水平测试员审音失度之成因及对策[J].绍兴文理学院学报:哲学社会科学版,2000,(2).
[4]原新梅,刘冬冰.关于普通话水平测试若干问题的研究和对策[J].河南师范大学学报:哲学社会科学版,2001,(3).
[5]黄伯荣,廖序东.现代汉语[M].北京:高等教育出版社,2005.