APP下载

影响普通话水平测试信度与效度的实证研究①

2011-03-31李海宏

长江大学学报(社会科学版) 2011年12期
关键词:效度信度普通话

李海宏

(浙江传媒学院 播音与主持艺术学院,浙江 杭州 310018)

影响普通话水平测试信度与效度的实证研究①

李海宏

(浙江传媒学院 播音与主持艺术学院,浙江 杭州 310018)

普通话水平测试的信度与效度是影响普通话水平测试规范性和科学性的重要问题。试卷的设计、普测员的水平、被试的心理素质等都是影响普通话水平测试信度与效度不容忽视的因素,将这些影响降到最低能够提高测试的信度与效度。

普通话水平测试;信度;效度;影响因素

推广普通话是国家的一项重要的语言文字政策,越来越多的职业岗位已经实行普通话持证上岗制度,普通话等级证书已经成为影响某些人员职业发展的重要砝码,普通话水平测试(以下简称PSC)的重要性不言而喻,如何保证PSC的规范性和科学性就成为我们必须考虑的问题。鉴于此,笔者以浙江省普通话培训测试中心2006~2009年期间送审国家语委普通话培训测试中心的8个批次206名一级甲等被测者的测试结果为例,分析影响现行PSC信度与效度的相关因素。

一、PSC的相关概念

《普通话水平测试大纲》(以下简称《大纲》)中明确规定,PSC是“为进一步提高推广普通话工作的制度化、规范化、科学化水平,完善普通话水平测试系统”而制定的,它“不是普通话系统知识的考试,不是文化水平的考核,也不是口才的评估,是应试人运用普通话所达到的标准程度的检测和评定。”《大纲》中规定了测试的方式及内容,浙江省PSC中心免测“选择判断”项;大纲中明确规定了各项的评分标准,并根据最终得分将PSC分为三级六等,最高级别为一级甲等(97分及其以上),最低为三级乙等(60分及其以上但不足70分)。所有的测试结果最终体现为一定的分数及等级,因此成绩评定直接反映并影响着PSC的信度和效度,体现着测试的科学性和规范性。

二、语言测试的信度与效度

信度(Reliability)是反映测验结果受到随机误差影响程度的指标,是评价测验质量的最基本的指标,高信度是高效度的前提,没有信度,效度也谈不上[1](P143)。PSC属于主观评分,根据目前的经典测试信度理论,我们可以将主观评分的信度理解为评分员的一致性,据此笔者认为如果几个测试员给出被测者的成绩和等级是一致的,尤其是等级是一致的,就可以说该测试具备高信度,反之,则不具备高信度。美国心理学学会认为效度是“对测验分数所作的特定推论在恰当、有意义以及实际使用价值几个方面的程度。”[1](P203),正如张凯在《语言测试理论及汉语测试研究》中指出的,“信度和效度是测验的两大质量标准,是测验研究最为重要的问题,而效度更是重中之重,已被公认为语言测验的核心问题。”[1](P168)按照Deterich和Freeman的观点,如果脱离了效度问题,包括信度在内的一切有关标准或质量的讨论都会显得毫无意义。语言测试中效度的重要性由此可见一斑。同时,效度的定义中已经明确表示出,目的性是效度的基本特征,即考查某个测验有效的程度一定要针对其测验目的而言,否则讨论效度也是无意义的,因此在考查PSC的效度问题时必须紧紧围绕PSC的目的——“PSC不是普通话系统知识的考试,不是文化水平的考核,也不是口才的评估,是应试人运用普通话所达到的标准程度的检测和评定”。

三、影响PSC信度与效度的相关因素

通过对本次课题研究中所涉及的206份试卷及其考核结果来看,影响PSC信度与效度的主要因素如下。

首先是试卷的设计与测试目标不尽一致。浙江省PSC试卷主要由四部分构成:单音节字词朗读、多音节字词朗读、短文朗读、命题说话四部分。从试卷构成来看,字词的朗读毫无疑问是考查学生语音是否标准的重要内容,但不可否认的是字词的识记水平会影响到测试成绩,而这与测试目标无关;第三题为短文朗读,从测试的实际情况来看,考生出现“错读、漏读和增读”的情况往往是对短文不熟悉,而不是语音不标准、语言不规范。第四题的命题说话评分标准中的“离题”虽然防止了测试者“以不变应万变”的错误应试行为,但客观来说是否离题也与普通话测试的目标无关。

试卷难易程度的差异也导致测试与目标相违背。试卷的难易程度很大程度上影响了考试成绩。如在考项“读单音节字词”中,有的试卷生僻字比较多,而有的就相对少些,如13号试卷中就出现了8个比较生僻的字词(“帧、娑、幔、菖、溯、岿、疵、眩),学生在这8个字词中得分率仅为42.9%,而52号试卷则只出现了3个相对比较生僻的字词(“嫌、删、庚”),两者相比就是0.5分,而这个分数对于想考取一级甲等的学生而言是至关重要的,而且学生反映生僻字多了对考生的情绪影响很大,后续的考试内容也受到了影响。考项“读多音节词语”中试题的难易程度也不一致,如20号试卷中几乎没有生僻词语(只有“隧道”相对生僻些),而9号卷中则出现了7个较生僻的词语(“拙劣、果脯、赘述、寒碜、攫取、渣滓、蔑视),后者的得分率仅为57.74%,也严重影响了考生的成绩,并因此影响了PSC的效度和信度。第三题朗读短文中,40篇文章形形色色,有的较口语化,如《二十美金的价值》《陶行知的“四块糖果”》等,有的则书面色彩浓厚,如《站在历史的枝头微笑》《海洋与生命》等,由于语体色彩的不同导致学生在停连、朗读熟练程度等方面扣分差别较大;有的同学儿化韵读得不太标准,但作品4号《第一场雪》中有8个儿化韵,而更多的作品中根本没有儿化韵,这也严重影响了测试的信度与效度。考项“命题说话”的难易程度也相差较大,如有21个题目侧重叙述(如“我的朋友”“我尊敬的人”等),9个题目侧重议论(如“谈谈服饰”“学习普通话的体会”等),相对而言叙述要比议论容易得多,虽然抽签时是两个题目选择一个,但有的学生恰恰选到了相对较难的两个,在调查中我们就发现有4个同学选择了议论性的题目,由于流畅程度各扣1分,与一级甲等失之交臂,的确可惜。上述由于试卷难易程度不一导致的扣分与《大纲》的测试目标——“是应试人运用普通话所达到的标准程度的检测和评定。”是风马牛不相及的,这影响了测试的信度和效度,也影响了考试的公正性。

其次是测试员的水平参差不齐。虽然在本次课题调查中涉及到的测试员都是国家级普测员,但是其中表现出的水平差异依然是不容忽视的。在调查中我们发现普测员受自身语言条件的限制影响了评分的客观性。有62人次的考生由于前后鼻韵发音不到位导致没有通过一甲,而测试这62人次考生的普测员中有24人次是浙江籍(前后鼻韵发音不准确是浙江方言的典型特点之一),占到所涉及测试员比例的67%,显然测试员受本身方言的影响导致了误判;还有方言词汇和语调的问题,在调查中我们发现有5人次比较明显的方言词汇和语调问题没有扣分,涉及到的9人次测试员全是跟考生方言区一致,由此可见由于测试员本身语言条件限制导致评分有失公正的现象是必须要重视的。

最后是应试者的心理素质。作为参加PSC的主体,应试者的心理素质至关重要,通过问卷和调查统计我们发现,由于应试者心理素质原因导致的扣分是比较多的。通过听评录音我们发现,不少考生将平时认识的字词读错,如把“典雅”读成“雅典”,把“饭盒儿”读成“盒饭儿”,甚至有的考生将短文《胡适的白话电报》中的“干不了”两次错读成“不干了”,有的考生在考试中紧张得透不过气来,录音里长吁短叹的声音不时出现,有的考生说话题时声音直发颤,流畅度受影响,这些都影响了学生的成绩。

四、提高PSC信度与效度的措施

在语言测试中我们要坚持定量与定性相结合的原则,定量是定性的基础,而定性是定量的概括和总结,同时还要注意以下几点。

第一,编制试卷时要经过充分的信度、区别度、难度分析,以保证PSC的信度与效度。PSC作为国家性的水平考试,试卷的题目类型、评分标准等必须经过充分论证,以保证标准的信度与效度,如果标准有误,后续的操作都是无稽之谈;每一份试卷的信度、区别度、难度必须经过充分分析,以保证试卷的平衡性和公平性。

第二,尽可能地避免与测试目标无关的考查内容。PSC“是应试人运用普通话所达到的标准程度的检测和评定。”那么跟此目标无关的一些内容要减少到最低限度。如测试想通过单双音节字词朗读考查考生语音标准水平,就要将字词识记水平对被试的影响控制到最小程度,尽量少用生僻字等。现在的考项“命题说话”是单向说话,考生可以经过精心准备将错误减少到最低限度,如尽量避免个人的语音弱点等,如果可能的话,采用真实的双向对话更能考查出考生的真实水平。

第三,将客观影响因素控制到最少。如普测员的水平可以通过经常性的培训不断增强其听辨能力;普测员由于劳动强度太大造成的失误可以通过适当减少工作量避免;考生由于心理紧张造成的失误可以通过考前培训、模拟等减少,这些措施都可以提高PSC的信度与效度。

PSC是国家推广普通话的重要举措之一,测试的最终目的是提高国民的普通话水平,通过不断的改进和完善提高PSC的信度与效度始终是保证测试公平、公正的前提。

[1]张凯.语言测试理论及汉语测试研究[M].北京:商务印书馆,2006.

H102

A

1673-1395(2011)12-0077-03

2011 10 29

李海宏(1976—),女,山东潍坊人,讲师,硕士,主要从事播音主持专业教育研究。

① 本文属浙江传媒学院科研项目(KYKT0704423)产出论文。

责任编辑 胡号寰 E-mail:huhaohuan2@126.com

猜你喜欢

效度信度普通话
《广东地区儿童中医体质辨识量表》的信度和效度研究
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
我教爸爸说普通话
科技成果评价的信度分析及模型优化
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
被看重感指数在中国大学生中的构念效度
外语形成性评估的效度验证框架
中文版脑性瘫痪儿童生活质量问卷的信度
17
广而告之推广普通话