俄语专业标准化考试阅读试题的命制理论与实践
2016-11-24荣洁
荣 洁
(黑龙江大学 俄语学院,黑龙江 哈尔滨 150080)
俄语阅读试题是教学考试和标准化考试中的常规试题。含有俄语阅读试题的标准化考试主要有:高等院校全国统一招生俄语考试、俄语专业四、八级考试、全国硕士研究生入学统一招生俄语考试等。其理论基础涉及教育学、心理学、考试测量学等,实施过程中要参照教学法、教学大纲、考试大纲等。
中国的标准化考试起步晚于英美,但早于俄罗斯。国内标准化考试的层级不同,命题人员群体也不同,命题的原则、规范、难度、信度和效度也有较大差异。看似简单的标准化试题,其命制过程却不那么简单。要做到“形似”容易,而要达到信度、效度、难度、区分度均好,却并非易事。命题过程中要认真考虑所选文章的题材和体裁、选材的长度、包含的生词数量、考点的选择、设问的角度、设问的覆盖面、选项的设计、选项的排列、选项间的关联、问题与选项的用词总量等等。将这些方面综合起来考虑,方可以命制出符合考试要求的试题。
苏联标准化考试研究与实践落后于英美,起步时间虽早(20世纪20年代),早期的题型和内容与教学考试几乎没有本质区别。苏联解体后,俄罗斯的对外俄语教学开始重视对标准化考试的研究与应用,对此,俄罗斯的测试专家 T.M. Бaлыxинa(2006:14)曾写道:“近几十年,俄罗斯的教学状况和条件出现改观,这使标准化考试和国家统一考试显示出重要意义和社会需求。在此基础上,依照俄罗斯制订的国标的原则与规范,从20世纪90年代起,国家开始出台对外俄语标准化考试规范,并对该级考试做了详尽的描述。”
中国标准化考试的研究与推广应用集中在教育部考试中心。俄罗斯标准化考试的研究与推广应用中心分设在莫斯科大学、彼得堡大学和莫斯科普希金俄语学院。中国教育部考试中心主导的考试层级与规模之多、之大,是俄罗斯三所大学无法与之相比的。
一、命制阅读试题的主要依据
阅读试题与教学大纲、与相应的考试大纲关系密不可分。命题工作尚未着手前,首先要了解教学大纲对本阶段阅读技能的要求。以俄语专业四级考试为例:《高等学校俄语专业教学大纲》对基础阶段阅读教学的要求是,“1、细读:运用所学语言知识独立阅读,正确理解与所学课文难度相当的文章,阅读速度40~50词/分钟。2、略读:能读懂难度略低或相当于正课课文,生词量不超3%,阅读速度80~100词/分钟。理解准确率以75%为合格。全学年阅读总量400~600页”(高等学校外语专业教学指导委员会俄语组,2012:6)。
《高等学校俄语专业四级考试大纲》对基础阶段阅读技能的要求为,“1、考试要求:能够读懂难度不超过教学大纲要求,生词量不超过3%的俄语原本文章和材料(根据所学构词法规则,可认知的词汇除外),掌握所阅读内容的主旨和大意,了解文中的事实和细节,并能根据上下文的逻辑关系进行一定的判断和推论。阅读速度为90~100词/分钟,总量为1800~2000词。考试时间:25分钟。3、考试方式:客观选择题10道”(史铁强等,2006:3)。
考试大纲没有给出答题预留时间的长度。仅仅规定阅读考试时长25分钟。命题教师通常按每小题解答时间30秒计,10道题的作答时间应为5分钟。这样算来,阅读时间就只有20分钟了。按20分钟计算阅读总量则为:
(90~100词)×20分钟 =(1800~2000词)
考纲里已标明阅读总量为1800~2000词。其中应包含10个设问和40个选项的用词量。一个设问与四个选项的用词量平均为25词,10个小题的用词量应不超过250词。四篇短文的用词量约为:(1550+1750÷2)÷4 ≈ 410词。即每篇短文用词控制在400词左右。
(400词×4篇)+(25词×10问)=1850词
这说明,四级考试命制试题时,用词总量基本执行考试大纲的下限,完全符合教学大纲要求。
2014年,四级考试有了变化,在不改变阅读速度、阅读总量的前提下,答题时间增加5分钟,改为30分钟,题量增加10题,改为20道题。答题时间为10分钟,阅读时间依旧为20分钟。阅读总量依旧为:(90~100词)×20分钟 =(1800~2000词),依旧符合教学大纲要求。
二、阅读试题的选材与压缩、修改
标准化考试中,对阅读材料的选择是有严格要求的:通常不得选用内容涉及武装冲突、宗教信仰、种族歧视、性别歧视、考试成败、失去亲人、负面国情等,可能影响考生情绪,导致考试成绩受影响的材料(但教学考试通常不受上述制约)。短文里专有名词的数量不应超过词汇总量的2%,否则会给考生带来较大的压力。设问要有一定的覆盖面,考具体信息的试题不超10%。带有民族文化信息的专有名词不得轻易改动。
命题教师多认为,用来做阅读试题的材料应为小小说、科普类文章、改写的名篇、名人传记、励志类文章、故事、寓言等。涉及社会、地理、人文、文化艺术等。
用来做试题的短文通常应节选自俄罗斯的正规出版物或俄罗斯的官网。从网上选材料时,务必考虑文字的权威性。网络材料出错的情况很常见,所以使用时一定要认真核对。
选好文章后,我们会发现文章的篇幅、生词量往往不合乎考试要求,需要压缩文字总量、替换生词、标注生词。压缩不应导致文章的结构的失衡,不应改变作者的创作意图,不应改变文章主旨。命题人员尽量不要用“掐头去尾”的方法来压缩文字,而是采用“瘦身”的方式来压缩篇幅,以保障文章情节的连贯性和逻辑性。
选择压缩名家的名篇是非常好的选择,但要考虑考生的语言水平,压缩文字难度高的作品,用来做低级别的试题,难度可想而知。如果考虑不周,这样的选择往往以失败告终。有命题老师曾尝试将Eвгeний Hocoв的«Tpидцaть зepeн»(436 词)压缩成 300 词的短文,结果很不理想,只好放弃。未能成功的原因是,注意到了短文的思想性好,篇幅也不大,仅需要减掉136词。但没有考虑短文的语境特殊,替换生词之后,原文的“味道”没有保留下来。
命题教师都很清楚,想要保住短文的“原汁原味”,就要减少改动,这就导致必须注释生词(短文中生词的标注应该与该词的语境意义相符。机械地照搬词典意义并不是最佳的注释方法)。生词注多了,一是达不到命题要求(生词不得超3%),二是不看俄语也能猜出阅读的大致内容。生词如果注少了,则会出现超纲词,考生有可能看不懂文字。用同义词代换又容易“走味”。这一矛盾在低级别的考试中需命题教师付出巨大努力,才能得到圆满解决。
三、设问与选项的用词总量与考点的选择
对设问与选项的用词总量,考试大纲中没有明确标注。实践中通常的做法是一个问题加四个选项的用词总量为25~30词。我们依旧以下限计算,20道题用词500个左右。
四级考试的阅读用词量与八级考试的阅读用词量相比:四级用词量为:1850词(短文):500词(选项);八级用词比2500词(短文):500词(选项)。
从技术角度看,2014年以前,四级考试中,设问每用1词,就要平均覆盖短文里7.56个词(1:7.56)。八级考试设问每用1词,就要平均覆盖短文里5个词(1:5)。2014年,四级考试做了调整,试题设问每用1词,要平均覆盖短文里3.78个词(1:3.78)。八级考试设问每用1词,就要平均覆盖短文里5个词(1:5)。这个比例与调整前的比例相比,理论上更加合理。
考点的选择与命题教师对命题要求、对文章内容的理解有直接关系。一些老师往往考虑的是技术要求,即1个问题配4个选项,用25~30词,较少考虑对阅读实效性的要求。选考点时,多考虑选项好做与否,不考虑该做不该做。多考虑难度,不考虑挖掘的深度。结果只完成了考试工作,没有做好导读工作。
笔者认为,命制阅读试题,必须考虑文章的脉络主线。偏离主线选择考点,难度可以达到要求,但效度肯定会下降,信度也必然会受影响,如果我们把试题的考点都集中在一起做分析,就很容易发现问题,试比较:
《太阳、老人和少女》是舒克申创作的一篇短篇小说。故事梗概如下:一个到西伯利亚写生的年轻女画家,看到一位老人坐在河边的老树旁边,面对着落日沉思。这场景打动了她。她提出为这老人画像。老人同意了。第一天和第二天傍晚姑娘都在为老人画像。第三天的傍晚老人没有出现。第四天,她去村里一打听,才知道老人已去世了。
小说中日出和日落分别象征着生命的开始与终结,河水的流淌象征着时间的流逝。饱经风霜,双目失明的老者是凭借自己的生活经历而感受身边的一切的。他的一生平凡、简单。他热爱这片养育了他的土地,他为这片土地做出了巨大的牺牲,却能以恬静的心境来面对死亡。而他的死忘也像太阳落下去那么自然。
年轻的女画家从老人平淡的一生中感受到了某种看似简单,实际上意义极为深刻的道理。她更深一层地理解了人生的意义与付出的高尚。
一个衰弱的老人。一个年轻的少女。老人走向死亡,他像夕阳那样渐渐陨落。而年轻的少女像清晨的朝阳那样朝气蓬勃。太阳落下又升起,一代人消逝,一代人又成长起来。年轻一代从老一代的身上得到了启发和启示,这将能够使他们在人生道路上走得更坚定、更远。
命题实践告诉我们,用文字浅显,内涵深刻的短文并不都合适做阅读试题。这样的短文里要发掘的内涵太多太多,而短文里文字支撑又太少太少。此时命题教师是给自己出难题了,因为从这样的选材中找文字支撑几乎不可能。命题教师只好转而考查某些不太相关的具体信息,这也是选了这样的短文后,找不到理想考点的无奈之举。
该题确定的三个考点要检查的都是具体信息,对帮助考生正确理解小说主旨的作用不明显。考点选在情节主线上显然会更好。
四、设问的角度
考点确定之后,从哪个角度设问、覆盖多少文字便成了命题教师最纠结的问题了。命题实践告诉我们,设问的角度应有变化,避免“千题一面”。考点间不应出现较大的空白区,也不应当重复覆盖。考点不应针对考生不熟悉的生词或短语。不提常识性问题,设问应当有效度。
但我们也可以见到一些改变角度的设问,这些设问变得不那么传统了。
(一)“逆向设问”的试题
试卷中,经常可以看到“逆向设问”的试题。这里提到的“逆向设问”的试题,是指“不考学生读到了什么,而考学生没有读到什么”的试题,笔者并不倾向采用“逆向设问”(它似乎源于“排除法”),尽管这类题的技术参数有时也会相当不错。例如:
这类题的优点是覆盖面大,3个内容正确的选项可以覆盖大量的文字信息。可以降低命制试题的难度系数,提升答题的难度。
缺点是不太符合阅读规律。没有人边看书,边记忆自己没有读到什么。相反,读者通常记忆自己读到的内容。做试题分析时,文字表述也令人难以接受,例如:
[A]莫斯科的发展规划不考虑历史传承和各市区的特点。这个选项与文中内容不符,也不合逻辑,所以是正确项。
(二)“选择最佳”的试题
标准化考试题的选项里,通常只能有一个是正确项,其他三个都是错误项(或称干扰项)。但也有个别试题要求选择最佳答案,例如:
这样设问,是明确告诉考生,四个选项都包含了正确信息,只是其中一项的正确信息含量最多,其他次之。但我们都清楚,正确信息含量少些,并不等于错。这样的试题实际上要求考生先给选项排队,例如:正确信息量不饱满;正确信息量基本饱满;正确信息量较饱满;正确信息量最饱满。然后选择最饱满的一项作为正确项。
这类试题做心理测试题比较合适,因为涉及主观评价,每项得分可以不同。做标准化试题则不合适,标准化试题毕竟与心理测试题的评分方法不同。
(三)考“主旨大意”的试题
此类试题考点通常用两种方法呈现,通俗地讲,一是为短文选择题目(Кaкoe нaзвaниe бoлee пoдxoдит к этoмy тeкcтy?);二是选择命题教师归纳的正确项。我们先来看一下为文章选题目的试题。入选的短文题目是«Hoвoгoдняя cкaзкa»。命题的方法是将短文的标题移入选项中。再配三个干扰项。
这样设选项的优点是可以考查学生的概括能力,想象能力。不足之处是三个干扰项都有主观评价在内,有时很难说它们是完全错误的,因此这类题的区分度往往不好。再如:
这类试题选项中的内容都是命题教师归纳出来的。哪一项归纳得比较科学、全面、合理,该项就会成为正确项。哪一项“归纳”得不科学、不合理、不合逻辑、过于片面,就会成为干扰项,例如:[C] Cибиpь—знaкoмoe мecтo для бoльшинcтвa тypиcтoв из Aфpики.
这样的题实际上是要求考生在阅读了短文的基础上,判断命题老师哪个选项归纳得最合理。哪些归纳得不合理。第二类题与第一类一样,区分度往往不理想,但可以达到一定的难度。
命题老师要求考生依照自己的理解选择正确项,之后再指责考生的选择是错误的,这有些像主人请客人依照自己的口味判断面前的四种饺子,哪一种最好吃。当客人按要求选出后,主人却说客人选错了。这其中的不合理成分大家一目了然。
(四)需要“简单计算”的试题
顾名思义,短文里出现了数字,命题教师就将考点设在了这些数字中。考生要边读边计算。考虑到这毕竟是俄语考试,不是数学考试,所以这样的“计算题”要计算的(换算的)数字往往比较简单,掌握了“四则运算”的考生都能答题,例如:
这类题的优点是,学生只有读懂了,才能正确计算出数量。该题的选项用词量小,可以给其他选项腾出空间。不足之处是,一些考生看到数字就开始紧张,越紧张就越出错。命题老师也放不开手脚,不敢出复杂的计算题,只能让成年人做小学算数题,这就导致试题有时会显得有些小儿科。如果这样的题考生真的读不懂,那就只好猜了。
(五)“需调动背景知识”的试题
认知心理学告诉我们,每个人在阅读过程中常常需要调动头脑里的背景知识来帮助理解自己所阅读的内容。为了全面考核考生的阅读能力,命题教师就想出了一种可以检查背景知识的试题,例如:
学生需了解俄罗斯人常常凭借直视对方的双眼,来判断对方是否说谎,方能做出正确选择。
该题型是命题教师在多年经验积累的基础上创新出来的。它不同于普通的试题,是一种将阅读理解与文化背景知识结合在一起的试题。命题的总体方向是正确的,应当进一步探索、完善。不足之处是,合适的材料难找。发掘内涵与导读有一定的难度。因教学中难练到,所以难度系数和区分度有时也会随之降低。
(六)设两个考点的试题
为了增加试题的覆盖面和难度,命题老师设计了一种含有两个疑问词的问题,即一题双问,试比较:
这样设问肯定可以扩大覆盖面。但无疑会提高难度。考生要考虑两个问题八个信息点。必然多耗时,必然多了犯错的的几率。
(七)考“成语和修辞格”的试题
短文中出现成语或修辞格时,命题老师也会注意到它们的存在,也会考虑检查考生是否正确理解了这些语言点。命题的方法常常是引用原句或截出必需部分来做设问,例如:
但也可以见到文中没有出现成语,但命题老师在选项中用成语检查考生对该句子的理解的情况,例如:
该题的优点是考查了必要的语言点。缺点依旧是覆盖面小。选项里增加了短文里没有出现过的成语,这大大提升了答题难度,短文之外的内容极可能干扰答题。
(八)必须考虑“文字支撑”的试题
这类题的设问中多带有疑问词 пoчeмy, зaчeм, для чeгo 等涉及原因、目的的试题。此时四个选项文字要尽量出自短文,但又要有差别。正确项的内容必须有文字的支撑,干扰项不应是命题教师的个人推论。例如:
短文并没有告诉读者,那次飞行并不顺利。首先,Л. Лeoнoв出舱之后,宇航服意外膨胀,宇航员多次尝试,但依旧无法退入飞船。最后飞控中心和宇航员协商,决定改变操作规程,宇航员改为头先进舱。虽然宇航员的玻璃头盔重重地撞在了舱壁上,好在头盔没有破损,宇航员最后顺利地回到了飞船中。这样才避免了一次重大事故。飞船降落过程中,自动控制系统失灵,Л. Лeoнoв改用手控系统操控飞船,降落地点虽大大偏离了预定地点,但还是平安着陆了。这是宇航员第一次手控飞船降落,史无前例。Л. Лeoнoв是苏联第11位宇航员,却两次获得苏联英雄奖章,这与此次不同寻常的飞行联系紧密。时隔多年人们才了解到这些内幕。
当我们得知这些信息之后,我们必然会对[D]选项提出质疑。短文中虽未提及上述两点,但重大历史事件的内容是不可能改变的,命题必须客观对待史实。
五、设问的句法结构
设问中句法结构的难度应与考试层级的难度保持一致。即,层级越高,设问的句法结构就应越复杂多样,用词更高级,否则很难体现出考试层级的不同,我们来看一下现行低层级考试与高层级考试设问的实例:
这两组问题的难度差异迥然:第一组的参考词表为2000词,此处用了37个词。第二组的参考词表为8000词。此处用了45个词。第二组的设问句法结构明显比第一组复杂。这说明两组命题教师都充分考虑到了两个层级的各自特点与差别。如果没有注意到这些区别,命制试题时,就可能会降低试题的效度。
六、正确项与干扰项的编写
(一)正确项的编写细则
“正确项”,顾名思义,应当是不存任何争议的正确选项。如果是单选题,正确项则应是唯一正确选项。编写正确项的技巧并不多,通常会照搬短文的词语,或用同义词、同义结构替换短文中的相应词汇和句子结构。基本原则是“形可变,意不可变”。同时,也要注意正确项的长度与错误项的长度要保持基本一致。正确项里不使用生词,这样会增加阅读的额外负担。也会影响试题的信度和效度。
命题教师为了确保正确项最大限度概括必要信息,往往会尽力求准、尽力求全。因此,早期的阅读试题中,正确项经常是最长的或次长的选项。这就导致技术层面上出现纰漏,给作答者以可乘之机。
(二)错误项的编写细则
“错误项”,顾名思义,应是包含错误信息的选项。编写错误项的注意事项远比编写正确项的注意事项多。每题中正确项只有一个,错误项却有两到三个(三选一或四选一时)。因此,出现问题的几率明显升高。命题教师应注意以下原则问题:
1.错误项要能回答问题,不用所答非所问的选项做错误项。所有的选项都要能够回答提出的问题,否则有误导之嫌;
2.编写错误项所使用的词汇应尽量来自短文,这样可以增强干扰性,也可加大阅读的覆盖面,加大考生阅读的有效性;
3.如果短文中的词汇不能满足编写错误项的条件,可以选用文中没有的词汇,但这些词汇应是考生学过的词汇,与短文中的词汇是同一语义场的词汇,或符合该语境、符合预判的词汇;
4.错误项里不应使用文中没有的生词;
5.不可以仅凭选项中“正确信息量不足”,就认为该项是错误项,这样的选项给出的信息虽不足,但信息依旧是正确的,这样的选项应看作是正确选项;
6.不应因追求难度、追求数据的完美,而忽略该问中考点的数量;
7.错误项与正确项的长度应协调,不应出现明显的差异,影响试题的信度;
8.每小题使用的词汇量尽量均衡,避免与其他小题形成强烈反差;
9.变换设问角度,使用不同的疑问词,使用不同的句法结构;
10.控制用词总量。
七、结语
命题过程中的制约因素有很多,但可以简单归纳为:试题要保证相应的信度、效度、难度和区分度。内容不应涉及国际摩擦、宗教、民族、犯罪等问题;尽量不要涉及单亲、考试失败及其他可能引起考生心理波动的问题。生词数量应减少到最低,上限不超过词汇总量的3%。不出对一部分考生有利,一部分考生不利的题。试题不应有争议,不应过易或过难。命题的语言要标准、规范。正确选项必须100%正确,不建议命制引导考生采用排除法判定正确项的题。干扰项也必须是100%的错误项,不应该用信息不全的选项做干扰项,不完整的信息不见得就是错误信息。选项中不应出现俄语中不存在的词汇搭配。设问和选项的长度要合理,选项不应 “所答非所问”。相互关联的题不应出现相互提示。历史事件的年代、事实表述必须正确等。
注释:
① 本文所列举的试题例均节选自全国统一招生考试和等级考试试题。