小学语文质量监测阅读题命制初探

2019-09-10施茂枝

语文建设·下半月 2019年8期

施茂枝

2015～2017年，教育部进行首轮义务教育质量监测，小学语文以四年级学生为监测对象，阅读题权重大幅增加，内容与形式脱胎换骨。省、市、区各级监测相继跟进，市、区级小学语文监测对象年级扩大。身处前线的学校厉兵秣马，模拟监测紧锣密鼓。大小监测，连带期中、期末考试，阅读题命制唯上级监测马首是瞻，或如法炮制，或东施效颦，但无不是实实在在的“指挥棒”，正深刻影响着课堂教学。命题兹事体大，若有不当，不仅影响监测的效度、信度，更让教师无所适从或误入歧途，大张旗鼓的质量监测不是提升而是降低教学质量。

一、质量监测功能与命题原则

科学合理的命题应遵循一定的原则，而测评目的不同，其评价功能相异，命题原则也有别。

1.监测的主要目的和功能

本轮质量监测主要功能为何？《中国义务教育质量监测报告》指出：“目的是为了科学评估全国义务教育质量总体水平，客观反映影响义务教育质量的相关因素基本状况，系统监测国家课程标准和相关政策规定执行情况，为改进学校教育教学、完善教育政策提供依据和参考。”评估水平是本轮质量监测的意图之一，但非主要和终极目的。从大处看，是了解义务教育质量的基本情况及存在的问题，并对问题产生的原因作出诊断，为国家层面完善政策提供依据和参考;从小处看，是为了解义务教育阶段各门主要课程的实施情况，发现问题，寻找原因，为完善课程设计，改进教与学——落脚于改进学，提供依据和参考。因此，本轮质量監测主要发挥检查、诊断、反馈三大功能。其中诊断居于核心，但检查是基础;无检查功能的发挥，诊断和反馈便无从谈起。“此次国家义务教育质量监测工作立足中国国情”。2001年以来，我国实施义务教育新课程是“国情”的重要组成部分。《中国义务教育质量监测报告》有关监测目的之“评估”“反映”尤其是“系统监测国家课程标准和相关政策规定执行情况”直接揭示，本轮监测实为对我国义务教育新课程的一次检阅。

2.匹配目的和功能的命题原则

清楚认识质量监测目的，准确把握其主要功能，命题原则便昭然于前。小学阅读题命制应秉持以下主要原则：

（1）依据课程标准

本轮质量监测“依据课程标准研发指标和工具，吸收了国际上较先进的测量学技术，与国际项目实现了交流并接轨”。其中小学语文阅读题命制接轨国际阅读素养测评项目。后者也有诊断功能，但其主要为了解各国学生阅读素养的发展水平和未来发展方向，属水平评估。而前者也有评估水平的成分。衡量水平应有一定标准。国际阅读素养测评由项目组自定标准，测评成绩非绝对水平，各国学生互比方显其高低。我国质量监测是检阅新课程，考查学生实现课程目标的程度，在此基础上对问题进行诊断和反馈，故衡量水平的标准是国家课程目标的实现情况。理论上说，阅读题命制若能严格依据语文课程标准，精准把握语文课程目标，题量、题型、要求等科学合理，监测成绩便可较真实地显示绝对水平。

诚然“交流并接轨”国际项目是本轮质量监测的一大亮点，但二者毕竟有别，是否“依据课程标准研发指标和工具”是其分水岭。然而，当下小学语文大小监测将其混同于国际阅读素养测评，只讲接轨罔顾或轻忽语文课程标准的现象普遍存在，严重违背这一原则。

（2）取向阅读能力

不同于高考、中考为代表的中学语文测评，我国小学语文测评一向鲜少考查阅读能力，多以考查阅读之名行考查基础知识、基本技能之实：给一则短文，题目却是找同义或反义词、指修辞方法、改句型句式、加标点符号、仿句子句群之类。国际阅读素养测评则以阅读能力为取向，包括以9岁小学生为测评对象的PIRLS（国际阅读素养进展研究），教育部本轮小学语文质量测评阅读题主要在此与之接轨。不少人因此视之为全新事物，单看命题的确如此，其实《义务教育语文课程标准（2011年版）》（以下简称“语文课程标准”）早把“具有独立阅读能力”作为阅读的首要和核心目标，接轨国际已久，只是许多小学语文教师包括部分研究者习惯无视于此。近年因误解“学习语言文字运用”，不少小学语文阅读课更蜕变为写作课或表达课，与这一目标越行越远。教育部首轮小学语文质量监测，借其强大的权威性和导向性，迫使下级监测阅读题发生根本性、颠覆性改变，其实质是回归阅读之本。

但以考查基础知识、基本技能替代考查阅读能力的命题，基层教师及部分教研人员驾轻就熟，积习难以迅速、完全改变。在大小监测中，考查非阅读能力的“阅读题”依旧顽固地占据部分卷面，监测部门级别越低情况越甚，尤其是教师自制的模拟题。

（3）掌握学段分际

课程总体目标下有学段目标，举世皆然;在以生或以学为本的先进理念下，更应以学定教，适段而教。关于阅读能力培养，语文课程标准要求：“阅读教学应注重培养学生感受、理解、欣赏和评价的能力。各学段可以有所侧重，但不应把它们机械地割裂开来。”可倒过来说，“感受、理解、欣赏和评价”能力互相渗透，不宜机械割裂，但教学时各学段仍应有所侧重。此亦以学定教，适段而教。教学如此，评价亦然。

语文课程标准关于精读评价，在四个学段分别提出侧重点;关于文学作品评价，就第一、第二和三四学段提出了三个不同的侧重点。细读其文，从微观层面看，对于指导命题还不够具体和明晰，个别地方还存可议之处，但其基本精神毫不含糊：评价要以本学段目标为依据，谨守学段分际，突出梯度。从中观和宏观层面看，这对实践具有指导意义，必须坚决贯彻落实。然而，当前大小监测多简单模仿国际阅读素养测评，对于不同学段，文本类型、长度、难易未显示出明显差别，评价指标中各层级能力要素权重大体相当，并未“有所侧重”，题量、题型及难度也差距不大。

二、阅读能力要素与评价指标

明确的评价指标是科学命题的前提。取向阅读能力的测评，评价指标当然直接取之于阅读能力要素或从中开发。准确把握阅读能力要素，便成为科学命题的又一关键。伴随研究进展，阅读能力要素不断被揭示。析出的能力要素越周全，其相加之和就越接近阅读能力;各要素内涵越明晰，评价指标就越明确。

1.从评价指标看众说阅读能力要素

关于阅读能力要素，向来说法不一，近二十年来又新说迭出。但从可作为明确的评价指标角度看众说纷纭，便发现其不足：其一，有些能力要素内涵模糊，难以据此命题;其二，未穷尽所有能力要素，无法全面考查阅读能力。

一般的传统观念认为，阅读能力包括认读能力、理解能力、欣赏能力和创造能力。语文课程标准的“感受、理解、欣赏和评价”则将其一分为四。以“感受”为第一层次能力要素别出心裁且非全无道理，但考查“感受”的命题从何下手？颇费思量。作为普通的常用词语，“理解”之义无人不知;但作为阅读领域的专业术语，“理解”却是一个巨囊，囊中何物秘而难测。阅读能力要素终于评价能力，高阶思维能力有所遗漏。若仅以此四要素作为评价指标，难以命题，也不利于全面考查阅读能力。

此外，还有种种说法：或认为阅读能力包含认读、理解、欣赏、评价、记忆、运用能力，或认为阅读能力包括整体感知、信息整合、理解阐释、鉴赏评价、批判探究能力。相比于语文课程标准的四要素，此二说尤其后一说将对阅读能力的认识向前推进了一步。PISA（国际学生评估项目）以获取与检索、整合与解释、反思与评价为指标测评阅读能力，PIRLS以提取信息、直接推论、解释并整合观点为评价指标。祝新华先生拟定的评价指标是复述、解释、重整、伸展、评鉴和创意。众说的阅读能力要素之间，各项目评价指标之间，以及能力要素与评价指标之间，互有出入。每次测评国际项目，评价指标时有微调，在可预见的未来依然如此。单独看上述众说或測评项目，其能力要素或评价指标之和，其实都不同程度地小于阅读能力。尤其是有些要素和指标过于模糊，内涵缺乏清晰的界定，命题者不容易把握，并非理想之评价指标。

2.可明确指标化的阅读能力要素

借鉴上述众说和评价指标，结合自己的思考和体会，笔者不揣浅陋，尝试将阅读能力分解为六个层级，共十二个要点，力求其和能最大程度地接近阅读能力，并勉力界定其内涵，以作为相对明确的评价指标。

（1）检索与复述

检索是从认读或感知能力中开掘出的阅读评价指标，其本身就是最低层次的阅读能力要素;对应PISA的“获取与检索”和PIRLS的“提取信息”，在“感受、理解、欣赏和评价”中难有归属。检索包括找到时间、地点等故事情境要素，找到特定观点、结论和文章已陈述的主题句或中心句及其他特定信息。复述是直接用文章语句等表示或显示检索所得。命题形式多为选择、填空、是非判断、作标志等。例如，“阿凡提向巴依借的东西是（）”“非洲象和印度象有何不同，从文中找出相关句子，用横线画出来”。

（2）了解与转述

了解主要包括意会或懂得词句表层意思，知道代名词所指，明白人物关系等，归属于“感受、理解、欣赏、评价”中的“理解”，但层次最低。语文课程标准中学段目标“结合上下文和生活实际了解课文中词句的意思”“能联系上下文，理解词句的意思”“能联系上下文和自己的积累，推想课文中有关词句的意思”，均属理解;但在PISA和PIRLS的评价指标中难以归属。转述则是用自己的语言说出或写出了解所得，或直接用文中上下文解释某个语句意思。命题可采用填空、选择、作标志等，例如，“文中画线的短语‘永恒的缺陷’指什么”“‘细看水点崖中滴，疑是珍珠倒卷帘。’请画出能表示古诗句意思的句子”。

（3）解释与推论

阅读过程是文本意义生成的过程，主要是理解的过程，故“理解”居于“感受、理解、欣赏、评价”的核心。而解释和推论又是“理解”的核心，亦即阅读过程主要是解释和推论的过程，由此把文章读厚、读透。解释主要指开掘文本深层意蕴或言外之意，也包括人物外在动作行为和情绪所表现的内在心理或缘由、人物话语的弦外之音等。说明事件的前因后果、辨析文本信息异同、识别和例举证据等也归属解释。推论主要指根据文本既有情节、人物性格以及人物关系等，合乎逻辑地设想另一情节，或为人物设想另一套行为、心理模式。在PISA的“整合与解释”、PIRLS的“直接推论”和“解释并整合观点”中，有解释与推论的归属。若将其拆开，解释不完全对应两个国际项目中的“解释”，推论亦然。命题形式可采用选择或简答。例如，“作者的心情不再忧伤，是因为（）”“在太空飞行时，航天员在飞船里为什么有点像‘罗锅’”“‘本文介绍的‘花果山’与《西游记》中孙悟空居住的仙境同名，除了名字相同，还有哪些相似之处，请至少列举两条”“小狐狸回到家里，妈妈会对他说什么，做什么”。

（4）概括与整合

概括与整合互逆于解释与推论。概括是用扼要的语言浓缩文章的全部或局部，或化具体为抽象，是把文章读薄的过程。整合是聚合分散信息、形成完整形象或整体的过程，亦即重组信息。概括与整合在“感受、理解、欣赏、评价”中仍归属“理解”，在PISA的“整合与解释”和PIRLS的“解释并整合观点”中，亦有所归。语文课程标准二、三学段目标“能初步把握文章的主要内容”“了解事件梗概”对概括与整合有所涉及。二者可进一步细化为归纳文章主要内容或内容要点，归纳人物性格特征，提炼文章主旨，给文章或各个段落添加大小标题，将零散信息加以集中、重整以简要介绍某物，等等。此项评价指标，命题以简答为主。例如，“为表现钱学森的品质，课文中写了他的哪些事例？请概括地写下来”“请简要概括‘光污染’的危害，至少写出两点”。当然，根据实际情况，选择题可备采用。

（5）欣赏与评价

欣赏与评价在“感受、理解、欣赏、评价”中独占其二，内涵略异，但非泾渭分明，常合称评鉴，从是非、优劣方面对文本进行价值判断。有品评思想内容，如评说作者观点、人物品行、性格;有品评语言形式，如品味运用精妙的词语、句式、修辞和玩味匠心独运的表达方式、表现手法和篇章结构等。命题形式多为简答或选择。例如，“作者写到‘秋刀割过的麦地’在表达情意上的作用是（）”“作者介绍彭勃思书铺楼层分布时，为什么先介绍下层、三层、四层、五层，最后才介绍二层”“小兔子和小山羊，你更喜欢谁？为什么？请说出两点理由”。评鉴为高阶思维，故语文课程标准第四学段目标才明确提出“欣赏文学作品”，但二、三学段目标“体会课文中关键词句表达情意的作用”“辨别词语的感情色彩，体会其表达效果”“说出自己的喜爱、憎恶、崇敬、向往、同情等感受”，已是局部评鉴，小学阅读测评也不能遗漏。

（6）审辨与反思

最高阶阅读思维是理性、独立和反思性思维，即批判性思维，古语“审问之，慎思之，明辨之”与此有交集。一般认为，它有不懈质疑、多元意见和理性判断三个要点。PISA评价指标“反思与评价”部分涉此。加强对批判性思维的考查，已成国际阅读素养测评的一个方向。语文课程标准未将此列入阅读能力要素，但未轻忽其教学与评价，有实施建议为证：“在理解课文的基础上，提倡多角度、有创意的阅读，利用阅读期待、阅读反思和批判等环节，拓展思维空间，提高阅读质量。”“重视对学生多角度、有创意阅读的评价。”考查审辨与反思，可以让学生对文本内容和语言提出质疑，或发表不同于他人的见解并提供足够的论据等。例如，“作者没有看见漫山遍野的桃花，文章却以‘花开的声音’为题，是否矛盾了？请你谈谈你的看法，并说明理由”“狐狸妈妈对小狐狸一再叮嘱，有必要吗？请联系文本和生活体验谈你的看法”“有读者认为，‘她’不可能做出‘先洗碗后盛水喝’的举动。你同不同意这种观点？请根据文本内容说明理由”。

十二个要点非界限分明，因为阅读能力的各个能力要素往往互渗互融。例如，对作者观点、人物品行、性格等发表看法，从评说角度看，属“欣赏与评价”;从有理有据地发表自己的观点看，属“审辨与反思”。

值得一提的是“运用”。国际阅读素养测评的个别题目难以归属其评价指标，也难以归属上述六个层级十二个要点，国内大小质量监测包括中考、高考也如此。“赵爷爷记性差，常常忘记银行卡密码，银行建议他办理刷脸取款业务。他担心别人会拿着他的照片去刷脸取款，自己皱纹增多难以识别，请你用文中相关知识帮助他消除顾虑。”（杭州市2018中考语文卷）“若有人要进行航天飞行，请你根据本文内容，为他提几条建议。”此二题考查哪项评价指标？似属整合，实为整合阅读所得去解决生活问题，超越了整合，称“运用”更为恰当。本文不视“运用”为阅读能力要素，因为阅读的本质是生成文本意义，将“运用”置于其内于理不合，但认可测评时根据文本实际适当涉及，因为致用才是培养阅读能力的终极目的。不少阅读测评考查范围也略超阅读能力范围，国际阅读素养测评就通过问卷方式了解学生的阅读态度与习惯，近年我国中考语文试卷也有少量试题考查阅读的面与量。“运用”与此均为阅读能力以外的附加评价指标，未改变以考查阅读能力为核心的取向。但“运用”中不应包括仿写，因后者属写作能力。诚然，写作在语文课程中地位显赫，读写能力又互渗、互动，但语文质量监测不同于一般语文练习，要求试题结构与语文能力要素匹配，阅读与写作分开命题更为合理。当下不少小学语文质量监测均已单列写作题，又在阅读题中安排仿写，写作题权重是否合适可议，根源则是将其视之为“运用”且归属为阅读能力要素。

三、文本选用与难度控制

合理选用命题文本，准确把握试题难度，此为真实反映被试者阅读水平和实现课程目标程度之必需，是阅读能力取向命题科学性的组成部分，也是影响监测效度的重要因素。当下各级各类小学语文质量监测几乎所有被试者都做不完题目，监测效度可疑，主要原因就是文本选用与难度控制不当。

1.命题文本选用

选用文本是阅读题命制的基础工程。从理论上说，高级别、大面积语文质量监测或阅读测评当以教材选文的高标准去选用命题文本，然而受限于主客观条件实难做到，遑论一般性、经常性的低级别或校内监测，但绝不能以此为滥用的托词。当下不少小学语文质量监测，特别是级别较低的，直接采用初中语文试卷或练习中的命题文本，个别甚至从高中语文试卷或练习中“拿来”。如此颠覆常人认知和想象之举，固然与寻找合适文本不易有关，但无视命题原则才是主因。

（1）文本类型

已知的命题文本类型包括连续性和非连续性、文学和非文学等大类以及其下小类。通常，课程计划、课程标准、教材的出台，标志着每门课程设计的完成，三者的关系是：课程标准依据課程计划研制，教材又依据课程标准编写。以检查义务教育课程实施情况、对问题作出科学诊断为己任的语文质量监测，命题文本类型宜与语文课程标准本学段目标要求和教材课文一致，大小类皆然。课程标准与教材偶有出入，宜经认真权衡后作出决断。例如，第二学段目标未要求阅读说明性文章，但所有版本教材本学段均有编排，学生经历过阅读实践，本学段质量监测考查此类文本阅读有据可依，只是考点要根据学段目标作出合理设计，考查说明方法就不合适——那是第三学段才提出的目标。

以15岁学生为调查对象的PISA，每份试卷的三个文本有连续性、非连续性、混合、多元化等类型。连续性文本包括文学、实用（说明文和议论文）两类。以9岁学生为测评对象的PIRLS，通常是文学类和信息类连续性文本各一。由于目的、功能不同，我国质量监测本不能完全照搬国际项目，但匪夷所思的是，当前各级各类小学语文质量监测，命题文本个数和类型却照搬PISA。阅读简单的非连续性文本在语文课程标准第三学段目标首次提出，配套教材尚未发行，学生未经阅读实践，但各级监测不分年级，一律考查。

（2）文本难度

小学的命题文本难度应低于同学段、同学期教材课文。具有独立阅读能力是义务教育语文课程阅读方面的总体目标，其形成非立竿见影，要经历从不独立到半独立再到独立的过程。小学是独立阅读能力培养的起步阶段，尤其是前两个学段。测评时，被试者在短时间内独立完成阅读，命题文本难度理应低于在教师指导下需用数倍于监测时间才完成阅读的同学段、同学期的课文。学段越低，难度宜越小;到第四学段末，难度才可接近于同学期的课文。

命题文长是影响测试难度的重要因素。小学命题对文长无明文规定之标准，各国的标准差异巨大，让人莫衷一是。在我国，取向阅读能力的小学阅读命题为新事物，已有经验里无现成答案。但文长标准并非无头公案，教材课文、我国中高考与国际项目命题文本、学生学力实际、测试时长等，均为可循之迹。

PISA单篇文长平均354字左右，3个文本总长1150字左右。PIRLS单篇文学文本平均1000字，与信息类文长之和为1800字左右。由于PIRLS测评对象为9岁学生，当下以四年级学生为测评对象的较高级别质量监测的文长多与此相近;低级别监测，文长则几乎都在PIRLS之上，翻倍的也偶尔惊现。须知，国际项目是单纯的阅读测评，时长80分钟。我国小学语文质量监测试题包括积累与运用、阅读和写作三大部分，时长通常也是80分钟，有的甚至只有60分钟，命题文长必须低于PIRLS。

很长一段时间，我国中考文学类文长多为600～1100字，说明文、议论文的文长多为600～1000字，高考单篇多为千字文，这是长年命题实践而形成的默契。长期研究语文能力评估的祝新华先生认为，高中生现代文阅读考核1000、1500字左右各一篇是可行的。最近几年，中高考命题文长应声而涨，中考文本总长已达2700字左右。中高考以选拔为目的，设多少比例的学生完不成答题的门槛不无道理。但以诊断为主要功能的质量监测却不能，否则，考查实现课程目标的程度无从谈起，诊断功能又何以发挥？

小学生知识能力水平与初中毕业生不可同日而语，这是常识。语文课程标准学段目标的部分量标，可供观察差距参考：

比之于初中毕业生，小学毕业生识字量少500字，第二学段学生少1000字，质量上差距更大，足以影响阅读速度和深度。默读速度，第三学段末学生只有初中毕业生一半略多一点，第一、第二学段学生则差距巨大。阅读总量，小学毕业生大约只有初中毕业生的三分之一，第二学段末学生差不多只有初中毕业生的十分之一，第一学段末学生只有初中毕业生的八十分之一。因此，小学命题文长必须远低于中考，第三学段末达一半左右比较合适，低学段酌减。

再看教材。统编本教材尚未全部出台，已经发行的教材课文长度见涨。在小学测评命题文本难度应低于同学段、同学期教材课文的原则之下，该版教材课文长度实不能作为命题文长的量标。人教版小学语文课文，三年级平均450字左右，四年级平均650字左右，五年级平均750字左右，六年级平均1000字左右。基于相同原则，总体上，命题文长还应略低于此。

语文课程标准要求逐步学会精读、略读和浏览三种阅读方法。略读是粗知文章大意，浏览是快速地从文中捕捉信息，精读是反复思考、咬文嚼字以领悟文章深层意蕴。古人云，观文者披文以人情。朱熹提倡读书要熟读精思，说：“看文字，须要入在里面，猛衮（滚）一番。”“读书着意玩味，方见得义理从文字中进出。”叶圣陶主张：“一字未宜忽，语语悟其神。”三者所指均为精读。阅读测评时，用略读和浏览只能完成检索与复述、了解与转述试题，要完成解释与推论、欣赏与评价、反思与审辨等具有一定思维深度的试题，须多用精读。测试时间有限，若命题文本过长，必导致被试者无法从容精读，被迫多用略读和浏览，在诸多试题上难有高质量答案。因此，快速阅读和答题质量通常构成矛盾，即使是中高考，也要拿捏命题文长。对于小学语文质量监测，不假思索盲目“拿来”，显然是不折不扣的重大失误。

综上.可推导出小学阅读命题文长的参考指标：

依上述指标，直接从现成文章中找到长度、难度均合适的命题文本难度颇大，加工改造必不可少。我国中高考一向如此，但小学语文命题者缺少相关意识和经验，应尽快补上这一课。

2.试题难度控制

难易适度是高质量试题的指标，而试题难度又有相对与绝对之分。相对难度与被试者知识能力水平等有关，体现在被测者主观感受和测评结果统计上。绝对难度无关被试者，是与试题本身所属知识能力水平和解题技巧等有关的固有特性。此处所谓难度为后者。阅读题本身难度的控制，要充分把握解题所需知识能力水平及技巧，并主要从以下几方面把控：

（1）题量控制

阅读能力要素有6个层级12个要点，不等于每个文本要设计一一对应的12道题。题量多少要依据被试者知识能力水平、测评时长进行综合考量。PISA单个文本平均题数为3.6个，3个文本总题数为12个左右。不知何故，当前我国各级各类小学语文质量监测，命题文本个数和类型参照PISA，题数参照PIRLS，一律就高不就低。PIRLS是单纯的阅读测评，而我国小学语文质量监测的考查范围包括积累运用、阅读和写作，测评总时长相同，用于完成阅读题的时间远少于PIRLS，阅读题的数量理当相应减少。第三学段比较合适的题量是：文学文本5题左右，说明文4题左右，非连续性文本3题左右，总题量12～14题，一般不宜超过15题。第一、第二学段应酌减。

（2）权重控制

六个层级的阅读能力要素依据思维深度划分，一般而言，难度随之递增，但不能画上等号。例如，检索与复述中找到特定观点、结论和文章已陈述的主题句或中心句等，以把握全文或局部大意为基础，其难度不在了解与转述之下，甚至更难;概括与整合有时也难于局部的欣赏与评价。要综合考虑某种能力要素在阅读能力中的地位，也要根据其所需知识能力水平及答题技巧，合理安排考查指标的权重。一般情况下，第一学段更适合考查被试者对故事情境信息的检索与复述、对词句的了解與转述;第二学段可更多考查了解与转述、解释与推论、比较简单的概括与整合以及关键词句的欣赏与评价;第三学段在考查解释与推论、概括与整合、欣赏与评价的基础上，可以适当增加反思与审辨试题。

（3）题型控制

题型与难度有一定关系，可通过配置不同题型调节难度。阅读题有作标志、填空、选择、是非判断、简答等题型，其中选择和简答被更多采用。反思与审辨类试题宜更多采用简答题;解释与推论、概括与整合、欣赏与评价，简答题或选择题均可。就难度而言，简答题一般大于选择题，因为它需要思维结果明确后才能正确作答，而选择题即使只有粗略和模糊的感受或想法，也可在数个选项的比较和排除中作出正确选择。故，第三学段可适当采用简答题，而第二学段宜更多采用选择题。

对于选择题本身，选项间的干扰度决定其难度。读者对阅读材料的感受和理解原本是多元的，往往这样解读可，那样解读无不可，没有唯一的正确答案，但阅读测试的选择题只有唯一答案，这是一种矛盾，对命题者恰到好处地把握选项间的干扰度提出高要求。总体上看，针对小学阅读测试，选择题的选项干扰度不宜过大，特别是解释与推论、欣赏与评价类选择题。这个对，那个好像也没错，便让被试者陡生困扰。不少试题往往将也许不够准确但不能说或难说是错误的解读作为干扰项，这对于阅读能力发展处于初级阶段的小学生来说，难度颇大。有些选择题将自己的个性化解读作为唯一的正确选项，却将他人眼里的正确解读作为干扰项，倍增难度，还误导被试者，应尽量避免。同时，还有一种做法可控制难度，即从多个解读选项中选出唯一的错误解读。多个选项为正确解读，这符合多元解读规律，同时正确解读对错误解读干扰度相对较小，选择难度减小，更适合小学生，尤其是前两个学段。

（4）标准控制

标准即评分标准。评分标准高低事关试题难度大小;应根据不同学段被试者知识能力水平，准确把握尺度。主观题——主要是简答题，更应审慎对待评分标准。眼下不少小学阅读测试，简答题完全以命题者参考答案的答题角度和要点为标准，陡增试题难度。拟定阅读题参考答案的答题角度和要点，往往需要命题者反复斟酌;高级别、大面积测试，需数位身为业内精英的命题者反复讨论多时甚至多日。要求小学生在短时间答全专业命题者长时间冥思苦想甚至集中集体智慧研拟的角度和要点，无理且残忍。拟定简答题的参考答案，必须穷尽所有可能的答题角度和要点，但对小学生可得满分的答题角度和要点却不能求全，宜根据试题所需要的知识能力水平和答题技巧设定合适的评分标准，只要选择某个角度答对其中的部分要点即可，对有别于参考答案而言之成理的答案，应酌情给分。如此，不仅可将难度控制在适合被试的区间，还鼓励了多角度、有创意的阅读。

取向阅读能力的小学阅读测试在我国才刚刚起步，科学命题是全新课题。以了解测试质量的目的和功能为起点，以命题原则为指导，以阅读能力要素和评价指标为抓手，精心选择试题文本，合理控制难度，小学阅读题命制方可走上科学之路。