APP下载

“唯分数”与考试数据

2022-03-02陈方丁

广东教育·综合 2022年2期
关键词:学业分数考试

陈方丁

中共中央、国务院印发《深化新时代教育评价改革总体方案》后,各界兴起了学习、贯彻、落实的热潮,尤其是教育领域,结合习近平总书记的讲话及全国教育大会的精神,纷纷“对标对表”,对原有的相关文件、相关规定、相关管理方式等进行了修正,拟定贯彻落实的细则、工作主体及工作日程。

考试评价部门,泛指用大规模标准化考试的方式,對教育领域,特别是对教育领域内与试者的学业成就,进行测量评价的部门,包括从事命题、组织考试、评卷、分数解释与使用等业务的相关单位。它作为教育评价的一个主体,在学习、贯彻、落实《深化新时代教育评价改革总体方案》中,更是对考试评价的所有工作进行了全面的梳理与反思。不少人对“唯分数”与考试数据的认识存在困惑甚至陷入误区,工作上出现了“不敢为”的苗头。因此,有必要匡正认识,放下包袱,更好地推进考试评价改革工作。

破除“唯分数”,能否不要分数——分数的必然性

数字只是一种符号,由于这种符号系统具有同一性、等级性、等距性、等比性等特性,特别适合逻辑运算,所以人们通常使用数字来描述事物的属性。我们可以用数来描述事物属性的类别(名称量表),也可以用数来描述事物属性的等级(等级量表),或者进行等距运算(等距量表)、等比运算(等比量表)推测事物的属性。

数量是客观世界存在的形式,“数量关系”是事物的固有属性。任何现象,只要存在,就有数量。在教育领域,每个学生的学业成就、人格特征、能力倾向、职业性向、思想品德、综合素质等属性,总是存在差异。这种差异可能是类别上的差异,也可能是程度上的差异,也可能是暂时的差异,也可能是未来发展的潜在差异。所有的差异都可以用数据来描述。当我们用数据来描述学生学业成就的差异时,数据就是分数。例如,我们将考生普通高中学业水平考试的卷面分数从高到低划分为A、B、C、D、E 5个等级,各等级的人数比例分别约为17%、33%、33%、15%和2%。对考生考试结果用A、B、C、D、E进行等级描述,事实上就是运用数据的等级量表对考生学业水平的差异进行5分制的分数等级描述。

可见,有物存在,就有数量;有数量存在,就可测量;有测量,就有数据。测量运用于教育领域,特别是运用大规模标准化的考试评价教育对象时,其结果的表征就是分数。

破除“唯分数”,并不是不要分数,考试分数仍然是评价教育的重要手段,考试评价仍然是教育领域中的重要工作,分数的统计与分析仍然是教育评价不可或缺的重要组成部分。在学校教学班中,教师通过对学生的诊断性考试得到的分数,仍然是诊断学生学习情况的重要指标;学校对年级各班进行的形成性考试得到的分数,仍然是促进教师完善教育方案、帮助学生改进学习的重要工具;教育行政部门组织的终结性考试获得的分数,仍然是对已制定教育方案、计划、课程等整体效益鉴定的重要手段;普通高等教育招生考试的分数,仍然是选拔人才的主要标尺。

只是每一种考试得到的分数,均有其独特的功能和使用的边界,不能夸大,更不能越界。正如列宁所说:“真理只要向前一步,哪怕是一小步,就会成为谬误。”

追“分”路上,此分非彼分——考试评价的“分数”追求与“唯分数”的分数追求具有本质区别

考试评价部门使用大规模标准化考试的方式,评价考生的学业成就,以此作为招生录取的依据,其成效是有目共睹的。《国务院关于深化考试招生制度改革的实施意见》对考试评价工作作了充分的肯定:改革开放以来,我国考试招生制度不断改进完善,初步形成了相对完整的考试招生体系,为学生成长、国家选才、社会公平做出了历史性贡献,对提高教育质量、提升国民素质、促进社会纵向流动、服务国家现代化建设发挥了不可替代的重要作用。

然而,随着时代发展,考试评价及其衍生的一些问题不断显现,甚至固化。“唯分数”终成了顽瘴痼疾。事实上考试评价对“分数”的追求,对“好的分数”的追求,从未止步。

考试评价对正确的分数追求,从未止步。2014年,《国务院关于深化考试招生制度改革的实施意见》颁布后,教育部考试中心构建高考评价体系的研究工作随之启动,组织多所高校的150多位专家,在全国广泛调研的基础上,最终形成了理论性与现实性相结合、国际化与民族化相结合、基础教育与高等教育相衔接的中国高考评价体系。从高考层面对“培养什么人、怎样培养人、为谁培养人”这一教育根本问题给出了回答。中国高考评价体系的科学建构,是健全立德树人落实机制、实现德智体美劳全面发展育人目标的必经之路。个别地区的试题出现价值观方面的误导,值得警惕。

考试评价对科学分数(真分数)的追求,从未止步。组织教育学家、心理学家、测量学家、学科专家升级测量工具的工作,从未间断。测量对象属性的界定,不断深化;各学科必备知识、关键能力、学科素养测量的可操作性,越来越强;学科内容测量的基础性、综合性、应用性、创新性的把握,越来越精准;编制的测量工具,越来越先进;测量误差的控制,越来越好;考试分数的效度、信度,越来越高;特别是随着新兴测量理论的广泛应用,数据的统计与分析,越来越科学。总之,考试分数越来越正确、越来越准确地标示与试者的知识、能力及素养状况,分数越来越“真”,越来越有价值。

考试评价对公平分数的追求,从未止步。由于考试分数与教育资源、乃至社会资源的分配直接关联,考试招生制度是促进社会纵向流动的机制之一,考试招生部门对公平分数的追求责无旁贷。在命题环节,从题型采用、分值分配、素材选取、情景创设、设问与参考答案和评分标准的确定、难度控制等,都将公平摆在重要位置;在考务环节,从标准化考场的建设、标准化考务流程的健全、评分细则的拟定、评卷误差的控制等,无不凸显公平。

考试评价对全面分数的追求,从未止步。广东省2021年普通高校的招生,依据考生全国统一高考和省普通高中学业水平选择性考试科目成绩,参考综合素质评价实施录取。在《关于做好2021年基于高考基础上综合评价招生录取模式试点工作的通知》中规定,综合评价录取试点高校要重点研判考生高中综合素质档案内容,将学生社区服务、社会实践经历、研究性学习和自主选修课程学习情况等作为初审的重要内容和必要条件……要按照6:3:1比例(即学生高考成绩占综合成绩的60%,高校综合素质测试成绩占30%,高中学业水平合格性考试成绩占10%)合成考生的综合成绩。这些改革,追求的就是不断拓展的全面分数。

可见,考试评价主体的“分数”追求与“唯分数”论的分数追求,具有本质区别。考试评价主体追求的“分数”是一种“好”的分数,“唯分数”论者追求的分数是一种“多”的分数。在价值取向上,考试评价主体追求的是立德树人、服务选才、引导教学的分数;“唯分数”论者追求的是“多”的分数,是为了个体获得更多的教育资源或社会资源的分数。在思想方法上,考试评价主体承认分数的相对性,承认分数的使用边界;“唯分數”论者把分数绝对化、标签化,特别是对高考分数,任意扩大使用范围,作为评估学生、评估教师、评估学校成绩的唯一指标。考试评价主体努力使分数增量,表征着知识、能力、素养的增量,追求分数的“真实”;“唯分数”论者“走捷径”,通过“刷题”获取“练习效益”,在同等知识、能力、素养水平下,得到更多的分数增量,追求分数的“虚胖”。

当然,对于“虚胖”的分数,双方都有责任。一方面,学校教师不应通过题海战术,提高考生解题答题技能的办法,获得分数的增量,而应该走素质教育的道路,努力提高学生知识、能力、素养的水平,获得分数的增量;另一方面,我们的测量还不够正确、准确,效度、信度还要提高,教育测量者要反思,测量得到的数据究竟是与试者的知识、能力、素养等心理属性,还是解题答题的技能技巧等心理属性?在编制测量工具时,一定要想办法把这两种不同的心理属性区分开来,降低甚至消除“练习收益”。我们要用专业智慧,让分数更有价值。通过不断改革命题形式,不断创新题型,不断创新试题情景,挤掉分数的水分,让分数消肿,纠正“唯分数”主体的教与学行为及价值取向,难免会引发阵痛。

“唯分数”论的错误在于把相对的分数绝对化,把全面的分数狭隘化,把表征的分数本质化,把测量的误差扩大化,把相对稳定、处于发展变化的分数绝对化、静止化。考试评价与“唯分数”双方在指派数据(分数)与获取数据(分数)问题上的博弈,将长期存在。

“追分”路上,此分非彼分。切勿将所有对分数的追求一概排斥,“谈分色变”,不要把孩子和洗澡水一起泼掉。

用“分”场处,此用非彼用——考试评价的数据使用与“唯分数”的数据使用存在重大差异

对考试数据的使用是否会导致“唯分数”?这需要做具体分析。大规模标准化考试数据的使用,包括首次使用和再次使用。

考试数据的首次使用,就是运用考试数据进行招生录取。高等学校招生“唯”分数是导致高中教育“唯分数”困局的必要条件。高等教育在价值观层面的唯分数录取,恐怕无人认同;但在现在社会条件下,在实践操作层面的唯分数录取,恐怕是一种必然的选择。

考试招生的有关文件规定,推行新一轮高考综合改革的省区,高考考生总成绩由统一高考科目成绩和普通高中学业水平考试科目成绩组成,普通高中学业水平科目考试成绩以“等级”(一般分为五个等级,各等级具体比例由各省根据基本教学质量要求和命题情况等确定)或“合格、不合格”呈现。它一方面,扩大了录取分数的范围;另一方面,又使分数的形式更加多样化,不仅有数据,也有等级。显然这是破除“唯分数”困局的重要举措。

但是,要将上述规定贯彻到考试招生录取工作中,确实不易。第三批高考综合改革的试点省区,为确保招生录取的公平性与可操作性,将高考模式确定为“3+1+2”(“3”为语数外高考统考科目;“1”为普通高中学业水平选择性考试的首选科目,即在物理与历史中,选择其一;“2”为普通高中学业水平考试的再选科目,即在化学、生物、地理、思想政治四个科目中,任选其二),“3+1”按原始分计入总分,“2”的等级成绩按一定的规则依据卷面分数,分分转换为等级分。唯分数录取,似乎回到原点。但是它向社会昭示,使用分数录取,只是操作层面,而非价值层面。依据分数录取,是出于公平的需要。

考试数据的再次使用是指招生录取工作完成后,根据一定的需要,借助各种分析工具,对考试数据的统计与分析。大规模标准化的考试,由于其测验的编制、实施、评分、记分、分数的解释与使用,都按照统一的标准和严格的规定进行,考试数据是高质量的原始数据,具有很强的原创性和针对性。我们知道,数据的质量是一切统计与分析的基础,其重要性甚至超过分析方法本身。大规模标准化的考试数据库,就是一个“金库”,为我们的分析、研究和决策,奠定扎实基础。对高考考试数据等大规模标准化考试的数据,如果在招生录取工作完成后,便束之高阁,不再使用,不再进行深度挖掘,以此诊断学情教情,就是一种不作为。

在正确价值观引领下,大规模标准化考试数据的再次使用和深度挖掘,并不会对“唯分数”取向推波助澜,反而能更好地在服务命题、引导教学、帮助考生规划生涯方面发挥积极作用。

从命题角度来说,一份试卷是否承载了它应该具有的功能,是否完成了它的任务,需要做定性与定量的分析。比如从服务选才的功能来说,总分将考生的区分程度是否能满足招生录取工作的需要,分数的变量是否能把考生知识、能力、素养等心理属性程度上的差异,正确地、准确地标示出来,这就需要统计卷面的平均分、标准差、效度、信度、标准误差,需要统计试题的难度、区分度、差异系数等等。这些数据的统计与分析,对于命题工作至关重要。

在国际大规模标准化考试项目中,中国命题团队的工作难度最大。一则中国考试承载测量以外的其他功能较多;再者在中国的环境下,试测后的试题不能直接使用,试卷试题的许多参数都只能靠命题团队借助试测、借助对往年考试数据的统计与分析,做出大致的估计,工作难度极大。考试数据的再次使用是下一年命题工作的基础,与“唯分数”关联不大。

教师、学校及市县教育行政部门对考试数据统计与分析的愿望更为强烈。初级中学服务中考、高级中学服务高考,这是学校的职能之一。这些工作完成得如何,给学生、给家长、给社会的“工作汇报”,总得让数据说话。当然,在“唯分数”价值观引领下,统计并炒作诸如“高考状元”“高分考生”“北清率”等,无疑会推波助澜“唯分数”。但为改进本地区、本学校教育教学工作,深度挖掘分数背后所蕴含的信息,了解掌握本地区、本学校各学科必备知识、关键能力、学科素养等方面的水平与位置,了解自身的长处与短板,从只关注分数条的分数转向发掘数据背后所蕴含的信息,并不会强化“唯分数”。不能因为数据敏感,而对基层考试数据的需求视而不见,听而不闻。天津市教育考试院通过社会服务的办法,为有需要的学校提供正确价值观指导下的相关考试数据服务,其做法值得借鉴。有的省级考试机构正在研制考试年报的地市版、学校版,也不啻对基层考试数据需求的积极回应。

从考生个人角度看,目前给考生的考试数据,内容大体上就是总分、各学科分数、总分排位,通俗地说就是“分数条”,没有更多的数据信息。教育部考试中心曾经启动的云海工程项目,改革传统的高考分数报告办法,建立全方位、多层次、发展性、个性化的综合考试评价体系,为考生提供内涵丰富、并具有诊断与发展导向功能的评价报告,帮助考生全面、清晰地认识自己,更好地选择高校和志愿,做好职业生涯规划。上海市教育考试院在普通高中学业水平合格性考试项目中改革了“分数条”形式,从学科的知识内容和能力目标两个维度,报告考生的学业情况。浙江省教育考试院在普通高中学业水平考试项目中,从试题得分、学科知识、学科能力、认知目标掌握四个维度,分五个层次,报告考生学业情况。这些做法,都值得借鉴与推广。

在正确教育价值观的引领下,考试分数的再次使用与深度挖掘,不仅是必要的,而且是无止境的。

猜你喜欢

学业分数考试
艰苦的学业
分数的由来
无限循环小数化为分数的反思
音乐提升学生学业表现
树起学业担当之心
可怕的分数
算分数
Japanese Artificial Intelligence Robotto Take Entrance Examinations
你考试焦虑吗?
准备考试