“体美劳”纳入高考科目的可行性分析*
——基于“标准参照”与“常模参照”考试功能分类视角
2023-06-07廖白玲
廖白玲
一、引言
党的二十大报告提出,“全面贯彻党的教育方针,落实立德树人根本任务,培养德智体美劳全面发展的社会主义建设者和接班人。坚持以人民为中心发展教育,加快建设高质量教育体系,发展素质教育,促进教育公平。”[1]发展素质教育,需要进行课程体系改革,也需要评价体系改革。《深化新时代教育评价改革的总体方案》明确提出“稳步推进中高考改革,构建引导学生德智体美劳全面发展的考试内容体系”[2],为进一步完善我国高校考试招生制度指明了方向。在基础教育课程体系中,德智体美劳都有相应的科目载体,考试内容体系改革,意味着可以借助中高考的评价指挥棒作用,引导基础教育课程教学变革,促进学生身心全面发展。具体操作层面,内容体系的变化意味着中高考科目的变化,素质类课程纳入高考科目是否可行是值得探究的问题。
既往高考科目以智育考察为主,形成与素质教育格格不入的应试教育生态。作为全面育人重要组成部分的德育、体育、美育和劳动教育,则被打包在综合素质评价中,最早在江苏2008高考方案中,然后在2014年国务院关于深化考试招生制度改革的指导意见中,都强调了综合素质评价在考试招生中的参考地位。然而,改革初衷在实践中无法得以真正落实,综合素质评价事实上成为一种“摆设性制度”[3]。
如果说德育在高考“政治”科目中有所体现,那么作为更具开放多元特征和不可量化性的体育、美育和劳动教育,如何从高考招生的“参考”地位提升到“依据”地位、应实行合格性条件限制还是选拔性分数竞争、适用统一考试还是区域考试等,是值得研究的问题。作为素质教育类课程,体育、美育和劳动教育既有共性,也有科目本身的差异性,本文尝试把“体美劳”作为非学科类课程的笼统概念,以“体美劳”是否应当纳入高考,特别是以标准参照分数还是常模参照分数纳入高考的问题做一点探讨。
二、“体美劳”纳入高考科目的争议
“体美劳”如何纳入高考内容评价体系的争议,源于素质教育评价难题,一方面是学生综合素质全面发展的科学测量存在困难,另一方面是纳入高考带来的指挥棒效应可能引发更为复杂的应试教育问题。在中招环节,全国多地就“体美劳”纳入考试科目进行了有益探索,纳入高考则因“牵一发可能动全身”而仅停留在理论探讨层面。
(一)素质教育促进学生全面发展的评价难题
在基础教育阶段,中高考常规考试科目被称为学科类科目,学科类课程教学是智育的主要内容,而音体美以及近年倍受关注、旨在促进学生身心全面发展的劳动技术课程都被看作“副科”,习惯上被作为与应试教育相对的素质教育的重要内容。素质教育评价什么、如何评价是一个难题,就像中国古代选拔官员的察举制“举孝廉”难以考察品德,基础教育阶段中小学生素质教育促进学生全面发展的成效也难以评价,进而出现长期为人们诟病的应试教育下“高分低能”问题。素质教育评价难题涉及发展性评价与选拔性评价、个性发展评价与全面发展评价、过程性评价与结果性评价、量化评价与质性评价等四方面关系[4],简单把综合素质类课程评价结果纳入高考不能实现促进学生全面发展的办学目标,这也是新高考改革谨慎参考综合素质评价结果的原因。有研究者提出,综合素质评价不是为了甄别与选拔学生,而是为了促进学生各方面综合素质的发展,为学校办学、教师教学和学生发展提供导向,与高考结合可能会带来弄虚作假现象[5]。
(二)“体美劳”纳入考试科目的既有探索
体育和美育纳入招生考试评价的政策依据是中共中央办公厅、国务院办公厅2020年印发《关于全面加强和改进新时代学校体育工作的意见》和《关于全面加强和改进新时代学校美育工作的意见》两份文件,前者提出“将体育科目纳入初、高中学业水平考试范围。改进中考体育测试内容、方式和计分办法,科学确定并逐步提高分值。积极推进高校在招生测试中增设体育项目。启动在高校招生中使用体育素养评价结果的研究”,后者提出“探索将艺术类科目纳入初、高中学业水平考试范围。全面实施中小学生艺术素质测评,将测评结果纳入初、高中学生综合素质评价。探索将艺术类科目纳入中考改革试点,纳入高中阶段学校考试招生录取计分科目”[6]。同年更早时间中共中央、国务院印发了《关于全面加强新时代大中小学劳动教育的意见》,提出“把劳动素养评价结果作为衡量学生全面发展情况的重要内容,作为评优评先的重要参考和毕业依据,作为高一级学校录取的重要参考或依据”[7]。显然,体育和美育纳入考试特别是纳入中考范围是非常明确的,而对健全劳动教育评价制度仅提出“作为重要参考”的意见。在实践方面,体育、美育等综合素质评价项目纳入中考有多地探索,特别是浙江省嘉兴市,从2003年成为浙江省第一批省级课改实验区开始,对综合素质评价改革进行了积极探索和实践,构建了一套比较完善的评价体系[8],2018年又开始探索把综合素质评价结果折算成分数纳入中考总分,满分值为20分,取得较好成效,该做法在国内多地被借鉴推广。
(三)“体美劳”纳入高考科目的争议焦点
综合素质评价纳入中考,特别是体育纳入中考,全国各地已有比较成熟的经验,但是“体美劳”纳入高考科目,社会各界尚有许多疑虑。以体育纳入高考问题为例,有的研究者认为,理性分析并深刻把握高考综合改革的内在意蕴,是理解新时代体育纳入高考的前提条件和逻辑起点[9]。虽然加强学校体育工作是新时代开展素质教育促进学生身心健康发展的必然要求,但以纳入高考科目的形式来推进该项工作,则会牵一发动全身,必须经过专家学者科学严谨的研究论证和一线工作者的试点探索。而有的研究者则持相反观点,认为当前高校招生录取参考综合素质评价在实施中遭遇阻力,存在形式化、虚化等问题,综合素质评价成绩的复杂模糊性与高校招生录取所要求的简单精确性之间的矛盾是根本原因[10],提升高校招生参考综合素质评价的有效性,应当采取定量融入式参考,也就是将量化评价分数纳入高考总分。
就体育纳入高考而言,争议集中在以何种形式纳入高考,可能的形式有:其一,体育纳入高中学考,把是否合格作为学生参加高考的限制性条件;其二,体育素养评价结果折合分数纳入高考总分,发挥过程性评价的引导作用;其三,高校在招生测试中增设体育项目,“让体育作为正式高考科目”[11]等。对于美育纳入高考,一方面借助评价“指挥棒”作用,可以“倒逼学校美育课程回归美育”[12],但另一方面如果过程性评价变得简单粗暴、终结性评价被功利化的时候,美育的“春天”就无法到来[13]。劳动教育亦然,如何有效平衡“教育与考试”的关系是争议的焦点。
三、标准参照与常模参照:两种类型考试的功能定位
消解“体美劳”综合素质评价项目纳入高考带来的“教育与考试”矛盾,关键是如何正确看待“体美劳”考试的功能定位,需要确定纳入高考总分的素质类科目分数属于标准参照考试还是常模参照考试的结果,避免功能混淆的困扰。
(一)标准参照与常模参照的内涵与功能差异
关于标准参照考试与常模参照考试的差异,国内学者早在20世纪八九十年代已有深入探讨。标准参照考试需要事先制订评价标准,且“标准”在特定时期内应当是明确的、绝对的、客观的、不依赖于样本的[14]。在标准参照考试中,对特定分数的解释不受该分数在同一考生群体中的相对位置影响,而是依据事先制订的标准来解释分数的实际含义[15],如果每位考生都能达到规定“A”等级的标准,就应当允许所有考生都拿到“A”等级的成绩。常模参照考试,是用正态分布理论来处理成绩分布,关心的是考分之间的比较关系,对成绩的评价依据是考生在同一群体的相对排名。常模参照考试,习惯上使用原始分数进行排名比较,因为对成绩的区分度要求较高,更科学和精确的排名比较方法是百分位比较或标准分数比较。
标准参照考试的功能定位为“合格—保障”,常模参照考试的功能定位是“竞争—选拔”。标准参照考试,对于考生来说最终成绩效用具有可预测的确定性,对于考试组织者来说,关注的重点是同一考生群体的达标合格比率,保障考生群体在某项指标的普及水平。常模参照考试具有历时与共时可比性的优点,对于考生来说最终成绩效用取决于同一群体考生的整体水平,具有不可预测的不确定性,对于考试组织者而言,关注的重点是如何把考生水平区别开来,从中进行优中选优,如传统高考,即是通过选拔考试形成考生群体对稀缺优质高等教育资源的竞争,进而提高拔尖创新人才培养水平。
(二)两种类型考试在教育考试中的应用
标准参照考试即“合格-保障性”考试,常用于课程教学目标达成、学业水平达标等方面的测评。标准参照考试需要预设标准,对于大规模考试而言,“标准”设定相对困难,且基于项目反应理论进行大型题库建设的人力物力成本较大,所以较为严格意义上的标准参照考试应用场景并不算多。比较典型的如驾照理论考试、计算机等级考试、医师资格证考试等。高等教育自学考试按照考试功能来定位,也属于标准参照考试,课程成绩60分即可获得单科合格证,但是“标准”往往不好把控,同一科目不同年份的60分考试成绩因为试题难度差异导致所反映的实际学业水平有所不同。
常模参照考试即“竞争-选拔性”考试,比较典型的就是高校招生考试和公务员考试,因为录取名额相对固定,受试题难度差异和考生数量变化两个因素影响,所以每年划定的录取分数线会出现波动。大学生英语等级考试(CET)是为人们熟知的衡量“是否达到标准”的考试,但是CET考试实际上并不是标准参照考试,而是属于常模参照考试。CET分数不是卷面成绩,而是标准分,虽然有一个固定达标的分数,但实际上却是动态性确定卷面分划线,每次限定一定比例考生通过,并限定考生获得优秀的比例,至于考生真实卷面答对比例有多高,是否达到卷面60分要求则无关紧要[16]。
(三)混淆考试功能定位差异带来的高考改革困扰
传统意义上,高考是“高利害高风险”[17]的“竞争-选拔性”考试,虽然实践中呈现成绩形式还存在使用原始分数还是使用标准分数的争议,但运用常模参照考试的一般理论进行分数解释则是普遍共识。长期以来高考实行文理分科考试,由此引发文理分科与文理融通两种改革思路的争议,会考制度以及后来的学业水平考试制度从形式上缓解了文理分科考试的矛盾,但“高考”与“学考”关系的新矛盾形态成为研究者和决策者关注焦点。在新高考改革之前,江苏省在2008年前后进行的有较大社会影响的“3+2”模式高考改革探索,收获很多经验,也出现许多问题,其中一个问题是混淆了具有学业水平考试性质的选修科目的功能定位,赋予选修科目以选拔功能,造成学生学业负担加重。
按照江苏2008高考方案,语数英3门必修科目计算总分,2门选修科目的等级根据成绩排位来确定,并设定了“双B本科门槛”,另外所有六门选修科目成绩均达到A等级且技术科目测试合格的考生,可获得10分加分计入高考成绩。决策者的初衷是希望以此驱动考生认真学习所有选修科目,包括没有纳入高考成绩的选修科目,但在实际操作中引发了更为激烈的分数竞争。为了获得10分加分,成绩优秀者分分必争,为了上本科,两门选修科目成绩都要在前50%,名校则一般有两门选修科目A等成绩的要求,很多考生临近高考,需要全力以赴对付选修科目,因为这是本科门槛的等级。而且,这个等级是常模参照的、考生与考生之间排位竞争的等级,一旦没有获得相应等级就可能带来“高分低录”的后果,例如2020年成为媒体关注热点的江苏省高考状元白湘菱,就因为一门选修科目成绩是B+而与国内名校失之交臂。
江苏2008高考方案还有必修科目“学考”成绩有不合格D等级就不能参加高考的规定,对偏科考生或平时成绩不理想的考生造成较大心理压力。相比而言,2014新高考试点的浙江省方案对不合格E等级没有限制参加高考的规定,并试图通过“选考学考科目”的形式化解“学考”与“高考”的矛盾,但是选考科目本质上就是高考科目,学业水平达标与高校生源选拔的根本矛盾还是没有解决。浙江2011年开始实施的“三位一体”综合评价招生,把学业水平考试纳入高考成绩,赋予学业水平考试选拔功能,引导学生全科目全面发展,但是否有利于拔尖创新人才培养有待进一步研究和论证。
如今,对于“体美劳”纳入高考科目这个问题,人们普遍的想法是这样做可以通过高考这个抓手,赋予其更多的指挥棒功能,至于“体美劳”评价本身是适用普及定位的标准参照考试还是适用选拔定位的常模参照考试则缺乏探讨。
四、“体美劳”纳入高考科目的可探索路径
就普通高校招生而言,除体育、艺术等特殊专业,考生“体美劳”素质需要满足的是基本要求,“体美劳”考试的基本定位应当是标准参照考试,也就是“合格-保障性”考试。“体美劳”纳入高考,首先应当遵循合格性考试的标准确定性原则,而实际纳入高考科目,则需要区分纳入考试环节和纳入招生环节的差别。
(一)政府统一施测:以科目“达标赋分”纳入高考成绩
高考是“普通高等学校招生全国统一考试”的简称,是具有公平性和权威性的国家级教育考试,“体美劳”纳入高考科目的直接路径就是在考试程序上与其他学科类考试科目保持一致,实行政府组织的统一考试,且考试成绩纳入高考成绩。为了避免“体美劳”科目的学科化以及由此引发的“应试”负面效应,“体美劳”科目考试的性质应当是标准参照考试,也就是说,获得满分的标准应当是确定的,而这个标准是学生身心健康发展应当达到且大多数人能够达到的。
“体美劳”高考科目达标即可以一定权重比例的分数纳入高考总分,分数权重多少合适,需要进行科学论证,就目前部分地区试点的综合素质评价纳入中考分数的实践来看,相比150分的语文或数学,“体美劳”等非学科类科目以满分20或30分纳入高考总分,对没有达到基本合格标准的考生,则以相应分数纳入总分而不做高考资格限制,就能够发挥巨大的促学促练指挥棒功能。因为标准参照考试的确定性,大多数学生通过正常的学习和锻炼都确定能够获得满分,不会产生额外的心理压力和学习负担,同时也达到了以考促学、以考促练,进而促进学生身心健康全面发展的教育教学目标。
(二)中小学施测:“过程性”评价结果纳入高考成绩
把“体美劳”作为统一考试科目的最大优越性是公平性得到保障,但是也存在显见的不足之处,即仅仅依据高中学业结束之后的一次终结性考试成绩难以客观衡量“体美劳”素质教育质量。学生在临近高考前,通过集中训练或突击培训就能够获得达标分数,这显然偏离了通过高考指挥棒来推动中小学日常开展全面发展素质教育的初衷,只有过程性评价才能保障过程性的学业质量。“体美劳”的过程性评价与结果性评价的矛盾本质上是评价主体的矛盾,核心问题是中小学测试的过程性评价结果是否客观和公平。地方教育主管部门可以通过建立小学、初中和高中一体衔接的综合素质评价信息管理平台,依据新课标课程体系,以核心素养为要点组织评价,确保非学科类科目评价客观真实和公开公平,方便高校招生参考,引导和监督中小学办学方向。
上海是比较典型的案例,2014年新高考改革意见印发之后,2015年上海市教委印发《上海市普通高中学生综合素质评价实施办法(试行)》文件,较早系统开展高中生综合素质评价,提出“在考察学生的综合素质时,重点关注品德发展与公民素养、身心健康与艺术素养等”,同时提出“高校招生过程中要参考综合素质评价结果”,但始终没有迈出从“招生参考”到“纳入成绩”的探索步伐。综合素质评价的综合影响因素过多,存在考试公平和社会影响的不确定性,但是明确把“体美劳”科目的过程性量化评价结果纳入高考成绩,或者结合区域统一测试成绩纳入高考成绩,坚持标准参照的考试定位和非竞争性的评价原则,则具有较强的可操作性。
(三)社会第三方施测:高校自主确定招生评价依据
社会第三方施测适用于标准参照考试,如美国的SAT、GRE、TOEFL等重要考试都是由非营利机构ETS(Educational Testing Service)承担,特别是SAT,是由美国大学理事会(College Board)主办的学术能力评估考试,有“美国高考”之称,其成绩是高中生申请美国大学入学资格及奖学金的重要参考。“体美劳”中的体育、音乐和美术科目,经过一段时期自主招生素质项目加分的驱动,社会上已有较为成熟的等级评价体系,政府可以探索认可或委托具有独立性、专业性、权威性的第三方评估机构参与相关科目的阶梯式等级认证。
社会第三方施测的最大顾虑是考试公平性和私营机构的非公益性,但是类似于CET(大学英语四、六级考试)由教育部教育考试院实施,“体美劳”科目的社会化考试也可以由政府授权的事业单位、非营利组织或公益机构实施。区别于政府统一施测纳入高考成绩的做法,借鉴综合素质评价的“参考”用途,社会第三方施测成绩可作为高校招生中的参考信息。高校具体如何使用第三方测评结果由高校自主决定,相关高校在招生章程中明确要求并提前公布,规范和公开使用情况[18]。社会第三方测试成绩与学校综合素质评价信息形成数据印证关系,高校在考生入学后可以进行复核。
五、结语
古人所谓“科举兴,学校废”是古代科举社会考试与教育关系的描述,现代网民调侃“高考不死,教育难兴”是现代中国考试与教育矛盾的写照,平衡考试与教育的关系是千古难题,应试教育已成为东亚儒家文化圈较为典型的教育生态特征。从1952年建立全国统一高考制度,到2014年启动新高考改革,考试科目始终是高考改革的核心内容,如何用好高考科目指挥棒成为应试教育转型素质教育的关键。
高考是一场高利害关系的博弈,它不仅与考生的前途息息相关,而且与教师、学校、地方教育行政部门的业绩紧密相关,与高校的生源质量紧密相关[19]。探索“体美劳”纳入高考科目或考试成绩纳入招生环节,兼顾高考既有科目的竞争—选拔性功能,赋予高考对于素质类非学科科目的合格—保障性功能,有助于平衡“两依据”和“一参考”关系,突破综合素质评价“摆设”困境。利用高校招生“牛鼻子”开启学生健康成长之门,是构建教育良好生态、缓解家长焦虑情绪、促进学生全面发展的必由之路,也是建设高质量教育体系、办好人民满意教育的必然要求。