智能技术赋能基础教育评价改革的实然困境与路径选择
2023-03-23张进良谈桂芬
□ 张进良 杨 苗 谈桂芬
《新一代人工智能发展规划》指出,到2025年智能社会建设取得积极进展,为公众提供个性化、多元化、高品质的基础教育服务(国务院,2017-07-20)。教育要发展,评价是关键,教育评价是推动人才培养模式改革与教育创新的重要引擎(谈松华,2017),也是基础教育领域中落实立德树人根本任务的核心环节。新时代我国义务教育质量评价、学校办学质量评价和学生发展质量评价发生新变化(教育部等,2021-03-18),国务院指出要健全教育质量评价监测体系,建立以“五育”并举、全面发展素质教育为导向的科学评价体系(中共中央国务院,2020)。传统基础教育评价的评价目的、评价对象、评价方法(谈松华,2017)已不能满足新时代基础教育高质量发展的需求,“双减”政策的出台进一步折射出基础教育评价改革的紧迫性(中共中央办公厅等,2021-07-24)。人工智能(Artificial Intelligence,AI)驱动的大数据、区块链等技术集群发展,在对基础教育的教学环境、教学资源等要素产生变革性影响的同时,也为教育评价改革提供了技术支持。基础教育教学评价改革是时代需求、教育发展、技术进步等多方协同作用的重要诉求(杨宗凯,2020),如何顺应新时代教育改革与发展趋势,合理利用智能技术,准确识别基础教育评价的困境,深入推进“双减”工作,革除“唯分数、唯升学”等片面评价,促进教育评价要素全方位革新,是新时代实现基础教育高质量发展所面临的现实问题。
一、实然困境:AI赋能基础教育评价改革的羁绊
从马克思唯物主义辩证法角度切入,辩证地分析基础教育评价改革问题,既要看到智能技术在基础教育评价改革中展现出的赋能作用,同时也不能忽视智能技术与基础教育评价实情的耦合失调。智能技术与基础教育评价情境相结合时也产生了包括理念、技术、主体和实践等多重困境。
(一)理念之困:基础教育评价改革的认知偏差
教育评价作为一种价值判断活动(陈玉琨,1999,p.7),其改革必然在一定的教育理念引领下进行,当前基础教育评价改革还面临着诸多理念困境。
1.受传统教育评价观的排异
传统教育评价观的主要表现为功利主义导向的教育评价观、工具主义导向的教育评价观和管理主义导向的教育评价观。功利主义导向的教育评价观受“读书做官”传统教育观念的影响,崇尚应试教育文化,致使分数与升学率成为教学质量评价的唯二标准(黄志坚,2017,p.33),重结果、标准化、简单化与效率至上等形式化倾向明显。工具主义导向的教育评价观从工具主义逻辑出发,将教育评价视为评价者为达到某种教育之外的目的而设计的工具手段,把满足现代政治、社会和经济发展需要的程度作为教育评价的主要内容(张新平&林美,2016),忽视对教育实践德行的评价。技术的工具理性往往过度关注教育中的软硬件建设,忽视技术在教育应用中的价值理性(宋乃庆等,2021),对育人的本体价值关注不够。管理主义导向的教育评价观遵循效率至上的管理逻辑,教育评价是教育管理者等自上而下组织的基于权力、控制等对人或教育的高效控制与管理工作(徐彬&苏泽,2020),教育评价目标往往服从于教育主管部门的行政目标,难以回应对学生个性化发展目标的全面价值关照,这种行政化教育评价模式已使教育评价制度逐渐僵化(徐彬&苏泽,2020)。上述三种传统教育评价观本质上是对现代教育评价观的排异,未遵从科学性与教育性相结合的原则,使得教育评价服务于立德树人根本任务的功能正在发生异化。
2.对智能技术赋能教育评价的忽视
从技术视角来看,目前人工智能尚处于弱人工智能阶段,其智慧水平并没有我们想象的那么高(黄欣荣,2018)。国内智能技术在基础教育领域的应用与国外也有一些差距,专业性不够深入、综合性服务商较少、智能技术和创新教育结合不够紧密(李晓晓,2019)。虽然智能技术在交通、物流、安防等领域中得到了较为普遍的应用,但是智能技术在我国大部分地区中小学尚处于试验推广阶段,更谈不上对基础教育评价的智能化变革(杨欣,2021),教师对智能技术支持的教学信心也有不足(冯筠等,2021)。持智能技术的悲观主义观点的教育者实际上是对智能技术认识不足,未站在信息技术促进教育变革的高度来认识智能技术对基础教育评价改革的驱动作用。
教育评价改革的保守主义的一种观点认为现有的基础教育评价手段用得好好的,不理解为什么要谈基础教育评价智能化。大部分教育者倾向于安于现状、因循守旧,不愿意探索利用新型信息技术促进基础教育变革。另一种观点源自对智能技术在基础教育评价运用中所引发的伦理道德问题、陷入技术理性陷阱等方面的担心,如能否利用智能技术对师生的个人信息、日常表现、学习成绩以及个人敏感隐私信息进行记录和综合分析决策(赵汀阳,2018),以及由此引发的教师、学生、家长对个人伦理道德问题的争议。如当师生习惯于用智能技术开展教育评价时,会不会形成“智能依赖症”,从而使他们的思维受困于智能“牢笼”,进而缺乏深度思考(林晓峰&谢康,2019)。这种观点也担心智能技术支持的教育评价全方位地监视、获取并分析学生学习数据,使学生变成“透明人”,学生的学习过程完全在教师的“算计”之下,逐渐沦落为被算计的客体,失去了本身作为教育主体的目的意义(安涛,2020)。
(二)技术之困:基础教育评价改革的技术制约
教育界对人工智能的探究正在兴起,实现“科技赋能教育”的预期目标成为诸多学者和教育者的美好愿望。但是事物的发展皆具两面性,作为新时期基础教育评价改革的根本动力之一,智能技术也存在难以克服的技术局限。
1.智能教育评价的底层技术开发有待加强
客观地讲,目前人工智能技术只能完成特定情境下的任务,难以迁移到比较复杂的情境,如文字识别系统只能识别文字字符等(张志祯等,2019)。人工智能技术在教育评价应用中衍生出诸多智能化评价工具和手段,如智能组卷、智能阅卷、智能监考、智能评测、自适应测试和大规模标准化测试等(李晓晓,2019)。但是智能技术在基础教育评价中的应用面临着挑战,除了客观题的智能化阅卷相对成熟之外,主观题阅卷的准确性和智能化程度还有待提高,针对英语口语和写作学习效果的自动测评和反馈功能较弱,尤其是对开放性口语和作文的自动诊断和反馈均面临较大挑战(席小明,2021),在认知与情感计算、深度学习和智能测评等方面也还无法真正达到教育现代化的理想需求(朱成晨&闫广芬,2018)。另外,面向中小学各阶段各学科的智能化教学评价系统和工具的开发力度有待进一步加强,市面上供中小学师生选择使用的智能化评价系统不多,智能技术在基础教育评价实践中的普及程度不够。如学生综合素质评价主要在“人人通平台”上进行,但综合素质评价的信息大部分依然靠人工上传,并未打通与学生在线学习系统、学生档案系统等系统之间的数据壁垒,使得综合素质评价的效率不太理想。
2.智能教育评价的数据分析技术等尚需发展
数据驱动是智能化教育评价的基础,教学行为大数据的采集、分析、可视化等都是智能化教育评价的关键技术,合理采集并分析教学行为的多模态数据,实现对学习者个体和群体认知水平、人格特质和心理健康等的精准评估,是开展智能化教育评价的前提。一方面,除了从在线教学系统中采集教育评价数据之外,还要依靠智能传感器、智能可穿戴设备、智能摄像头、智能学习终端等采集非结构化行为数据。但是大部分中小学缺少这些智能数据采集设备,数据采集自动化水平不高。另一方面,数据来源比较单一,以片段化数据为主,缺少对文本模态、视频模态、语音模态和生理模态等多模态数据的收集,对基于多模态数据的测评实践也较为缺乏(骆方等,2021),利用脑电、眼动识别、肢体识别等方式建立测量规则的实践尚处于研究探索阶段(郑勤华等,2019)。智能化教育评价需要将师生教学行为数据在符合数据伦理规范的前提下于一定范围内共享,但是目前诸多教学系统之间存在着数字鸿沟,各系统的数据标准不一、接口不通,使得教学行为数据的共享不畅,严重制约了多主体参与教育评价的便利性,影响了教育评价的效率。
(三)主体之困:基础教育评价改革的保障不力
教育评价的主体依然是承担教育活动价值判断任务的人。《深化新时代教育评价改革总体方案》的落实关键在于“落实主体”,即教育管理者、校长和教师对“方案”具有足够的理解能力和运用能力,以及运用之后的反思与重构能力(李政涛,2020)。新时代背景下基础教育评价改革对评价主体提出了新要求,但是由于受管理主义导向评价观的长期影响,存在评价主体专业化程度不够、数据素养不高等问题。
1.评价主体的专业化程度有待加强
首先,传统的基础教育评价以政府为主体,把评价结果作为“教育问责”(戚业国&杜瑛,2011)的主要依据,导致教育评价行政化倾向明显,评价权力过于集中。由于时空因素和技术限制,无法让教师、学生、家长等利益相关者参与到教育评价中,导致教师评价中教师缺位、学生评价中学生缺位,教育价值单一化倾向明显。其次,政府对于教育评价有绝对的话语权,可能容易忽略其他主体的需要,使教师、学生等难以参与到教育评价过程中,导致教育评价的全面性、公平性、客观性不够,评价结果失之偏颇(彭拥军,2020)。由于缺乏有效的专业引领,教研人员与学科教师互动不足,缺乏基础教育评价的专业团队,导致基础教育评价的专业性不足。最后,存在评价主体错位现象。在学生评价中,教师的权威身份使得学生沦为被动接受者,学习积极性得不到发挥,对自身言行反思的动力不足。
2.评价主体的评价素养有待提升
教育评价主体的评价素养是制约教育评价改革的重要因素之一,“如果教师缺乏评价素养,就意味着对其自身职业发展极其不利”(Popham,2004)。中小学教师的教育评价素养有待提升,主要体现在:教师教育评价知识、标准化测验结果的解释与运用等方面的知识欠缺;教师的评价方案设计能力、诊断学生学习表现的能力、自我评价和同伴评价能力等都有待提升(张瑞&覃千钟,2020);教师利用评价结果的教学决策能力较差,凭经验描述学习目标,误用评价方法,评价结果反馈不当,评价伦理失范等(郑东辉,2017)。教师数据素养发展面临较多的实践难题,如教师数据意识相对薄弱,对教育大数据的潜在价值认知不足,认为教育评价就是考试、测验;如教师数据应用能力较弱,大部分教师仍以自身知识或经验进行教育决策,对评价数据利用不足(杨现民&李新,2021)。
(四)实践之困:基础教育评价改革的行动掣肘
教育评价是一种实践活动,人们比较依赖传统的教育评价标准、评价方式和评价手段,不可避免地在基础教育评价改革中遭遇多方面的不适应和困难。
1.评价标准欠科学
评价标准是开展教育评价的重要依据,评价标准的科学合理是构建教育评价方案的关键所在。我国基础教育评价标准异化主要表现为评价标准的单一化与标准化:单一化的评价标准奉行学习成绩与分数至上;评价标准的标准化依据评价指标采取量化手段对评价对象进行一次性评价。由于教育过程的动态性、需求的差异性以及成才和发展环境的复杂性,单一化和标准化的评价标准难以适应创新人才培养的评价要求(司林波,2022)。面向不同教育场景的教育评价标准的科学性和操作性有待提升,传统教育评价标准过分关注分数、升学、排名等智育指标,轻视德育、体育、美育、劳育等内容,忽视了评价对象发展的多样性和个体差异,淡化了对教育评价对象即人的全面发展之“树人”目标的关注和理性认识。
2.评价方式传统单一
评价方式是教育评价中采用的方法和手段,是回答“怎么评”的问题。在基础教育教学评价中,受中国传统考试文化、应试教育考评制度和功利主义教育评价观等影响,教师等评价主体将考试作为人才选拔和教育评价的唯一手段,过分依赖评价指标,并且惯用期中考试、期末考试等传统的阶段性、结果性评价手段,忽视并不乐意采用信息技术支持的过程性评价,缺少持续性跟踪的形成性和增值性评价,导致基础教育评价方式比较单一、评价的甄别功能突出、育人功能弱化。伴随着智能技术在中小学教学中的应用,教育评价手段已经由过去的考试、量表测量过渡到档案袋评价、课堂观察、自动测试等多样化评价手段,但是由于受到教学评价工具的智能化程度、教师评价素养等方面的影响,评价手段的信息化、智能化程度不高,教育评价数据的采集、分析和可视化能力较弱。对智能化教育评价工具的开发力度不够,可供一线教师使用的优质评价工具不多,且现有的评价工具对评价的教育性关照不够,最终影响了基础教育评价的效率和评价结果的信度与效度。
二、时不我待:AI赋能基础教育评价改革的契机
(一)回应AI时代人才培养需求变化之时代需要
人工智能的迅猛发展将会给社会带来持久、长远的革命性影响(金东寒,2017,p.14),人类社会即将从工业时代、信息时代进入智能时代(李政涛&罗艺,2019)。智能时代人类的分工更加明确,标准化、劳动密集型的工作由机器人完成,人类则需要完成那些创造性和情感性的工作。社会分工的变化会导致人才需求的变化,各行各业对劳动者的能力、素养提出了新要求,不再需要适应工业化时代的标准化人才,而需要适应数字经济时代具备创新能力的复合型应用人才(张进良,2018)。习近平总书记在2019年国际人工智能和教育大会的贺信中指出:“培养大批具有创新能力和合作精神的人工智能高端人才,是教育的重要使命”(央视新闻频道,2019-05-16),智能时代不再需要“知识分子”,而需要能够解决复杂问题的“高手”(曹培杰,2020)。智能时代人才需求的变化,倒逼教育目的必须与时俱进,教育评价作为基础教育活动立德树人成效判断的关键环节,必须从机制、方式等方面做出改革,才能适应新时代基础教育体系改革与发展的需求。
(二)顺应AI时代教育评价方式革新之内在需要
科技赋能教育评价改革时机已至(董奇&赵广立,2021-01-12),人工智能、大数据技术赋能的教育评价能够实现教学活动监测的时间连续、空间全域和价值多元,数据采集也突破时空和类型限制(朱德全&吴虑,2019),使得教育评价更加客观、智能与全面(杨现民&田雪松,2016,p.147)。语音识别、自然语言理解、情感识别和行为识别等智能技术提升教育评价数据的采集、处理、分析和运用的效率,促进教育评价数据化、智能化,由此引发教育评价形态的变革(刘邦奇等,2021)。如何让人工智能技术赋能基础教育评价,革除传统基础教育评价方式的弊端,从技术层面和方法层面优化基础教育评价,是顺应AI时代基础教育评价改革与发展的内在需求。
(三)满足AI时代基础教育优质发展之现实需要
迈入新时代,我国基础教育逐渐由基本均衡转向优质均衡,人们对优质教育的需求日益增强(钟秉林,2018)。国务院在《关于深化教育教学改革全面提高义务教育质量的意见》中提出“全面提高义务教育质量”,并将建立健全质量评价监测体系作为主要任务之一。教育评价方式的多样性、评价手段的科学性、评价结果的客观性等,与新时代基础教育的高质量发展密切相关。但我国基础教育评价还存在着明显不足,如教育评价理念过于传统、评价导向不科学、素质教育落实不到位等,这些都不利于学生的全面发展(肖雪,2019)。基础教育的高质量发展体现为学生成长的高质量、教师专业发展的高质量和学校整体发展的高质量,要构建高质量教育体系,需要对教育的各子系统进行系统改革。教育评价既作为教育系统改革的主要内容,同时又肩负着对教育质量的把脉诊断等任务,是基础教育改革中艰巨且复杂的难题。积极利用人工智能的技术优势和思维优势,赋能基础教育评价,逐步探索建立支持创新人才培养的基础教育评价体系,促进我国基础教育质量提升和学生全面健康发展,将极大地满足基础教育高质量发展的现实需要。
三、积极创新:AI赋能基础教育评价改革的路径
如何促进智能技术与基础教育评价实践的融合,化解基础教育评价改革中的多重实践困境,是新时代基础教育改革与发展中急需解决的问题,也是建设高质量教育体系、实现教育现代化的重要举措。教育评价一般由为什么要评、由谁来评、如何评价和评价结果如何应用等基本要素组成,应该在系统思维方法的指导下,针对基础教育评价的实践窘境,开展基于智能技术的基础教育评价系统改革探索。
(一)坚持立德树人的教育评价导向
评价理念引领着基础教育评价的方向。《深化新时代教育评价改革总体方案》指出要“落实立德树人根本任务”,这既是新时代基础教育的核心和灵魂,也是新时代基础教育评价要实现的本质功能。中小学应立足基础教育改革与发展的新时代背景,改进现有评价制度,不断优化评价机制,坚决杜绝“唯分数、唯论文、唯升学”现象发生,引导各类评价主体树立科学的评价观,使学生评价、教师评价、教学评价、学校评价等相互协调、相互补充、相得益彰。
1.树立科学的人才观
新时代人才的标准将发生变化。新时代制造业的流水线需要投入劳动者的创造力和想法。此时制造业的生产将是能够满足用户多元化需求的个性化生产,需要具有创新思维和创新能力的人才。新时代基础教育的成才标准是基于“德才兼备”的人才质量观,学校应该避免只停留在知识与技能层次的表面考核,需要不断探索德、智、体、美、劳“五育融合”的评价方法,并将其落实到学校评价实践中,把培养德智体美劳全面发展的社会主义建设者和接班人作为教育的根本价值追求。
2.树立科学的评价观
从发展历程来看,基础教育评价理念经历了从工具导向、目标导向到决策导向再到价值导向的四个发展阶段。智能时代基础教育评价要始终坚守教育的本质属性与育人目标,智能技术的工具属性必须与教育的价值属性相匹配。中小学校在各类教学评价中需要超越工具导向的评价观,回归“服务于人的全面发展”这一根本性教育价值,始终秉持德行为本、能力为重、和谐发展的理念,摒弃以分数衡量学生的做法,避免在基础教育评价中使用简单的“头痛医头、脚痛医脚”的线性思维,要运用系统思维和复杂思维整体指导教育评价。针对不同阶段、不同主体的特点,综合运用智能技术赋能过程评价、结果评价和增值评价等多元化评价方式,扭转教育评价中只重视学生知识技能的功利取向,注重对生命的尊重和关爱,唤醒学生的生命意识,激发学生的生命活力(郑刚等,2021),促进学生智慧、品格、审美等全方面发展(张娜,2017)。
(二)夯实智能实用的评价技术基础
针对基础教育评价中人工智能底层技术和数据分析技术等方面的技术困境,需要从教育评价的总框架进行系统思考。智能技术助力教育评价的应用总体框架由基础层、技术层、平台层和用户层等构成,其中技术层是赋能教育评价的核心,平台层是赋能教育评价的关键(刘邦奇等,2021)。以合理优化基础教育评价为出发点,正确把握工具理性和价值理性之间的关系,从智能技术与教育评价融合的角度,优化教育评价数据的采集、分析与可视化等技术,开发针对不同场景的智能化教育评价系统与教育测评工具,是夯实基础教育评价改革的重要基础。
1.研发智能化的数据分析技术
教育大数据的常态化、全时域与智能化采集是新时代基础教育评价现代化的重要技术基础,构建教育大数据标准,规范教育大数据格式,通过智慧校园建设与升级打破智慧教学系统、学生档案系统、综合素质评价系统等之间的数字鸿沟,整合并共享考试数据、课堂教学数据、师生社会性交往数据等多源数据,提升评价过程与数据收集的智能化,方便教师等评价主体提取并分析数据,做到评价有据可依。教育信息化企业应开发专门针对基础教育评价的智能测评系统,提升智能机器人与教师协同程度,提升数据采集与分析的智能化程度,提升评价结果呈现的可视化和反馈的个性化与智能化水平,降低基础教育评价系统的技术门槛,方便教师利用这些系统反思并改进自己的教学实践。如科大讯飞公司为中学开发的智慧课堂信息化平台,能够自动采集课堂实录数据、课堂互动数据等课堂教学过程性数据,并对这些数据进行自动分析和建模,自动生成可视化课堂教学报告,供学校管理者和教师反思教学(科大讯飞教育技术研究院,2021)。
2.发展智能化教育测评方式
技术支持的教育评价经历了计算机化测验、计算机自适应测试、持续性测试等发展过程,近年来伴随着智能技术、数据挖掘和学习分析技术与教育测评的深度融合,智能化测评应运而生。智能化测评针对主观题的自动判分模型能够提升判分的效率,对测试结果的智能评分、即时反馈和动态评价,可以提升智能化测评的自动化与高效性,能够合理解释学生档案,并给师生提供适当的建议(彭波等,2021)。因此,企业和教育部门需要深度合作,深入分析基础教育评价的需求和短板,创生能够满足学生学习水平评估、课堂教学评价、学生学习成果认证等不同测评场景需求的智能化教育测评方式。一是针对学生知识水平评估的智能化测评,Rodrigo利用学习者在编程学习中的眼动数据实时诊断学生的编程能力,并通过师生互动过程中学生编程能力的变化系统评估教师教学效益与学生学习效益(Rodrigo,2020)。英语作文智能评测系统(批改网)利用自然语言处理技术,通过对照文本特征与分数之间的关系自动评分,实现了英语作文在线快速批改(周建设等,2017)。二是针对课堂教学中的智能化教学评价,采集课堂教学视音频数据,挖掘其中的关键信息特征,对教师教学进行精确画像,分析教学活动中的师生互动方式、师生关系等,帮助学校和教师了解学生需求,精准调整教学方案(骆方等,2021)。如清帆科技公司研发的“EduBrain教学分析系统”,能够实现对上百堂课的教学数据采集和自动化分析,生成课堂情感、发言、行为和考勤等多维学情报告,为教学管理者和教师提供丰富、即时的课堂数据反馈,帮助教师优化教学模式、提升教学水平,让学生获得更个性化的学习指导,提高学习能力(况姗芸等,2021)。三是针对学生学习成果的智能化认证,利用区块链技术去中心化分布式功能,以及可公开访问、内容真实、无法篡改等特征,记录学习者的学习过程,将学习取得的成果通过区块形式散布在链条之中,方便教师等教育评价主体随时访问学生学习数据,科学认证学习者学习成果,以数字徽章替代学生成绩单,二者的结合为学习者提供了一个更加透明、公正、客观的成果认证过程(吴莎莎等,2018)。如廊坊市从2018年就开始探索教育评价与区块链技术的融合应用,并成功创建了个人诚信成长报告(郑旭东&杨现民,2020)。
3.开发智能化的教育评价系统
智能化评价的价值主要体现在适用于不同教育评价情境的智能化教育评价系统中,具体包括教学智能评价系统、学生学业智能评价系统和学生综合素质智能评价系统等。如天津师范大学研究团队研发的学习品质智能测评系统,能够规模化、批量化地对区域、学校、学生个体进行智能诊断,自动高效地输出诊断报告,并基于诊断出的问题自动输出有针对性的改进措施,及时为区域、学校以及每名学生提供高效率、全面化、个性化的智能诊断服务(王光明,2021)。各级教育行政管理部门应该引导企业开发能够适用于不同评价情景的智能化评价系统,如利用智能技术和大数据技术实现对学生综合素质评价模型的构建、评价数据的收集与挖掘等,进而完善基于大数据的学生综合素质评价体系,实现学生综合素质评价的智能化和自动化。如南京师范大学附属中学使用的学生综合素质评价系统,可通过平台对接、接口导入全面采集学生综合素质评价的各项数据,并利用智能技术对内容进行自动审核、分析、整合,自动生成学生综合素质评价报告(科大讯飞教育技术研究院,2021)。
(三)构建多元专业的教育评价主体
1.构建多元参与的评价机制
教育教学活动是一项复杂的活动,需要多元教育主体对教育活动的价值进行评判,方可凸显教育活动的价值。《深化新时代教育评价改革总体方案》指出要围绕政府、学校、教师、学生、社会五大主体,全面反思、审视、调整、完善现行的评价制度、标准、程序等,坚持破立结合,革除以管理者为评价主体的单一化弊端,进一步推进实施“管办评分离”,构建多元主体参与的上下贯通、内外结合的评价协同机制。构建智能化教育评价系统可以为各评价主体获取教育评价数据与协商交流提供便利,评价主体在平等协商对话中获得主体性关照,体现教育评价各主体间的民主对话,进而形成和谐的师生关系,切实发挥评价的育人功能,使教师和学生都得到满意的发展。
2.提升评价主体的数据素养
新时代的教育评价不同于传统教学环境下的评价,读懂抽象的教育大数据,理解教育大数据背后的教育价值,需要教育评价主体具有数据素养。在职前教育培养阶段,增设教育评价与测量、教育大数据与学习分析等理论和实践课程模块,充实职前教师的教育评价类知识,提升其数据素养。在职后教师专业发展阶段,制定数据支持的教师专业发展计划,举办教育评价、教育测量、教育大数据分析等专题培训和研修活动,强化教师数据支持的教育评价意识,提升数据支持的教育评价能力。在教学实践中,激励并帮助中小学教师重视数据、会用数据和用好数据,引导教师养成数据支持的教学分析、教学评价与教学决策的习惯,从而整体提升教师数据分析能力、数据解读能力、数据支持的教学反思与决策能力(张进良等,2015)。
3.提升评价主体的专业性
《深化新时代教育评价改革总体方案》指出教育评价应不断加强专业化建设。由于教育评价不仅仅是一项教育实践活动,更是一种高度专业化的工作,评价目标和评价方案的制定、评价方案的解读和实施、评价结果的反馈和运用,都需要以评价专业化为保障。因此,要成立由素养较高的专家组成的介于政府、学校和社会三者之间的专业化评价机构。为了确保专业性、独立性和公信力,对评价机构要有严格的准入机制和资格审查制度(魏宏聚,2021),避免出现政府成为评价标准制定者、评价实施者和评价结果的裁判者等而导致的多角色冲突。由专业化评价主体构建专业化评价方案,并严格按照科学程序开展评价,提高教育评价的客观公正性,使评价结果更具有公信力(宋乃庆等,2021)。高等学校应加大教育评价专业人才的培养力度,以便为基础教育评价提供人力资源保障(易凌云,2021)。借助人工智能技术,为智能教学助理机器人增设教育评价功能,开发专用教育评价机器人或智能教育评价助理,帮助专业机构提升教育评价的效率和效果。教育评价主体充分利用智能教育评价系统探索人机协同的教育评价机制,有效利用人工智能算法对教育全过程的数据进行分析,为用户提供自我优化的教育评价结果,有效规避由教师为主的教育评价所导致的主观性强、针对性不强等问题,从而整体提升教师这一教育评价主体的教育评价能力(胡钦太等,2021)。
(四)开拓智能高效的教育评价实践
1.构建质量为本的评价标准
首先,要树立质量意识,即教育评价要回归教育本体,要从学生发展质量出发来制定评价标准(石中英,2020)。构建新时代基础教育评价标准要树立多元质量观,构建囊括德智体美劳等多方面品质的质量指标,即教育评价不仅仅要关注认知维度的知识和能力,更要考察被评价对象的德智体美劳等多方面品质,这意味着教育评价标准也要体现“五育并举”。其次,针对不同的评价对象与评价目的等设计个性化的教育评价标准,由于评价的对象、目的、情境等不同,相应的教育评价应该具有针对性与多样性。基础教育评价应该充分考虑城乡二元体制下城市和农村中小学的差异性和评价对象的多样性特征,避免过分追求精确、精细和全面,革除用一个标准、一把尺子去评价教育的弊端,注重评价标准的针对性、丰富性和可选性,尽量使每一类教育评价都能找到适合的评价标准。最后,强化评价指标的可操作性,《深化新时代教育评价改革总体方案》指出教育评价观倒逼机制的形成,关键在于如何有效落地,即重点探索出系统且行之有效的评价指标体系(程天君等,2021)。应该根据评价的目的和侧重点的不同,设置科学合理的指标项权重,兼顾指标内容的教育性、针对性以及大数据采集的可行性,构建符合人性、体现教育的丰富性与复杂性等丰富内涵的评价标准。
2.利用智能技术改善结果性评价
传统的教育评价往往以一次性、末端评价等结果性评价为主要手段,每一次的评价只能反映评价对象的阶段性学习成果,不能反映学习全过程的学习结果,评价结果的实效性不强。一方面可以借助智能技术优化结果性评价的环节(丁玉祥,2021),利用智慧学习空间中的学习成果实时记录功能,记录学生在各种场景中的学习成果,实现结果性评价覆盖学习过程。利用区块链技术构建面向终身学习的学分银行,可记录学生学习过程和学习结果,并且长期保存在学生自己的个人学习空间中。注重在学习结果背后培养学生形成正确的世界观、价值观和人生观,以及道德修养、社会责任、合作意识和创新精神等非认知品质。如“教育链”能通过区块链记录学习者的学习情况,当学时达到一定数量后可获得相应的学分,还可凭借积分申请链内的相关福利(兰丽娜等,2021)。另一方面利用智能技术优化结果性评价的过程和结果反馈,利用图像识别、视频识别、语音识别来优化考试流程,促进考试命题、组卷和阅卷等环节的智能化,利用考试结果准确判断学生的知识掌握程度,并以可视化、直观的形式向学生个性化反馈与提供帮助。
3.利用智能技术优化过程性评价
国务院在《深化新时代教育评价改革总体方案》中指出:“充分利用信息技术,提高教育评价的科学性、专业性和客观性。”在基础教育评价改革实践中,充分发挥大数据技术对教与学全过程数据采集的技术优势,实现智能技术支持的全过程实时评价,有效利用学习者学习行为数据,为其提供适应课堂集体学习、自主学习等不同场景的智能化学习资源和过程服务。在课堂教学场景中,利用AI摄像头、教学机器人等采集师生的声音、面部表情、学习姿态与教学交互等实时数据,形成学生群体或者个体学习过程报告,为激发学生学习动力和帮助教师进行教学决策提供实时的过程性数据支持。如杭州十一中学引进的智慧课堂行为管理系统能够通过识别学生的面部与动作,自动完成课堂考勤,记录学生课堂上的六种行为和七种表情的发生次数,计算出实时的课堂专注度,便于教师进行课堂管理与因材施教(吴立宝等,2021)。在学生自主学习场景中,利用智能大数据技术采集学生在不同学习系统中的学习数据,促进学生学习伴随式数据采集与分析的自动化和智能化,识别学生学习和教师教学的薄弱环节,向学生提供适应性学习支持与服务。如“梦盒学习”通过分析学习者的学习行为数据,判断其对知识的掌握情况,进而为学习者制定符合自身需求的学习计划(杨雪等,2016)。
4.利用智能技术创新增值性评价
《深化新时代教育评价改革总体方案》中引入增值性评价的目的在于“育人”,是“自己跟自己比”的纵向评价,即通过评价唤醒每一个个体的生命价值和生命活力,指向学生核心素养培养,应该体现动态性、发展性和增值性。一方面应利用大数据和云计算技术不断完善教与学过程的纵向数据库,收集学生个人信息、测试数据、学习过程数据、体育健康数据等在内的全域数据,为全面准确地判断学生学业成就变化提供数据支持。采用大数据、深度学习等智能技术,构建内涵丰富的增值性教育评价统计模型,分析学生学习成就增值幅度,其统计分析对象不限于学生考试成绩,还应包括学生的情感、态度、心理、体育、健康等全方位数据,从促进学生发展的角度重点关注每一位学生的进步程度,并利用自动反馈手段及时反馈学生各方面的努力程度和进步表现,激发学生学习的内部动力。如美国田纳西州增值性评价系统(Tennessee Value-Added Assessment System,TVAAS)建立了一个能运用复杂模型计算出学生学业成绩增值的跨学科纵向数据库,用以评估教育者的教育效能(周瑶&陈星贝,2020)。另一方面,利用智能技术可评估学生德智体美劳等方面在内的综合素质发展,并将评价结果应用到升学和职业选择等环节,如清华大学附属中学利用大数据技术开发了学生综合素质评价系统,该系统在参与主体、评价体系和未来发展等方面充分展现了多元化的特点(王殿军等,2018)。
四、结语
基础教育评价改革是一项系统工程,有其内在的逻辑,要促进智能技术发展和基础教育改革与发展的阶段性目标有机结合,以加快实现教育现代化和促进基础教育高质量发展为指引,进一步凝练基础教育评价的经验,理性分析基础教育评价的现实困境,发挥智能技术对教育变革的赋能优势,从理念、技术、主体、标准、方式等维度进行智能化改造,促进基础教育评价提档升级,保证基础教育评价的“全员性”主体关照、“全方位”数据采集、“全域性”督导跟踪、“全面性”质量检测,构建与新时代基础教育现代化目标相一致的教育评价体系,为办好人民满意的基础教育提供参考。