综合素质评价:智能化时代学习评价的变革与实施
2020-05-26田爱丽
摘要:基于大数据的智能化学习评价既是教育评价对时代发展做出的回应,更是评定学生综合素质的需要。评价出传统纸笔测试评价不出的学生素质、促进学习与评价一体化是基于大数据的智能化学习评价的主要目标与功能诉求。个性化评价标准、伴随式数据采集、实时生成的评价报告,是智能化学习评价的主要方法。在此过程中,建设全域的数据终端、建立科学的评价模型、较强的算力支持以及保护学生信息隐私等,则是实施智能化学习评价的关键要素与保障条件。
关键词:智能化;学习评价;综合素质
中图分类号:G434
文献标识码:A
一、从双基到三维再到综合素质:我国基础教育课程改革的历程与聚焦
立德树人,发展学生综合素质,是我国当前基础教育改革的主要价值诉求与根本任务。其实,对于培养学生的哪些品质或能力,不同时期我国社会发展的需求是不同的,与之相应的国家政策要求以及教育改革目标也是不同的。建国以来,我国基础教育重视“双基”目标的实现,即夯实学生的学科基础知识和基本技能,对“双基”的强调从二十世纪五十年代一直持续到八十年代。到了二十世纪八九十年代,随着改革开放的深入推进以及社会整体发展程度的提升,社会各行各业对高素质人才的需求越来越高.以往强调“双基”目标实现的人才培养模式不再能满足社会发展需求,于是从上世纪九十年代末,我国开始启动建国以来的第八次课程改革,开始了以课程为核心波及整个基础教育领域的系统改革。2001年6月,教育部正式颁布《基础教育课程改革纲要(试行)》,整体设计与规划新时期基础教育的目标、课程教学以及评价活动等,其人才培养的目标则是在原有“双基”的基础上更加突出“三维”目标的达成,即学生学习的知识与技能、过程与方法、情感态度价值观三方面发展的情况,这也是通常被理论者和实践者称之为的“新课程改革”目标。“新课程改革”实施十余年的时间里,取得了不少的成就,也遇到了一系列的问题,为总结经验、反思问题,更好地应对未来社会经济快速变革的要求,尤其是人工智能时代对人才的需求,新一轮的课程教学改革义开始启动。以2014年教育部颁发的《关于全面深化课程改革落实立德树人根本任务的意见》[1]为标志,我国义开始了新一轮的教育改革历程,而本次改革的核心则是发展学生的核心素养。学生核心素养即是学生应具备的、能够适应终身发展和社会发展需要的必备品格和关键能力[2],具体包括文化基础、自主发展和社会参与三大方面。新一轮课程教学改革通过大力实施素质教育,落实核心素养,达到提高学生综合素质的目的。综合素质与核心素养相辅相成,相互一致,是一个整体[3]。因而,进入新世纪以来,我国基础教育课程教学改革无论是对三维目标还是核心素养的强调,其主要诉求与根本任务是发展学生的综合素质。至于学生综合素质究竟是什么素质,笔者认为,学生的综合素质是个体在特定情境中,通过利用和调动心理社会资源,以满足复杂需要、解决任务的能力,蕴含着个体的价值追求、思维方式、审美取向以及行为表现等。个体综合素质具有整体性、长期性和稳定性等特征,决定着个体的行为表现[4]。2014年12月我国教育部印发的《关于加强和改进普通高中学生综合素质评价的意见》中将学生的综合素质界定为五个方面,即学生的思想品德、学业水平、身心健康、艺术素养和创新实践五个方面。2018年召开的新时期全国教育大会,要求学生具有坚定的理想信念、深厚的家国情怀、高尚的个人品德,丰厚的学识、卓远的见识、奋斗的精神、创新的思维、综合的能力等[5],这些都为学生综合素质的发展与评价提供了重要参照。
如何保障学生综合素质培养得以有效落实,评价是其中重要的环节。知名的课程教学论专家拉尔夫·泰勒曾提出[6],在课程教学实施过程中,评价是检测课程目标是否得到落实、落实到何种程度,并以此矫正课程教学活动的重要方式。当前,如何通过评价方式的改革确保学生综合素质得到应有发展,是基础教育评价改革的一项重要任务。从上述对综述素质的界定可知,学生综合素质发展程度很难通过传统纸笔测试进行评价。为了将学生综合素质落到实处,需要通过改革评价方式方法予以保障。随着当前“互联网+”、大数据、云计算等人工智能技术在教育领域的深入应用,教育评价方式方法已经开始发生变化。其中表现之一,即是学习平台建设的侧重点已经从以往的重视内容即“内容为王”的时代过渡到了“数据为王”的时代了。学习平台不仅仅有学习内容的呈现,更要有基于学生学习数据的收集、整理、分析和评价。高度重视和实现学习平台的数据挖掘与分析价值,是教育信息化2.0时代平台开发的重中之重[7],也即是基于大数据的智能化学习评价。这就需要教育信息化平台开发过程中,采用人工智能技术,根据数据全生命周期管理的理念,从数据的生成和收集,到数据的存储和管理,再到数据的分析、使用和共享,高度重视和实现数据的价值[8],进而实现对学生学习分析与评价的智能化。最后,从提升评价便利性、降低评价成本的角度考虑,也需要基于互联网时代数据采集的便利,采用智能化手段综合評价学生综合素质发展情况。
二、重在评价传统纸笔测试评不出的综合素质:基于大数据智能化学习评价的目标
多年来,中考高考过程中纸笔测试尽管备受诟病但是依然无法被取代的重要原因在于纸笔测试形式的公平性,其对所有孩子都一样,公开、透明,这也是纸笔测试被认为考试录取过程中最为公平的举措。然而,从其实际运行过程来看,纸笔测试的评价往往重在测试学生对认知方面的知识记忆与理解的程度,再加上一定程度的分析与应用,并不利于对学生高层次认知能力如创造力的测试。更为主要的是,对于学生的非认知能力如学生的尽责表现、情绪调节、合作能力、思想开放、社会交往以及学生的批判性思维和元认知能力等社会情感能力[9]的发展情况,传统的纸笔测试更是无能为力。因而,纸笔测试无法全面检验当前学校是否在培养学生的综合素质以及培养到什么程度,这也是为什么基础教育改革在大力倡导要发展学生的综合素质,实际中很难有效落实的重要原因。“考什么就教什么,教什么就学什么”是基础教育运作的实践逻辑。在传统纸笔测试的背景下,学生综合素质无法有效测评,这就导致了教育教学实践中,学生综合素质发展得不到应有的重视,或者受口头上重视行动上不重视,其实施效果当然不如预期。因而,在智能化时代,利用大数据分析技术评价学生的综合素质,评估学生的高层次认知能力和非认知能力,是教育评价领域变革的重点所在。
实践中,让传统纸笔测试“搬运”到在线平台上,学生在线答题,平台自动批阅,这当然会提高测试效率,降低测试成本,学校普遍实施的网络阅卷即是此思路。不可否认,这的确减轻了教师重复性批改的负担,节省了教师的宝贵时间。但是本研究认为,基于大数据的智能化学习评价更为重要的则是需要进行思维范式的创新,当前需要突破的界限是,利用物联网、特定的评价模型与人工智能算法,通过收集数据而进行的大数据智能评价,是和传统的纸笔测试不一样的评价,它重在评价以往纸笔测试难以评价的内容,即上文所言的学生综合素质,如学生的身体健康、学习负担、学习品质、创新能力、复杂场景中的问题解决能力等。余胜泉教授也指出,人工智能的评价“不仅可以分析学习过程中学生知识掌握情况,还可以分析学生的学科能力、核心素养、学生的体质健康和心理健康发展情况”[10]。因而,通过构建科学合理的评价模型,基于全域的网络覆盖和终端数据采集,采用人工智能算法,对数据进行有效的管理、储存和分析,并将分析结果进行清晰而义个性化的呈现,切实实现对每个学生的综合素质,尤其是对时代要求和终身发展必备的品格与能力进行“数字画像”,才是大数据时代学生学习评价的主要诉求。刘三[11]提出的“量化学习”的概念也是在这个意义上而言的,量化的数据不仅指学生外显的数据,更包括学生内隐的数据,通过分析学习服务、学习场景、学习活动以及成长过程中人的行为与学习个体的内隐特征,实现对学习者高度个性化的数据表征,从而更好地了解学习者的特点和个性差异,全面把握学习者的真实需求,对其学习活动进行更为准确与广泛的研究,从而开展精准教学,提供个性化学习服务,形成以学习者为中心的个性化学习模式。
实现上述智能化评价学生综合素质的功能,就需要开展对教育全过程数据的采集与分析,比如利用智能学习环境以及具有数据采集能力的学习终端如平板电脑、智能手机、数码笔、可穿戴设备、摄像头等应用[12],为破解学生学习数据采集难题提供了技术方案。实践中这方面的尝试不胜枚举,如有学校和培训机构利用人工智能技术,在教室内开始使用的隋绪识别系统即为这方面的有益尝试,系统全过程捕捉学生在教室内的学习行为,基于学习行为与学习情绪之间的内在关联,系统随时分析学生学习行为背后的情绪状态,并及时对教师和学生进行提醒[13]。比如在杭州第十一中学教室内,“智慧课堂行为管理系统每隔30秒会进行一次扫描,针对学生们阅读、举手、书写、起立、听讲、趴桌子等6种行为,再结合面部表情是高兴、伤心,还是愤怒、反感,分析出学生们在课堂上的状态”[14]。从当前的运行情况来看,学校在充分考虑学生隐私保护的情况下,提高了教学管理效率,简化了考勤程序,并努力寻找课堂教学行为与学生学业成就之间的关联。还有,当前中高考过程中的英语听说测试即是人工智能用于教育评价的成功案例。传统英语的纸笔测试造就了数以万计的“哑巴英语”学习者,在人工智能支持下的听说测试、听说教学则可以在很大程度上提高国人英语学习过程中的听说能力。其他诸如有学校给学生佩戴的智能手环可以收集和检测学生在运动、睡眠以及膳食方面的情况,及时提醒学生注意保持健康的生活方式。上海市奉贤中学内建设的智能实验室,系统能够直接采集学生做实验的全过程数据,并直接上传至平台,这为解决传统实验教学中“重理论、轻操作”的现状提供了保障与支持。在艺术教育和评价方面,利用人工智能技术评估学生的美术、绘画等各种艺术作品的质量已在各类艺术考试中被逐步采用。上海市卢湾一中心小学内的云图书馆、云厨房、云操场的建设,都是利用人工智能技术全方位采集学生校内学习生活数据的有益尝试,这为突破传统纸笔测试评价的局限、探索综合素质评价的开展提供了重要思路。
当然,对上述做法也有一定的争议,有人认为这种做法让师生始终处于一种“被监控”状态,侵犯了学生隐私,因而表示不满或抵触类似改革项目。也有人认为这是利用现代信息技术尤其是人工智能技术提高教育评价的全面性、综合性的有益尝试。本研究持后者的立场,对现代信息技术在教育教学以及评价活动中的各种创新应用,应给予鼓励和宽容的态度,即先发展后规范,而不是一开始就将之拒于门外。毕竟,类似于这些新出现的评价类型,尤其是对学生情绪情感的评价方法等,只是教育场景变革的一个起点……但是这将是人工智能与教育进行深度融合及教育教学精准化的必然选择,也是新一轮科技革命下构建教育新生态的关键诉求[15]。因而,在遵循教育和研究基本伦理的前提下,慎重开展智能化评价的各类尝试与创新,是当今时代应有的教育研究和实践的情怀与态度。
三、评价与学习一体化:基于大数据综合素质评价的主要特征
布卢姆将学习评价分为三类:终结性评价、诊断性评价和形成性评价。诊断性评价,即诊断学生当前的学习状态,为即将学习什么内容做好定位的评价;形成性评价,即对学生的知识学习情况不断地评价、反馈与改正;终结性评价,即阶段性地评估与总结学生学习情况。当然,形成性评价与终结性评价不是截然分开的,二者也是经常相互转化的。布卢姆及其团队的研究表明:学习过程中不断地进行形成性测试、反馈与矫正,是促进学生知識掌握的有效策略[6]。对每个学生不断地测试、反馈与矫正,也是构成掌握学习理论的重要要素与不可缺少的环节。如果学生人数少,不断地进行形成性测试与评价,具有实施的可能性。但是当前各地的实际情况则是学生多、班额大,老师为批改学生作业劳心烦神,我国如此,其他不少国家也与此类似。即使教师非常辛苦,还是难以做到不断地对每个学生的学习情况进行测试、反馈和矫正。对教师的调研也表明,能够坚持这样做的老师,其所教的学生学习成绩一般都不差;反之不被教师关注,得不到教师及时有效反馈的学生成绩也很难得到保障。
如果说以往难以做到对每个学生的学习情况进行及时的评估、反馈和矫正,是由于教师的时间、精力不能保障。现代信息技术的发展则为改善这种情况提供了极大便利与可能。教育管理者应该利用技术来收集学习过程中的实时数据,为持续改善学习效果提供依据[17]。在线学习的开拓者和引领者萨尔曼·可汗(Salman Khan)即是依据布卢姆的掌握学习理论以及知识空间理论,利用现代信息技术创立了可汗学院学习空间,切实实现了学生在线学习与评价的一体化。学生注册登录后即可根据自己的需求开展在线学习,学习过程中管理平台不断对学生学习内容的掌握程度进行测试,并及时生成学习结果的图表,反馈学生学习成效,根据学生的学习需求推送个性化学习资源,然后再进行测试、反馈与矫正,直至达到掌握程度,再进入下一个知识点的学习。
当前,基于物联网的智能化学习评价,其信息收集更为全面、系统,反馈更为及时与智能,评价与教和学的改进结合得更为密切。学生的自主学习、个性化学习正在成为现实。教育正在实现从“少数人的个性化”到“多数人的标准化”再到“多数人的个性化”的历史性跨越,其意义和价值无论如何估计都不为过。同时,基于平台的评价反馈结果也便于平台和算法自身的不断改进,逐渐提高基于数据评价的效度和信度。因而,做到评价与学习一体化,基于评价及时改进教与学,以评价及时强化教与学的成效,是基于大数据智能化学习评价的主要诉求。国外提出“教育数据科学”的学者比尔和玛丽(Bill Cope&Mary Kalantzis)几年前就提出,基于大数据的评价,历史性地终结了教学和评价分离的状况,学生在线学习的过程同时也是生成形成性评价的过程[18]。
四、个性化标准、伴随式采集、及时性报告:基于大数据综合素质评价的方式方法
为实现每个学生的综合素质更好地发展,充分利用现代信息技术带来的便利与优势,基于大数据的智能化学习评价主要采用个性化标准、伴随式采集以及及时性报告的方式开展。
(一)个性化标准
相对于以往一把尺子评价所有学生的现状,智能化学习时代需要为每个学生的学习制定一把适合的尺子,做到一把尺子评价一个学生,即个性化的评价标准。这就需要针对不同的评价项目和内容,可以是德育、智育、体育、艺术教育等,也可以是某个特定的项目,如一个社会化学习项目或一个研究课题,根据学校教育的共同要求,结合学生个体的实际情况,由学校教师、学生、以及家长协商制定出适合个体的评价标准,如要达到的能力要求、学习内容的规定、学习时间以及练习时间的时长,论文或作品提交的数量和质量等。然后,通过人工智能技术,将该评价标准内置到平台上学生的学习空间内,该标准即是学生学习评价的依据。每个学生的基础不同,天赋有差异,其一定阶段内的学习标准和评估标准也是不同的,当然这个不同是基于国家的共性标准达到以后的个性化体现。因而,个性化评估标准并不否认国家共性标准的达成,尤其是义务教育阶段更是要首先确保国家教学标准的实现。
(二)伴随式采集
相对于当前更多的是通过对学生在线行为数据的采集,如鼠标点击、键盘敲击以及在线作答等途径实现的数据收集与采集,基于大数据的智能化学习评价则会在此基础上进一步采用伴随式数据采集与整理方式。无论是知识的学习、还是技能的练习甚至包括学生社会实践或社区服務,针对学生学习、练习或实践的过程,通过全域式网络架构与学生随身携带的智能感应终端,学习与评价系统伴随式采集学生学习过程的数据,即如学习或练习的时长、提交的论文或作品、实验过程或体艺技能练习的全过程、社会实践或社区服务过程。上述信息能够在学生不知不觉、不需特别配合的学习过程中就被记录和采集到平台中来。也正是从这个意义上而言,有学者认为,大数据时代背景下,学生学习数据的生成只是在线学习的伴随物或副产品[19]。当然,该信息的采集、管理和使用都要提前和学生协商一致,必要时签订伦理协议,以保护好学生的个人信息和隐私不受侵犯。
(三)及时性报告
在智能化学习评价时代,形成性评价与终结性评价的区别正在逐步弱化和模糊,任何一个节点的形成性评价都可以是终结性评价;反之,任何一个阶段的终结性评价也都可以被看作该阶段的形成性评价[20]。基于管理平台上内置的学生评价标准,结合学习过程中伴随式采集的数据,平台及时对学生学习的方方面面进行专项或综合分析,并向学生、教师和家长发送阶段性学习诊断报告。报告可以时时生成,在发送给学生、教师或家长时,可以根据学习内容的需要和学生教师本人的需求与喜好,选择是一天发送一次,还是一周发送一次,或者是一个月一次。报告或提醒的内容,需包括学生在该领域取得的成绩、存在的薄弱之处,需要改进的方法与路径、改进所需的材料与内容等。报告的内容既可以作为师生改进学习的依据,也可以作为鉴定性考核的依据,兼具形成性评价和终结性评价的功能。
五、实施基于大数据综合素质评价的保障条件
基于上述智能化学习评价的功能定位,那么建设基于数据的智能化学习评价方面的思路则是应用驱动创新[21],这个过程中需要重点关注如下几个方面的保障要件:
(一)全域的数据终端
要做出全面综合的评价便需要有全面综合的学生数据采集源。为方便收集学生学习全过程的数据,需要做到无意识、非侵入、非配合的状态下采集、管理与分析学生学习数据,这就需要学生整个学习环境的全域网络覆盖与学生随身携带智能感应终端。这是“互联网+”条件下实现大数据综合素质评价的前提与基础,仅仅依靠问卷调查或者学生电脑操作的数据是不足以对学生的综合素质发展情况做出整体性和综合性评价的。
(二)科学的评价模型
科学的评价模型是基于大数据评价的关键技术。有了全面的数据,不一定能够得出科学的评价结论。要想得出科学的评价结论,就需要对数据进行有效的分析和使用,这就需要构建针对特定学习内容或项目的科学评价模型。而科学评价模型的构建则需要学科专业人员、教育评价人员、信息技术与大数据专业人员以及工程师的通力配合,有机整合上述几个领域的专业智慧,才有可能构建出科学的在线评价模型。一定程度上可以说,科学的评价模型是智能化学习评价的核心与关键。
(三)较强的算力支持
在今天尤其是面向未来的时代,有关个体学生学习生活的全域数据,不会仅仅局限于文本数据,更多的会是图片、视频、音频等伴随式采集而来的“大”数据,计算机系统对这些数据进行及时高效的储存、分析、处理和呈现,需要较强的网络宽带的支撑以及强大的算力支持,否则数据很难被及时记录、储存和分析。随着5G时代的到来,这一技术难题会迎刃而解,但是常态化以后则需要较高的维护成本,这亦是政府和教育行政部门在引领和推动教育大数据评价时需要考虑的一个方面。
(四)学生隐私的保护
的确,互联网时代如何做好学生的隐私保护还是一个有待深入研究的实践课题。一方面,要想全面准确地评价学生的综合素质,就需要尽可能全面详细地采集学生学习生活数据。另一方面,要确保学生数据得以有效保护,这是大数据智能化时代务必做好的工作,诚如一学者所言:“身处这样一个时代,生活中完全拒绝让渡任何个人信息,是很难想象的。我们能做的,是让这个信息交换过程变得更可控,造福社会而不是毁坏人们的生活场景”[22]。因而,实践中需要兼顾如下两个方面:一是伴随式、全过程地采集学生信息,二是平台通过任何方式采集来的学生信息以不侵犯学生隐私为第一原则。在对隐私的界定有争议时,平台采集学生信息之前需要告知学生及其家长,在学生和家长同意的情况下与之签订数据使用说明协议书,不得无故对外泄露学生信息。
综上,“互联网+”时代的教育评价,基于大数据收集、整理与分析的优势,不仅在于提高传统纸笔测试的效率,将传统的评价内容“搬移”到网上,更为重要的是,利用互联网、物联网的便利,突破思维局限,超越以往纸笔测试的内容,对学生综合素质发展情况进行评价,这就需要基于特定的评价模型,设置个性化评价标准,进行过程性伴随式的信息采集,并及时对之进行有效的整理、分析和呈现,及时评估并报告学生综合素质发展的情况。让评价、教学与学习过程密切结合起来,切实发挥评价促进学生综合素质发展的重要功能。
参考文献:
【1】【2】教基二[2014]4号,教育部关于全面深化课程改革落实立德树人根本任务的意见[Z].
【3】王文湛.权威解读核心素养、素质教育、综合素质的内涵[EB/OL]http://www.sohu.com/a/127319175_559448,2019-05-24.
【4】田爱丽,严凌燕.高校综合评价招生的理论、实践与展[J].华东师范大学学报(教育科学版),2018,(3):69-78.
【5】习近平.决胜全面建成小康社会,夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告[EB/OL].http://www.gov.cn/zhuanti/2017-10/27/content_5234876.htm,2017-10-27.
【6】(美)拉爾夫·泰勒.施良方译.课程与教学的基本原理[M].北京:人民教育出版社,1984.
【7】【8】【21】田爱丽.教育信息化平台开发的重点转向——从“基于内容”到“基于数据”[N].中国教育报,2019-03-02(07).
【9】OLCD.Social and Emotional Skills Well-heing,connectednessand success[EB/OLl.https://wWw.oecd.org/eclucation/srhool/U PDATED%20Social%20and%20Emotional%20Skills%20-%20Well-heing,o/e20connectedness%20ando/c20success.pdf%20(wehsite).pclf,2019-01-15.
【10】余胜泉.人工智能在教育领域中的应用[EB/OL].http://v.people.cn/nl/2019/0515/e14644-31085129.htmL2019-05-15.
【11】刘三蚜,李卿等.量化学习:数字化学习发展前瞻[J].教育研究,2016,(7):119-126.
【12】李葆萍,周颍.基于大数据的教学评价变革[J].现代教育术,2016,(6):5-12.
【13】孙波,刘永娜等智慧学习环境中基于面部表情的情感分析[J].现代远程教育研究,2015,(2):96-103.
【14】潘佳锟.杭州一中学课堂引入人脸识别“黑科技”[EB/OL].http://epaper.hjnews.com.cn/html/2018-05/18/content720387htm?from=timeline,2018-05-18.
【15】刘智,方常丽等物理学习空间中学习者情绪感知研究综述[J].远程教育杂志,2019,(3):33-44.
【16】(美)B-S.布卢姆,J-F.马道斯等.邱渊,王钢等译.教育评价[M].上海:华东师范大学出版社,1987.228-267.
【17】周由游,施建同.技术推动学习的新模式——美国国家教育技术计划的启示[J].中国电化教育,2011,(10):54-58.
【18】【19】【20】Billcope&Mary Kalantzis.Big DataComes to School: Implicationsfor Learning,Assessment,and Researrch[J].AERA Open,2016,2(2):1-19
【22】盛玉雷让隐私保护跟上大数据时代[N].人民日报,2017-08-03(05).
作者简介:
田爱丽:教授,博士,博士生导师,研究方向为在线教育与教育管理(altian@sem.ecnu.edu.cn)。