新时代教育评价的技术思考与改革实践
2022-07-08韩磊许发磊黄陈蓉
韩磊 许发磊 黄陈蓉
[摘 要]中共中央国务院近期印发的《深化新时代教育评价改革总体方案》是教育改革的纲领性文件,旨在完善立德树人体制机制,扭转不科学的教育评价导向。本文关注总体方案的落地实施,立足于总体方案的思想内涵,着眼于总体方案倡导的信息化技术手段和“四个评价”实践中的数据思维,提出了基于大数据技术的高等教育评价实施举措。即:整合现有信息资源,建设教育大数据基础设施;利用多元数据思维,破解“五唯”顽疾;运用平台全样本数据和智能分析技术,提升过程评价和增值评价的可实施性。
[关键词]教育评价;数据思维;大数据;人才培养
[中图分类号]G710 [文献标识码]A [文章编号]1005-5843(2022)03-0007-06
[DOI]10.13980/j.cnki.xdjykx.2022.03.002
中华人民共和国成立后,开启了社会主义教育评价制度的探索。20世纪90年代,国家教委颁布了《普通高等教育学校教育评估暂行规定》,这是关于教育评价的第一个具有行政法规性质的专门文件,既是教育评价历史经验的总结,也提供了未来一段时期教育评价的规范。《国家中长期教育改革和发展规划纲要(2010—2020年)》中关于教育评价问题也多次提到实施综合素质评价。随着教育评价制度的发展变迁,我国教育事业已经取得举世瞩目的成就,高等教育正在由大众化向普及化迈进,然而同时也形成了“唯分数、唯升学、唯文凭、唯论文、唯帽子”的顽瘴痼疾。重科研、轻教学,忽视思想品德教育,弱化体育、美育和劳动教育等问题影响着教育事业健康发展。在此重要历史关头,中共中央国务院于2020年10月印发了我国第一个关于教育评价的系统性改革文件——《深化新时代教育评价改革总体方案》(以下简称《总体方案》)。
《总体方案》的出台吹响了新时代教育评价改革的号角,天津市围绕五大改革主体,细化提出了84项具体改革举措和51条清理整治措施。清华大学党委书记陈旭教授在人民日报上撰文,倡导把立德树人成效这一根本标准内化到学校建设和管理各领域、各方面、各环节,做到以树人为核心、以立德为根本,不断完善立德树人体制机制。
围绕《总体方案》,进一步探讨新时代教育评价改革的落地实施细节问题,对推动改革走向纵深,办好人民满意的教育尤为必要。为此,本文在深入分析《总体方案》的内涵及技术思维的基础上,依托大数据技术提出落实“四个评价”的有效途径,为推进教育评价改革提供有益探索。
一、新时代教育评价改革方案的内涵认识
(一)定位准确,目标清晰
《总体方案》确定的近期目标是经过5~10年的努力,各级党委和政府科学履行职责水平明显提高,各级各类学校立德树人落实机制更加完善,引导教师潜心育人的评价制度更加健全,促进学生全面发展的评价方法更加多元,社会选人用人方式更加科学。远期目标是到2035年,基本形成富有时代特征、彰显中国特色、体现世界水平的教育评价体系。
《总体方案》所确立的远期目标体现了立足中国、面向世界的开放包容,彰显了教育的国本地位。近期目标瞄准了立德树人根本任务,抓住了掣肘中国教育的关键问题,指出了教育评价改革的责任主体。在这场教育评价改革中,没有旁观者,全社会都是参与者和建设者,不同主体有着具体的子目标,全社会都为建成新时代教育体系而奋斗。学校、师生作为重要责任主体当思虑总体方案落实之策,全力实践好总体方案的部署。
(二)针对症结,破立并举
《总体方案》对教育评价改革进行了系统部署,共设计了5个方面22项改革任务。5个方面是针对五大主体的评价改革展开,即改革党委和政府教育工作评价、改革学校评价、改革教师评价、改革学生评价、改革用人评价。22项改革任务有破有立,界限清晰明确,具有很强的方向性。
在改革教师评价时,突出质量导向,重点评价学术贡献、社会贡献以及支撑人才培养情况,不得将论文数、项目数、课题经费等科研量化指标与绩效工资分配、奖励挂钩。根据不同学科、不同岗位特点,坚持分类评价,推行代表性成果评价,探索长周期评价,完善同行专家评议机制,注重个人评价与团队评价相结合。对教师评价改革可谓破立并举,破的是“五唯”的简单数量化,立的是代表性成果、长期评价、多元评价。
在改革学生评价时,强调促进德智体美劳全面发展,要求严格学业标准,完善各级各类学校学生学业要求,严把出口关。完善实习(实训)考核办法,确保学生足额、真实参加实习(实训)。记录学生的日常表现,体现了注重过程,破除“唯成绩”论;严把出口关,体现了对培养质量的关切。
(三)责任明确,组织有力
《总体方案》体现了党管一切的价值引领,要求各级党委和政府要加强组织领导,把深化教育评价改革列入重要议事日程,根据本方案要求,结合实际明确落实举措。不仅明确了管理体系,也引领了教育价值,就是要使党的思想在教育中绽放光芒,让教育真正为党和国家的发展事业服务,让正确的人生观、价值观、世界观成为学生的核心素养。同时,《总体方案》还压实了各主体的责任,明确地指出了社会各界的行动路线。要求党政机关、事业单位、国有企业要履职尽责,带动全社会形成科学的选人用人理念。新闻媒体要加大宣传解读力度,合理引导预期,增进社会共识。只有社会各界责任在肩,共同发力,才能全面实施此项“破立”工程。
《总体方案》对落地实施进行了组织部署,指出各級各类学校要狠抓落实,切实破除“五唯”顽瘴痼疾。同时构建政府、学校、社会等多元参与的评价体系,建立健全教育督导部门统一负责的教育评估检测机制,发挥专业机构和社会组织的作用。在组织部署中,明确了教育评价的指挥棒作用,但同时强调教育评价不能代替教育教学实质工作,评价改革要对症下药,不能增加学校负担。“五唯”顽瘴痼疾是各类学校的关键痛点,推进改革的靶点,各类学校在教学评价改革中责无旁贷。要把《总体方案》悟透、细化,拿出结合学校实际的可操作性举措,让《总体方案》发挥改革实效。
二、落实教育评价改革方案的技术思考
(一)教育评价改革方案中的技术手段
《总体方案》既包含着因果清楚的原则性思维,又蕴藏着何以结果的技术性思考。为了确保教育评价改革的落地实施,《总体方案》中多次指出要借助信息技术的力量。例如,在改革学生评价时,要求通过信息化等手段,探索学生、家长、教师以及社区等参与评价的有效方式;在组织实施中,建議创新评价工具,利用人工智能、大数据等现代信息技术,探索开展学生各年级学习情况全过程纵向评价、德智体美劳全要素横向评价。可见,信息技术被视为落实新时代教育评价改革的重要技术手段之一。
《总体方案》将信息技术作为落实改革举措的技术支撑,是信息技术赋能新时代教育事业成功实践的经验总结。人工智能开启了人类第四次工业革命的新纪元,当前,“互联网+”、人工智能等新信息技术正在融入教育教学过程,网络课堂、慕课、微课、翻转课堂、虚拟仿真等新兴教学模式正在被广大师生采用和接受。新兴信息技术在教学、管理、教育资源建设等方面的全流程应用,正在改变人才培养模式、学习环境和教学方法,同时促使新型教育体系向智慧、个性、开放、多元的方向发展。现任教育部长怀进鹏院士早在2014年就明确指出,教育公平需更广泛依靠信息技术。
毋庸置疑,大数据、人工智能等新兴信息技术赋能教育教学过程的同时,也为扎实推进新时代教育评价改革提供了数据和智力支持。如利用人机互动技术记录学习者对测评情境的反应时间、测评正确率、多人协作等,获得过程性和终结性评价数据,进而实现对学习者思维能力、创新能力和合作能力的综合评价;基于深度学习技术,分析教学、家庭、学校、社会环境等对学生学业成就的影响,评估出关键的影响因素;基于多模态智能识别技术,分析教学语音、视频等,获取教与学关键行为、教师或学生的情感等,进而全面研究教学过程、特点和规律;基于数据挖掘技术,获得教育评价深层数据,对学生学业成就水平进行客观诊断分析,并提出个性化、有针对性的指导和建议。
(二)实践“四个评价”过程中的数据思维
《总体方案》以“五唯”顽疾为靶点,有的放矢,精准打击,提出了“改进结果评价、强化过程评价、探索增值评价、健全综合评价”的改革基本思路,简称“四个评价”。
结果评价是以结果为标准和导向的评价。教育不强调结果,会弱化其存在的价值;但是,不全面地看待结果,又会出现“唯分数”“唯论文”等现象。分数、论文本身并没有错,错在“唯”——“唯”是将单一评价指标极端化。改进结果评价就是要改掉结果评价中的一些负面问题,让综合结果取代单一结果,运用多元数据代替单一数据。过程评价,是一个对学习过程的价值进行建构的过程。《总体方案》指出,强化过程评价正是审视了前一阶段评价体系中弱化过程评价数据的问题而采取的行动。进一步强化过程评价,就是要将过程数据收集起来,发挥出在评价中应有的作用。增值评价是美国学者泰勒、迈克柯等在20世纪80年代提出,是以评价对象自身为基准进行价值判断的一种方法。在不同价值观下,质量主体增值的要素和范围不一,合理选择测评点并构建增值数据是探索增值评价的关键。综合评价是一种关注被评价对象全方位的思维角度,鼓励各级各类学校协同多方评价主体,构建测评的指标体系,利用一定的方法或模型而做出的总体判断。健全综合评价离不开指标体系和观测数据,更需要智能算法的辅助,使评价更具可操作性。
上述关于“四个评价”的阐释中,每种评价都折射着数据光芒,且有“数据越密集,评价越客观”的基本态势。数据思维、信息技术在落实“四个评价”进程中发挥着越来越重要的作用。近年来推出的“强基计划”是改进结果评价的一种尝试,强调“基础+特长”,将考生高考成绩、高校综合考核结果及综合素质评价情况等按比例合成考生的综合成绩。综合成绩是多元评价主体参与的综合素质评价结果,是更科学的评价方法。无论是“强基计划”还是普通高招,从考生信息采集、试卷主客观题批改、分数统计分析、招生录取等无不需要借助信息技术提高效率。过程评价在课程评价改革中备受青睐,大数据等技术对此功不可没。如基于大数据的在线教学过程评价方法,利用深度学习算法构建在线学习过程分析模型,满足教育质量评估和政策分析研究的需要。增值评价关注个体在时间轴上的表现对比,如果没有历史数据的存储,就无法形成增量对比。在中小学教育中,已经出现了“题拍拍”、“错题本”等APP,能够自动形成“增量”变化,极大地促进了学生的学习动力,发挥了增量评价的激励优势。
三、基于大数据的高等教育评价改革实践
(一)建设教育大数据基础设施
1.建设高等教育大数据平台的必要性。我国对大数据领域高度重视,早在2015年,国务院就发布了《促进大数据发展行动纲要》,纲要提出了建设教育文化大数据的构想。近几年,各高校响应政府号召,顺应时代潮流,在各自的发展规划中加大了大数据平台建设的资金投入。
不仅有上述政策驱动,高等教育大数据平台建设更有强劲的内需动力。为提升管理效率,多数高校建立了教学、科研、就业等多种管理信息系统,在日常运行中生成了大量结构化数据,但是还有一些调查问卷、座谈会等数据因缺乏管理信息系统而未形成有效的存档。另外,随着自媒体的发展,广大学生在学校社交平台上的评论数据,因系统架构局限而没有得到深层次的利用。从发展趋势看,教育数据必将成为国家基础性战略资源之一,为教育评价改革提供支撑平台。
2.高等教育大数据平台的系统框架。构建教育大数据平台应坚持数据共享原则,兼顾原有管理信息系统和新拓展数据源。教育教学过程中产生的数据既有结构化数据,又有非结构化数据。结构化数据主要来自现有管理信息系统中的规格化数据,如教务、财务、科研、人事、学生基本信息、网络教学平台、质量评估等数据。非结构化数据是数据结构不规则或不完整、不方便用数据库逻辑表来表现的数据,包括办公文档、文本、XML、HTML、各类报表、图片、音频和视频等。建设教育大数据平台时,将学校各应用系统的数据进行集成和整合,使来源各异、种类不一的数据相互访问,打破信息孤岛,实现数据共享。
高校大数据平台应具有极强的可扩展性。教育大数据的采集与治理是一项长期持久的工作,随着教育信息化工作重点的变化推进,对于平台的规模和要求也会不断变化。系统应设计可扩展接口应对不断发展变化的需求。如当前非结构化数据比以往任何时候都更受重视,其内容和形式正在不断丰富,系统都应保留灵活开放的接口,为扩展系统功能做好准备。
(二)基于大数据平台构建多元化教师评价体系
1.大数据助力高质量人才引进。师资队伍建设始于人才引进,人才引进质量影响深远。多数学校在人才引进时,遵循这样的业务流程:首先确定引进计划,接着人事处接收简历,简单过滤后分发给学院,再由学院组织业务能力面试。在此流程中,简单粗放的操作普遍存在,如由编制数简单推算引进人数;依据论文数量、人才帽子、项目确定人才等级,过滤简历;根据学位、专业简单分发简历。以至于引进的人才工作若干年,用人单位才发现有悖引进初衷的情况并不鲜见,原因之一是人才引进时缺乏科学的人才评价机制和手段。
利用大数据技术可以弥补上述缺陷,助力高质量人才引进。著名的汤森路透公司曾利用数据分析方法,预测了2013年的8位诺贝尔奖获得者,充分说明了数据分析在人才预测和筛选中的作用。人才引进不能只做专业技术的评价,用人单位可以基于数据平台,设计全方位的心理调查问卷,采集应聘人才的心理素质、价值取向方面的数据,用科学的方法评判其是否符合本单位的文化理念。图1给出了教师评价数据与评价主体之间的关系,厘清这些关系,有助于人才的科学评判。
人才质量评价离不开成果要素支撑,《总体方案》强调高质量和贡献度。因此,对于引进人才的论文、项目等要素,不能只看等级、数量,应深入挖掘论文质量,引入其他高校同行、企业技术同行的多元评价意见,尤其重视学术贡献和社会贡献评价。同时,还应采集关于应聘者的历史信息,诸如学习或工作经历中的关键事件、自媒体信息等,推测其发展潜力。智能预测之智源于历史数据,学校要构建人才发展数据库,对校内教师的教学、科研、师德、社交习惯等数据进行全面的采集,分析符合学校价值取向且为学校发展做出重大贡献的人才特质,为人才引进提供决策支持。人才引进后,再次纳入教师数据采集体系,如此往复,形成良性的自我学习的智能决策体系。
2.大数据驱动教师分类评价机制形成。教师分类评价是《总体方案》中倡导的教师评价模式,体现了人尽其才的用人观。构建教师分类评价机制有利于激发教师工作热情,增强工作自信和获得感。很多高校对教师分类评价实践过程中的主要困惑再次回到科研评价、教学评价以及教学科研的当量问题。科研工作看似容易量化,但简单量化逐步形成了“数篇篇”的现象。教学评价方面,又走向了不易量化的极端,指标模糊,软尺度评价结果趋同,在关乎教师核心利益的评价中失去权重作用,形成了轻视教学的不良现象。这些现象的背后,有评价公正性追求下简化操作的主观原因,也有技术手段无力的客观原因。
数据驱动为教师分类评价提供了新思路,大数据技术可为教师分类评价提供技术保障。通过大数据采集与分析,建立多元化的科研评价,以“唯”字为特点的单一评价必然失去存在土壤。将教育教学过程中大量的非结构化数据收集起来,运用人工智能技术挖掘模糊数据的关联,逐步建立公平的教学评价指标体系,让教学投入指标在各类评价中得到体现,激发教师教书育人热情。教学和科研评价的当量问题是学校日常绩效管理的难题。当前较少有两种指标的当量计算,或者平行计算,或者“以分换分”,这些都不能满足新时代教育评价改革的需要。建立两种评价体系的当量互换是一个系统工程,甚至是一个动态化的过程。当量互换因学校因学科而不同,需要大数据分析技术的辅助,只有拥有大量关于学术研究、教学活动的复杂属性样本数据,才能有效建立两种劳动之间的当量指标体系。
3.大数据保障多元指标综合评价实施。“五唯”的核心弊端是“唯”,破“五唯”的直接途径就是“多元”。在实际工作中,“多元”意味着复杂、可操作性差,甚至非人力所能及,但是大数据技术为“多元”评价提供了极大便利。大数据可以保障如下几个方面的评价顺利实施。
第一,科研成果形式多元化。就科研成果的形式上,不能以论文作为唯一成果形式,还应该考虑专著、专利、软件著作权、科普文,甚至网络博文等,只要能够体现学术性、创新性的成果都应不拘一格地作为科研的结果呈现,纳入评价分析的基础数据。还要进一步对科技成果的基础性、应用型分别考慮。对于基础性的研究成果,要拉长科研评价的时间轴,放到更广泛的学科范围中去审视成果的贡献度。对于应用型成果,要重视科技成果的转化,从转化的难度、转化的领域、转化的效益等多方面考虑。借助大数据技术可以顺利完成多元数据的采集、存储和自动评价计算。
第二,评价的时间节点多样化。尽管科学研究是围绕研究课题有组织、有计划、有目的的认识活动,但是相比于一般认识活动,科学研究更加明确,更有探索性。传统的科研项目验收方法有计划性、数量化、计件化的评价倾向,诱发了“灌水”论文,也间接引导了科研工作者集中精力去产出“短平快”成果,淡化了“宁做十年冷板凳,不写文章半句空”的学术情怀。依托大数据平台,评价科研工作的时间节点可以灵活机动,做到节点评价和机动评价相结合,短期评价和长期评价相结合,成果评价和劳动评价相结合。即科研工作者可以选择固定时间的节点接受评价,也可以根据工作进展申请评价;在科研失败的情况下,将成果评价转换为劳动评价,失败的尝试同样值得尊重。有了大数据平台支持,关于科学研究的评价,可以更有持续性、可跟踪性,对后期研究工作形成借鉴,超越一般结论性评价的意义。
第三,评价的尺度智能化,评价的体系动态化。“五唯”不是教育评价的初态,是评价过程的渐变态。原有评价体系中也有多元的评价指标,例如,“师德师风优良,耐心辅导学生,教学工作量饱满”,只是一些指标因不易评价而逐渐在评价体系中失去权重。可见,要保障多元化指标体系的实施,必须有强有力的评测手段支持,而大数据、人工智能正是完成多元化指标体系测评的技术基石。对一些相对模糊的评价语言,可以借助于自然语言处理、人工智能技术进行有效分析,这样模糊语言发挥话语权,相关指标重回评价体系。另外,利用大数据平台可扩展性的技术支持,结合国家发展战略,动态调整评价体系,引领教师服务战略目标,争做贡献。
4.大數据支撑多元评价主体共同参与。教育教学评价是引领学校、师生、社会发展的指挥棒,履行评价的主体不能只是主管部门、用人单位,这样不利于营造客观公正的评价氛围,甚至影响评价的公信力。落实教学评价改革过程中,应当搭建多元评价主体共同参与的平台。如论文的质量评价,除了校内专家评价,还应邀请跨区域的其他高校同行专家、同一技术领域的企业专家共同参与。搭建的大数据资源平台要及时采集同行专家的数据,应为同行专家提供评价入口,方便信息的录入与后续处理。在学生培养质量评价方面,除了任课教师评价学习成绩、辅导员教师评价思想表现,还应当将用人单位作为评价培养质量的主体,应当鼓励将第三方评价机构的数据作为参考,如麦克思就业质量调查等。
(三)基于数据智能推进注重过程评价和增值评价的学生评价体系
1.基于线上/线下教学数据的大学生学习评价模式改革。相对于基础教育,高等教育已经较多地考虑了代表过程评价的平时成绩,但过程评价执行不到位,平时成绩评定草率的情况普遍存在,导致学生平时松懈而考前突击的现象屡见不鲜。过程评价流于形式,一方面是因为教师教学投入不够;另一方面是因为缺乏高效的过程评价手段。而当前流行的线上教学或线上/线下混合教学模式为过程评价提供了新途径。慕课教学受到广大师生的欢迎,尤其在疫情期间得到了大力推广;混合教学强调学生在全程教学中的地位和作用,关注学习成果的评价标准。学习平台能够有效地量化和管理传统的质量评价内容,深化学生学习成果评价的广度和深度,如学生技能获得、知识获取、投入效果、素质提升、思想引导等。
如图2所示,教学过程中的课堂教学、线上教学、资源建设、课程设计、教学方法均纳入宏观质量评价;而课前摸底测试、学生的出勤、线上问题的抢答、课后作业完成情况、线上调查问卷等数据均在系统中记录并纳入学生课堂的微观评价。借助于大数据信息技术教学平台,可以方便采集传统课堂中难以记录的过程瞬间,有效地支撑学生参与度、教学逻辑等评价指标,为完善学生过程评价和探索增值评价提供依据。
网络教学平台有效地记录了学生课程学习的轨迹。课前测的结果体现了学习知识的起点;课堂活跃度体现了学生的精神风貌、知识掌握情况;课后作业体现了学生对课堂知识的领悟和巩固情况。多个学期多门课程的数据积累可用于为学生画像,作为学生工作者指导学生的依据,如学业警示、发展规划等。运用评价指标在若干个时间节点上的观测数据构建增量评价,避免一考定成败,引导学生个性化发展。
2.基于数据分析的大学生评奖评优体系。除了课堂学习外,课外生活也是大学生自我提升的重要部分,应纳入到大学生评价体系中。课内课外的综合评价为学生评奖评优提供重要依据,评奖评优体系引导学生朝着德智体美劳全面发展的方向发展。
首先,大数据平台将校园党团组织、兴趣协会的特色活动整理归档,记录学生的活动数据;其次,及时解析校内社交平台的学生交流数据;再次,实时抓取百度贴吧等社交平台上的本校师生社交数据;最后,采集学生学科竞赛获奖数据。在大数据平台基础上,统计分析出学生的兴趣爱好分布、宏观动态,服务学生管理政策制订。同时,针对每个学生勾勒其思想动态、典型活动,充实学生思想评价,辅助开展有针对性的思政教育工作。另外,借助大数据平台,对学生异常行为进行预判、跟踪、化解,避免学校生命安全事故发生。
参考文献:
[1]周洪宇.深化教育评价改革,加快推进教育现代化——《深化新时代教育评价改革总体方案》解读[J].中国考试,2020(11):1-8.
[2]顾明远.对深化新时代教育评价改革的几点认识[J].教育测量与评价,2020(08):3-5.
[3]雷新勇.关于教育评价改革的若干思考[J].中国考试,2020(09):10-14.
[4]张楠,宋乃庆,申仁洪.新时代教育评价改革的价值意蕴与实践路径[J].中国考试,2020(08).
[5]李一希,黄毅.价值异化:高等教育评价“五唯”问题探析[J].高等工程教育研究,2020(04).
[6]付八军.高校“五唯”:实质,缘起与治理[J].浙江社会科学,2020(02):90-94.
[7]陆珺.破“五唯”背景下高校教师评价体系建设的探究[J].教育探索,2019(06).
[8]胡祖辉,徐毅.大数据背景下高校教育数据的分析与应用研究[J].现代教育科学,2017(01):109-114.
[9]李艳燕,董笑男,李新,等.STEM教育质量评价指标体系构建[J].现代远程教育研究,2020(02):48-55,72.
[10]赵学孔,龙世荣.混合式教学模式下教学质量多元评价研究[J].教育教学论坛,2020(36):48-49.
(责任编辑:许高蕊)
Technical Thinking and Reform Practice of Educational Evaluation in the New Era
HAN Lei, XU Falei, HUANG Chenrong
(Nanjing Institute of Technology, Nanjing, Jiangsu 211167, China)
Abstract: In order to improve the mechanism of morality education and reverse the unscientific orientation of educational evaluation, the CPC Committee and the State Council recently issued “the general plan for deepening the reform of educational evaluation in the new era”, which is a programmatic document for the reform of educational evaluation. This paper is concerned about how to implement the general plan. Focusing on the information technology advocated by the general plan and the data thinking in the practice of “four evaluations”, this paper puts forward the implementation measures of higher education evaluation based on big data technology. Namely: integrate existing information resources and build education big data infrastructure; Exploit multiple data thinking to solve the disease of “five only”; Use the full sample data of the platform and intelligent analysis technology to improve the enforceability of process evaluation and value-added evaluation.
Key words: educational evaluation; data thinking; big data; talent training