人工智能教育大脑的生态架构和应用场景
2022-03-30徐冰冰
张 治 徐冰冰
(1.上海市宝山区教育局,上海201999; 2.上海市宝山区教育事务中心,上海201999)
一、问题提出
人工智能嵌入教育大致要经过三个阶段:第一阶段是作为内容的人工智能,以观念传播和技术普及为主,常作为课程进入学校系统;第二阶段是作为工具的人工智能,即广义的人工智能赋能教育教学的各个场景,技术成为原有教育模式的加速器,用于提升效率,但是几乎不改变原有流程,没有流程再造和范式重构;第三阶段是作为思维方式,即人工智能作为人类智能的伴生体,深度嵌入教育系统,成为人类智慧的一部分。在第三阶段,人们开始思考人类智能和人工智能如何分工,不同的人如何学习才能实现效果最优,学什么最重要,什么可以不学,什么可以不教,教育教学流程和治理范式是否需要重构或优化,而不是简单地为教育做内容的增量(见图1)。但是,当前人工智能教育应用仍停留于浅表层面,未形成整体化应用,也没有形成教育大数据开放共享和治理的机制体制,缺少人工智能治理整体解决方案。此外,作为人工智能核心元素的数据,整体质量不高,文本、图像、声音、影视、超媒体等结构化与非结构化数据也缺少固定的标准规范,且缺乏开放共享和治理的机制。
图1 智能技术融入教育的三个阶段
1.缺少安全可控、保护隐私的技术
教育大数据涉及用户的个人隐私,对数据的合理利用、安全治理提出了较高要求。人工智能+教育的健康发展依赖高质量的数据集,这就对教育大数据的治理提出了要求。随着教育应用场景的拓展,数据来源越来越广、过程越来越复杂、规模越来越大、维度越来越多,提升了数据隐私保护的难度。目前数据治理技术和工具众多,但能够衡量隐私安全和判断最优的寥寥无几。我们要推进教育智能化发展,需要研究和实现面向教育行业的数据治理关键技术。
2.缺乏适用于教育的算法模型
算法逐渐成为影响人类行为的基础规则。然而,受限于技术本身与应用逻辑,算法应用过程中存在不可解释隐忧、自我强化困境等挑战。学习者模型和教学策略模型的普适算法难以应对人的独特性和不可复制性,教育领域的算法歧视也会造成教育公平和个性化的冲突。因此,提出人工智能算法治理体系及核心算法模型,是应对人工智能带来的风险与挑战的有效手段。目前,算法治理基础薄弱还不能有效支持各类教育场景。人工智能在教育行业的探索,一方面应用场景、应用学科比较零散,另一方面相关的人工智能关键技术和算法模型往往是“一项目一方案”,且会随着项目的结束而结束,缺少能够整合各类教育特色的算法模型和关键技术的教育大脑。当前的教育模式是标准化、规模化的,如何满足学生个性化、灵活的学习需求,是长期难以改变的教育难题。
3.教育实际场景应用还存在诸多困难
人工智能领域已有神经网络、语义分析、知识图谱等众多算法,但这些通用算法在实践中并不能直接用于教育智能化,还需要利用具体教育场景的历史数据,按照既定规则和目标,重新训练和学习,特别是要适应教育的规则体系和国家的教育发展生态,才能贴合教育行业需求,符合人工智能治理原则。
综上,无论是数据治理还是算法治理,面向教育行业的人工智能治理还缺乏整体的解决方案。本研究提出通过开展教育数据治理和面向教育领域的算法治理,“哺育”健康强壮的教育大脑,加快推动线上线下融合的教学模式改革,实现大规模因材施教和教育决策精准科学。
二、概念建构
人工智能的发展就是不断模拟、拓展人类智能的过程,终极目标是模拟、拓展人类大脑(见图2)。1956年,麦卡锡等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”时,首次提出“人工智能”概念。随后几十年,人工智能在模拟、延伸和扩展人类智能方面进步巨大,模拟人的“听”,形成了语音识别、机器翻译等;模拟人的“看”,形成了图像识别、文字识别等;模拟人类“说话”,形成了语音合成、自然语言合成等。大脑是人类最复杂的器官,代表着人类最高智慧的物质基础。20世纪80年代末,美国科学家卡沃·米德(Carver Mead)首次提出类脑计算概念,希望通过研究人类大脑的工作机理,设计像人类一样思考、学习的机器人。2016年,AlphaGo引发人们对人工智能的关注,机器学习迅猛发展,人工智能也迈向了认知智能阶段,模拟人类思考,发展形成了人机对弈、定理证明等;模仿人类学习,发展形成了机器学习、知识表示等;模仿人类行动,发展形成了类人机器人、自动驾驶汽车等。雷·库兹韦尔(2011)以智能大脑为隐喻,通过给大数据植入数学算法,模仿人脑融合机制思考、解释海量数据的机理,做出有逻辑关系的判断。
图2 人工智能发展历程
近几年,智能大脑从概念逐渐走入实践。城市治理领域提出了城市大脑,即通过全面采集、集成、分析和挖掘城市空间中的大量异构数据,开展全局实时数据分析,解决城市治理问题,实现公共资源的优化配置。我国多个一线城市分别在城市大脑、数字政府、智慧城市等方面开展了实践探索。在教育领域,虚拟学校将成为社会教育系统的大脑,担当资源提供者、学习引导者、管理服务者、决策支持者等角色(张治,2018)。有学者提出人工智能教育大脑概念,并将其定义为海量教育数据模型、深度学习算法、高度计算力等智能化技术与算法的融合体,如同人类大脑,具备理解、交互、情感、计算、决策等强大能力,能够满足优质化的教育数据需求(顾小清等,2021)。有学校开展了教育大脑相关探索,提出学校大脑概念,即以互联网为基础设施,建设一套完善的感知层、传输层、决策执行层(即“感、知、用”的学校大脑架构),通过对学校教育教学活动的无感沉淀,自动形成丰富、清晰、多维度的学校数据资源,形成能即时分析、诊断、预警、监测、评价、反馈且能融管理、学习、成长支持于一体的人工智能系统(饶美红,2020)。
这些研究和实践驱动人工智能发展的三要素——数据、算法、算力,以大脑的概念集成。教育大脑的概念建构还应辨析三对概念。其一,人工智能与大数据。大数据是传统计算,不会根据结果采取行动,只是寻找结果。人工智能允许机器执行认知功能,作出反应,且不断改变行为,以适应新的变化并修改反应。这是数据中台与教育大脑的本质区别。其二,教育大数据与领域知识。除了数据、算法、算力,驱动人工智能的要素还包括“知识”(各行各业领域知识,包括知识、经验、流程)(周志华,2020),赋能各行各业提质增效。缺乏知识支撑的数据难以真正赋能认知,就像只有动词没有名词,无法组织文章一样。特定领域的知识图谱和认知模型算法相结合,才能真正支撑人工智能的全面赋能。其三,教育大脑与物联网大平台。大脑的核心价值是算法集成中枢,没有神经感知系统的支持,就会失去反射弧的完整性。算法和算力离不开互联网和物联网的全面感知能力和数据集聚,否则教育大脑就会丧失功能。
在此基础上,本研究立足于数据、算法、算力三个核心要素,引入学科知识图谱的教育领域知识,将教育大脑定义为人工智能在教育领域的仿生智能体,包括多模态数据的全面感知系统、基于知识图谱和学习者模型的多智能算法裁定类脑中枢系统、多场景应用的反馈系统三部分(见图3)。教育大脑面向特定学科领域,表现为自适应学习系统,面向全部领域就演变为智能学习管理系统或智能导师,并在教育决策支持等方面发挥增能效应。 教育大脑具备可感知、可进化、能决策、快反馈、有情感等特征。1)可感知。教育大脑的感知系统能全面感知教育大数据,结合多种数据感知手段,实现多模态数据融合、全域互联、智能感知,发挥数据驱动教育的最大价值。2)可进化。人类之所以能够进化成智慧生命创造文明,得益于人脑进化。人脑有很强的自适应与自组织能力,后天学习可进化出新功能。教育大脑也具备这种能力。人工神经网络可在学习或训练过程中改变突触权重值,以适应变化,超越设计者原有知识水平,促进教育智慧沉淀与智能进化,带动人、机、物、资源、环境协同进化。3)能决策。人工智能正向高阶决策智能跃迁,即从感知智能到分析智能再到决策智能由低向高的非线性演化,教育大脑将为教育管理者决策提供支持。4)快反馈。人脑是一个大规模并行与串行组合处理的网络系统,其判断、决策和处理的速度远高于串行结构的普通计算机。教育大脑中枢神经系统是类脑的人工神经网络,具有并行处理特征,相较于计算机系统,其反馈速度提升明显。5)有情感。教育大脑可开展算法治理,进行伦理分析,避免算法歧视。
图3 教育大脑概念图
三、生态架构及关键技术
本研究尝试结合人类大脑的生物结构和人工智能典型特征构建教育大脑。人类大脑皮层约有100亿个神经元,每立方毫米约有数万个神经元,它们互相联结形成神经网络,通过感觉器官和神经接收身体内外的信息,然后传递至中枢神经系统,经过对信息的分析和综合,再通过运动神经发出控制信息,以实现机体与内外环境的联系,协调全身的各种机能活动。神经元分为感觉(传入)神经元、联络(中间)神经元、运动(传出)神经元,进而形成感受器、传入神经、神经中枢、传出神经和效应器的反射弧结构,能够感受信息、处理信息、支配运动。据此,我们将教育大脑架构为类脑神经感知系统、类脑中枢神经系统和类脑运动神经系统三个基本结构,分别对应人工智能“输入数据—处理数据—输出功能”的基本流程。感知系统是输入端,场景应用是输出端,类脑中枢神经系统负责人工智能算法处理(见图4)。
图4 教育大脑架构
(一)类脑感知神经系统:融合多源多维多模态教育数据
人类通过眼、耳、口、鼻、皮肤把检测到的信息源,包括光子、压力、温度等传递至大脑,进而形成感官体验。教育大脑的类脑感知神经系统如同人的感知神经网络,可获取线上线下多来源、多维度、多模态教育数据。感知数据的“神经元”就是数据采集工具。为保证数据的深度、广度和质量,系统需要设计多样化的数据采集手段。摄像头、传感器等数据采集工具相当于人类的感受器官,负责采集数据,传输至教育大脑。教育数据采集工具包括平台采集(终端采集)、物联感知、机器视觉(图像识别、视频采集)、机器听觉。
教育信息化正在从1.0走向2.0,教育平台和系统越来越多,教育管理、教辅后勤、教育评价、行政办公、家校沟通等环节都配有系统、平台,存储了大量用户数据,包括学生学习的过程性数据和结果性数据。这就需要打通数据孤岛,开展数据治理。物联网数据和信息系统数据融合正在成为新的趋势。智能摄像头能够采集线下教学环境中学习者交互的视频音频数据、校园安全数据、学生行为轨迹数据等;边缘计算可用于自动切片关键动作,并对重要动作、危险动作进行管理;智能教室的摄像头具备自动导播功能,能自动标注课堂行为。物联网数据和信息系统数据正在融合这些教育数据,使其具备价值,并进入教育大脑的中枢系统(见表一)。
表一 类脑感知神经系统的数据采集
(二)类脑中枢神经系统:集聚多智能算法的教育决策模型
中枢神经系统是人脑思维和意识活动的基础。人类通过将感知到的数据传入大脑,穿过中枢神经系统,形成大脑反应。教育大脑的类脑中枢神经系统由多重组合的教育决策模型组成,是教育大脑运行和效能发挥的逻辑基础。人工智能赋能教育本质上是数据驱动的算法应用。就教育大脑支撑的大规模因材施教而言,算法模型主要有三类。
第一,构建学科知识图谱,积淀教育领域知识与规律。2012年,谷歌公司为提高语义搜索功能,提出了知识图谱概念,目的是减轻用户收集、总结和归纳的压力,通过知识图谱迅速、快捷地查询主题的脉络。知识图谱是将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法,与计量学引文分析等方法结合,用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构的多学科融合的研究方法。知识图谱不仅能够帮助学生建立完整的知识体系,明确学习目标,提高学习效率,而且有助于教师迅速发现学生学习薄弱环节,进行针对性答疑,从而有效提升教学质量。
第二,构建学习者模型(见图5),了解学习者的学习特征、学习状态和所需的帮助。一是了解学习者学习特征、学习风格、能力倾向,即根据学生的基本信息、多元智能测试和霍兰德职业兴趣测试,初始化学习者模型,根据预置程序性和方法类知识构建初始的知识模型,为学习者推荐研究方向和学习资源,并提供学习流程引导和支持。二是了解学生所处学习状态,即通过主动感知学习者对文本、视频、图片等学材的操作数据和学生的社交数据,以及获取物联网技术 (如传感器、摄像头等)提供的学习情境和学习者状态(如眼动跟踪、情绪感知等)等信息,感知学习者所处情境和学习进程等。这样可以不断更新和完善学习者模型,并依赖智能推理引擎适时推送有效的学习资源(如系统预置的与方法论相关的微视频、动画、案例、文本等)和任务,辅助教师引导、激励学生完成学习任务。三是了解学生需要哪些支持。越来越多的学习者行为和结果数据被实时记录,不仅为学习管理、服务和评估提供了客观依据,还能基于智能技术进行数据挖掘,实现学习者模型、程序性和方法类知识模型、个性化教学策略模型的重构和调优,推动系统不断优化,为学习者提供更精准的自适应学习服务。
图5 基于人工智能的学习系统概念模型
第三,专家经验与机器学习相结合、知识图谱与学习行为数据相结合,形成教学策略模型,支撑大规模因材施教。教学策略模型是规范,也是引导。教师上岗前,大多学习了大量理论知识,如多元智能理论、认知心理学……但很少在教学中践行这些理论。我们花了大量时间、精力把世界上最先进的教育理论传授给教师,遗憾的是,教师还是用传统的方式教学,教育理念和实践之间的差距非常大。很多教师没有真正理解这些教育理论,即使有理解,也受限于班级环境等因素,最终难以实施。教师一般会选最简单、最容易的方式授课。教学策略模型能推动教师在课堂上将教育理论“用”起来。教学策略模型不是唯一的,模型之间可自由切换。主流教学策略模型有三种:讲解辅助的建构、任务驱动的探究、评价驱动的补救。三种模型彼此交叉,进而生成多种路径(张治等,2018)。
(三)类脑运动神经系统:驱动人工智能与教育生态协同进化
类脑运动神经是教育大脑各项功能的输出,保证人工智能支撑各类教育场景。计算能力指数据处理能力,是人工智能发展的三个支撑之一。人脸识别、语音识别等需要算力支持,算力的高低与人工智能的发展程度成正比,反映人工智能的成熟度和智能化程度。
在类脑运动神经系统的驱使下,各教育生态要素重组形成教育智能体(见图6),具备自我改进的功能。一方面,对于任何学习者,存在某种教育资源、学习环境、互动机制和学习过程,使学习者的知识结构改变达到最优;另一方面,教育资源通过在特定学习环境与学习者互动而得以改善。未来,学校是教育学、认知科学、技术和社会的混合体,伴随着教育大脑的进化而不断进化。
图6 各生态要素系统进化形成教育智能体
四、典型应用场景
教育大脑将富有立体感、多元化的数据汇集成教育大数据,通过智能算法挖掘出规律、关系、原理等,一是可以避免数据混乱无章、彼此相互割裂;二是采用智能算法,进行智能思考、理解与快速反应。人工智能教育大脑不仅是感知系统、中枢系统,更起到末梢的作用,支撑人工智能对教育的全面赋能。在当前弱人工智能的现实背景下,教育大脑至少可以支撑智能教学、精准评价、智能治理、智能预警四种典型场景。
(一)智能教学服务
教育大脑从学生自适应学习、教师智能备课、家校共育三方面支撑智能教学服务(见图7)。第一,支撑学生个性化学习。同质化的大众教育体系曾给人类世界带来了不可估量的好处,但是这种同质化的大众化教育体系不仅让教育日益机械化,在本质上也抹杀了教育的创新可能(安东尼·塞尔登等,2019)。教育大脑可从中枢神经系统的“记忆”中获取学习资源和学生学习数据,从而了解学生的兴趣爱好、能力倾向、学习风格,为学生推荐适合的学习资源,定制个性化学习路径,尽可能让学生花最少的时间达到理想的学习效果。个性化学习让教学目标、教学方法、教学内容及教学顺序可能因学习者的需要而有所不同(Culatta & Fairchild,2016)。第二,支撑教师备课、教学、课外辅导。教师往往基于经验和认知上课,难以考虑每位学生的知识基础。人工智能教育大脑通过收集和分析学生信息,并通过统计和分析,为教师针对性教学提供基础。人工智能教育大脑不但可以开展数据收集,还可以对海量数据进行分类,总结针对性问题以及给出针对性建议。教育决策不再以经验为主,而是以规模化的数据和智能算法为中间媒介,由数据智能驱动,走向智慧化决策,让决策有规律可循。教育大脑利用教学数据,帮助教师的判断和决定,帮助不了解学生、做不到个性化教学的教师更精确地推送资源、实施个性化教学和因材施教。第三,促进家校共育。人工智能教育大脑促使教育不局限于学校,而是面向各个系统,不仅可以对师生产生作用,同时将学校、教师、家庭融为一个系统。这有利于促进家校沟通,构建新型的教育生态环境,成为教育与社会其他系统连接的纽带。教育大脑所提供的教育是动态的、智能化的。它不但可以理解周围的环境变化,而且还可以根据环境变化做出及时、针对性反馈。我们可以通过教育大脑构建立体化的综合教学场。
图7 教育大脑支撑的智能教学服务
(二)精准教育评价
人工智能技术正在为满足多种多样的教育需求发挥着不可替代的作用。教育正实现从“少数人的个性化”到“多数人的标准化”再到“多数人的个性化”的历史性跨越。学生数字画像是实现这一目标的关键技术。学生数字画像由用户画像发展而来。人工智能教育大脑通过收集数据进而总结出描述其真实特征及行为的标签。在技术支持下,学生学习行为(如学习发展、学习特征、能力倾向、兴趣爱好、行为轨迹)和结果数据可被全方位采集,而后以自动化方式处理,提炼出可描述其特征和行为的标签集,最终从各维度完整地描述学生,并精准识别其学习状态,帮助教师精准指导与干预,使教学更具个性化。
(三)智能教育治理
教育治理是教育管理民主化的集中体现,是治理理论在教育领域的延伸,指政府、社会组织、利益群体和公民个体,通过一定的制度安排开展合作互动,共同管理教育公共事务。教育治理现代化是教育现代化的重要组成部分,是教育治理与信息化的结合。在智能环境下,传感器和定位系统的广泛部署,将数据收集触角延伸至细微时空的各个角落,实现高动态、分布式的全场景感知(Peng,2017)。人工智能教育大脑打破了数据流通的壁垒,融合了互联网、大数据、5G、人工智能等新兴信息技术,实现了教育生态融合,让智能技术贯穿于教育决策形成、执行、反馈和智能纠错的全过程,可支撑学校或区域宏观教育治理,提升教育决策的科学性、精准性,有助于开展更全面、更系统的智能治理。教育大脑支持下的智能教育治理融合政府、学校、家庭、社会等多方力量,促进教育生态系统的发展与完善,使教育管理者思维、理念、行为方式与现代社会高度契合(褚宏启,2013)。
(四)智能教育预警
人工智能不仅可以支持人类决策,还可以帮助人类预测未来。人工智能可实现学生学业预警和身心健康预警。对在线学习场景中学生学习过程缺乏监督、学习主动性不高、教师的反馈和帮助不及时、学习效果不佳等问题,教育大脑可通过分析学生学习行为数据,结合学科知识图谱,精准识别处于学习危机的学生,提前提醒并进行干预。此外,教育大脑的类脑感知神经系统基于学生校园学习数据、生活数据以及互联网行为数据,通过学生心理危机事件预警模型(见图8),可形成学生心理危机五级分类及具体的学生心理关爱服务和心理危机干预方案。
图8 青少年心理健康预警数据分析模型
五、思考与建议
第一,开展数据治理,加快数据安全、隐私保护、伦理等相关立法。人工智能的发展离不开数据,但教育数据涉及大量学生数据,且具有特殊性、复杂性等特征。在数据开放成为国际趋势的背景下,教育行业应积极探索如何在保护数据安全、不侵犯隐私、合乎伦理的条件下,促进教育数据开放共享,让数据真正变成驱动教育变革的动力。在数据应用层面,我国应加快制定行业统一的数据标准,建立数据安全管理办法和开放共享机制,加强隐私保护;在研究层面,鼓励研究者在遵守安全、隐私、伦理的前提下,深入研究。
第二,开展算法治理,推进算法健康、有序发展。算法是负责加工数据“石油”,不仅决定机器的“智商”,更关乎人工智能发展的安全性、规范性。如果算法不能纳入治理范畴,必然存在算法乱用、算法歧视等隐患。目前,人工智能等新技术教育应用的社会监管能力提升速度远落后于技术革新的速度。要保证算法和模型的良性运转,我们必须对其进行必要监管,及时进行风险评估和管理(凯西·奥尼尔,2018)。2021年,国家互联网信息办公室等九部委发布的《关于加强互联网信息服务算法综合治理的指导意见》提出,将逐步建立算法安全综合治理体系。教育领域应进一步强化互联网教育企业主体责任,推进算法监管模式创新,提高算法可解释性。
第三,推进社会实验,促进人工智能+教育的良性发展。人工智能必须经过检验才可以用于教育实践,也必须提前考虑进入教育可能带来的问题。这就需要在真实教育场景中开展实验,推动人工智能技术在特定教育场景中的应用,通过科学抽样和伦理审查,建立实验组和对照组,通过观察、对比、总结,形成技术规范、标准、政策、建议,将因技术不成熟而造成的负面影响降至最低,促进人工智能技术良性发展。