我国教育大数据建设的现状分析与架构初设
2017-05-30娄晓敏
娄晓敏
摘要:该文从教育大数据建设的意义与作用入手,通过分析国际国内教育大数据建设的发展现状和我国教育大数据发展面临的挑战,尝试以放眼国际和“教育本土化”为原则,对我国教育大数据建设,提出初步的基本架构设想:在遵守基本指导思想的基础上,构建我国教育大数据资源生成、应用与进化的整体解决方案,提供运用大数据破解教育难题的新模式,完善关键技术与产品服务,助力产业新生态形成。以达到建构“以人为本”的,有效服务、促进中国教育发展的中国教育大数据建设的基本目的。
关键词:教育大数据建设;现状分析;架构初设
中图分类号:G434 文献标识码:A
一、教育大数据建设的意义
教育大数据是指一切可用于教育发展并可创造潜在教育价值的数据集合。居全球之首的教育规模,使我国在前期教育信息化实践中已经积累了海量数据,这些数据一部分属于政府政务数据,并未向行业开放;一部分存储在各类信息化平台中,缺乏有效的汇聚机制。如何充分发挥已有数据资产的价值,同时积累更多更全面的数据并加以有效分析利用成为我国教育大数据建设的关键。当前,我国教育面临资源配置公平与效益、教育质量提升、学生个性化发展三大时代命题。基于信息化背景的大数据,无疑为破解这些难题提供了全新的思路和解决方案,为我国教育发展提供了良好的机遇,所以,对教育大数据建设相关问题进行探索研究具有理论和实践意义。
二、教育大数据建设发展现状
(一)国际发展简况
教育大数据,作为大数据发展战略的重要组成部分,各国从发展战略、技术研发与实践应用等各个方面都在积极推进。
在发展战略方面,各国竞相将其提升至国家战略层面。2012年,美国政府投资2亿美元启动“大数据研究和发展计划(Big Data Research and Development Initiative)”,并于同年发布《通过教育数据挖掘和学习分析促进教与学》,促进美国高等院校及K-12学校教学系统的变革。欧盟的《开放数据战略》,在观念意识、法律政策和技术研发等方面提出了详细的发展规划,将教育、培训与终身学习列为开放数据战略的重要领域。英国发布《把握数据带来的机遇:英国数据能力战略》,促进了英国大数据挖掘与应用的发展。日本发布了《创建最尖端IT国家宣言》;新加坡抓住大数据的机遇,努力推动新加坡成为全球数据分析中心,通过政府数据门户,开放了包括教育在内的9大类数据集,并提供了数据开放接口标准。
在大数据快速发展的整体背景下,教育领域中大数据的研发与应用也显示出强大活力和前景。国际上教育大数据应用已经出现了一些典型技术,主要针对个性化教与学、关联分析与预测、教育管理决策等。Knewton和可汗学院(Khan Academy)对个性化学习提供了重点支持,可以基于学习者特征、学科知识结构、学习过程行为对学习进行个性化支持。预测分析报告项目(Predictive Analytics Reporting,PAR)在学生模型构建与风险预测方面进行了探索,借助预测模型可以发现隐含规律,有效实施教学干预,促进教育教学质量提升。通过Learnsprout和Brightbytes公司的Calarity,将技术应用情况的综合数据采集、分析、诊断,提出可行性解决方案并予以验证。
综合起来看,国际范围内,教育大数据应用和技术研发,在政府、学校和企业的推动下,已经出現了一批针对教育需求,应用先进技术,较为有效地促进教育教学的产品和服务。但从实践及技术层面看,大数据的应用,需要集合多个跨学科领域、又专业又复杂的技术成果。而这些技术成果的产生和集成,均面临较高的技术和管理风险。况且,大数据应用,是一对一的应用,不同的应用场景,需要采用的技术和方法也不同。因此,各国“大数据”战略能否如其所愿,均尚待实践检验。事实上,“大数据研究与开发计划”的一些项目,也已经出现“可能实施不了”的声音。所以,各国教育大数据建设到底结局如何、能否最终落地,均尚待时日。
(二)国内发展现状
近年来我国开始不断倡导和推动教育大数据发展。2011-2020年的教育信息化十年发展规划、促进大数据发展行动纲要等一系列文件,从不同角度,全方位确定了我国教育大数据建设的国家战略与举措规划了十个大数据工程,并在“公共服务大数据工程”中明确提出“要建设教育文化大数据”。
随着大数据政策的出台,大数据标准建设也在快速推进中。但是,当前大数据标准还存在许多缺失环节。与通用大数据领域相比,教育领域大数据标准制订仍是一片空白,标准建设亟待加强。
大数据产业发展方面,部分企业从数据采集的角度进行了大量研发,通过音视频资源、点阵数码笔、试卷扫描等多种途径获取教育教学数据,并开展以统计分析为主的分析应用。部分互联网教育企业凭借内容、产品、服务等方面的积累,正在积极探索或计划涉足教育大数据相关业务。部分企业开展了题库类产品的研发,通过拍照搜题、学习行为记录等方式获取数据,并初步结合知识地图进行了学习状态呈现和内容推荐。部分在线学习平台产商开始探索基于课程学习数据的模型构建和分析技术,探索在线课程中的学习预警、学习诊断、资源推荐等服务。传统数据分析企业,凭借在商业数据分析领域的技术积累,开始进军教育数据挖掘与学习分析市场,基于通用数据分析系统提供教育解决方案。
教育界对教育大数据建设的研究,主要集中在大数据时代背景下的教育变革基本理论思辩研究;对教育大数据挖掘和分析出的教育现象进行解读;教育大数据本体及相关技术研究。另外还有如祝智庭、郑燕林和柳海民等提出的自适应学习、教育大数据应用的定位研究;胡弼成和王祖霖对大数据应用方法研究;杨现民等提出的对教育大数据应用的分类研究等”。具体的技术研发,也取得了较大突破。如三元空间大数据计算方法等。可见,大数据时代新思维已逐步建立,技术手段与方法导向正在形成。
总体而言,我国教育大数据建设正快速发展。政府出台各种文件推动教育大数据发展,教育领域存在大数据应用的巨大需求,各类相关企业的数据积累和技术积累为教育大数据产业的蓬勃发展提供了基础支撑。但目前仍存在很多不足。具体体现在,教育大数据标准存在很多空白,亟待加强建设;教育大数据的分析方法仍较落后;教育大数据应用偏重个体学习支持,题库类产品居多,缺乏综合解决方案;教育大数据模型构建较为初步,未能整合教育领域专家知识和大数据前沿技术等。
(三)发展趋势及挑战
当前教育大数据行业,在市场需求、行业标准、关键技术、规律探索和产品服务方面体现出以下特点。
1.市场需求增长强劲
教育大数据与教育大数据需求快速发展,并且日趋多样化。根据《中国基础教育大数据发展蓝皮书(2015)》预测,2016年中国教育大数据市场规模约为4.49亿元人民币,环比增长率为61.88%。市场规模和领域需求都在快速发展之中。
2.行业标准有待逐步建立
需要有统一的行业标准与规范。目前,正在积极制定大数据产业标准。专门针对教育大数据的标准制定工作还未正式开始,有待尽快启动。
3.核心技术有待突破
在大数据核心技术日趋成熟的背景下,教育大数据技术获得了很好的发展条件。但总体而言教育大数据技术与通用大数据技术相比仍较为滞后,领域特性不足。当前教育大数据产品过于偏重技术,而对教育重视不足。通用大数据前沿技术与教育领域研究成果的结合明显不足,在数据采集、数据分析和数据应用等层面均缺少符合教育应用需求的关键技术支持。这些都成为制约教育大数据建设发展的重要因素。
4.教育规律探索亟待加强
教育大数据应用对教育领域需求只是初步尝试,尚未针对教育规律开展深入探索。大数据可以成为探索教育规律的重要方法与工具,揭示学习与发展的深层规律,但对于教育规律探索的支持明显不够。
5.产品服务有待完善
目前,虽然产生了许多教育大数据产品,但真正能够与教育教学实践相结合,融入教育教学实践,在学校、区域或更大范围内对教育教学产生实质性影响的却并不多见。产品和服务的形式较为单一,针对性、灵活性、有效性明显不能满足需要,促进教育发展与变革上的真正价值更未体现出来。教育大数据想要良性快速发展,必须在领域标准、共性技术、教育支持和产品服务上取得突破。
三、我国教育大数据建设架构初设
综合分析可知,从战略高度定位,教育大数据的最终价值应体现在与教育主流的深度融合并持续推动教育系统的智慧化变革上,使之成为推动教育变革和发展智慧教育的基石。然而,在拥有超强独特性和复杂性的教育面前,我国教育大数据建设同样面临应用落地、数据安全与治理、数据运营等一系列挑战。综合考量,现从以下几方面进行架构尝试。
(一)立足本土,明确基本的指导思想:(1)厘清教育是主体,技术是辅助工具的辩证关系。(2)实现大数据技术“教育化”,使其切实能够为教育所用;(3)教育大数据在发展过程中,必须遵守相关伦理问题。
(二)放眼全球,构建我国教育大数据资源生成、应用与进化的整体解决方案。当前教育领域已积累了海量数据,教育大数据应用必须以数据资源为中心,一方面充分利用已有数据资源,开放政府教育政务数据,打通已有教育数据汇聚融通的渠道;同时采用新技术采集那些以往难以测量的非结构化的、过程性的、隐性化的教学数据,实现教育数据的全面化采集汇聚与深度挖掘分析。
技术研发应围绕着数据资源从哪来、怎么管、怎么用等问题,通过关键技术研发、标准制定、示范应用,提出教育大数据资源的数据生成汇聚与共享机制;基于大数据分析技术,形成应对我国整体和不同区域教育实践的应用解决方案;并在此基础上,对数据本身的持续存储、清洗、分析、应用的管理和进化模式进行总结和提炼,最终形成教育大数据资源生成、应用与进化的整体解决方案。此方案应为全国教育信息化和教育大数据应用提供可重复的实践模式,和可验证的成熟数据挖掘技术,为提升整体教育管理服务水平提供强力支撑。
核心的工作是围绕数据资源的生成、存储、清洗、分析、应用、共享和管理的全流程共性技术和标准的研发,为教育大数据产业各环节提供技术支撑。建立起教育过程数据伴随式全面采集的完整流程,同时打通已有海量教育政务数据、教育教学数据与新生成数据的汇聚共享渠道。在教育领域中的大数据应用,更重要的是要建立起符合教育教学规律,能够切实支撑中国教育改革与发展的基础数据架构和服务能力。
(三)提供运用大数据破解教育难题的新模式
传统的教育体系应对中国教育多年来面临的教育公平、教育质量、个性化教育需求等问题,有难以跨越的困难,如:区域流动人口的剧增带来的学龄人口剧增,导致学位紧张的问题;城乡、学校教育质量差异导致择校的社会性难题;个性化教育服务无法兼顾的问题;教育教学资源主动推送不够智能的问题等。教育大数据建设应通过研发和示范应用,提出并验证利用大数据破解教育难题的可行性和有效性,通过对不同区域的不同试点应用,为教育三大命题的突破提供解决方案,并可以对其进行验证。
学习过程、形式方面,大数据时代碎片化海量信息的现状,决定了教育者和教育机构,应着力于培养学习者的碎片化学习习惯和思维;同理,大数据时代的学习者,也应具备使用移动学习设备、利用碎片化时间,获取碎片化知识的能力,使自身知识多元化增长。
(四)完善关键技术与产品服务
我国教育大数据领域已经具有一些有代表性的研究成果,但当前的研发与应用水平还不能满足教育行业的核心业务应用需求,主要表现在没有形成数据采集、数据汇集、数据分析、数据呈现、智能诊断、适应性干预等服务的提供能力。教育大数据建设应进一步突破关键技术瓶颈,形成相关的技术手段和产品系统,促进我国该行业的研发水平和应用水平。应通过多种方式开放关键技术和服务,为教育行业大数据应用构建底層支持,最大程度地提升教育行业整体智能化服务水平。
首先,对《教育管理信息教育管理基础代码》中缺失的在线教育、教学环境、教学过程等相关数据标准进行及时补充和完善,建立完善的教育数据标准。其次,构建更具专业性的数据模型,改变前沿数据分析方法与技术的应用不足的问题。再次,改变当前教育大数据应用对教学决策支持不足的问题,实现产品和服务多元化发展。
(五)助力产业新生态形成
深层教学规律将有力促进我国教育发展,提升教育教学质量,进而提高人力资源水平,增强国内人才竞争实力。教育大数据建设应通过广泛的教育教学数据,构建学生认知与发展模型,为教育教学规律探索提供坚实的数据支持。研发完成的教育大数据分析关键技术与平台可以为教育教学规律探索提供先进的技术支持。应基于丰富的数据和先进的技术,以试点区域学习者为对象开展深入研究,发现深层规律,为个性化教学服务的提供奠定基础,最终提升教育教学质量。
教育大数据建设应在基础技术创新能力、技术成果产品转化能力和产品工程化应用能力三方面,进行联合攻关,以解决教育大数据领域共性的、关键的技术问题,实现重大突破和创新,促进产业可持续发展。依托各省已有成果,为全国各地教育行业相关企业提供教育大数据技术与应用的引导和帮助,组织瓶颈技术创新攻关,集思广益,加快企业成果的共享和转化,优化教育大数据产业链,通过教育企业联合,形成合力。
总之,教育的最终目的是培养“完全的人”,是面向“人”的长期、动态的过程,而非流水线上的产品或数字的简单集合。因此,教育大数据建设应当立足“以人为本”的“教育本土化”,通过汇集和分析的教育数据,挖掘技术的研发和应用,结合教育治理计算仿真技术,动态监测教育发展状况,洞察教育现象的深层逻辑,有效预测教育发展走向,针对教育结构调整、教育资源配置、办学绩效评估等宏观和中观教育治理的核心任务提供大数据解决方案,及时准确地反应自然、社会、经济、教育、技术等的系统状态和趋势,促进教育这一复杂系统的治理和决策。