教育大数据标准化的思考与建议
2018-12-01饶景阳王杨春晓
吴 砥,饶景阳,王杨春晓
(华中师范大学 教育部教育信息化战略研究基地(华中),湖北 武汉 430079)
0 引 言
大数据指涉及数据量的规模巨大,无法通过人工在合理时间内达到截取、管理、处理并整理成为人类所能解读的信息[1]。教育大数据是大数据的一个子集,目前学者对教育大数据的概念界定存在争议。总体来看,教育大数据主要包括两个层面:广义上的教育大数据泛指所有来源于日常教育活动的行为数据;狭义的教育大数据指学习者行为数据,主要来源于学生管理系统、在线学习平台、课程管理平台等。
作为基础性战略资源,大数据成为提升教育质量和优化教育管理的重要支撑,教育大数据的发展规划和行动路线受到我国政府部门的高度重视。2014年3月,大数据首次出现在《政府工作报告》中;2015年8月,国务院发布《促进大数据发展行动纲要》[2],明确指出大数据成为推动经济转型发展的新动力、重塑国家竞争优势的新机遇、提升政府治理能力的新途径;2016年12月,工业和信息化部正式印发了《大数据产业发展规划(2016—2020年)》[3],全面部署“十三五”时期大数据产业发展工作,提出以大数据产业发展的关键问题为出发点和落脚点,促进数据开放与共享,深化技术的应用创新;2018年4月,教育部印发《教育信息化2.0行动计划》[4],提出利用大数据技术为学习者提供海量、适切的学习资源服务,深化教育大数据应用,助力教育教学、管理和服务的改革发展。
1 大数据政策和法规
信息技术的进步带动数据挖掘技术的提高,文本分析能力的拓展以及数据分析速度的提升,推动教育大数据在大规模开放在线课程、智慧学习环境、校园信息化管理等方面的运用。主要发达国家高度重视大数据的发展,颁布一系列政策和法规标准为教育大数据发展提供良好的外部环境。
1.1 美国大数据相关政策
美国是教育大数据研究和应用的领先国家,在技术研究、系统开发、实践应用方面都取得了显著进展。1968年美国联邦教育部成立了全美教育数据统计中心(National Center for Education Statistics),2002年全美教育数据中心与美国教育研究所与合并重组后成立了教育科学研究院(Institute of Educational Science),研究院作为美国重要的教育决策咨询机构之一,是利用数据支持教育教学改革的重要力量。大数据在美国教育评价决策中发挥了重要作用,例如美国联邦政府设立全国教育进展测评机构负责监测美国中小学生学业成就现状和发展趋势,该机构对美国中小学的阅读、数学、写作、科学、历史、地理、公民教育等学科进行了全面测评,其测评结果成为美国联邦政府及各州衡量教育发展、分配教育资源、促进教育改革的重要依据。
2012年10月,美国教育部发布《通过教育数据挖掘和学习分析促进教与学》[5],报告旨在更好地促进美国国内大数据教育应用,指出目前教育领域中大数据的应用主要有教育数据挖掘和学习分析两大方向。数据挖掘和学习分析两个研究方向虽然同源,却在研究目的、研究对象和研究方法等方面截然不同[6]。2013年11月,美国信息技术与创新基金会发布《支持数据驱动型创新的技术与政策》报告,报告指出数据驱动型创新是一个崭新的命题,提出政府应大力培养所需的有技能的劳动力,推动数据相关技术的研发。
1.2 欧盟大数据相关政策
欧盟国家对大数据发展的支持主要表现在3个方面:一是大力推进开放数据战略,二是资助大数据领域的研究和创新活动,三是支持大数据技术与产业的发展。2011年欧盟公开发布《大数据战略》,随后英国和法国先后发布大数据相关行动计划,从国家层面颁布一系列战略规划,见图1。
2011年7月,法国启动“Open Data Proxima Mobile”项目,该项目希望通过公共数据在移动端上的使用,从而最大限度地挖掘其应用价值。2011年11月,英国发布对外公开数据进行研究的战略政策,并于2012年4月成立世界上首个开放式数据研究所(The Open Data Institute,ODI)[7]。2013年2月,法国发布数字化战略图,明确了大数据是未来要大力支持的战略性高新技术。2014年8月,德国联邦政府内阁通过了由联邦经济和能源部、内政部、交通与数字基础设施建设部联合推出的《数字议程(2014—2017)》。
1.3 日韩大数据相关政策
日本和韩国将教育大数据作为学校改革创新的重要驱动力。一方面,建立大数据分析机构,搭建数据收集和分享平台。例如2013年12月,日本政府推出了data.go.jp网站,目的是提供不同政府部门和机构的数据供使用,向数据提供者和数据使用者开放数据;2013年8月,韩国科学、ICT和未来规划部与国家信息社会机构协同成立了韩国大数据中心(Korea Big Data Centre),以促进政府开放数据的分析与应用,成为服务大数据企业的实验基地,并为大学培养大数据专业研究人员。另一方面,日本和韩国颁布了大数据产业发展规划,为大数据的发展提供政策支持。2012年6月,日本IT战略本部发布《电子政务开放数据战略草案》,迈出了政府数据公开的关键性一步;2014年5月,日本政府出台了大数据应用个人数据使用报告,以指导企业使用大数据进行创新产品和服务研发;2014年12月,韩国未来创造科学部提出了“数据产业发展战略”计划,以求进一步推动韩国在数据产业方面的发展及创收。
图1 欧盟教育大数据主要政策时间轴
2 大数据标准研究现状
国际知名标准化组织ISO和ITU-T等都已开展了大数据领域的标准化工作。2015年,国际电信联盟(ITU)批准了首个大数据标准《基于云计算的大数据需求与能力标准》(编号ITU-T Y.3600)。此国际标准详细规定了以云计算为基础的大数据要求、能力和使用案例,以及高级“系统背景”方面的考虑与其他实体间的关系,明确给出了大数据的定义,即为一种允许可能在实时性约束条件下收集、存储、管理、分析和可视化具有异构特征的大量数据集的模式。ISO/IEC JTC1 SC32“数据管理和交换”分技术委员会是与大数据关系最为密切的标准化组织,持续致力于研制信息系统环境内及之间的数据管理和交换标准,为跨行业领域协调数据管理能力提供技术性支持。JTC1/SC32现有的标准制订和研究工作为大数据的发展提供了良好基础,其标准化技术内容见图2。
图2 SC32标准化技术涵盖内容
此外,ISO/IEC JTC1 SC36专门成立了教育大数据相关标准工作组(WG9),基于大数据的智能学习环境建设技术等相关标准成为研究的焦点。
美国在通用教育数据标准方面走在发达国家前列。美国国家教育统计中心于2009年设立技术工作组,为教育核心数据元素制定了切实可行的、公共的数据规范。美国通用教育数据标准 CEDS(Common Education Data Standard)设计了不同受教育阶段产生的数据的层级模型,提供相应的数据匹配和研究工具。CEDS对给定数据元素的名称、定义、选项集和技术说明形成的一套公共集合,包括一个“域”和“实体”的层级模型和一个完全规范化的逻辑模型,其数据模型见图3[8]。CEDS的基础教育部分下设12个子项目,包括基础教育课程、课程单元、当地教育机构等部门,开发者可以通过CEDS设计出新的标准数据库系统,或连接到已存在的标准数据库系统。此外,美国国家标准与技术研究院(National Institute of Standards and Technology)建立了大数据公共工作组,工作组下设术语和定义、用例和需求、安全和隐私、参考体系结构和技术路线图5个分组,目前已经完成了大数据定义、大数据分类、大数据用例和需求、大数据安全和隐私需求、大数据参考架构调研白皮书、大数据参考架构和大数据技术路线图等输出物V1.0版本,于2015年5月21日前征求意见,同时进行V2.0版本的工作。
图3 美国CEDS数据模型
我国教育大数据标准相关工作也在有序展开。2014年12月,全国信息技术标准化技术委员会大数据标准工作组正式成立。工作组主要负责制订和完善我国大数据领域标准体系,组织开展大数据相关技术和标准的研究,申报国家、行业标准,承担国家、行业标准制修订计划任务,宣传、推广标准实施,组织推动国家标准化活动,对口ISO/IEC JTC1/WG9大数据工作组。2015年7月,工作组正式成立7个专题组,包括总体专题组、国际专题组、技术专题组、产品和平台专题组、安全专题组、工业大数据专题组、电子商务大数据专题组。
3 教育大数据标准化推进建议
1)完善教育大数据标准的体系框架。
教育大数据标准的体系框架是教育大数据的基本标准体系,具体包括教育基础数据标准、数据处理类标准、数据分析类标准以及教育大数据服务类和道德伦理标准四大类。其中,数据分析类标准包括学习分析互操作标准、数据序列标准、学习分析可视化标准和参与者画像标准等内容。
2)注重教育大数据隐私保护。
教育大数据在带来便利的同时,也滋生了一系列新的信息安全问题和伦理问题。大数据时代的网络安全要做好网络硬件的维护和常规管理,也要做好信息传播安全以及管理安全的综合性分析,利用数据安全与伦理类标准来保障大数据环境的正常运行。
3)整合优势力量参与标准制订。
教育大数据运用难点主要在于采集、处理和可视化,相关标准的制订离不开企业、教育机构以及研发机构等多个单位的支持和参与。对于标准内容的完善可以采用专业化分工的方式,由相关领域的专家带头,建立涉及教育大数据发展的基础性、方法性、公共性标准和规范。