APP下载

义务教育优质均衡发展数据分析平台的实现

2021-08-02夏道勋唐胜男田星瑜

计算机技术与发展 2021年7期
关键词:县域可视化优质

夏道勋,唐胜男,田星瑜

(1.贵州师范大学 大数据与计算机科学学院,贵州 贵阳 550025;2.贵州省教育大数据应用技术工程实验室,贵州 贵阳 550025)

0 引 言

为了切实落实“努力办好人民满意的教育”的总体要求,以实现教育公平为主线,以推进素质教育为主题,以促进县域义务教育优质均衡发展为核心,努力办好每一所学校,促进每一名学生健康成长和全面发展。通过充分了解教育资源的真实分布情况,各部门严格实施教育改革,切实推进县域义务教育优质均衡发展,使得校际差距、城乡差距不断缩小,以达到义务教育的总体发展要求。该文设计一种基于大数据技术的义务教育大数据动态可视化平台,以促进县域内义务教育优质均衡发展,促进教育公平。县域义务教育优质均衡发展数据分析平台为县域义务教育发展中面临的重点问题和突出问题如“普及十五年教育”“义务教育优质均衡”“城乡教育一体化”“学生综合素质评估”“办学条件改善”等,提供基于评估主题的动态数据支持设计,提升县域义务教育治理体系与治理能力现代化水平。

1 相关工作

中国义务教育进入了“优质均衡发展”新阶段的最重要标志是教育部于2017年4月颁发的《县域义务教育优质均衡发展督导评估办法》(教督[2017]6号)文件,这一举措也促使着全国的义务教育均衡发展往更高水平进步,全面提高义务教育质量。科学合理的决策支持服务能力有利于指导义务教育资源的优化配置,有利于义务教育优质均衡发展的宏观调控,更好实现教育公平。如何对义务教育优质均衡发展进行有效分析和评价,并建立一套合理、有效的义务教育决策支持服务能力评价系统,具有重要的现实意义。

根据大数据分析数据生命周期,优质均衡发展的数据分析前提是有效数据。信息技术发挥“知识传播快、覆盖面广、资源共享”等优势,已逐步实现教育管理、优质教育资源共享、现代远程教育平台搭建、E-learning个性化学习和虚拟教育社区等信息化建设,赋予了教育事业全新的内涵,推动义务教育优质均衡发展,为优质均衡发展数据分析提供了宝贵的数据资源[1-2]。任秀颖等[1]提出了构建教育信息化模式的保障机制,为促进国内城乡义务教育优质均衡发展提供了信息化实践思路。王继新等[2]的研究结果为促进教育均衡发展提供了理论指导意义,提出了采用县域义务教育信息化的方式来解决教育均衡发展的问题。他们从教育公平、教育资源配置和教育生态学三个不同的方面全面分析了四种教学模式,分别是双规制数字学校模式、城乡互助的“双师”模式、有组织的MOOC模式和适切性数字资源全覆盖模式;为了得出更全面的理论体系,进一步对四种模式进行比较分析,且对四种模式的可持续发展提出了实际的建议。针对义务教育优质均衡发展的数据资源需要利用数据抽取、数据转换与数据加载(extract-transform-load,ETL)等技术进行数据采集,将不同类型数据进行业务规则与需求的转换与清洗[3-4]。

数据分析是构建义务教育优质均衡发展决策支持服务能力评价系统的核心。为了解决义务教育优质均衡发展中的难题,提高优质义务教育资源共享的效率,谢剑萍[5]采用战略管理分析方法,提出了义务教育优质均衡发展的战略对策。艾伦[6]对比分析了义务教育优质均衡测量方法,采用差异系数、基尼系数以及均衡指数分别对义务教育优质均衡指标进行测量,比较三种不同测量方法的计算结果,指出均衡指数的非线性特性和非对称性特性在测量分析上体现出来的优势。在数据分析过程中,陈家全[7]构建了义务教育均衡发展评价系统,降低了数据处理的难度,简化了评价环节,使得数据分析更具有操作性和针对性。高军等[8]和沈光辉等[9]研究了学校教育管理服务模式,并构建了基于大数据技术的教育管理服务平台原型,为教育领域创建高效、决策支持平台提供有价值的参考模型。为了进一步揭示对复杂教育规律的理解,辅助教师监督学习过程,提升管理者科学决策水平,余泰等[10]重点阐述了文本数据可视化、多维数据可视化、网络数据可视化、时间序列数据可视化和地理空间数据可视化等5种主流的教育大数据可视化呈现方法,并给出具体的应用场景。

义务教育优质均衡发展必然需要全社会各方面的努力,是一个庞大的且事无巨细的社会工程,需要全社会协调解决义务教育发展过程中的难题,不断推进基础教育均衡发展[11]。科学合理的决策支持服务能力有利于指导义务教育资源的优化配置,有利于义务教育优质均衡发展的宏观调控,更好实现教育公平。该文利用大数据技术,动态、可视化、全自动地生成决策文档,为了更清晰地表明县域义务教育优质均衡发展数据分析结果,采用了分区域、分学校层次、分观测点的方式进行展示,从而创建出具有更全面的教育决策力、更强的教育问题洞察力和教育过程优化能力的决策支持服务平台。

2 分析平台系统设计

为满足义务教育在异构网络环境下业务策略生成和评估的要求,研究根据各类监测数据和分析结果对教育大数据业务影响的评估技术,并结合义务教育优质均衡发展相关策略,重点研究义务教育优质均衡发展的数据分析平台,决策支持服务和决策数据的可视化技术。对现有义务教育各类数据库进行系统分析,涵盖教育、人口、地理、经济等领域,以及对县域义务教育数据积累现状进行调查研究,研发县域义务教育优质均衡发展数据分析平台,丰富县域义务教育优质均衡发展的决策支持能力。

2.1 平台架构设计

县域义务教育优质均衡发展数据分析平台采取Spring MVC+MySQL+Spark设计架构[12],设计有数据源、数据平台、应用服务和展示交互等四个层次,见图1。平台通过ETL技术和离散数据采集,实现县域义务教育优质均衡异构数据汇聚;利用HDFS和Hive on Spark技术,将教育统计数据库、经济社会科技数据库等义务教育相关多源异构数据组建成县域基础教育发展评估系统数据仓储;在数据仓储的基础上,采用Spark MLlib技术实现义务教育优质均衡发展的四个维度进行数据分析;采用ECharts、GIS工具或技术实现数据分析可视化。

图1 县域义务教育优质均衡发展数据分析平台系统架构

2.2 平台功能设计

为了实现义务教育优质均衡发展的评估要求,分析平台从四个维度不同观测点进行综合指标分析,四个维度分别是资源配置、政府保障程度、教育质量和社会认可度,实现分地区级、县区级和学校整体的义务教育优质均衡发展的综合指标分析,以及实现决策支持与预警能力。

资源配置维度一共有7项指标,重点在于评估县域义务教育学校的软硬件配置水平,如学校的仪器设备、校舍和教师等。该维度除了需要精确核算每所学校的资源配置水平,也需要评估校际均衡发展情况,评估达标的规则是每所学校至少有6项指标达标,且余项至少达到要求的85%。政府保障程度维度共有15项指标,重点考核县级人民政府是否依法履职,是否切实落实了国家有关法律、法规和政策要求,是否有效推进了义务教育均衡发展,检查城乡一体化成效等,该维度需要每项指标均达到要求。教育质量维度共涉及9项指标,重点评估县域义务教育普及程度、每所学校管理水平、学生学业成绩质量和学生综合素质发展水平等,该维度需要每项指标均达到要求才能符合评估标准。

社会认可度维度需要设计专门的问卷调查,以学生、家长、校长、教师、政协委员、人大代表及其他群众为调查对象,重点调查县级政府及相关教育职能部分对教育公平政策的落实情况、推动优质资源共享的举措,以及学校是否规范办学行为、加强实施素质教育、有效地改革了考试评估制度、教育质量是否显著提高等,调查结果需要85%及以上的人满意现阶段义务教育。

3 ETL数据抽取与处理

大数据应用的关键在于信息共享与互通,该文采用ETL技术实现义务教育跨领域、跨系统、跨地域的数据共享,为实现义务教育优质均衡发展的数据分析夯实基础[13]。

3.1 ETL数据抽取

在义务教育信息化建设过程中,沉淀了来自不同时期、不同操作系统、不同业务系统和不同类型数据库的数据,如教育事业年报数据、教育财务预决算、国家地区教育比较数据等结构化数据,以及教育有关的文件、报告和社会调查等半结构化数据或非结构化数据。ETL数据抽取是将这些与义务教育相关的数据从异构数据源端经抽取、转换、清洗、装载至数据仓储端的处理过程,如图2所示。

图2 ETL数据抽取框架

3.2 基础数据拆分方法

在某个县域下,建设一所学校是需要考虑特定的历史背景。所以根据不同时期的需要,贵州省建有九年一贯制学校、完全中学、十二年一贯制学校和附设幼儿班等类型的学校。因为同一所学校的学生,不同阶段占用的教学资源不尽相同,所以需要对基础数据进行拆分。下面通过学校类型分类,列举了基础教育数据拆分方法。

3.2.1 九年一贯制学校

九年一贯制学校是指该学校的小学和初中实行一体化教育。拆分方法:首先考虑各学部的办学规模,然后对学校办学条件进行拆分,应按照小学生与初中生为1∶1.1的比例进行分解,最后分各学部按各一所学校纳入统计结果。如下是某所九年一贯制学校小学部校园建筑面积的计算公式:

(1)

3.2.2 完全中学

完全中学是指该学校既设立初中部又拥有高中部的学校,在拆分该类学校办学条件数据时,先根据初中、高中各自的办学规模,学校学生需要按照一定的比例进行分解,例如按照“一个初中生∶一个高中生=1∶1.2”进行拆分,再将该所学校的初中部按一所学校纳入数据统计结果。如下是某所完全中学初中部校园建筑面积的计算公式:

(2)

3.2.3 十二年一贯制学校

十二年一贯制学校是指该学校包括小学、初中和高中三个学习阶段,对该类学校办学条件数据的拆分方法是先根据小学、初中、高中各阶段各自的办学规模,按照“一个小学生∶一个初中生∶一个高中生=1∶1.1∶1.32”的比例进行拆分,再将该所学校的小学和初中两个学段的拆分数据各按一所学校纳入统计。如下是某所十二年一贯制学校初中部校园建筑面积的计算公式:

(3)

3.2.4 附设幼儿班

附设幼儿班是指某小学、初中、九年一贯制或十二年一贯制等学校设有幼儿班教学,也需要涉及基础数据的拆分。拆分方法:小学附设幼儿班:一个在园幼儿∶一个小学生=1∶1;初中附设幼儿班:一个在园幼儿∶一个初中生=1∶1.1;九年制附设幼儿班:一个在园幼儿∶一个小学生∶一个初中生=1∶1∶1.1;十二年制附设幼儿班:一个在园幼儿∶一个小学生∶一个初中生∶一个高中生=1∶1∶1.1∶1.32。相应基础数据的拆分公式和上面类似。

4 数据分析与可视化

通常,差异系数分析法、基尼系数分析法和均衡指数分析法是教育领域进行均衡性水平测量的三种方法[6,14],并且差异系数分析法是教育部相关文件中规定的测量方法,该文重点阐述差异系数分析法。

4.1 差异系数分析方法

计算综合差异系数时,需要比较的数据有生均教学及辅助用房面积、生均体育运动场馆面积、生均教学仪器设备值、每百名学生拥有计算机台数、生均图书册数、师生比、生均高于规定学历教师数、生均中级及以上专业技术职务教师数等。

差异系数分析方法公式表示为:

(4)

4.2 基尼系数分析法

基尼系数由意大利统计学家克拉多·基尼(Corrado Gini)提出,它的最大值为1,最小值为0,其值越接近0则表明被测对象的均衡性越好,计算公式如下:

(5)

其中,n表示被测学校总数,Pi表示第i所学校学生数占全部被测学校学生总数的比例,wi表示第i所学校教育资源占全部被测学校教育资源总数的比例,计算时需要将生均教育资源数进行升序排列,否则会出现负值无效现象。

4.3 均衡指数分析法

艾伦[6]于2012年正式提出均衡指数分析方法,该方法是为了有效测量教育资源配备均衡性而被设计出来的测量分析方法,取值范围为[0,1],取值为0时代表绝对均衡,取值为1时代表绝对不均衡,计算公式如下:

(6)

其中,n表示被测学校总数,Pi表示第i所学校的生均教育资源占所有n所学校生均教育资源总额的比例,log2表示求以2为底的对数,π表示圆周率。

三类数据分析算法能很好地获得县域义务教育优质均衡发展现状和存在的不足,为缩小义务教育城乡、校际差距提供了数据支撑,能够提供解决问题的基本思路,促进了义务教育标准化建设。

4.4 基于GIS技术的数据可视化

数据分析可视化是对县域义务教育优质均衡发展的分析结果进行可视化表达[15-16]。该文利用ECharts+GIS等可视化呈现技术[17],以行政地图作为底本,根据学校的经纬度标注出某所义务教育学校在地图上的地理位置,并用不同大小、不同颜色的圆点进行标注,全局地呈现出省级、地区级或者县域下义务教育优质均衡发展数据分析结果,圆点稠密、颜色偏红的县域义务教育优质均衡发展越发不均衡。

5 分析平台的实现

分析平台以县域义务教育优质均衡发展数据分析为主线,主要实现了平台系统登录、数据抽取、数据分析和数据可视化等功能模块。重点围绕差异系数分析方法,实现了县域义务教育优质均衡发展数据分析和可视化,均包含有幼儿园、小学和初中三个义务教育阶段,以及特殊教育。

5.1 数据抽取

分析平台自动抽取了某省义务教育基本状态数据,形成数据仓储,数据量大,并且数据宝贵,平台的使用者必须要有合法的身份才能登录。平台将用户分为系统管理员、省级教育主管、地区教育主管、县域教育主管和学校管理员等五种角色,每个用户的账户密码采用MD5加密算法,登录时需要输入随机产生的验证码。合法用户登录进入平台后,可根据自己的需要修改密码。抽取每年教育事业年报数据,可实现资源配置、政府保障程度和教育质量三个维度大部分观测点的数据分析[18-19]。教育事业年报主要统计五大类数据,它们分别是县域学校基本情况、教学班数班额情况、学生基本情况、教职工信息和学校办学条件。这些数据每年都需要上报到上级主管部门,每年统计的数据也会存在差异。为此,分析平台提供了方便、快捷的数据抽取接口,可分年/分县域/分学校将所有与优质均衡数据分析相关的教育事业年报数据抽取至分析平台中,存放在HDFS或者Hive on Spark里。

其余所需数据从教育财务预决算库、国家地区教育比较数据库,以及教育有关的文件、报告和社会调查等数据中抽取,实现从异构数据源端经抽取、转换、清洗、装载至Hive on Spark的处理过程。并校验数据仓储中的数据是否出现字符、数字不规范的情况,查找数据项是否缺失,校验数据项是否准确。如果存在上述等问题,需要采取措施,确保数据的准确性、完整性、一致性和时效性。根据数据分析的需要,平台可动态地修改社会调查问卷,为每所学校提供动态调整数据采集接口的功能。

5.2 县域义务教育优质均衡发展分析

平台分别对某省县域下幼儿园、小学、初中和特殊教育的四个维度进行优质指标、优质差异系数、优质基尼系数和均衡指数分析。该文重点阐述小学阶段的县域义务教育优质均衡发展数据分析和可视化。

某县域下小学阶段资源配置7个优质指标数据分析。共评估的指标分别是每百名学生拥有高于规定学历教师数、每百名学生拥有县级以上骨干教师数、每百名学生分别拥有体育/艺术专任教师数、生均教学及辅助用房建筑面积、生均体育活动场馆面积、生均教学仪器设备值和每百名学生拥有网络多媒体教室数。

相应功能的操作均在主页面左边的菜单导航栏中,点击某县域下的数据分析菜单,相应的评估分析数据即可呈现到页面的右边显示区域。在平台上,红色数字的部分表明该所学校对应的指标未达到评估标准,黑色数字部分表明该所学校对应的指标已达到评估标准。所有图表均可实现打印和数据导出功能。

某县域下小学阶段优质均衡差异系数分析。小学阶段的优质均衡差异系数评估了各学校教学及辅助用房面积、各学校体育运动场馆面积、各学校教学仪器设备值、各学校网络多媒体教室数、各学校高于规定学历教师数、各学校体育和艺术学科专任教师数和各学校骨干教师数的生均值等指标。其设计思想与优质指标数据分析基本相同。

5.3 优质均衡发展数据分析可视化

数据分析可视化展示了县域义务教育优质均衡发展的分析结果。利用ECharts+GIS技术,以某省地图作为底本,用附有学校名称的圆点标注出全省每所义务教育学校所在的地理位置,并根据该所学校各项指标分析的结果,将圆点用不同大小、不同颜色表示,非常直观地展示出该县域下每所学校整体达标情况。

在地图页面中,如果某圆点的颜色越红,说明该所学校离达标指标相差越远,圆点的面积也越小;如果某圆点的颜色越绿,说明该所学校越接近优质均衡评价指标,圆点的面积也越大。该功能可单击页面区域中的“图表切换”按钮,便可打开对应数据分析的可视化展示功能。

5.4 均衡发展决策平台

均衡发展决策平台是根据某省、某地区、某县域下所有学校四个维度的综合分析结果,全面、直观地展示在对应地域之上。在不同辖域下,绿色越多的辖域表示已达标的学校越多,红色越多的辖域表示未达标的学校越多。点击不同的辖域或者学校,系统会给出未达标的具体原因,同时可以自动生成数据分析报告,列举出整改建议。

如果想获得某个辖域下的义务教育优质均衡发展综合数据分析结果,可通过移动鼠标至地图上该辖域,双击鼠标左键,平台会自动跳转至目的辖域,其右边指标明细指示器也会自动更新该辖域的评估数据。辖域可分为省级、地区级、县级和校级四个级别,其操作方式和数据呈现方式均相同。

6 结束语

大数据的潜在价值已被不断地挖掘和使用,它正在悄然地改变世界,也在改变着基础教育的发展。县域义务教育优质均衡发展数据分析平台通过对大量义务教育相关数据进行抽取、整理和仓储;对某省县域下幼儿园、小学、初中和特殊教育等义务教育阶段的四个维度众多评价指标进行优质指标、优质差异系数、优质基尼系数和均衡指数分析。该分析平台不仅能够帮助教育管理者判断某学校是否满足教育需求,制定科学的教育决策和整改措施,而且能够充分了解某县域教育系统的典型特征,精确评估义务教育优质均衡发展的进程状况。

猜你喜欢

县域可视化优质
发酵工艺为获得优质沙棘酒提供基础
数据可视化设计在美妆类APP中的应用
基于融媒体环境的县域媒体技术创新
思维可视化
县域经济 绥德“网上货运港”
妊高症护理中优质护理的应用
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
复变函数共形映射的可视化实验教学
复变函数共形映射的可视化实验教学