大数据支持下的农村留守儿童学业成绩预警系统研究
2017-08-08丁世强赵可云
丁世强,赵可云
大数据支持下的农村留守儿童学业成绩预警系统研究
丁世强,赵可云
新型城市化建设过程中,农村留守儿童由于缺乏父母的照顾,导致他们在学习发展中存在着不同程度的问题。近年来,针对这类问题,许多学者纷纷提出解决方法,这些措施和方法在一定程度上虽然可以改善留守儿童的学习现状,但是还存着经验性、宏观性和滞后性的问题。随着大数据时代的来临,利用大数据技术提升留守儿童的学习成绩,发挥其个性化、微型化和及时化的优势,可以弥补传统解决措施的不足。文章基于留守儿童的特殊性,提出了一种大数据支持下基于离群数据挖掘的学业成绩预警系统,形成了一套类似气象灾害的红、橙、黄、绿、蓝五级预警表,并对这一系统在实际运用可能遇到的问题进行了剖析。
大数据;留守儿童;学业成绩;预警系统
近年来,国家和社会越来越重视留守儿童问题。教育部在2005年提出的《关于进一步推进义务教育均衡发展的若干意见》中明确规定了关于农村留守儿童的教育问题,指出“地方各级教育行政部门和学校要有针对性地采取措施,及时解决进城务工农民托留在农村的留守儿童在思想、学习、生活等方面存在的问题和困难”[1]。2016年1月27日,国务院常务会议上提到“决不能让留守儿童成为家庭之痛社会之殇”。毫无疑问,无论是从国家、社会、家庭还是留守儿童本身来看,解决农村留守儿童的学业问题都有重要意义。随着大数据时代的到来,大数据与教育相结合已成为不可阻挡的趋势,利用大数据分析技术,对留守儿童在学习过程中产生的学习数据进行分析,建立他们的学习行为模型,发现其存在的学习问题,并及时进行预警,可为问题的解决开拓新的理论与实践研究视角。
一、目前农村留守儿童面临的学业成绩问题
研究表明,留守儿童的学习问题、心理健康教育问题、思想道德品质和社会化问题等是农村留守儿童的主要教育问题,[2]尤其是在学习方面面临着更多的问题。据调查,有60%以上的留守儿童学习成绩较差,还有不少已对学习失去了兴趣。[3]留守儿童的父母平时不在身边,他们的监护人也往往是临时的或者隔代的,“重养不重教”现象非常普遍。有调查表明,74.96%和84.2%的留守儿童祖辈只有小学及以下文化程度。[4]另外,留守儿童在学习过程中自觉性往往比较差,甚至有许多留守儿童出现逃学和辍学的现象,学习成绩大都处在中下等水平。[5]
由此可见,留守儿童的学业成绩问题非常突出,他们的学业成绩会受到社会、学校、家庭等许多方面的影响。在留守儿童所在地区,社会政治经济条件较差,学校缺乏促进他们学习的学习资源,父母不能陪在身边辅导其学习,在这样的环境下,他们在学习方面所面临的困难异常巨大。很多留守儿童对学习失去信心,最终出现厌学、逃课等现象,有些甚至参与了社会不法行为,走上了犯罪的道路。解决留守儿童学业成绩的问题,引导其健康成长是促进他们实现个体人生良好发展的重要路径。
二、大数据预警留守儿童学业成绩的价值
1.已有留守儿童学习成绩问题解决路径的局限性
已有针对留守儿童学习问题的解决路径,一般从家庭、学校和社会等3方面出发,从不同的角度解决他们的学习问题。例如史晖认为,留守儿童的教育是一项社会系统工程,需要政府、学校、家庭和社会合力构建支持体系,共同解决留守儿童的教育问题。[6]张俊良、马晓磊认为,父母应加强亲子教育以及营造良好的家庭教育环境,留守儿童所在学校应实施寄宿制度以及建立特别的档案管理制度等措施,政府在政策方面也要进行政策创新和引导。[2]张文诺认为,要有效解决农村留守儿童的教育问题,就要大力发展农村寄宿制学校,重视对农村留守儿童的心理健康教育,加快农村基础教育改革,树立以学生为中心的建构主义学习观。[7]
这类宏观性的解决方法,对于解决农村留守儿童的学业成绩问题虽具有一定的指导意义,但也存在着一系列问题,主要表现为:(1)解决措施具有经验性。针对留守儿童的教育决策往往是经验性的,缺乏真实可靠的数据,这也是教育决策一直存在的诟病。(2)解决措施具有宏观性。已有解决措施针对的是所有的留守儿童学业成绩问题,而事实情况是虽然他们的学习成绩普遍较低,但是其面临的问题却各不相同,有的可能是缺乏学习兴趣,有的可能是学习方法不适合,有的可能是学习态度问题等,所以,解决措施缺乏一定的针对性。(3)解决措施具有滞后性。已有策略,只有当留守儿童学习问题出现甚至非常严重的时候,才会被教师、家长等人员所察觉,时机略显滞后,此时解决问题可能要付出更多的人力和物力。(4)解决措施忽视心理因素。留守儿童受社会环境、家庭环境等影响,他们的心理要比非留守儿童更加脆弱,而心理健康状况直接影响其学习的积极性和学习效果,所以他们的心理因素对学业成绩的提高有重要作用。
2.大数据预警留守儿童学业成绩的可能性与特征
目前,国家和政府正在加强教育与大数据的融合。2015年8月,国务院发布了《促进大数据发展的行动纲要》,文件指出:“数据已成为国家基础性战略资源”,并在启动的十大工程之一“公共服务大数据工程”中明确提出要建设教育文化大数据。[8]如果教师能够在课堂中合理地运用数据,就可以有效了解学生的学习情况,发现其学习中的问题并制定改进计划,这对于提升教学质量以及缩小学生间的差距有重要意义。[9]
大数据对于解决农村留守儿童的学业成绩问题体现出了新的优势及可能性,具体表现为:(1)大数据能够实现留守儿童学习的个性化。利用大数据提升学习成绩,其对象不再是宏观上的社会、学校和家庭,而是具体到留守儿童个体的学习及心理数据,这些数据对于其他对象没有意义,是高度个性化特征的体现。通过对个体学习行为及心理数据的收集,建立符合个体的行为模型,智能化地预警其当前存在的学习问题,并给出合适的干预性建议或措施[10],从而实现留守儿童的个性化学习。(2)大数据能够实现学习的微型化。利用大数据技术能够在不影响学习的情况下,随时随地地跟踪、记录、分析留守儿童的学习行为数据。教育大数据能够关注每个留守儿童的微观表现:在什么时候翻开书本,先做哪道题、后做哪道题、某道题思考时间、修改次数等等,收集微观层面的学习行为数据。(3)大数据能够实现留守儿童学习的及时化。利用大数据的分析和预警功能,能够及时地了解该留守儿童当前的学习情况和心理问题,从而推送出符合其学习及心理方面的建议和方法,及时解决其面临的学习和心理问题,避免了学习问题的进一步恶化。
三、大数据下留守儿童学业成绩预警系统的构建
有研究通过比较留守儿童与非留守儿童的学校适应情况发现,前者存在更严重的心理和性格方面的障碍,表现出更多的越轨行为,心理健康状况直接影响其学习的积极性和学习效果,所以对于留守儿童心理数据的收集至关重要。另外,留守儿童的家庭往往处于亲子分离的状态,不同模式的监护管教对他们的影响也不相同。留守儿童监护人对他们的管理相比非留守儿童更趋宽松,许多更是放任其自我发展,明显影响到留守儿童的生活学习质量。在这种环境下,学校应成为干预留守儿童学习行为的主阵地。
1.农村留守儿童学业成绩预警系统结构
留守儿童学业成绩预警系统结构主要包括:界面层、应用层、支撑层和基础层等4部分,如图1所示。界面层包含了学生登录、教师登录以及家长登录等3种方式,以方便不同身份的人使用。系统使用学生学号+身份证号码、家长姓名+身份证号码、教师编号+身份证号码登录,主要确保采集到的留守儿童学习信息及个人信息的安全性。应用层是核心层,包括了数据的录入存储、数据分析以及预警系统。输入和存储系统将采集到的留守儿童学习数据输入系统中,并保存数据;数据分析系统主要是对数据进行有效的挖掘,通过各种大数据分析技术分析留守儿童学习行为数据,建立学习对象的学习行为模型,发现其存在的学习问题和潜在的困难;预警系统主要负责预警分析、预警发布和干预措施的提出。支撑层包含了该系统提供的主要服务类型,如存储服务、多媒体服务和通信服务等服务类型。基础层是系统的基础部分,包括基本的操作系统、所需的网络设备和服务器等。
2.留守儿童学业成绩预警的流程模型
基于之前对留守儿童学业成绩预警系统结构的建立,同时结合大数据分析及农村留守儿童学业成绩预警的逻辑,形成了留守儿童学业成绩预警流程图,如图2所示。
(1)留守儿童学习数据的来源
图1 农村留守儿童学业成绩预警系统结构
随着“三通两平台”的建设、精品开放课程建设以及全国数字校园、区域教育云的建设和完善,在大数据环境下,能够对留守儿童的学习行为进行跟踪、记录、分析。本文所涉及的留守儿童学习数据来源主要包括4个方面:留守儿童、课程、课堂和心理状况。从这些角度综合地收集留守儿童的学习数据,使数据的采集更加完善[11],更加全面地了解他们的学习情况。第一,留守儿童数据是指其基本信息,包括姓名、性别、年龄、监护人等。收集基本信息主要是为了对其个人和家庭的了解。第二,课堂学习数据是指留守儿童在课堂学习过程中所记录的学习行为数据。本文将课堂数据分为行为数据、认知数据、表情数据,这些数据主要通过监控设备来获取,主要包括上课认真听讲的时间数据、玩手机的次数、与教师的互动次数、与其他学生讨论的参与数据、微笑次数等,一切能够反映学生学习情况的数据都可以通过监控设备记录下来。第三,课程数据是指与所学课程相关的数据,具体指课程作业情况、知识点的掌握情况以及课程的平时成绩和期末考试成绩等。这些数据与传统的数据相似,主要来源于留守儿童的数据库。第四,心理数据主要是通过问卷调查和访谈建档的形式获取。采用周步成等修订的《心理健康诊断测验》来对留守儿童的心理健康状况进行数据收集;访谈的对象包括留守儿童的监护人、学校老师、同学、村干部等人员,收集的内容包括他们对留守儿童的认识、看法和家庭成员外出务工给留守儿童带来的影响等。
图2 留守儿童学业成绩预警流程图
(2)留守儿童学习数据的采集
数据的采集是最基础的一步,心理数据的采集可以通过调查和访谈的方式获得,而针对留守儿童学习行为的数据采集,目前常用的数据采集技术有视频监控技术、点阵数码笔技术、智能录播技术等,能够在不同的时间、地点采集留守儿童的学习数据,保证数据的准确性,具体情况如表1所示。
表1 留守儿童学习数据采集技术及采集内容
(3)留守儿童学习数据的预处理
数据的预处理主要是对已经采集的留守儿童各种学习数据,进行分类、“去噪”以及进一步的存储。通过数据预处理环节,能够将收集到的各种学习数据转换为合适的数据类型,而且对数据的“去噪”和清洗还能保证数据的质量和可靠性,这是在进行农村留守儿童学业成绩预警中必不可少的一步。
(4)留守儿童学习数据的分析
学习数据分析是整个预警系统的核心部分,只有通过数据分析才能发现数据所具有的潜在价值。学习成绩预警系统将留守儿童学习过程中的视频数据、声音数据、表情数据、行为数据等转化为相对应的具体数值,例如,将视频数据转变为认真听讲的时长、回答问题的次数、交头接耳的次数、玩手机的时长、挠后脑勺的次数等;将行为数据转变为点击鼠标次数、鼠标停留时长、完成某道题时长、修改次数等;将表情数据转变为微笑的次数、皱眉的次数等。这样就把复杂的数据简单化,转变为一个个的小数据,方便数据的存储和处理。本预警系统主要是针对在学习过程中存在问题的学生,为此,学业成绩系统采用的数据挖掘方法是离群数据挖掘法,离群数据是指偏离正常数据,而不是偏离大部分数据或一般数据。
本文离群数据挖掘的思路:在一个具有n个数据的集合中,首先给出一个正常标准,然后根据已有的离群数据挖掘算法,如基于统计的离群数据发现方法、基于距离的离群数据发现方法、基于偏离的离群数据的检测方法等,挖掘出与正常数据存在显著差异的数据d(d (5)留守儿童学业成绩的预警判别 通过对学习数据的离群挖掘和分析,发现存在学习问题的留守儿童,然后进行相应的预警和反馈。针对农村留守儿童学业成绩的预警判别表,笔者借鉴了金义富2类6级信号及判别表[11],采用了类似气象灾害的预警信号,建立了留守儿童学业预警信号判别表,用红、橙、黄、绿、蓝5类颜色进行可视化输出,如表2所示。 表2 留守儿童学业预警信号判别表 (6)留守儿童学习及心理的干预方式 武法提将利用大数据技术进行的学习干预定义为:“为了帮助学习者克服学习困难,顺利完成学习,以基于学习过程的教育大数据的分析为基础,针对每位学习者的具体学习状态而实施的各种支持性策略和指导性活动的综合。”[12]笔者借鉴学习干预的定义,提出了几种进行留守儿童学习干预的方式。留守儿童自己登录系统,查看个人当前的学习情况以及是否存在学习问题,若存在问题可以根据系统给出的建议进行改正;家长也可以随时随地地登录系统帮助留守儿童发现存在的学习问题,及时地督促其学习,妥善解决问题;同样,教师也可以登录系统查看每位学生的学习情况,对于存在问题的留守儿童,教师可以直接与其进行沟通交流,也可以通过电话短信的方式与他们的家长联系,让家长与留守儿童沟通及时解决问题;学校管理层人员也可登录该系统随时查看学习问题严重的留守儿童,并及时与其班主任和家长取得联系,共同解决存在问题。 对于留守儿童心理干预的策略与方法,采取的策略可以有:(1)个体筛查,重点关注。教师及学校管理人员可以通过对留守儿童建立的档案及相关访谈,进行全面的测评,对筛选出存在问题的留守儿童进行重点关注,然后通过心理教师提供相应的咨询辅导,班主任也要做好后续的动态观察。教师一定要做好相关的保密工作,以免个人信息传播带来更大的负面影响。(2)团体辅导,心理提升。通过对心理数据进行整体统计分析,找到留守儿童产生问题的行为与心理状况之间的相关性,以行为为指标,以心理数据为预测,通过逐步回归分析找到心理数据对各问题行为的预测性。通过以上策略能够有针对性地提升留守儿童的心理资本短板,降低问题行为的发生率。 1.留守儿童数据采集缺乏资金和技术的有效支持 预警系统的第一步是对学习数据的采集,数据采集面临的第一个挑战是技术设备问题。因为数据的采集离不开数据采集技术设备的支持,首先这些设备都比较昂贵,其费用可能是留守儿童所在学校无法承担的;其次是数据采集技术的限制,学习数据种类和结构非常复杂,要想真正地采集到需要的数据,需要更加先进的数据采集技术的支撑。另外,本文针对心理数据的采集方法为调查问卷及其相关人员访谈,目前还没有完全利用大数据技术进行心理数据采集的技术支持。 2.留守儿童数据采集实施难度大 留守儿童所处地区往往文化观念落后,他们的监护人、教师及其相关教育部门必然存在对大数据技术的质疑,所以在数据的采集与实施过程中需要对有关内容进行相应的普及。同时,由于数据采集涉及课外的学习数据,而留守儿童的家庭方面往往没有计算机及网络设施的提供,所以课外学习数据的采集困难重重。 3.留守儿童学习数据的处理和分析难度大 首先,在农村留守儿童学业成绩预警系统中,数据的分析是最重要的一个模块。数据具有一定的时效性,随着时间的流逝,数据中所蕴含的知识价值也逐渐衰减,这给数据的分析带来了极大的挑战。若不能及时有效地进行数据处理分析,那么数据的价值将大打折扣。其次,大数据时代的学习数据结构复杂、类型多样,往往是半结构化和非结构化的数据,目前针对教育大数据的分析技术并没有普及,数据分析能不能真正实现对学习数据的分析功能,仍值得大家思考。 4.留守儿童的学习数据缺乏安全性 随着大数据与生活的关系越来越密切,教育大数据几乎记录了农村留守儿童的所有学习信息,这些数据不可避免地涉及农村留守儿童的隐私,然而目前还没有具体的关于大数据信息安全的管理细则。如果关于留守儿童的数据外泄,将会对他们今后的发展产生不利的影响,所以还需高度重视教育大数据的隐私安全性,要加强学习数据的安全建设,保证大数据环境下留守儿童学业成绩预警系统地安全运行。 留守儿童学业成绩预警系统,能够收集到之前无法获取的数据,并通过大数据分析技术进行学习过程的分析,及时发现他们当前存在的学习问题和潜在的心理问题,然后通过教师、家长和学校管理层等人员进行学习干预,以促进其学业成绩的改善。随着国家对于留守儿童地区的不断建设、社会对留守儿童关注度的增加以及大数据技术的逐步成熟,利用大数据来预警留守儿童的学业成绩,具有切实的实践可行性。利用大数据对留守儿童学业预警,对于促进他们学习能力发展,实现他们的健康成长具有重要社会现实意义。 [1] 范先佐,郭清扬.农村留守儿童教育问题的回顾与反思[J].中国农业大学学报,2015(1):55-64. [2] 张俊良,马晓磊.城市化背景下对农村留守儿童教育问题的探讨[J].农村经济,2010(3):102-105. [3] 谭深.中国留守儿童研究述评[J].中国社会科学,2011(1):138-150. [4] 全国妇联课题组.全国农村留守儿童状况研究报告[Z].农村留守儿童工作信息,2008(4):34-37. [5] 辜胜阻,易善策,李华.城镇化进程中农村留守儿童问题及对策[J].教育研究,2011(9):29-33. [6] 史晖,王德勋.农村留守儿童的教育问题及对策研究[J].教育探索,2008(9):89-90. [7] 张文诺.农村留守儿童教育问题研究——以甘肃省农村留守儿童教育为例[J].教育理论与实践,2013(14):21-23. [8] 杨现民,唐斯斯,李冀红.发展教育大数据:内涵、价值和挑战[J].现代远程教育研究,2016(1):50-61. [9] 顾小清,薛耀锋,孙妍妍.大数据时代的教育决策研究:数据的力量与模拟的优势[J].中国电化教育,2016(1):56-62. [10] 杨现民,王榴卉,唐斯斯.教育大数据的应用模式与政策建议[J].电化教育研究,2015(9):54-69. [11] 金义富,吴涛,张子石,等.大数据环境下学业预警系统设计分析[J].中国电化教育,2016(2):69-73. [12] 李彤彤,黄洛颖,邹蕊,等.基于教育大数据的学习干预模型构建[J].中国电化教育,2016(6):16-20. 责任编辑 张军涛 Study of Children Left Behind the era of Big Data Academically Warning System DINGShi-qiang,ZHAOKe-yun/ QufuNormalUniversity In the process of new urbanization, the left-behind children in rural areas have different problems in learning and development due to lack of parental care. In recent years, many scholars have proposed solutions to these problems. Although these measures and methods can help improve the learning situation of left-behind children to a certain extent, there are still problems of being empirical, macroscopic and lagging. With the advent of the era of big data, it can fill the failings of the traditional measures to improve the academic achievements of the left behind children by utilizing the big data technology and making full use of its individualized, miniaturized and timely advantages. This paper presents an early-warning system of left-behind children academic achievements based on outlier data mining in big data environment, and forms a five-level warning table marked by red, orange, yellow, green and blue, which is similar to a meteorological disaster warning table. It analyzes the problems which may occur in the practical application of the system. Big Data; left-behind children; academic achievements; early warning system 2017-03-01 10.13425/j.cnki.jjou.2017.04.011 丁世强,曲阜师范大学传媒学院教育技术学专业硕士研究生,主要从事儿童学习能力发展、教育信息化方面的研究(1476099149@qq.com);赵可云,中国教育大数据研究院,曲阜师范大学传媒学院副教授,教育学博士,主要从事教育大数据、儿童学习能力发展等方面的研究 国家社会科学基金项目“农村留守儿童学习社会化的影响因素及新媒体干预机制研究”(15CSH054)四、大数据预警留守儿童学业成绩可能面临的挑战