APP下载

基于大数据分析学习辅导型题库智能优化价值研究

2019-05-24王丽彬王华

电脑知识与技术 2019年4期
关键词:个性化教学数据分析大数据

王丽彬 王华

摘要:大数据在教育领域的应用给教育带来了重要的变革,教学资源题库在教学中的应用为学生提供了多元化的教材,学生教学平台上产生的学习数据改变了教学评价体系,促进了智慧型教师的发展,实现了以学生为中心的现代化教育。为本文运用大数据的数据分析技术对某数据库题库中三到六年级语数英三个科目的测试题目进行分析挖掘,以为教学、辅导及题库优化提供支持,促进教学资源平台在教育教学过程中的合理应用,为教师对学生进行个性化教学提供支持策略。

关键词:个性化教学;大数据;数据分析;教学资源题库

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2019)04-0009-03

1 前言

随着互联网+和大数据产业的发展,教育领域也随之发生着变革,大数据在教育领域的应用,改变了传统的教学模式与教师角色。在传统教学课程中,教师掌握着绝对的话语权,以知识权威者的姿态向学生传递知识,忽视学生在学习过程中的主体地位,缺乏有效的师生交互,学习过程强调学生的机械记忆与知识复述,教学信息的传递是单向性的,学生无法在原有经验基础上建构有意义的知识。大数据促进了教师角色的转变,教师由知识的传授者转变为课堂的组织者、引导者、促进者,在教学过程中充分发挥学生的主体性地位,促进学生在学习过程中的主动性与创造力的发展,实现“教”和“学”的双向沟通,并且能够适时地对学生的学习情况进行反馈并建立有效的互动交流,完成以学习者为中心现代教学理念。

2012年Brookings Institute 研究机构的研究报告指出大数据能够探查学生的学习和表现[1]。教育工作者通过大数据技术能深入了解学生知识盲点及难点;也能够通过大数据技术为学生提供合理的教学计划和课程安排。大数据对教育的改革是颠覆性的,从以往靠成绩认识学生到根据全方位数据来了解学生;从停留在表面的成绩到运用测验、考后数据分析结果为学生提供更好的教学。此种基于数据分析的教育服务,将会成为教育界的必要模式。大数据系统平台上的教学,能够及时地捕捉学生产生的学习数据,通过对数据的分析、挖掘,能够对学生的学习动态进行及时的评价与反馈,以了解学生的发展与变化,优化学习资源库为学生提供更加适宜学生发展水平的教学资源以促进学生的个性化发展。

2 大数据在教育领域中的应用

2.1 大数据的定义

大数据又称巨量数据,指数据量大到人们不采用工具的前提下无法在合理的时间内对数据进行解读。大数据拥有以下4个特点,又称为4V,Volume,数据量巨大,数据级别在PB以上;Variety,数据的类型多种多样,如文本文档、XML、二进制文件等;Velocity,处理数据速度快,短时间内提取数据价值;Value,数据隐藏巨大价值,只要进行合理的运用都能带来巨大的价值。

2.2 大数据的运用模式

大数据产业在发展的过程中,通过不断的学习与摸索,借鉴其他产业的数据运用进而形成大数据从数据收集到得出数据的价值,最后运用数据存在的价值的运用模式。大数据技术的运用分为以下四个步骤:数据采集、数据导入/预处理、数据统计/分析、数据挖掘。数据采集是通过web应用、APP、网络爬虫等收集数据;数据导入/预处理是指运用数据处理技术对数据进行预处理并导入数据仓库;数据统计/分析是指在数据仓库里对数据做统计分析,初步提取数据的价值;数据挖掘是指通过数据挖掘技术,挖掘出数据里的价值。

2.3 教育大數据及应用价值

美国于1968年成立教育数据统计中心,全国性的成绩评测体系于1969年完成,用来检测学生的学业成绩以及预测学生成绩的趋势[2];2002年美国通过的教育科学改革法中确定数据在教育领域中的决策作用[3];2012年美国教育部年发布《Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics》报告,对美国的教育大数据的发展、运用领域、案例、挑战以及建议进行说明[4]。2014年我国教育部印发的《2014年教育信息化工作要点》指出要推动我国教育大数据的发展,同时教育大数据应用列入教育信息化工作中[5]。以上所述表明大数据在教育领域中具有重要作用。

当前应试教育背景下,老师主要是通过学习成绩来了解学生,而对教师教学质量的评价也基于学生学习成绩,教师对学生真实的学习现状知之甚少。然而大数据分教育行业带来改革:①实现个性化教育。大数据背景下,收集学生学习的数据变得愈加容易,运用大数据分析学生的学习数据能为学生提供个性化的教学辅导,实现精准教学,促进学生发展。②真正了解学生。全方位、长期的数据收集,为我们全方位了解学生提供数据基础,能深入成绩背后了解学生,摆脱了老师对学生仅停留在课堂和成绩表面的肤浅了解。③为教育决策提供数据支持。在经济领域,企业决策中商业智慧(Business Intelligence-BI)系统起着很重要的作用,商业智慧(BI)应用也是大数据应用的一种,从BI系统在经济领域的作用可以看出,大数据在教育领域的决策作用是重要的,创造教育智慧(Education Intelligence,EI)同样可为教育的决策提供了重要的数据支持。

2.4 国内题库运用与发展

互联网时代的到来推动线上教育的发展和在线测试系统的发展,在线测试系统的核心是题库,良好的在线测试系统应有良好的题库。

国内的题库发展都是不断的收纳新题目,对旧题、老题很少投入时间去维护,最新纳入的题目能测试当前学生对知识点的掌握情况,而旧题的测试实证往往和旧题定义不相称,出现这种现象的原因是因为旧题是在纳入题库时其题目设计与当时学生能力相符,经过一段时间的测试训练后与现有学生能力出现不相称现象。

忽视对旧题的维护更新,长时间后就会造成学生测试与题目自身定义的部分属性出现不相称现象。长久下去,题库对学生的能力测试就会出现差异性,测试就不能正确的反应学生的学习情况。一个良好的测试系统需要对题库进行维护,能够完整反映被测者的能力状况,一个处于维护、更新的题库就是一种活着的题库,这也是题库数据在未来的运用中更有发挥新的作用,使得测试数据更有价值的题库。

3 教学资源系统数据库分析研究

本研究对福建某辅导管理平台(VOSMaP)的题库中的题目难易度定义与题目测试后留下错误率的差异性研究。该平台集测试、题库、教学管理于一体。系统包含携学测试数据、用户信息数据、学生测试数据、题库数据等,数据库表39张,本文的研究主体是题目定义难易度与题目错误率的差异性,涉及的数据主要有题库数据以及学生测试数据。

3.1 语数英错题总体分析

该平台(VOSMaP)在设计题库时对题目的难易度、所属知识点等信息都有明确定义。本文针对此平台的题库以及测试部分的数据进行数据分析并對结果进行探究。

在提取数据阶段,本文运用SQL针对题库以及学生测试数据进行清洗提取,最终数据包含了题目的难易度(易 = 1,中 = 3,难 = 5)、错误率及题目相关的知识点等信息,如下图所示:

数据显示,部分题目难易度的定义与题目对应的错误率存在不相称现象。本文据此问题对数据进行了更深入的研究。在进一步数据统计处理后,本文的数据部分包含了1563道错题,其中错误率与难易度定义不称的有672道题目,占总题数的43%。原题目难易度定义如下:错误率小于45%的题目定义为简单题;错误率在45%到75%之间的题目定义为中等题;错误率大于75%的题目定义为难题。从这里我们可以发现两项可能的判断,该平台2011年中设计题库时,存在:(1)当时出题人员对小学3-6年级科目知识点难易分级的认知,与2012-2013年小学3-6年级学生对该知识点难易分级的认知存在相当落差。(2)对2012-13年当时的3-6年级学生在知识点分类的测错比值的非法,将取(0,1)之间(0.45,0.75)切分的三级比率与学生水平实际的切分并不十分相称。由此分析可见,用于测知学生知识点学习效益的核心题库,实质存在出题与测题学生的(时序)及(知识认知)的高度相称性的问题;其现象也提示,任何题库的完备都是一时可用,要真正符合测知问题及以个人化或群化解决知识学习问题的过程,以运用的题目,必须长期持续优化,成为有机性且智慧高的题库,只有(测与知)相称的目标水平。

上图为错题分布的核密度图,横轴代表题目的错误率,纵轴代表题目的错误密度,从上到下分别是简单题、中等题、难题的核密度图。从图中可以直观地看到,容易题的错误率普遍在0.5以下,错误率在0.1左右时的密度最高,这样的分布是比较科学的;中等题的错误率均匀地分布在0.7以下,在0.1是密度最高,这说明被定义为中等题的一部分题目是不相称;难题的错误率主要集中在0.5至0.75,这与上文对难题错误率的定义不相称,说明难题的定义也存在定义与实质的不相称认知。针对上图体现出来的问题,笔者对数据做了更进一步的处理,根据错题错误率、知识点、难易度等信息运用R的tapply()函数得到知识点在不同难易度下的错误率,并运用上述提取的数据做进一步的数据分析挖掘。数据如下所示:

表中第一列表示知识点,第一行表示不同的难易度,难易度与知识点在表中的交集形成不同知识点在不同难易度下的题目错误率。

针对该数据集,本文运用R的kml第三方程序包根据知识点在不同难易度下的错误率进行聚类分析。kml分析函数继承于k-means聚类分析算法,它针对的数据集是纵向数据。对三到六年级语数英三科进行聚类分析得出的结果如图3所示。

根据结果可以看到,笔者运用聚类分析函数KML把所有的知识点分为了6类,其中D类、E类以及F类是题型难易定义与实测结果不相称的知识点。分析如下:D类知识点难中易三类题目错误率都处于一条水平线上,不同难易度题目的错误率没有明显差异。E类知识点难题的错误率比中等题的错误率低,明显不符合逻辑。F类知识点呈现的现象是中等题的错误率比简单题的错误率低,这也是不符合逻辑的。图中A、B、C三类知识点相对正常,随着题目难易度升高,题目错误率也相应地升高,基本上题型难易的认知设计与实证值相称性明较好。

3.2 优化改进

笔者运用MySQL存储过程与MySQL定时器功能提供了一套针对上述现象的解决方案,运用定时器定期对题目难易度根据题目错误率进行修改,从而达到对题库题目难易度自动维护的效果,完整的代码实现请阅读附录B。对 本研究所使用的测验题量与实证错误比率值,将该对错题难易度进行优化后,新的不同难易度错题分布图如下所示。

从优化后的核密度图可以看出,现在简单题错误主要集中在0.45以下,中等题主要集中在0.45到0.75之间,难题则集中在0.75以上,经过这次优化后,错题难易度与题目之间的相称性得到了解决。

4研究过程发现的问题

4.1 题库题型难易度无法准确反应学生的学习情况

本文研究发现,在题型难易程度设计时,设计人员通常会根据以往的经验设计,忽视学生学习经验的发展,因此常出现现阶段题目测试情况反映出的难易度与题目错误率的实证并不相称,学生的学习能力与学习需求是不断发展变化的,例如以前学生的计算能力较强,而现在的学生因为计算器、手机等电子产品的影响,计算能力不如以前的学生;现在的学生因网络或社会开放,接触的信息多,阅读能力比以前的学生能力强,题库的设计没有适时的根据学生的发展水平与认知变化而进行相应的调整,造成学生测试时测试情况与题目难易度设计与实证呈现出不相称性。

4.2 题目难易度与错误率不相称

本文的研究发现,题库中的题目难易度与学生测试的题目错误率存在不相称性。上述的分析结果中得出,福建师范大学学立方教育科技项目知识加值线上辅导管理平台(VOSMaP)题库部分题目难易度设置与学生测试后题目错误率所反映的难易度不相称,上述分析过程中也反映出教师在设计题目难易度时,与学生对题目难易度的认知有一定的不相称落差。形成的原因是多样的,如老师对题目难易度的定义是根据以前学生的能力来定义。背景不同的学生在能力上有差异性,老师在进行题目难易度定义时是根据以前学生能力来定义,所以最新的学生在进行测试后,就形成了题目错误率与题目难易度不符的现象。

4.3 教师教学认知与学生能力存在不相称现象

题目的难易度设计是老师在教学过程中积累的认知经验来进行设置,而当学生进行测试后,发现学生的能力与老师的认知存在差异性,题目与难易程度无法良好的反应学生的认知水平。教师在教学过程中容易形成对知识重难点和对学生认知的固化认知,而学生的发展具有阶段性与个性化的特点,固化的认知无法反应动态的发展,依据教师的认知设置的整齐划一的题目难易程度无法准确反应学生的发展水平与认知能力。

5总结与建议

任何用于评量学生认知发展水平或老师教学效益的题库,其题型设计的难易度必须跟学生认知发展的变化而变化。著名教育家皮亚杰认为学生的发展具有阶段性,不同的发展阶段具有不同的需求。因此,题目难易度的认知定义是需要实证分析及时常维护,题库的有机性及活力是需要题库的维护来实现,有机活力的智慧型题库能够依据学生认知能力的发展变化进行测试评量地同步变化,应根据不同阶段学生的发展需求有针对性地对题库进行优化使之成为智慧型题库,提高学生的学习水平。

教师根据对学生的固化认知和过往经验进行教学会造成知识点难易度之间不相称,教师应在大数据辅助测评下及时了解学生的认知发展水平,从而及时调整教学策略促进学生学习。建构主义强调学生原有的经验背景,认为每个学生都不是空着脑袋进行学习的,他们在以往的学习过程中形成了丰富的知识与经验,教学不能忽视甚至是无视学生原有的经验背景,而应该以其作为新知识的生长点。大数据测评能够追踪学生认知水平的发展变化,有利于教师了解学生学习情况的动态变化,促进教师对学生原有知识经验背景地深层理解,并以此知识的生长点学生制定“最近发展区”促进学生的发展。

良好的學习测试系统可以全面地收集学生学习测试过程中所产生的数据,为系统数据后续运用提供更多的可能。通过对学生学习行为的数据分析,能够及时地对学生的学习情况进行分析与评价,有效的帮助教师及时地了解学生的学习情况,针对学生当前的学习情况有针对进行教学设计,对学生知识点的薄弱项进行强化学习,从而达到个性化学习的目的。

参考文献:

[1] WEST D M,Big Data for Education: Data Mining,DataAnalytics,and Web Dashboards.Governance Studies at Brookings [J].Brookings Institution,2012.

[2] 滕珺, 朱晓玲. 大数据在美国基础教育中的运用[J]. 人民教育, 2014, 1.

[3] SENATE U S. Education Sciences Reform Act of 2002, 107th Congress, 2nd Session (November 12, 2002). Report 107-337. Calendar Number 750 [J]. Us Senate, 2002.

[4] BIENKOWSKI M, FENG M, MEANS B. Enhancing teaching and learning through educational data mining and learning analytics: An issue brief [J]. US Department of Education, Office of Educational Technology, 2012:1-57.

[5] 本刊讯. 2014年教育信息化工作要点发布[J].中国教育信息化, 2014, 7.

【通联编辑:代影】

猜你喜欢

个性化教学数据分析大数据
高中体育特长生培养策略研究
创新高中语文教学模式,实施才情个性化教学
浅析大数据时代对企业营销模式的影响
网络环境下的商务英语课程资源库的建设研究