数据挖掘技术在MOOC中的应用研究
2015-04-15刘钟情成都体育学院信息技术中心计算机教研室四川成都610041
刘钟情(成都体育学院 信息技术中心计算机教研室,四川 成都 610041)
数据挖掘技术在MOOC中的应用研究
刘钟情
(成都体育学院信息技术中心计算机教研室,四川成都610041)
摘要:MOOC是旨在进行基于网络的开放式大规模学生交互参与的在线课程,以其自主学习、易于使用、注册门槛低、学习资源丰富等独特优点和优势吸引了全球大量的学习者,这些学习者来自世界各地,有着不同的教育文化背景和不同的学习特征,有着不同的学习目的,只有满足了这些学习者的个性化需求和目的,才能获得MOOC的可持续发展,并最大化其存在价值。借助数据挖掘技术,能从大量信息中获取隐藏在数据之中的有用信息,从而为决策提供支持。将数据挖掘技术应用在MOOC中,挖掘学习者的学习行为特征,提供更优良的教学资源和教学策略,才能实现MOOC存在价值最大化。
关键词:数据挖掘;MOOC;学习行为;辅助决策;监控预警
0 引言
MOOC,从2012年开始被广为传播,为“massive open online courses”的缩写,意为“大规模开放在线课程”,其核心理念是开放共享知识。目前各国教育机构纷纷投入到MOOC中,全球知名的MOOC项目有Coursera、Edx、Udacity等,国内高校也密切关注MOOC的发展,北京大学于2013年先后在Edx和Coursera上发布了7门课程并对全球开放,清华大学于2013年推出“学堂在线”平台,面向全球提供第一批在线课程[1]。初浅的数据挖掘方法在MOOC发展过程中得到了广泛的应用。如杜克大学凯西·戴维森教授在发现常规作法的局限性后,将在Coursera平台开设的课程与本校面对面课程进行混合教学,并与加利福尼亚大学教授的面对面课程同步进行,实现校际教师间的协作授课,校际学生间协作学习,从而使得MOOC教学法出现了新动向。又如,将MOOC的三大主流平台Coursera、Edx、Udacity和原有的网络教学平台进行对比分析,人们发现MOOC平台的功能相对简单,并最终根据实践需要对MOOC平台作出调整[2]。然而,在新的历史条件下,为了使MOOC可持续发展,并最大化其存在价值,就不能停留在初浅的数据挖掘基础上,必须对MOOC涉及的各环节和对象作深入的数据挖掘,找出隐藏的有用的信息和规律。本文研究了数据挖掘技术在MOOC中的应用。
1 数据挖掘概述
数据挖掘是从大量的、不完全的、有噪声的、模糊的和随机的数据中提取隐含在其中的人们事先不知道的但又潜在有用的信息和知识的过程[3]。其中的常用技术有关联分析、分类、聚类等。其中分类是基于预测型模型的数据挖掘,聚类是基于描述型模型的数据挖掘。关联规则的基本算法有Apriori算法、抽样算法、划分等。分类的常用算法有基于统计的算法、基于决策树的算法、基于距离的算法、基于神经网络的算法和基于规则的算法。聚类的常用算法有层次算法和划分算法[4]。数据挖掘使用各种各样的算法对于各种数据对象进行挖掘,最终得到数据挖掘的结果,从而为决策提供支持和依据。
2 数据挖掘在MOOC中的应用
2.1基于MOOC的学习者学习行为特征分析
网络使得基于MOOC平台的自主探究性学习得以实现,网络也提供了记录学习者隐性学习行为的载体。正如在电子商务模式中挖掘消费者的消费行为特征一样,基于MOOC平台的网络学习也需要挖掘学习者的学习特征。这些看起来无意识的、零散的学习行为之间潜藏着能折射学习者真实思维和学习情况的底层规则。对于隐藏在学习平台记录中的学习行为,采用合适的数据挖掘方法,生成的学习行为数据是改进学习、跟踪学习、评价学习的最佳数据来源[5]。学习分析[6]通过对数据背后的信息进行挖掘并有效利用,从而追求最大的教育效益[7]。构建能满足学习跟踪、评价及改进需求的行为分析模型和数据挖掘算法是关键。根据学习者的认知水平、性格动机、偏好等个性化属性,可以制定相应的学习内容与学习策略,可以建立相应的学习质量评价模型,可以实现适合学习者的资源的推荐。由此可见,学习者行为特征分析的重要性。然而,准确、自动地获取学习者的学习特征并不容易。MOOC出现的时间很短,目前,国内有一些分析学习者反馈的课程报告[8],全球范围内相关研究也很少[9]。麻省理工学院的研究者们研究发现,MOOC学习者的构成学习模式、如何评估教学质量远比想象中复杂[10]。MACFAYDEN等[11]通过对学习系统中的数据进行追踪分析,得出学习者期末成绩有关的行为变量模型。蒋卓轩等[12]首次针对中文慕课中学习行为的特点,将学习者分类,从而更加深入地考察学习行为与学习效果之间的关系,其研究表明,基于学习行为的特征分析能有效地判别一个学习者能否成功完成学习任务,并能找出潜在的认真学习者。罗梅罗等提出了在个性化学习系统中提高Web挖掘效率的高级架构[13]。在国内外为数不多的研究中,有的专门研究学习者背景数据;有的对学习者提交的作业数据进行研究[14];有的对学习者行为进行建模,预测学习行为[15-18]。学习者行为特征分析数据挖掘的数据源通常为学习者的注册时间,何种时间与何种课程资源的交互,如何交互以及交互的程度,练习次数,练习的成绩,练习的错误率,错误的内容和学习成绩等。
2.2辅助教学过程决策
通过对MOOC各类资源的使用情况进行数据挖掘,可以发现MOOC各类资源的使用效率,资源分析的结果呈现给课程开发者、课程设计者和课程学习者,从而为优化资源配置提供依据。通过对MOOC学习者聚类,给不同类别的学习者提供完全不同的教学资源,从而提高学习者的学习兴趣、提高学习效果。文献[19]通过学习者在线学习的路径、浏览顺序和习惯,确定学习者可能的学习风格类型,从而确定为学习者推荐合适的学习资源。通过数据挖掘的关联分析与时间序列分析,得出课程设置先后顺序、学习者特征、学习者成绩之间的规则和信息,从而合理设置课程[20]。通过Web挖掘,教师可以了解和分析学习者的学习兴趣,打造自主个性化学习的学习环境,并有针对性地制定教学策略。通过回归分析、关联规则等方法对不同类别学习者作出判别,判别教学方法和教学策略是否合适,从而为教师调整教学方法和教学策略提供依据。通过关联规则,找出不同课程线上线下时间配置与学习者成绩之间的关系,合理设置不同课程翻转课堂的总时间以及时间安排,从而激发学习者学习兴趣。通过数据挖掘技术,探索不同课程有效合理的课程考核方式,从而真实反映目前不同学习者的学习成绩和状况。
2.3学习者学习状况监控预警
学习者学习情况监控预警是指在学习者学习的不同阶段,关注学习者的学习动态,对学习者适时作出合适的预警或提醒,从而使学习者及时调整自我学习态度和方法,提高学习者的学习效率,达到好的学习效果。采用数据挖掘技术的关联分析与演变分析等功能,挖掘学生的学习动机、归因和自我效能感,寻找学习者各种行为活动之间的内在联系和规则。如通过数据挖掘技术挖掘出一条规则:当学习者同时出现A、B两种状况时,会导致C这种学习结果,而C结果却是不好的。那么,在跟踪监控学习者的学习过程中,当发现学习者出现了A状况时,系统即对学习者发出提示,及时对学习者进行教学干预,从而修正学习者的学习行为和学习计划。文献[21]试图建立对学习者的即时提醒机制,从而提高学习者的学习效果。又比如通过数据挖掘技术挖掘出一条规则:当学习者访问MOOC平台的某一个知识点或是某几个互相有内在关联的知识点越来越频繁,且在线时长越来越长,往往意味着学习者的专注度和兴趣度增高或是学习者遇到学习难点。当对学习者进行学习跟踪的过程中,发现学习者访问MOOC平台的某个知识点越来越频繁并且在线时长变长时,系统即对学习者发出鼓励,从而让学习者感觉自己是被关注的,仿佛和真实的老师在交互,让学习者有更暖心的学习体验和坚定的学习态度,从而收到好的学习效果。MOOC尽管有诸多优势,却仍然存在大量打酱油式的学习者并最终无法取代传统的面对面的课堂学习的一个很重要的原因是,MOOC只是一个平台,无法做到真正意义上教师的课堂管控,从而导致学习者想来就来想走就走的局面。而当MOOC有了对学习者学习情况的良好监控预警时,其人性化的一面将有更好的体现,从而让MOOC的优势有更好的体现。
2.4教学评价
教学评价是教学管理中的重要环节,客观公正的教学评价是促进教育健康发展的保障。教学评价包括教师的教学和学习者的学习。MOOC教学评价属于网络教学评价的范畴。由于MOOC教学在实现上对互联网及教育技术的依赖以及教与学活动在时空上的分离,MOOC教学评价重点关注学习资源和学习过程的评价。对学习者成绩、教学信息、评价信息、学习者的问卷调查进行数据挖掘,可以发现影响教学效果的各个因素之间的关系,从而保证教学评价的公平性、科学性、客观性和可靠性,有助于发现学习资源的使用和配置情况,以及教学各环节和要素有待改进的方面,有利于MOOC教学的互动和提高。文献[22]设计实现了一种基于Moodle平台,将教师评价、同学间互评以及学生本人自评相结合的基于过程的网络教学评价。文献[23]鉴于在线学习系统中学习质量不佳的现状,提出基于Web数据挖掘技术建立学习质量评价的模型。
3 结语
MOOC借助网络技术和资本力量的推动,获得了迅猛发展。尽管对MOOC褒贬不一,但其影响力深远。数据挖掘技术是从大量信息中获取有用信息的有效途径。将数据挖掘技术应用在MOOC中,实现MOOC存在价值最大化,具有时代性和挑战性。
参考文献(References)
[1]孙青,艾明晶,曹庆华.MOOC环境下开放共享的实验教学研究[J].实验技术与管理,2014,31(8):192-195.
[2]祝智庭,刘名卓.“后MOOC”时期的在线学习新样式[J].开放教育研究,2014,20(3):36-43.
[3]邹志文,朱金伟.数据挖掘算法研究与综述[J].计算机工程与设计,2005,26(9):2304-2307.
[4]DUNHAM M H .数据挖掘教程[M].郭崇慧,田风占,靳晓明,等译.北京:清华大学出版社,2005.
[5]胡艺龄,顾小清,赵春.在线学习行为分析建模及挖掘[J].开放教育研究,2014,20(2):102-110.
[6]祝智庭,贺斌.智慧教育:教育信息化的新境界[J].电化教育研究,2012(12):5-13.
[7]SIMENS G,GASEVIC D,HAYTHORNTHWAITE C,et al.Open learning analytics:an integrated & modularized platform:Proposal to design,implement and evaluate an open platform to integrate heterogeneous learning analytics techniques[R/PL].[2015-02-26].SOLAR.http://www.solaresearch.org.2011.
[8]TEAM OF PKU MOOC TEACHING RESEARCH.2013 first MOOCs of Peking University:people,crowd and network courseinvestigation and analysis report[R].Beijing:Peking University,2014.
[9]WALDROP M M.Online learning:Campus 2.0[J].Nature,2013,495(7440):160-163.
[10]BRESLW L,PRITCHARD D,DEBOER J,et al.Stuying learing in the worldwide classroom:research into edX′s first MOOC[J].Research & Practice in Assessment,2013,8(1):13-25.
[11]MACFAYDEN L P,DAWSON S.Minging LMS data to develop an″Early Waring″system for educators:a proof of concept[J].Computers & Education,2010,54(2):588-599.
[12]蒋卓轩,张岩,李晓明.基于MOOC数据的学习行为分析与预测[J].计算机研究与发展,2015,52(3):1-14.
[13]NESTERKO S,DOTSENKO S,HU Q,et,al.Evaluating geographic data in MOOCs[C/OL]//NIPS Workshop on Data Driven Education,2013[2014-06-01].http://nesterko.com /files/papers /nips2013-nesterko.pdf.
[14]HAN F,VEERAMACHNENI K,O′REILLY U.Analyzing millions of submissions to help MOOC instruciors understand problem solving[C/OL]//NIPS Workshop on Data Driven Education,2013[EB/OL].[2014-06-01].http://groups.csail.mit.edu/EVODesignOpt /groupWebSite/uploads /Site/ProblemAnalytics.pdf.
[15]YANG D,SINHA T,ADAMSON D,et al.″Turn on,tune in,drop out″:Anticipating student dropouts in massive open online courses[C/OL]//NIPS Workshop on Data Driven Education,2013[2014-06-01].http://lytics.stanford.edu/datadriveneduca⁃tion/papers/yangetal.pdf.
[16]RAMESH A,GOLDWASSER D,HUANG B,et al,Modeling learner engagement in MOOCs using probabilistic soft logic[C/ OL]//NIPS Workshop on Data Driven Education,2013[2014-06-01].http://lytics.stanford.edu/datadriveneducation/papers/ ramshtal.pdf.
[17]BALAKRISHNAN G.Predicting student retention in massive open online courses using hidden markov models,UCB/EECS-2013-109[R/OL].Berkeley:University of California,Berkeley,2013.
[18]KIZILCEC R,PIECH C,SCHNEIDER E.Deconstructing disengagement:analyzing learner subpopulations in massive open online courses[C]// Proc of the 3rd Int Conf on Learning Analytics and Knowledge,New York:ACM,2013:170-179.
[19]LO J J,SHU P C.Identification of learning styles online by observing learners′browsing behavior through a neural network[J].British Journal of Educational Technology,2005,36(1):43-55.
[20]李瑞林.数据挖掘技术在教学过程中的应用[J].制造业自动化,2010,32(9):153-154.
[21]WILLIAMS J J,WILLIAMS B.Using interventions to improve online learning[C/OL]//NIPS Workshop on Data Driven Education,2013[2014-06-01].http://lytics.stanford.Edu /datadriveneducation/papers/williamswilliams.pdf.
[22]常金娥.网络教学中教学评价系统的实现[J].中国教育信息化,2008(12):67-68.
[23]ALKHATTABI M,NEAGU D,CULLEN A.Assessing information quality of e-learning systems:A web mining approach[J].Computers in Human Behavior,2011,27(2):862-873.
(责任编辑:范建凤)
Application of Data Mining Technology in MOOC
LIU Zhongqing
(Information Technology Center,Chengdu Sport University,Chengdu 610041,Sichuan,China)
Abstract:MOOC is aiming to support web-based massive open interactive online course.It is self-study,easy to be used,easy registration,abundant resource of study.So it attracts a lot of learners who have different study aim,different education background and different study characteristic all over the world.Only when MOOC meets learners individual requirements and study aim,it can obtain sustainable development and maximize its existence value.A lot of useful information can be obtained and to provide decision-making support with the technology of data mining.Data mining technology is used in MOOC to find the learners study behavior characteristic to support better education resource and teaching strategy,and then the existence value of MOOC is maximized.
Keywords:data mining;MOOC;study behavior;assistant decision-making;monitor early-warning
作者简介:刘钟情(1982—),女,助教,硕士,研究方向:计算机应用。
收稿日期:2015-04-15
DOI:10.16389/j.cnki.cn42-1737/n.2015.03.015
中图分类号:TP391
文献标志码:A
文章编号:1673-0143(2015)03-0367-04