基于社会网络分析的国内E-learning数据挖掘研究述评*
2015-06-15赵君丽
刘 冰,赵君丽
(1.闽南师范大学 教育科学学院,福建 漳州 363000;2. 闽南师范大学 图书馆,福建 漳州 363000)
基于社会网络分析的国内E-learning数据挖掘研究述评*
刘 冰1,赵君丽2
(1.闽南师范大学 教育科学学院,福建 漳州 363000;2. 闽南师范大学 图书馆,福建 漳州 363000)
随着大数据时代的来临,数据挖掘技术在教育领域的应用越来越广泛,E-learning数据挖掘技术逐渐成为教育领域的研究热点.本文利用社会网络分析法从数据挖掘任务、方法、研究者和研究团队等多个方面对国内近十年来E-learning数据挖掘领域的217篇核心期刊文献进行量的统计与质的分析,揭示了国内E-learning数据挖掘研究的现状,以促进数据挖掘技术的教育应用.
E-learning;数据挖掘;社会网络分析;述评
随着教育信息化的飞速发展,网络学习已经被越来越多地应用到各种学习情境之中,基于网络环境的E-learning系统记录了海量学习者的学习信息,这些反映学习者学习行为和学习过程的数据信息就如同丰富的黄金宝藏,如果能运用合适的方式进行挖掘,揭示隐藏在数据背后的知识信息,将成为评价与促进学习者学习的最佳数据来源.由商业领域孕育而生的数据挖掘技术,在教育领域中悄然掀起并快速发展,目前已经逐渐形成一门新兴的学科——教育数据挖掘.
基于国内外已有的关于教育数据挖掘的研究文献分析,绝大部分研究对象都来自E-learning系统产生的数据,E-learning数据挖掘成为教育数据挖掘学科中一个重要研究领域,它将来自各种网络教育平台所蕴含的学习者学习数据转化为有用信息,为师生、家长、教育研究者、教育管理者和系统开发者提供参考并加以利用,以实现更有针对性的教学管理和教学优化措施[1]. 随着2008年由国际教育数据挖掘工作小组组织的每年一届的国际教育数据挖掘大会的成功召开,国外学者对E-learning数据挖掘的关注日益密切,研究文献数量出现井喷之势,期间出现了多篇文献综述,对一段时期的研究文献进行了回顾和总结,探讨了该研究领域存在的问题及未来的发展方向[2-4].
与国外相比,国内E-learning数据挖掘的研究还处于起步阶段[5],其具体研究状况如何?存在哪些研究热点?迄今为止,鲜有国内学者对该领域研究文献进行梳理分析.为此,笔者以近十年来发表于国内教育技术领域核心期刊的217篇E-learning数据挖掘相关文献为研究对象,利用社会网络分析法从国内的数据挖掘任务、方法、研究者和研究团队等方面进行分析,揭示国内E-learning数据挖掘领域的研究状况与研究热点,以促进数据挖掘技术的教育应用.
1 研究对象和研究方法
1.1 研究对象
本文的研究对象主要来源于中国期刊网全文数据库(CNKI),在检索界面中以数据挖掘或其常用的挖掘方法(如聚类、关联规则、社会网络分析、文本挖掘、决策树、回归分析等)为关键词,设定来源期刊为电化教育研究、中国电化教育、远程教育杂志、开放教育研究、现代远距离教育、现代教育技术、现代远程教育研究、中国远程教育、中国教育信息化等9种教育技术领域核心期刊,分别进行检索,获取316篇文献,经过去重、删除传统课堂及教学管理等方面的数据挖掘文献以及一些无关的文献(如广告、会议通知等),最终得到本文研究对象——E-learning数据挖掘领域有效文献217篇,文献数量按年限分布情况如图1所示.
图1 2002-2014年核心期刊论文分布
1.2 研究方法
(1)社会网络分析法.社会网络的研究起源于20世纪30年代英国人类学的研究,主要关注每个行动者与其他行动者之间关系的程度.社会网络分析的主要目标是建立行动者之间的关系,力图描述群体关系的结构,进一步研究这种关系结构对群体功能或者群体内部个体的影响[6].
(2)关键词共现网络分析法.关键词共现网络分析法是一种基于社会网络分析的研究方法,在图书情报学领域中有着广泛的应用,这种方法主要是在多个关键词在同一学科领域同一篇文献中同时出现时,说明这些关键词具有某些共性或存在一定的内在联系.在多个文献中同时出现的频率越高,则说明这些关键词之间的内在联系越紧密、距离越近[7],这些关键词就代表了该学科领域的研究热点.
本文采用定量与定性研究相结合的方法,运用MicrosoftExcel构建共现矩阵,利用社会网络分析软件Ucinet及NetDraw对搜集到的217篇文献进行关键词共现网络分析,归纳出E-learning数据挖掘领域的主要研究内容与热点.
2 关键词共现网络分析
一般来说,一篇文献的关键词即代表了其主要研究方向与内容,如果在某领域中多篇文献同时出现某些关键词,且出现频率比较高,说明这些关键词代表了本领域的研究热点.通过对217篇核心期刊文献关键词的出现频次进行统计,合并类似的关键词,剔除表述宽泛的关键词,得到出现频次大于6的关键词18个,如表1所示.
表1 高频关键词
以217篇E-learning数据挖掘相关的核心期刊文献的关键词作为数据源,用MicrosoftExcel统计出现频次并构建关键词共现矩阵,导入Ucinet中保存为##h文件,利用NetDraw社会网络图绘制工具去掉孤立点,最后生成关键词共现网络知识图谱,如图2所示.
图2 关键词共现网络知识图谱
图2显示,数据挖掘和社会网络分析两个术语处于网络图中心位置,分别有着大量的与之相关的、表征其各种属性或应用的关键词,这些关键词的关系网络图可以反映国内E-learning数据挖掘研究领域的概貌.
2.1 数据挖掘的任务
通过对高频关键词表(如表1)和关键词共现网络知识图谱(如图2)的归纳分析可知,国内E-learning数据挖掘任务主要包含以下几个方面:①社会网络分析,对学习者利用学习论坛、教育微博等网络学习社区开展合作学习的过程作量化研究,以探讨学习者之间的社会网络结构;②学习者网络学习特征分析,包括刻画学习者情感态度、动机、认知、满意度、学习风格等相关特征的分析;③学习者网络学习行为分析,包括学习者访问学习网站资源的频次、时间、顺序以及寻求帮助,学习意愿等;④教学评价,包括教学过程与教学资源的评价.其中,社会网络分析是目前国内研究的热点.
2.2 数据挖掘的方法
综合Romero、Ventura、Baker和Yacef等国外专家对教育数据挖掘方法的分类,国内学者葛道凯、张少刚等也将数据挖掘方法分为5种类型:统计分析与可视化、聚类(聚类、离群点分析)、关系挖掘(关联规则、序列模式挖掘、社会网络分析)、预测(决策树、回归分析、时序分析)、文本挖掘[5].
从高频关键词表和关键词共现网络知识图谱可以看出,聚类、关联规则、决策树和回归分析等是国内该领域用得比较多的数据挖掘方法.
3 研究者合著网络分析
3.1 研究者
通过对搜集的文献作者统计发现,2002-2014年间能持续对教育数据挖掘领域做深入研究的研究者屈指可数,发表E-learning数据挖掘相关研究论文4篇以上的学者主要有:赵蔚、王陆、胡勇、陈向东、王敏娟、王慧敏、叶新东和张驰(包括论文合作者).具体情况见表2.
表2 研究者论文发表数量统计
3.2 研究团队
抽取217篇文献题录信息中的作者指标,用MicrosoftExcel进行频次统计,构建研究者共现矩阵,导入Ucinet中保存为##h文件,利用NetDraw软件进行处理,得到国内E-learning数据挖掘领域研究者合著网络图谱,删除孤立点,只保留具有合作关系的研究者,如图3所示.
图3 研究者合著网络图谱
通过Ucinet对研究者合著网络结构进行量化分析,计算出整体网络密度为0.0184,网络节点(这里指研究者)之间的联接性不高,是一个稀疏网络,说明研究者之间的合作程度比较低,大多数为1位或2位研究者合作发文.
节点越大,说明该研究者在本领域中的影响力相对越高,图3显示,研究团队主要有以王敏娟、王慧敏为核心的团队,以赵蔚为核心的团队,以陈向东为核心的团队,以余胜泉为核心的团队等.
4 结论
(1)从图1可知,通过对收集到的217篇核心文献统计分析发现,国内E-learning数据挖掘研究始于2002年,在发展过程中虽然有几次小幅的振荡回落,但总体处于稳步上升态势,表明该领域研究已经越来越多地受到国内学者的关注.
(2)从关键词共现网络分析可知,国内E-learning数据挖掘领域的研究主要集中在社会网络分析、学习者特征分析、学习者在线学习行为分析和教学评价几个方面,其中社会网络分析是国内该领域非常突出的研究热点.文献中使用的数据挖掘方法主要以聚类、关联规则、决策树等为主,一些较复杂的数据挖掘方法(如文本挖掘、神经网络等)应用还不多.
(3)通过研究者合作网络分析可知,赵蔚、王陆、胡勇、陈向东等学者发表的文献相对较多,也初步形成了一些研究团队,但团队之间很少合作,通过网络密度分析,论文作者合作网络连通性非常低,尚未形成核心的研究者和研究团队,而且经过对研究者所属机构及学科背景分析,团队成员基本上来自同一机构同一专业,具备跨领域、跨学科背景的研究团队几乎没有.
E-learning数据挖掘的发展过程与技术紧密相连,其研究群体中很大一部分是计算机专家,但与电子商务、电信、银行等商业领域数据挖掘不同的是,E-learning数据挖掘有其自身的特点,需要研究者掌握一定的教育学和心理学理论,能够对通过数据挖掘所获知的学习者在线学习行为进行解释,提出合理解决方案,并将所获得的结果应用到网络学习环境中,以更好地促进教育教学.因此,加强多个领域合作、组建具有多学科背景的研究团队,促进和拓展一些较复杂的数据挖掘方法在教育领域的应用,成为E-learning数据挖掘研究能否摆脱技术桎梏、打破学科藩篱的关键所在.
[1]葛道凯.E-Learning数据挖掘:模式与应用[J].中国高教研究,2012(3):8-14.
[2]C.romero,S.Ventura.EducationalDataMining:AReviewoftheStateoftheArt[J].IEEETransSystManCy-bernC:ApplRev,2010,40(6):601-618.
[3]C.romero,S.-Ventura.EducationaldataminingAsurveyfrom1995to2005[J].ExpertSystemswithApplications,2007,33(33):135-146.
[4]K.yacef,R.Baker.Thestateofeducationaldataminingin2009Areviewandfuturevision[J].JournalofEducationalDataMining,2009,1(1):3-17.
[5]葛道凯,张少刚,魏顺平.教育数据挖掘方法与应用[M].北京:教育科学出版社,2012:197.
[6]刘军.社会网络分析导论[M].北京:社会科学文献出版社,2004:304.
[7]李亮,朱庆华.社会网络分析方法在合著分析中的实证研究[J].情报科学,2008(4):549-555.
(责任编辑:王海波)
10.13877/j.cnki.cn22-1284.2015.04.042
2015-01-24
刘冰,湖北大冶人,副教授.
O
A
1008-7974(2015)02-0127-03