大数据挖掘在互联网教育平台个性化教学中的应用研究
2018-12-07杨淑芳黄晨贡国忠景征骏
杨淑芳 黄晨 贡国忠 景征骏
[摘 要] 大数据是互联网教育平台的宝贵资源,大数据挖掘是互联网教育平台为学习者提供个性化服务的重要技术。主要探讨聚类、分类、关联分析、特异群组挖掘四种大数据挖掘技术在个性化教学中的应用。大数据挖掘技术将极大地提高互联网教育平台的个性化、智能化水平,使互联网教育在深化教育改革,提高国民素质中发挥重要作用。
[关键词] 计算机;应用现状;趋势研究
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 19. 063
[中图分类号] TP311 [文献标识码] A [文章编号] 1673 - 0194(2018)19- 0147- 02
0 引 言
习近平同志指出,教育是提高人民综合素质、促进人的全面发展的重要途径,是民族振兴、社会进步的重要基石,是对中华民族伟大复兴具有决定性意义的事业。李克强同志于2018年6月在宁夏考察时谈到,“互联网+教育”是促进起点公平的有效手段,它让偏远地区的孩子也能“走进”名校名师课堂,大大拓宽了他们的视野。随着云计算、物联网、移动互联网技术的迅猛发展,互联网教育的浪潮席卷而来,为教育教学带来了变化和革命,互联网教育不仅受到教育领域专家学者的关注,也引起了互联网企业的广泛兴趣。近年来,针对用户的个性化教学服务成为互联网教育的重要主题之一。为学习者提供个性化教学服务需要对互联网教育平台不同类型的海量数据进行有效整合,并以此为基础进行数据挖掘和实时分析,发现学习者个性化特征、兴趣和需求,进而有针对性地提供教学服务。
1 大数据是互联网教育平台的宝贵资源
互联网教育平台数据主要分为三类:学习者数据、教师数据、教学资源数据。随着云计算、移动互联网、社交网络等技术的快速发展及其在教育领域的广泛应用,互联网教育平台数据具备了大数据的特征,主要体现在以下四个方面:
(1)互联网教育平台数據类型繁多,不仅包含学习者、教师等人员信息,也包含文本、PPT、Flash、音频、视频等教学资源数据,以及提问、答疑、交流等教学过程中产生的各类异构数据。这些数据的组织形式、形态结构和类型格式很多,既有结构化数据,也有大量的半结构化和非结构化数据。
(2)互联网教育平台数据体量浩大,以腾讯公司的教育平台腾讯大学为例,目前包含微信学院、开发平台学院、营销学院、游戏学院5个学院,课程覆盖IT·互联网、设计·创作、语言·留学、职业·考证、升学·考研、兴趣·生活6大类别,汇聚了海量课程资源,拥有数万名学生。
(3)互联网教育平台数据流量增长迅猛,近年来以各类慕课、微课为代表的教学资源急速增加,同时移动学习App的广泛应用使得用户产生的搜索、点击、观看等数据也在迅速膨胀,这些数据时效性强,必须及时处理和分析,才能有效利用其价值。
(4)互联网教育平台的海量数据中蕴藏着巨大的价值,可以在教育教学中发挥重要作用,但是这些海量数据中也有很多无用信息,所以呈现出低价值密度的特点。
教育大数据的服务价值体现在聚焦、诊断、服务于“人”的学习全过程,以促进每个学习者的学习绩效[1]。大数据是互联网教育平台的宝贵资源,为学习者在教育平台上获得个性化教学服务奠定了基础。
2 大数据挖掘是个性化教学服务的重要技术
在大数据渗透到当今每一个行业和业务领域的时代,挖掘数据的潜能越发被各个领域所重视[2]。挖掘数据是开展个性化教学的重要技术之一[3]。互联网教育平台大数据的4V(volume、variety、velocity、value)特征决定了所采用的数据分析和处理技术应当是大数据挖掘技术,而不是传统的数据挖掘技术。应用大数据挖掘技术,互联网教育平台可以为学习者提供全方位、深层次的个性化教学服务。熊赟等[4]认为,大数据挖掘技术主要包括:面向多源异构、不完整数据的不确定数据挖掘技术;面向复杂数据组织形式的图数据挖掘技术,尤其是基于语义的异质网络数据挖掘;面向结构化稀疏性的超高维数据挖掘技术,面向价值高但密度价值低特征的特异群组挖掘技术;面向动态数据的实时、增量数据挖掘技术;高性能计算支持的分布式、并行数据挖掘技术等。大数据挖掘既需要对大数据有效的新的挖掘算法,也需要信息领域新的支撑工具和设施,如Hadoop、Spark等云计算基础构架,它们具有动态可扩展、高灵活性的特点[5],可以满足大数据挖掘和实时分析的要求。
3 基于大数据挖掘的个性化教学服务
本文主要探讨聚类、分类、关联分析、特异群组挖掘四种大数据挖掘技术在互联网教育平台个性化教学服务中的应用。
3.1 聚类及其应用
聚类分析是根据对象的属性和特征将相似的对象聚类成簇,可以帮助人们掌握事物的内部规律。根据背景、身份、年龄等个人信息,浏览、点击、观看、下载等教学资源使用信息,以及阅读、测试、讨论等学习行为数据对学习者进行聚类,分析不同学习群体的不同特点、兴趣和爱好,采取针对性的分类教学,满足学习者的个性化需求。例如,根据若干门课程成绩对学习者聚类,把其分为优秀、良好、中等、不合格四个等级,根据学习者的不同等级,为其制定不同难度的后续学习计划。根据类型、语种、标题、关键字、点击率等属性对教学资源进行聚类,可以为学习者进行相关性学习资源推荐。例如,《史记》、《汉书》、《后汉书》和《三国志》在中华史学著作中享有很高的声誉,并称“前四史”,属于同一类,为《史记》学习者推荐《汉书》、《后汉书》和《三国志》的学习资源,既可以很好地满足学习者的兴趣,也可以帮助学习者在历史知识方面更上一层楼。
3.2 分类及其应用
分类是根据已有数据样本集构造一个分类器,即分类模型,在数据集中的数据和类别标号之间建立映射,分类器能对未知类别的数据赋予类别。决策树、贝叶斯网络、神经网络、支持向量机、深度学习等都是分类分析中的重要技术。分类技术可以用于学习者学习成绩预测,学习需求预测,学习风险预警等[6]。例如,将学习成绩分为优良中差4个等级,根据学习者的背景、以往成绩单成绩、活动日志等进行新课程的学习成绩预测,预测成绩等级;将学习课程按内容分类,根据学习者的背景、以往学习内容、活动日志、学习路径等预测其新的学习需求,为其推送需要的学习课程;根据学习者的学习成绩、参与程度、课堂表现等数据预测其学习风险,若属于高危一类,须及时对学习者进行干预,提供个性化指导。
近年来,场景化、情景化的资源推荐服务也引起了关注[7]。通过场景建模、场景分类和学习者场景识别,可以为学习者提供契合其所处场景的教学资源。例如,若发现学习者的设备场景是移动终端,则向其推荐时长较短的微课视频,以便于碎片化学习,若检测到学习者的设备场景是台式机,则向其推荐时长较长难度较大的慕课视频,让其集中精力长时间学习。
3.3 关联分析及其应用
关联分析是寻找数据项之间有趣的关联关系,并以关联规则的形式表示。关联分析最著名的应用莫过于沃尔玛超市啤酒和尿布的案例,通過对用户消费的历史数据进行关联分析,了解用户的购买模式,进而选择营销方案。关联性是大数据背景下数字教育资源服务的特征之一[8]。教学资源在内容、主题等方面具有关联性,学习者和教师会因为兴趣和学习需要建立实时或非实时的讨论小组,进行问答交流、讨论协作,从而产生丰富的关联关系。通过对教学资源、学习者的关联分析,可以发现教学资源之间、学习者之间、教学资源和学习者之间的关联,进而为学习者进行相关性学习主题设定和相关性学习资源推送。
3.4 特异群组挖掘及其应用
特异群组挖掘是高价值、低密度的大数据挖掘中的特殊需求,它将大数据集中的少部分具有相似性的对象划分到若干组中,而大部分数据对象不在任何组中,也不和其他对象相似,这样的群组称为特异群组[9]。特异群组挖掘可以用于分析教育社区中的学习者用户,在庞大的学习者社会网络中挖掘交流密切的小社区对于个性化教学有重要意义。例如,可以针对小社区用户的特殊需求为其提供教学上的个性化定制服务,也可以通过特异群组的用户社交网络分析进行主题多样性的学习资源推荐[10]。
4 结 语
在“互联网+”时代,生产生活方式发生了巨大变化[11],教育也在发生变革。以学习者、教师和教学资源为主构成的大数据是互联网教育平台的宝贵资源。采用大数据挖掘技术深入分析平台汇聚的大数据,互联网教育可以为学习者提供个性化教学服务,学习者成为中心,互联网教育平台的学习资源得到充分利用,教师的作用得以充分展现,互联网教育给教学带来新变化,在深化教育改革,提高国民素质中发挥重要作用。
主要参考文献
[1]孟志远, 卢潇, 胡凡刚. 大数据驱动教育变革的理论路径与应用思考——首届中国教育大数据发展论坛探析[J]. 远程教育杂志, 2017(2):9-18.
[2]顾小清, 薛耀锋, 孙妍妍. 大数据时代的教育决策研究:数据的力量与模拟的优势[J]. 中国电化教育, 2016(1):56-62.
[3]祝智庭, 孙妍妍, 彭红超. 解读教育大数据的文化意蕴[J]. 电化教育研究, 2017(1):28-36.
[4]熊赟, 朱扬勇, 陈志渊. 大数据挖掘[M]. 上海:上海科学技术出版社, 2016.
[5]焦英楠. 浅谈大数据环境下的云计算信息安全问题[J]. 中国管理信息化,2018(5):165-169.
[6]杨现民,田雪松. 中国基础教育大数据2016-2017:走向数据驱动的精准教学[M].北京:科学出版社,2018.
[7]柳益君, 蔡秋茹, 何胜,等. 高校移动图书馆的场景化资源推荐服务:要素、模型和技术[J]. 图书馆学研究,2018(1):67-71.
[8]余亮,陈时见,赵彤. 大数据背景下数字教育资源服务的内涵、特征和模式[J]. 电化教育研究,2017(4):66-71.
[9]熊赟, 朱扬勇. 特异群组挖掘:框架与应用[J]. 大数据, 2015(2):66-77.
[10]柳益君, 何胜, 吴智勤,等. 基于用户社交网络分析的高校图书馆主题多样性阅读推荐[J]. 图书情报工作, 2018, 62(8):67-73.
[11]崔一佳, 吴志伟. “互联网+”时代企业管理的创新思考[J]. 中国管理信息化, 2018,21(4):42-43.