APP下载

数据挖掘技术在线上教育平台中的应用

2020-12-07赵玥

时代人物 2020年25期
关键词:数据挖掘计算机大数据

赵玥

摘要:自20世纪80年代末起,数据挖掘概念首次出现并作为人工智能和数据库领域研究的热点问题一直延续至今。本文介绍了几种数据挖掘的主要技术,并对数据挖掘在线上教育平台上的应用进行总结,最后指出其在线上教育平台的发展趋势。

关键词:数据挖掘;线上教育平台;计算机;大数据

在信息技术飞速发展的基础上,同时受今年新型冠状病毒疫情影响,线上教育商业发展趋势呈大规模增长,线上教育平台竞争激烈,各个线上教育平台都积累了以不同形式存储的海量数据资料。在大量的资料中,隐藏着许多有用信息,但这些信息很难有效被人们获得,仅依靠传统的数据检索或者统计学方法很难做到。想要利用好这些难得的大数据资源,就需要人们探索和开发更多方法技术,比如数据挖掘(Data Mining,DM)技术。

数据挖掘(Data Mining,DM)技术,通常又称为数据库中的知识发现(Knowledge Discovery in Databases),是从大量的、有噪声的、不完全的、模糊的、随机的实际应用数据中提取有效的、新颖的、潜在有用的知识的非平凡过程。它融合了数据库技术、人工智能、机器学习、统计学、知识工程、信息检索等最新的技术研究成果。数据挖掘技术在非常多的领域都可以用得到,只要是有分析价值的数据库,都可以利用数据挖掘工具为决策者获得有效信息提供帮助。

线上教育平台数据是有分析价值的大数据资源

首先,线上教育平台数据类型极其繁多,可分类为结构化数据、半结构化数据和非结构化数据,它们的组织形式、形态结构、类型格式呈多样化特征。

其次,除今年疫情影响外,云计算、移动线上、社交网络、移动设备APP的应用等也推进了线上教育平台流量的迅速增长。这些数据时效性强,要想有效其价值,必须及时处理和分析,而数据挖掘技术是最有效及时的方式之一。

几种数据挖掘的主要方法

利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等。在这里,本文主要介绍3种数据挖掘技术在线上教育平台的应用。

  1. 分类

分类是找出数据库中一组数据对象的共同特点,并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。其重要技术有:决策树、贝叶斯网络、神经网络、支持向量机、深度学习等。

分类在线上教育平臺中可以应用到学生的分类,学生的属性和特征分析、学生的需求预测等。例如,将学生选择的课程按内容分类,根据学习者的背景、以往活动日志、学习路径等预测其新的学习需求,为学生推送符合需要的学习课程。

  1. 关联规则

关联规则是描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。在大数据背景下的教育教学资源中,关联性是其重要的特征之一。

在线上教育教学中,学生和教师会因为兴趣和需求建立实时或非实时的讨论小组,进行讨论及交流协作。同时在内容、主题等方面,教学资源也具有关联性。因此,在学习者之间、教学资源和学习者之间、教学资源之间产生了丰富的关联关系。通过关联分析,可以为学习者推送相关联的学习内容,设定相关联的主题,提供个性化学习服务。

  1. 聚类

聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。聚类可帮人们掌握事物内部规律。

数据挖掘在线上教育平台的应用

构建学习者特征模型。依据学习者不同的特征参数,根据学习者经常访问的URL,跟踪统计学生访问次数、总停留时间、访问课程数、网站某时间段访问次数、参与讨论情况、学习偏好等,对学生学习活动进行全面跟踪和记录,再通过数据挖掘的去噪和模式发现模块,得到学习者的学习特征风格,建立和完善学习者学习模型,建立学习者个性数据库,作为后期学习者学习策略的制定奠定基础。数据库建立后,可为学习者调整学习资源,过滤无关信息。还可利用统计分析技术,预测学习者行为。

以个性化学习指导为导向。学习者作为个体,在个人学习能力、兴趣及学习习惯、原有基础及努力程度上都有不同,且这些属性是持续变化的。数据挖掘可用来挖掘学习者使用数据日志,分析其浏览趋势,以预测未来的访问模式。将有利于解决线上教育中针对各层次学生因材施教的问题。以个性化学习指导为导向,就是动态地获取学习者当前学习过程信息,在学习界面上反馈挖掘处理后的信息,给学习者以适合的、个性化的学习指导。

改进系统性能。对于线上教育平台来讲,学习者的满意程度和服务质量是关键。在解决系统安全性及稳定性方面,web的使用挖掘提供了网站构架的信息及用户使用信息,管理员可以根据站点流量信息,控制web缓存、负载平衡和网络构架等问题。

数据挖掘在线上教育中的发展趋势及存在问题

随着线上教育的不断普及和拓展,数据挖掘技术也越来越受到研究者的重视。线上教育带着其特殊的性质将大数据带入了教学应用中,让学生更了解自己,有了自适应的学习模型;教师更易于掌握学生学习情况,随时可随数据调整;教学资源更丰富多样。目前数据挖掘逐渐从高端研究转向常用的数据分析,很多教育领域的数据分析已经成功采用了数据挖掘技术来辅助决策。尽管如此,数据挖掘技术依然面临许多问题和挑战,如规模过大过于集中的数据挖掘效率有待提高,需要开发适应于多数据类型、容噪的挖掘方法,动态数据和知识的数据挖掘等。

参考文献

陈娜.数据挖掘技术的研究现状及发展方向[J].电脑与信息技术,2006(02):46-49.

胡侃,夏绍玮.基于大型数据仓库的数据采掘:研究综述[J].软件学报,1998(09):53-63.

HAN Jiawei , KAMBER M..范明,孟小峰,译.数据挖掘:概念与技术[M]北京:机械工业出版社,2001.

李施,李艳华,赵慧琼.教育大数据挖掘技术与应用案例分析[J].中国教育网络,2017(05):60-62

郑倩倩.数据挖掘技术在网络教学平台中的应用研究[J].通讯世界,2016(03):193-194

猜你喜欢

数据挖掘计算机大数据
中国计算机报202007、08合刊
中国计算机报2019年48、49期合刊
中国古代的“计算机”
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于大数据背景下的智慧城市建设研究
基于R的医学大数据挖掘系统研究
一体式,趋便携雅兰仕AL-225
一本面向中高级读者的数据挖掘好书