基于Web数据挖掘技术的远程教育应用研究
2014-07-29彭浩
彭浩
【摘要】 计算机技术与通信技术的发展,互联网的普及,人们可以足不出户,在家即可进行远程学习。数据挖掘技术的运用,使得远程教育更加智能化和个性化。本文从数据挖掘的概念出发,分析了如何将Web技术运用于远程教育。
【关键词】 Web数据挖掘 远程教育 决策树算法
随着计算机技术与通信技术的发展,远程教育以迅猛的态势发展起来,英特网上出现大量的教学资源,这些教育信息十分繁多和庞大,如何在这些庞大的数据中了解学生特性,从而根据不同学生采取不同的教育方法,数据挖掘技术的出现很好的解决了上述问题。
一、数据挖掘技术
我们知道信息是无处不在的,数据挖掘就是对这些信息进行探索性分析,一种对数据分析的方法论。数据挖掘是数据库挖掘中的一个步骤,涉及集人工智能、机器学习、统计学、数据库等多个领域,实际数据具有大量,不完整的,模糊和随机不可确定的特点,而作为一种新的数据处理技术,数据挖掘就是从这庞大的数据库中挖掘出人们未知、潜在有用的最终可理解的信息。
二、数据挖掘常用技术方法
(1)粗糙集方法。其主要思想在于通过信息系统来表示知识,通过信息系统进行知識简约,导出问题决策和分类规则,归纳后可以从知识库中抽取更有价值的隐含知识和潜在规律。所以,粗糙集方法其实质就是在大量信息系统中进行信息系统属性约简,得到一种属性约简集的过程,最终得到抽取的规则和方法。(2)遗传算法。它的基本思想是模拟生物生存进化过程中最优解的算法,其借鉴的生物学基础就是遗传和进化。通过遗传算法我们可以在数据库中进行搜索,并对其中随机产生的规则进行优化。遗传算法优点有以下两点:①在适应值函数有噪声下,遗传算法可以以极大的概率找到整体最优解而不容易陷入局部最优;②大规模并行计算机很适用于遗传算法。(3)决策树算法。其主要方法是先对数据进行处理,然后用归纳算法产生可读的规则和决策树,最后对新数据进行决策分析。决策树算法有以下几个特点:①决策树算法描述结构较简单,容易为人所理解;②效率高,适用于大规模数据的处理;③拥有较高的分辨进度。
三、Web数据挖掘技术在远程教育中的应用
(1)远程教育介绍。远程教育作为一种重要的教育方法,被广泛的用在高等教育,职业教育和成人教育中。在现代远程教育中,学习者是通过点击鼠标和浏览网页来完成他们的学习过程,因而他们的学习习惯可以完全被系统日志记录。我们只需要分析和挖掘系统日志,就可以很好的对学习者的学习习惯进行分析,同时也可以了解到远程教育系统是否能很好的服务于学习者。(2)Web数据挖掘。Web数据挖掘是数据挖掘技术与计算机网络技术的融合,网站上有三种类型数据,分别是:内容数据,结构数据以及使用数据。Web数据挖掘一般包括数据获得,数据预处理,模式发现,模式分析四部分。①数据获得:按照数据挖掘的目的获取不同学习者的数据。Web内容挖掘收集的信息来自于我们的网站资源。Web结构挖掘收集的数据来自于HTML内部痕迹和网页之间的超链接。Web使用数据从客户端收集,数据包括IP地址,URL等。②数据预处理:数据预处理是Web数据挖掘的关键一步,因为原始数据会受到不同程度的干扰,Web数据挖掘可能变得低质量而价值不高,因而数据预处理显得尤为重要。数据预处理处理的好坏直接关系着模型发现和模型分析。常用数据清理进行处理。③模式发现:在数据预处理之后,这些数据消除了扰乱,我们就可以对这些数据用常用的算法进行处理,如决策树算法。④模式分析:通过模式发现后,会产生一些规则和模型。怎样让学习者充分运用这些规则和模型,面对如此大量的晦涩的概念,我们通过模型分析,可以将这些规则和模型通过图形界面程序传递给学习者,方便他们学习。(3)决策树算法应用。决策树算法是一种广泛应用的分类算法,具有描述简单,容易理解的特点。我们要将学习者的学习成绩与哪些因素有关分析出来,如课前预习,课后作业复习等。同时生成相应的决策树,可以得到做笔记认真完成作业的学习者,他们的学习成绩好,可以评定成为优秀。没有完成则评定为不优秀,循环往复。决策树算法可以很详细的记录学习者的学习情况,及时给予评价,督促学习者不断努力学习。
四、结语
综上所述,互联网技术与教育结合是未来教育发展方向,数据挖掘技术应用于远程教育,使得教育平台更加智能化和个性化。虽然数据挖掘技术处于刚刚起步阶段,相信随着更多的数据挖掘方法出现,数据挖掘将有更广泛的应用空间。
参 考 文 献
[1] 陈勇飞,王羡欠. Web日志数据挖掘技术及应用[J]. 硅谷. 2009(04)
[2] 董彩云,刘培华. 数据挖掘技术在远程教育教学中的应用[J]. 计算机技术与发展. 2009(02)