APP下载

E-learning与数据挖掘技术的关联及应用

2011-11-25

制造业自动化 2011年4期
关键词:数据挖掘关联聚类

魏 庆

(河南财经政法大学 计算机与信息工程学院,郑州 450002)

0 引言

国外,尽管E-learning概念的提出已有十年,但真正“红火”起来只是近五年的事。据IDC统计,自1998年以来,美国E-learning市场的年增长率是83%。是什么促使E-learning市场在短短几年内有了如此之快的增长?其实,这是来自时代的压力。知识经济时代,恰恰是知识和技能极度短缺的时代,因为它们的半衰期越来越短。员工50%的知识和技能会在3到5年内过期,在IT领域这个半衰期更短。时代的特征决定了人们必须改变观念,“终生学习”不再是口号。我们的上一辈,也就是我们的父母,他们在中学或大学所学到的技能足以使他们在一生的工作中如鱼得水。而现在的一代则没有这样的幸运。知识经济时代的每一个人除了通过不断学习以获得新的技能,力求跟上变化,其他别无选择。

1 E-learning的特征

有人将E-learning界定为用因特网技术来实施一系列的学习解决方案,用以传播知识、提高效率。按照美国培训和发展协会(ASTD)的定义,E-learning是指由网络电子技术支撑或主导实施的教学内容或学习体验,E-learning必须具备以下特征:

1)基于Internet/Intranet,这是E-learning最主要的特征,正是有这样的技术背景,才极大方便了资料的即时更新、数据的分发和共享、学员之间的即时交流。

2)运用标准的网络技术,通过计算机把知识传输给最终用户。这里的关键在于运用标准的网络技术,如TCP/IP协议,网页浏览技术等组成的平台。

3)不局限于信息和技能的传授,其学习方式、内容及结果早已超越了传统学习或培训所涵盖的外延,E-learning是学习理念的革命。

这里要特别说明的是,E-learning与利用光盘的学习方式不同。用光盘进行单机学习不乏优点,如丰富的视频效果和动画,不受传输带宽的影响,但它缺乏网络特性,无法做到即时更新和共享学习,因此,它不是真正意义上的E-learning。

现在已有的E-learning服务大致可以分为四种:在线公告、在线培训、在线知识分享和在线指导。在线公告即在第一时间内通过网络发布重要信息;在线培训是通过网络向员工传播技能的一种有效方式,培训师可籍此了解培训效果;在线知识分享和在线指导是培训双方在网上开展交流、互动。

相比简单的费用节省之外还有其他一些好处,这就是E-learning所具有的灵活、快速、便捷的特点,而且特别易于管理。

E-learning可以提供同步或不同步的培训模式。不同步的沟通技术包括讨论、e-mail和共享数据库等。这些技术能让身处不同地区,甚至是世界各地的学员们分享丰富的学习资源,以及在课程和作业上进行合作,而无须考虑时间、地点的局限,因而我们经常称E-learning为“随时、随地的学习”。不同步的沟通亦为教员提供了方便。教员不一定要立刻提供帮助,而是可以离线进行。课程的评估、布置作业、安排测验亦可以如此。

若采用同步的、实时的模式,公司的所有员工可以在规定的时候同时进行交流,却无需离开办公室或家。同步的合作是由教员作为主导者,学员们在虚拟的环境中与教员交流,及互相讨论。教员通过交互式的在线学习及时、有针对性地指导学员。E-learning软件可以不断更新,使企业有持续不断的最新鲜的培训内容,给学员及时的资讯。软件包可以进行调整以适应不同的用户。因此,用户可以为自己定制所需的学习素材,掌控完整的学习过程,以达到最好的学习效果。一旦需要更新,立刻所有人都可以得到最新的培训。

研究表明E-learning可以使人们学习效率提高25%-40%,正是从“要我学”到“我要学”的转变激发了人们的学习兴趣,从而提升了效率。

2 数据挖掘技术特征

数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。

何为知识?从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。

3 数据挖掘和E-learning

数据挖掘在E-learning中的具体应用体现在以下三个方面: E-learning特征的数据挖掘和E-learning教学设计的数据挖掘,E-learning在线分析处理的数据挖掘。

1)E-learning特征的数据挖掘

将数字化内容与学科课程相整合,是达到E-learning目标的具体途径。E-learning数字化特征使信息的存储、加工、重放、复制过程变得简单可靠,标准易于统一,这使数据挖掘用于E-learning成为可能。E-learning多媒化特征是以计算机多媒体技术为依托,使信息媒体设备一体化,信息表征多元化,真实现象虑拟化,建立结构化、动态化、形象化的E-learning教学内容。这此是数据挖掘应用于E-learning的前提。E-learning网络化特征突破时空限制、实现资源共享、多向互动和多边合作。

2)E-learning教学模式的数据挖掘

E-learning的教学模式主要是研究型学习模式、案例研习模式、发现式学习模式、资源型学习模式、协作型学习模式和虚拟教学模式。E-learning的资源学习系统要求能够提供资源答理下具,为教师组织、编辑、管理资源提供帮助,为学生利用资源进行学习提供方便,允许教师根据教学的需要,随时增减资源,根据不同的教学内容和学习者特征进行教学设计。基于数据挖掘的e-Learning资源型学习系统由教师或学习者担任目标样本,并进行系统设置,提取目标的特征信息,根据目标特征自动在网络上搜集资料。

3)数据挖掘和E-learning在线分析处理

一个经常问的问题是,数据挖掘和E-learning在线分析处理到底有何不同。下面将会解释,他们是完全不同的工具,基于的技术也大相径庭。E-learning在线分析处理是决策支持领域的一部分。传统的查询和报表工具是告诉你数据库中都有什么(what happened),E-learning在线分析处理则更进一步告诉你下一步会怎么样(What next)、和如果我采取这样的措施又会怎么样(What if)。用户首先建立一个假设,然后用E-learning在线分析处理检索数据库来验证这个假设是否正确。

4 数据挖掘在E-learning中应用的功能分析

数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能。

1)自动预测趋势和行为

数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。一个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户,其它可预测的问题包括预报破产以及认定对指定事件最可能作出反应的群体。

2)关联分析

数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。

3)聚类

数据库中的记录可被化分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。80年代初,Mchalski提出了概念聚类技术牞其要点是,在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。

4)概念描述

概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。

5)偏差检测

数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是,寻找观测结果与参照值之间有意义的差别。

5 结束语

E-learning带来信息量的急剧增长,对信息提取提出更高要求,很难再依照传统方法在海量数据中寻找教育决策的依据。因此有必要借助数据挖掘对E-learning的应用进行挖掘,发现其中隐藏的规律,为信息技术与课程整合提供依据。

[1] 王锐,马德涛,陈晨. 数据挖掘技术及其应用现状探析[J].电脑应用技术, 2007,(02):147-149.

[2] 李丹丹. 数据挖掘技术及其发展趋势[J]. 电脑应用技术,2007,(02):177-179.

[3] 武森,俞晓莉,倪宇,王瑞峰.数据挖掘中的聚类技术在学生成绩分析中的应用[J].中国管理信息化,2009,(15):104-108.

[4] 黄科军,王静萍. 浅谈数据挖掘在电子商务中的应用[J].益阳职业技术学院学报, 2007,(02):163-165.

猜你喜欢

数据挖掘关联聚类
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于K-means聚类的车-地无线通信场强研究
“一带一路”递进,关联民生更紧
奇趣搭配
基于高斯混合聚类的阵列干涉SAR三维成像
智趣
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法