APP下载

大数据环境下的数据挖掘课程教学探索

2014-04-29李海林

计算机时代 2014年2期
关键词:数据挖掘人才培养大数据

李海林

摘 要: 近年来,大数据引起了各界相关部门的高度关注,中科院和各高校开始重视该方向的教学和研究。针对目前大数据带来的社会影响力,根据大数据具体特性以及数据挖掘学科交叉性强的特点,结合实际教学经验,分别从培养数据意识、加强理论体系、创新教学方法和深入科学研究等四个方面来探索如何设计高校数据挖掘课程,以解决大数据时代下数据挖掘课程因抽象而带来的问题,为培养优秀的大数据研究人才奠定理论基础。

关键词: 大数据; 数据挖掘; 教学方法; 人才培养

中图分类号:TP399 文献标志码:A 文章编号:1006-8228(2014)02-54-02

0 引言

近年来,随着科技进步和社会的发展,以数据为中心的各领域产生了越来越多的数据,引起了各界业内人士的高度关注。2012年初,美国政府投入2亿美元启动“大数据研究和发展计划”,使得大数据研究上升为国家意志,这意味着大数据对将来科学技术、经济发展,以至国家安全都有深远的影响。大数据的特点[1-2]可以归结为四个V,即Volume(体量大)、Variety(模态多)、Velocity(速度快)和Value(价值密度低)。然而,从这样的数据中挖掘和发现潜在有用的信息和知识,对数据理论分析和数据挖掘技术的要求也相应提高。

数据挖掘作为高校理学和工学专业设计中一门主导课程[3-4],其原始目的主要是让大学本科学生对数据挖掘的相关基础知识有一定的了解,并对较为成熟的技术和方法具有相应的应用分析能力。然而,针对大数据在现今各领域中的重要性以及它所带来的诸多问题和挑战,则应该从高校课程设置的层面作考虑,建立并完善适应时代发展的人才培养体系。本文根据大数据的特点和其发展方向,探索如何提高数据挖掘课程的教学质量,从教学层面探讨大数据研究人才的培养。

1 教学探索

1.1 科学引导,培养数据意识

数据挖掘是以数据为驱动的理论分析和应用课程,它既有具体性又有抽象性。具体性表现为其研究内容是以具体的数据为对象挖掘出的信息和知识比较客观,具有一定的解释性和理解性。抽象性表现为数据挖掘过程中理论、技术和方法等概念,课堂上一般难以在短时间内被消化和理解。针对这些问题,在进行数据挖掘课程设计之前,先要科学地引导学生对数据挖掘产生兴趣,并且逐渐培养学生的数据意识。

在数据挖掘课程中,可以先安排2至4个学时来讲解什么是数据,让学生理解数据在当今社会中的重要意义。特别地,针对大数据时代的到来,更多地让学生了解何谓“大数据”,大数据来自生活中的哪些方面,大数据的增长方式和情况如何,哪些领域中通过大数据相关研究取得了什么样的成果等。同时,通过实例或视频教学引导学生知道数据就在身边,并且能够通过数据挖掘技术来发现有用的信息和知识,为企业、政府和高校服务,使学生知道数据对于企业竞争的意义。另外,为了增强学生对数据挖掘更深刻的认识,通过数据分析或数据挖掘相关的招聘案例,从招聘热门程度、职位性质、工资待遇以及可持续性发展的前景等就业规划角度来吸引学生对大数据以及数据挖掘的了解和兴趣,以便为接下来的数据挖掘课程学习做好心理准备。

1.2 深化基础,加强理论体系

大数据的特征决定了现有的数据中心技术很难满足其分析需求,主要表现在去噪降维技术、数据特征表示、数据存储、数据整合、非结构化和半结构化处理、数据通信传输和处理等方面。这些决定了数据挖掘技术面临着更严峻的挑战,并且数据挖掘的知识将涉及到数据库技术、机器学习、统计分析、模式识别、信息检索、高性能和智能计算等学科内容。然而,在目前的大学生课程体系中,难以在有限的时间内开设这些课程。针对这个问题,我们的做法是:将数据挖掘课程授课对象定位在高年级的学生,即大三或大四年级,这些学生一般对学习目标有较清晰的认识,并且有一定的知识储备;做好前期课程的准备,如开设高等数学、高等代数、统计分析、概率等数学体系课程,以及算法设计与分析、数据库原理、计算机系统原理等计算机课程,为学好数据挖掘打下必要的基础理论。除些之外,鼓励学生自觉学习这些相关课程,并推荐一些经典且较易理解的文章和书籍。为了让学生更好地了解国内外最新有关大数据的知识以及数据挖掘技术的进展,大学生英文阅读理解和写作水平的培养也值得关注。因此,在数据挖掘课程体系中,需要深化基础技能和理论体系,为后期学习数据挖掘课程提供便利条件和知识储备。

1.3 联系实践,创新教学方法

理论来源于实践,而实践是检验理论的途径。由于学生对大数据认识的模糊性以及数据挖掘理论和算法的抽象性,数据挖掘教学方法应该让学生明白所学课程内容的具体原理和实际应用领域。在基本的教学过程中,对数据挖掘的基本概念、原理和算法的讲解最好结合案例教学法[5-6],并且使用具体的数据演算实例来分析数据挖掘的过程和结果,使学生从实际案例中明白数据挖掘技术在处理大数据过程中的作用和意义。

除了从授课内容和教学方法方面改善外,学生自己的积极参与可以大大提高整个教学质量。学生是课堂学习的主体对象,被动学习的效果不如主动学习,即让学生欣然接受数据挖掘中的新内容和新方法,并且鼓励他们利用所学知识去解决科学实践问题。因此,在数据挖掘课程设计过程中可以采用案例采编及案例分析法,让学生自己独立或组队去搜集新课程内容涉及到的案例,让他们每两周提供一次案例分析报告,报告内容主要是数据挖掘在数据分析中的作用以及处理过程。同时,在上机实验时,让学生演算案例中的具体实例,进而有针对性地指导、启发学生积极思考。另外,针对每次案例采集和实验,让学生提交相应的分析报告,使得教师能更好地把握好学生对数据挖掘新内容理解和接收程度。

1.4 增强兴趣,深入科学研究

大数据环境下的数据挖掘将面临着比以往更大的挑战,这也使得数据挖掘将涉及到更多的学科,造成教学难度加大。因此,在教学工作中,教师要发挥主导作用,积极引导学生学习新知识的兴趣。例如,让学生间隔性地去了解大数据环境下数据挖掘技术解决了什么问题,哪些企业或政府在这方面又有了什么创举,甚至让他们调查如今各大型招聘网中有关大数据分析和数据挖掘等职位的情况,进而增强学生对数据挖掘的兴趣。

另外,高年级中部分学生可能将选择深造,出国或考研。针对这部分学生,可以鼓励其选择数据挖掘方向的科学研究。通过分配一些具体且较为长期的课题任务让这些学生来完成,其研究内容可以精细到一个数据挖掘算法的研究,这样可以培养他们对问题的深刻认识,有助于他们对研究问题和研究方法的精确把握。可以通过阅读经典文献,掌握最新技术和方法,努力培养学生的创新性思维,并且鼓励和引导他们进行学术性创作。通过把科学研究引入到实际教学中,不仅可以培养学生接收新知识的能力,还可以提高其解决问题的能力,为他们后期的大数据科学研究打下较为坚实的基础。

2 结束语

数据挖掘是大数据环境下高校急需开设的一门重要课程。传统教学主要是讲解数据挖掘的基础知识,学生对于抽象的概念和知识难以理解。针对数据挖掘交叉性强且知识结构较为复杂的情况,提出相应的教学策略以提高学生对知识内容和技术方法的兴趣。本文根据大数据的特征、作用和意义,结合实际教学经验,重点从培养学生的数据意识、加强理论体系、创新教学方法和深入科学研究等方面进行数据挖掘课程教学设计,为提高大数据环境下数据挖掘课程的教学质量提供参考依据。实践教学结果表明,该教学方法不仅能够提高学生对数据挖掘的兴趣,更有利于学生掌握课程的主要内容,并且对培养学生在计算机科学领域中数据算法研究能力具有一定的帮助。本文教学方法主要应用于大学本科的数据挖掘课程,对于研究生的大数据环境下的数据挖掘教学模式和课程设计有待于进一步探索和研究。

参考文献:

[1] 王珊,王会举,覃雄派等.架构大数据:挑战、现状与展望[J].计算机学报,2011.34(10):1741-1752

[2] 李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域[J].中国科学院院刊,2012.27(6):647-657

[3] 黄美丽.“数据仓库与数据挖掘”研讨型教学实践探析[J].计算机时代,2012.12:52-53,55

[4] 刘建伟.数据挖掘课程设计的教学探索[J].科技信息,2013.23:55-56

[5] 王华秋.任务驱动的数据仓库与数据挖掘课程案例教学[J].黑龙江教育(高教研究与评估),2011.6:52-53

[6] 周森鑫,盛鹏飞,王夫芹.数据挖掘课程案例教学研究[J].计算机技术与发展,2012.11:183-186

猜你喜欢

数据挖掘人才培养大数据
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
基于人才培养的中职生日常管理研究
基于人才培养的高校舞蹈教育研究
女子中专班级管理共性问题与解决策略研究
基于人才培养的技工学校德育实效性研究
基于大数据背景下的智慧城市建设研究
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究