APP下载

新工科背景下数据挖掘实践教学探索

2025-02-13牟谷芳张秋燕李胜坤

高教学刊 2025年5期
关键词:协同育人产教融合数据挖掘

摘" 要:随着大数据时代的到来,数据挖掘作为一种重要的数据分析技术,已经成为各个领域中不可或缺的一部分,实践教学是数据挖掘课程中的重中之重。该文主要介绍数据挖掘实践教学改革的相关内容,分析当前数据挖掘实践教学存在的问题,如教学内容设计不合理、教学资源不足、教学手段缺乏创新和“产教融合、协同育人”不够深入等。该文针对这些问题,提出实践教学改革措施,详细介绍案例驱动式教学模式和产教融合项目的实施。通过引入实际案例和参与项目研究让学生在实践中掌握数据挖掘技术,提高学生的实践能力和创新能力。

关键词:数据挖掘;实践教学;案例驱动式;产教融合;协同育人

中图分类号:G642" " " 文献标志码:A" " " " " 文章编号:2096-000X(2025)05-0103-05

Abstract: With the advent of the big data era, datamining, as an important data analysis technology, has become an indispensable part of various fields, and practical teaching is a top priority in data mining courses. This paper mainly introduces the relevant reform measures about the practical teaching of data mining. This paper analyzed the current problems in practical teaching of data mining, such as unreasonable design of teaching content, insufficient teaching resources, lack of innovation in teaching methods, and insufficient depth of \"integration of industry and education, collaborative education\". This paper proposes some reform measures to address these issues, and provides a detailed introduction to the practical teaching model and the implementation of industry education integration projects. By introducing practical cases and participating in project research, students can master data mining techniques in practice, and improve their practical and innovative abilities.

Keywords: data mining; practical teaching; case driven; integration of industry and education; collaborative education

在当前大数据时代,数据挖掘的应用范围越来越广泛。它可以应用于各个行业,例如金融、医疗、零售和制造等,帮助企业发现市场趋势、用户行为、产品优化等方面的信息。同时,数据挖掘也可以用于社会问题的研究,如疾病预测、舆情分析、社交网络分析等,为社会发展和决策提供指导[1-5]。

近几年,国家把大数据作为基础性战略资源,并实施了国家大数据战略。为了培养高素质的数据挖掘人才,教育部积极推进新工科建设,注重理论与实践相结合的培养模式[6-7]。数据挖掘的实践教学对于学生的能力提升至关重要。通过实践教学,学生可以学习并掌握数据挖掘的方法和技能,了解实际问题的解决方案,并培养解决问题的能力和团队协作精神。

此外,数据挖掘的实践教学还可以提供一个真实的学习环境,让学生接触真实的数据和场景,从而更好地理解理论知识,并将其应用到实际中。通过实践,学生可以积累经验,掌握数据分析和挖掘工具的使用,培养数据思维和数据驱动的决策能力。数据挖掘的实践教学在新工科背景下具有重要意义。它不仅能够帮助学生提高实践能力和解决实际问题的能力,还能够为国家的战略发展提供复合型人才支持。在未来,随着大数据分析技术的不断发展,实践教学将继续发挥重要作用,培养更多具备数据分析和挖掘能力的新工科人才。在未来,随着数据挖掘技术的不断发展,实践教学将继续发挥重要作用,培养更多具备数据分析和挖掘能力的新工科人才。

一" 数据挖掘实践教学的“痛点”

(一)" 教学内容与实际脱节

教学内容与实际问题结合脱节,学生无法将所学的知识应用到实际问题中,也无法理解数据挖掘的实际意义和应用价值。教学内容只注重某一方面的技能培养,学生可能无法全面掌握数据挖掘的知识和技能;教学内容与行业接轨不够紧密,学生无法了解行业需求和发展趋势,也不可能适应和满足未来就业市场的需求。

(二)" 教学资源不足

数据挖掘实践教学是一个复杂而又重要的领域,需要多学科交叉融合、平台建设、计算资源和软件资源的支持以及优秀的师资队伍来保证教学质量和学生能力提升。①缺乏案例分析平台。数据挖掘实践教学缺乏提供案例分析平台,让学生无法通过分析实际案例来掌握数据挖掘的技能。②缺乏真实数据。实验中可能会使用过时的、虚构的数据集来进行教学,这会使得学生难以理解数据挖掘技术在实际应用中的价值和意义。③缺乏师资。数据挖掘实践教学缺乏具有实践经验和教学经验的专业教师和实习导师等。学生可能无法得到有效的指导和支持,难以掌握数据挖掘的方法。④缺乏实操环境。数据挖掘实践教学需要提供实践操作环境,包括数据库、数据挖掘工具等。随着科技的发展,许多新的数据挖掘工具和技术不断涌现,但这些工具和技术在教学中的应用仍然有限,学生可能无法进行实践操作。

(三)" 教学手段缺乏创新

①重理论轻实践。传统的数据挖掘实践教学模式通常先以理论知识灌输为主,学生被动接受理论知识,然后上机实验。学生被动接受,缺乏实践操作的机会和自主探究的空间。这种教学模式容易导致学生对知识的理解和掌握不够深入,难以真正掌握实践技能和创新能力。②教学方法单一。不能满足学生多样化的实践需求,导致学生对学习的兴趣和积极性不高;不能培养学生的创新实践能力,影响学生的综合素质。

(四)" “产教融合、协同育人”不够深入

实践教学和企业的合作目标可能存在差异,学校教学注重理论知识的培养,而企业更关注实际应用和市场需求:一是教师不重视与企业的合作,参与度不高,缺乏持续的沟通,学生就没有机会参与企业的实际项目,无法通过与企业的紧密合作,不能更好地了解行业的需求和发展趋势,提高自己的实践能力。二是课程实践内容未能及时更新,实验内容与行业需求脱节,不能满足行业的发展趋势。“先理论后实践”教学方法过于传统,无法将最新的数据挖掘技术和应用案例融入到实践中,教学过程不能与企业之间进行有效衔接。导致实践教学的“产教融合、协同育人”只是“合而不融”,流于表面而无法达到深入合作的效果。

二" 数据挖掘实践教学探索

针对数据挖掘实践教学面临的“痛点”,教学改革势在必行。为了提高教学质量和培养学生的实践能力,主要从更新实践教学内容、开展多维度的实践教学模式[8]、创新实践教学手段和建设实践教学平台等方面入手。

(一)" 更新实践教学内容

增加实践内容:在课程设置中,适当增加实践课程的比例,使学生能够在实际项目中学习和应用所学知识。这有助于提高学生的实践能力,并使他们更好地了解行业需求。

建立实践教学资源库:收集和整理行业内的实际案例和经验,使数据科学与大数据技术专业的实践教学更加贴近行业需求,为学生提供丰富的实践教学资源,更好地了解行业需求,提高他们的实践能力。同时也帮助学生更好地适应社会经济发展的趋势,培养出更多具备创新能力的大数据人才。

(二)" 开展多维实践教学模式

构建“第一课堂+第二课堂+竞赛项目”的分层次实践课程体系,突出学科交叉,注重知识在数据科学、人工智能等相关领域的综合应用和实践,旨在培养和强化学生的动手能力和创新意识。

第一课堂以案例驱动式教学为主,在算法讲解时,从案例库中选择与专业相近的应用案例,可以帮助学生更好地理解和掌握算法的核心知识点。例如,讲解图像处理算法,可以选择一个与计算机视觉相关的应用案例,如物体识别。通过这个案例,可以引导学生学习图像处理的基本概念,如像素、颜色空间、边缘检测等,并将这些概念应用到实际问题中:介绍物体识别的背景和应用场景,以及常见的物体识别方法。在实践过程中,重点讲解算法的关键步骤和原理,如特征提取、分类器训练、预测等。同时,还可以让学生思考如何优化算法性能,如使用不同的特征表示方法、调整超参数等。完成实例演示后,可以让学生尝试自己设计一个更复杂的物体识别算法,或者将其应用于其他相关领域,以拓展他们的知识面和实践能力。通过这种教学方式,不仅可以节省课堂学时,还能提高学生的学习效果。

第二课堂以“产教融合,协同育人”的项目为训练目的:让学生走出课堂,项目走进课堂。首先,企业提供一些实际的大数据应用案例,让学生在分析和设计这些案例的过程中学习和掌握数据采集与预处理、数据挖掘算法和程序设计。其次,企业提供一些实际的项目任务,参与实际的项目和案例,学生可以了解到企业在实际工作中遇到的问题和挑战,从而更好地理解自己的专业知识如何应用到实际工作中,提高他们的实践能力和解决问题的能力。最后,企业可以提供一些实际的创新指导,在项目的实施过程中,学生需要不断地思考和尝试新的解决方案,这不仅可以提高他们的创新思维,也可以培养他们的创业精神。总的来说,第二课堂与企业合作,开展“产教融合,协同育人”的项目,是一种有效的教育和培训模式,可以帮助学生提高专业技能和综合素质,更好地适应未来的就业和发展需求。

鼓励学生积极参加竞赛项目,如全国大学生数学建模竞赛、全国大学生数据统计与分析竞赛、数据挖掘比赛等。这些竞赛项目通常需要学生运用所学的数学方法、统计知识、数据挖掘技能来解决实际问题。全国大学生数学建模竞赛通常要求参赛队伍选择一个实际问题,通过建立数学模型来解决问题。这需要参赛队伍运用所学的数学知识,结合实际问题,创新性地提出解决方案。这种竞赛过程可以锻炼学生的创新能力和团队协作精神。全国大学生数据统计与分析竞赛则要求参赛队伍收集和处理大量的数据,通过统计分析方法来揭示数据背后的信息。这需要参赛队伍运用所学的统计学知识,结合实际问题,创新性地提出解决方案。这种竞赛过程可以锻炼学生的数据处理能力和数据分析能力。数据挖掘比赛则要求参赛队伍利用数据挖掘技术,从大量的数据中提取有价值的信息。这需要参赛队伍运用所学的数据挖掘知识,结合实际问题,创新性地提出解决方案。这种竞赛过程可以锻炼学生的数据挖掘技术和创新思维。总的来说,参与这些创新型项目,可以帮助学生提高自己的专业技能和创新能力,同时也可以提高他们的团队协作能力。

(三)" 创新实践教学手段

设计实验任务:根据所选数据集的特点和教学目标,设计相应的实验任务,例如分类、聚类、回归等任务。①分类任务。根据给定的数据集,学生需要使用适当的机器学习算法进行分类。可以选择常见的分类算法如决策树、支持向量机、朴素贝叶斯等。学生需要对数据进行预处理和特征工程,然后使用训练集训练模型,并使用测试集评估模型的性能。最后,学生需要解释分类结果并进行可视化展示。②聚类任务。根据给定的数据集,学生需要使用适当的聚类算法进行聚类分析。可以选择常见的聚类算法如K均值、层次聚类等。学生需要对数据进行预处理和特征工程,然后使用训练集训练模型,并使用测试集评估模型的性能。最后,学生需要解释聚类结果并进行可视化展示。③回归任务。根据给定的数据集,学生需要使用适当的回归算法,如线下回归、逻辑回归和岭回归等进行回归分析。

引导学生实践操作:在实验过程中,引导学生逐步完成数据预处理、特征筛选、模型训练和评估等步骤,并对结果进行检验。①数据收集和预处理。帮助学生理解如何获取和处理原始数据。②特征工程。引导学生选择和应用适当的特征工程技术来提取有用的特征。③模型选择和调参。帮助学生理解不同的机器学习算法及其适用场景,并指导他们选择合适的模型和调整模型参数以提高性能。④模型评估和解释。引导学生使用适当的评估指标来评估模型性能,并对结果进行解释和分析。⑤结果可视化。指导学生使用数据可视化工具将结果以图表等形式进行可视化展示。

组织讨论和分享:在实验结束后,学生可以展示他们的实验结果,并与同学一起讨论结果的意义、优点和不足之处。鼓励学生分享他们在实验过程中遇到的问题、解决方法以及吸取的经验教训。促进学生之间的合作学习和知识交流,让他们从彼此的经验中学习和成长。

提供反馈和评价:对于学生在实验中表现出的优点和优秀的工作成果给予肯定和赞赏;对学生在实验中存在的不足之处提出具体的问题和改进建议,并鼓励学生继续努力学习和提高,不断探索和应用新的数据挖掘技术和方法。

理论与实践相结合:在课程设置上,教师应将理论知识与实际应用紧密结合,让学生在学习过程中既能掌握基本概念和方法,又能通过实际项目锻炼自己的能力。可以通过案例分析和项目实践等方式将理论知识应用到实际问题中,让学生深入理解和掌握数据挖掘技术的应用过程。

项目驱动式教学:鼓励学生参与真实世界的数据挖掘项目,让他们在实践中学习。这有助于培养学生的团队协作精神、沟通交流能力和解决问题的能力。

(四)" 加强实践教学平台的建设

数据挖掘实践教学平台的建设需要考虑多个方面,包括平台架构、数据源、数据处理、数据分析和数据可视化等。同时,大数据实践教学还需要充足的软件资源的支持,如数据库、数据挖掘工具等。这些软件资源需要不断更新和升级,以适应新的技术和应用场景的需求。因此,需要搭建校企合作平台、确定合作目标和内容、建立合作关系、实施合作项目和评估合作效果。与企业保持密切合作,及时获取最新的行业动态和技术发展情况,共享企业的技术资源和实践案例,提高课程的实践性和针对性。结合行业实际需求,提供一系列大数据处理和分析的实际案例,让学生在实际操作中掌握技能, 培养学生的实际操作能力和创新能力。同时,构建稳定的专兼职组合双师团队,完善“引进与派出,双向培养”机制[8]。

针对数据挖掘实际场景应用案例,可借助于现有的大数据平台,如阿里云大数据平台[9]、TipDM数据挖掘建模平台[10]等进行线上完成。下面以医疗保险的欺诈发现为例说明在TipDM数据挖掘建模平台[10]的操作流程。首先,给出问题的设计流程图,如图1所示。

该实验流程分为 4 个步骤: 导入医疗保险的相关数据到TipDM数据挖掘建模平台;对数据进行探索性分析、修改列名和绘制保险条款类别饼图操作;对投保人信息表与索赔信息表进行表连接、数据编码化和数据标准化等操作;使用K-Means算法构建模型,进行投保人分群。通过这样一个完整的流程(图2),学生可以在实操环境中非常清楚地了解医疗保险的欺诈发现的流程和原理,只是在传统的实验条件下需要花费大量的时间。

三" 数据挖掘实践教学改革的成效

(一)" 以“产学合作,协同育人”为目标完善实践课程体系

成都信息工程大学应用数学学院(以下简称“我院”)不断完善创新教育课程体系,构建了“课程”—“实验室”—“公司”的三位一体。实践教学环节与企业合作将企业的实际项目包装引入到教学环节,由企业工程师讲授部分内容,有效提升了学生实操能力:一方面,强化实践课程与对口企业的融合,进一步拓展学生的知识宽度,培养学生创新意识,引导学生结合实践项目开展创新创业实践活动。另一方面,我院以大学生创新开放实验室和数学模型与仿真实验室为平台,引导学生深入进行课程实验和科研训练;与四川融科智联科技有限公司、万达信息股份有限公司、四川人为人才科技有限公司、成都和煦医疗科技有限公司、中孚信息股份有限公司和北京聪明核桃教育科技有限公司等共建校企合作教育基地(表1),构建共建共享协同联动实践教学平台,实现学生从“课程”—“实验室”—“公司”的创新教育与训练。

我院为实践教学不断加强指导教师培养,加强企业工程师和专业师资队伍建设的融合,通过“内培外引”的方式,解决实践教学双师型教师缺乏的现实问题。

(二)" 创建实践能力培养链,搭建学科竞赛培训体系

我院突破实践教学定式,以数据分析方法为主线,强化数据挖掘算法的应用,创建“逐步推进、分层深化、综合应用”的实践能力培养链。依托国家级科技创新平台,搭建“三段式分层次递进”的学科竞赛培训体系,以数学建模竞赛训练学生运用数学方法和算法设计解决实际问题的思维和方法,提高综合应用能力和创新意识;以大数据分析与算法设计项目来锻炼学生提出问题、设计方案、组织实施的探究意志和创造精神,提高解决复杂工程问题的高级思维和创新能力。

四" 结束语

随着大数据技术的发展和应用,对数据挖掘人才的需求持续高涨。传统“重理论轻实践”教学模式已经不能满足数据挖掘人才的需要。本文详细分析了当前数据挖掘实践教学的“痛点”,以构建“第一课堂+第二课堂+竞赛项目”的分层次实践课程体系,培养和强化学生的动手能力和创新意识。创新教学手段,激发学生的学习兴趣和培养学生的团队协作能力。实施“产教融合,协同育人”的教学模式,实现学生从“课程”—“实验室”—“公司”的创新教育与训练,提高学生的实践操作能力和创新能力。同时,要加强实践教学平台的建设,与时俱进,让学生更有效接触大数据分析平台,提高解决复杂工程问题的高级思维和创新能力。

参考文献:

[1] 韩阜益,陈建荣,唐俊峰,等.数据挖掘在高校资产管理中的应用[J].实验室研究与探索,2017,36(3):295-298.

[2] 王建民.大数据战略:从数据大国到数据强国[J].科技导报,2020(3):34-34.

[3] 魏凌华,徐成振,胡国亮.数据科学与大数据技术专业实践教学体系研究[J].淮北师范大学学报:自然科学版,2021,42(4):83-87.

[4] 李贞玉,杨国程,王鑫.新工科背景下地方高校化工类人才培养改革研究与实践[J].高教学刊,2021(10):1-8.

[5] 卫志华,孔思尹,丁志军,等.新工科背景下数据挖掘课程综合性实验设计[J].计算机教育,2020(3):127-130,135.

[6] 中共中央办公厅、国务院办公厅.中华人民共和国国民经济和社会发展第十三个五年规划纲要[Z].2016.

[7] 梁循.交叉学科课程金融数据挖掘教学探索与实践[J].高教学刊,2020(24):114-116,119.

[8] 孙开伟,邓欣,王进.新工科背景下数据科学与大数据技术专业实践教学体系研究[J].高教学刊,2023,9(14):5-8.

[9] 王振武.基于阿里云大数据平台的“数据挖掘”课程实验教学方探讨[J].实验室研究与探索,2018,37(6):192-196.

[10] 刘名军.顶尖数据挖掘开发平台(TipDM-D2)产品白皮书[Z].2015.

基金项目:教育部高等教育司产学合作协同育人项目“新工科背景下《数据挖掘》实践教学研究”(231107273010105);教育部2021年第一批产学合作协同育人项目“微分方程数值解一流线下课程建设”(202101011011);成都信息工程大学2022校级教改项目“《数据挖掘》线上线下混合式一流课程建设”(YJG2022059)

第一作者简介:牟谷芳(1981-),女,土家族,湖北恩施人,博士,副教授。研究方向为应用数学。

猜你喜欢

协同育人产教融合数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
校企合作协同育人在大学生就业工作中的作用研究
专业教师与思想政治教师协同育人机制研究
协同育人视角下高校创新应用型人才培养研究
浅议物流管理专业的产教融合
产教融合背景下高职院校“双师型”青年教师队伍建设研究
校企协同应用型软件人才培养机制
产教融合提升课程有效性的思考
由“依附”走向“联动”:学校与政府协同育人策略研究