大数据时代的高校实践教学改革
2023-11-21郑芳超
郑芳超
[摘 要]本文主要介绍多源数据在高校实践教学改革中的应用,包括多源数据的整合和利用方法、多源数据在实践教学中的应用场景和实践方法等内容。在大数据时代,多源数据的整合与利用已成为高校教学改革和高质量发展的核心问题之一。本文深入探究了多源数据整合方法和技术,如数据挖掘、机器学习、文本挖掘、多源数据融合和数据可视化等技术,为多源数据在高校实践教学中的应用提供了重要支持和保障。针对教育大数据分析这一应用场景,本文从多个方面介绍了多源数据的实践方法,包括数据来源、数据整合、数据挖掘和机器学习等方面,帮助读者更加全面深入地认识多源数据在高校实践教学中的应用。
[关键词]大数据时代;高校实践教学;教学改革;多源数据;整合与利用
doi:10.3969/j.issn.1673-0194.2023.17.065
[中图分类号]G642 [文献标识码]A [文章编号]1673-0194(2023)17-0229-04
1 相关理论概述
1.1 高校教育实践的界定
高校教育实践是指高校为了促进学生全面成长和社会实践能力的提高,通过开展教育实践活动,使学生在实践过程中获得经验和技能的一种教育活动。高校教育实践包括课堂教育实践、社会实践和科技实践三个方面。
首先,课堂教育实践。面对不同专业特点,高校为了加强对学生实际动手能力的培养,引导学生对所学相关实践技能进行训练和实践。包括实验、实训、实习等。例如,在计算机专业中,高校可以开设相关的计算机实验系统,让学生通过实验来深入了解计算机原理和应用,并掌握相关技能。
其次,社会实践。高校为了提高学生的社会实践能力,培养学生的社会责任感、创新精神和实践能力,开设社会实践系统,可以让学生到社会实践中去学习和提升自己的能力。社会实践可以包括参观、调查、实践等多种形式,如到企业考察,到社区开展志愿活动,到乡村进行实地考察,等等。
最后,科技实践。高校为了培养学生的实践能力,提高学生的科技创新能力,因而开展各种形式的科技实践活动,包括科研实践、学科竞赛、发明创新等。例如高校可以组织学生参加全国大学生电子设计竞赛、机器人比赛、发明展览等科技实践活动,让学生运用所学知识进行创新实践。
1.2 多源数据的类型、来源和特征
在大数据时代,各种类型和规模的数据不断涌现,高校教育实践中如何将这些多源数据进行整合和利用,是当前高校实践教学改革的重大问题之一。而要进行多源数据整合,就需要了解多源数据的类型、来源和特征。
1.2.1 数据类型
多源数据可以根据来源和类型进行分类。按来源,可分为内部数据(学生成绩、学科课程表、选课信息等),外部数据(图书馆藏书信息、实验室设备数据等)和第三方数据(政府公共数据、互联网数据等)[1]。按类型,多源数据可分为结构化数据(关系型数据库、表格数据等),半结构化数据(XML、JSON等)和非结构化数据(图像、文本、音频、视频等)。
1.2.2 数据来源
多源数据的来源可以分为内部数据和外部数据。内部数据是指来自高校学生、教师、课程管理系统、教学管理系统等内部系统中的各种数据;外部数据则是指来自高校周边环境或者是网络中的各种数据。
1.2.3 数据特征
多源数据有以下几个特征。
首先是规模巨大。随着现代计算机技术的高速发展,各类数据的规模呈爆炸式增长。其次是异构性。多源数据来源、数据格式、数据结构都可能不同,因此数据的异构性十分突出。再次是多样性。由于数据来源多,其涉及的问题、应用和领域的多样性也是非常显著的[2]。再次是不确定性。多源数据来源复杂,数据内容随时可能变化,因此数据的不确定性极强。最后是价值潜力大。多源数据集成后能够发掘更丰富的信息和价值,对决策和管理具有重要意义。
1.3 多源数据的整合方法和技术
多源数据整合需要利用现代信息技术手段和方法,如数据挖掘、机器学习、文本挖掘、多源数据融合等。下面介绍常用的多源数据整合方法和技术。
1.3.1 数据挖掘
数据挖掘是一种利用计算机技术和统计方法自动地從大量数据中提取知识和信息的过程。通过对数据的分析、处理和挖掘,可以识别数据中隐藏的模式和关联规律。数据挖掘可用于多源数据的提取、分析和利用。
1.3.2 机器学习
机器学习是一种人工智能领域的分支,其主要思想是利用计算机程序模拟人类的学习过程,对数据进行处理和分析。机器学习可以构建分类模型、聚类模型、预测模型等,并可以通过数据的训练和预测来识别模式和关联规律。
1.3.3 文本挖掘
文本挖掘是一种利用计算机技术和自然语言处理技术,从大量的文字数据中提取和分析有用信息的过程。利用文本挖掘技术,可以对数据进行预处理、特征提取、分类聚类、主题挖掘等操作,从而提高数据的利用价值。
1.3.4 多源数据融合
多源数据融合是将来自不同数据源的数据集成成一个整体,并解决数据来源、数据结构、数据格式等问题的过程。多源数据融合包括数据库融合、XML数据融合、Web数据融合、文本数据融合、图像数据融合等[3]。
1.3.5 数据可视化
数据可视化是将数据的复杂结构和信息可视化呈现,并提供一种直观的方法,以帮助用户理解、识别和分析多源数据信息。数据可视化可以实现挖掘数据的编码和解码,可以通过数据显示、动画、图形等方式呈现复杂的多源数据信息。
1.4 多源数据分析的技术和方法
以下是多源数据分析中常见的技术和方法。
1.4.1 数据清洗
数据清洗是多源数据分析的一个重要步骤,其目的是去除数据中的错误信息、缺失信息或重复信息等无用信息,保证数据的准确性和可靠性。数据清洗的方法包括数据预处理、数据统一、数据融合等。
1.4.2 数据可视化
数据可视化是多源数据分析不可或缺的一个环节,它使得数据可视化呈现,帮助人们快速、直接地感知和认知多源数据的整体情况。常用的數据可视化技术和方法有图表、散点图、热力图、气泡图等。
1.4.3 数据挖掘
数据挖掘是多源数据分析中的一个重要过程,它通过数据挖掘、数据分析和机器学习技术,从数据集中自动地发现潜在的关联规律和模式。常用的数据挖掘技术包括聚类、分类、关联分析、异常检测等。
1.4.4 机器学习
机器学习是多源数据分析中一种重要的方法和技术,它通过建立数据模型和算法,利用计算机程序来自动化地发现数据中的内在规律和模式,不断优化模型和算法,提高数据挖掘和分析效率。
1.4.5 文本挖掘
文本挖掘是多源数据分析中的一项重要技术,它利用自然语言处理、统计学和机器学习等技术,从文本数据中自动提取出有用的信息和知识。常用的文本挖掘技术包括情感分析、主题建模、关键词提取等。
1.5 数据可视化的作用和意义
数据可视化是信息技术发展和数据分析技术的产物,是将抽象的数据转化成图形、表格、图像等可视化方式,以增强人们对数据信息的认知、理解和分析的过程。在多源数据分析中,数据可视化有以下几个作用和意义。
1.5.1 帮助数据理解
数据可视化通过将大量的、抽象的数据转换成有形的、可视的图形或表格,更容易被用户理解和掌握。用户可以通过交互式的方式,直观地从不同角度、不同维度理解数据,从而更深入、全面地分析问题。
1.5.2 改善数据沟通
数据可视化呈现数据以图形、表格、动画等方式显示,极大地减少了数据呈现的烦琐性,使得数据分析师可以更加灵活地呈现数据和结果。此外,数据可视化使得数据和分析结果更能够被非专业和非技术人员所理解,提高了沟通效率和沟通质量。
1.5.3 突出数据重点
数据可视化让数据更具形象、感性的表达,可以帮助用户快速地找出问题所在,突出数据中的重点和特征,以优化数据分析和处理。它可以有效地提取数据中的信息,帮助决策者更好地了解数据信息,为决策和策略制定提供了准确的指导。
1.5.4 促进建立数据分析的思考模式
数据可视化通过图表、动画、图形等多种方式呈现,可以帮助用户更加抽象地理解数据中的规律。与传统的数值模型相比,数据可视化帮助用户从不同角度、不同空间和时间上理解数据,帮助用户建立数据分析和解释的思考模式,从而有效地提升用户数据分析能力。
2 多源数据在实践教学中的应用
A高校引用了教务系统,用来实时监测跟踪师生学习的大数据。在实践教学中,多源数据应用场景和方法可以包括:利用师生学习数据分析工具,通过观察分析学生的学习状态、兴趣爱好等信息,为学生提供个性化的学习方案及跟踪学习进展;应用学籍数据,对学生的学习情况进行整体分析,通过发掘规律和趋势,对系统设置进行优化和改进等。此外,多种数据源的整合和运用,可以更好地支持学校管理和监督教学质量,提升教学效果并完善对学生的综合素质培养。
2.1 多源数据来源
在该教务系统中,多源数据可以来源于高校教务管理系统、学生选课信息系统、校内教育研究中心、国家教育统计数据中心等多个数据源,每个数据源收集到的数据都具有不同的特征和价值。
2.2 多源数据整合
针对多源数据来源的特征,应选用合适的数据整合方法。可以采用数据仓库构建方法,对学生、教师、选课、课程表等数据进行整合,构建适用于多种数据分析工具的数据集。
2.3 数据挖掘
在多源数据整合之后,需要进行数据挖掘和分析,以寻找数据中的统计规律和相关性。可以通过数据分析工具对学生学业成绩、家庭背景以及选课行为等数据进行深入分析和挖掘,以期发现学生学习绩效提升的关键因素和方法。
2.4 机器学习
使用机器学习算法对教育数据进行分析和处理,以发现新的知识和洞见。例如,可以使用决策树、聚类等算法找出有助于人才培养的因素,为提升教学质量提供依据。
2.5 数据可视化
在大数据时代,数据可视化是一种重要的展示方式。通过数据可视化技术,可以让数据更加直观、易于理解,对教育决策和管理具有重要意义。可以将数据结果载入一些数据可视化工具如Tableau、Power BI,或者使用Python中的Matplotlib,以图形化方式展示数据分析结果[4]。
3 数据整合、分析和可视化过程中的实践策略
在实践教学中,多源数据整合、分析和可视化过程中具体的实践包括以下几个方面。
3.1 数据收集与预处理
首先需要收集来自多个数据源的数据,并进行预处理。由于数据有不同的来源,其格式各不相同,可能需要进行格式转换、数据过滤、清洗等操作,以便将数据整合为一个统一的数据集。
3.2 数据整合和分析
在数据整合和分析过程中,需要考虑多个来源的数据格式、数据质量等因素。在数据整合时,需要借助各种数据挖掘和机器学习算法,将多源数据进行融合和集成。在数据分析时,需要分析各种教学数据以及相互之间的关聯性,将多源数据拆分、计算和组合,探索数据之间的关联关系,研究数据变化的趋势和规律,发现问题和提供解决方案等。
3.3 数据可视化
数据可视化是将数据通过图形和图像的方式展示出来,使数据更直观,易于理解和分析。可视化技术可以加强对学生学习情况、课程质量、实验数据等方面的分析和解释。例如,通过制作各类图表,如条形图、饼图、热力图、矩阵图等,可以直观地展现数据之间的关系和趋势,让教师和学生更轻松地理解和分析数据。
3.4 数据挖掘实践
数据挖掘可以用于概括出多源数据中的潜在规律或模式,或是因素及原因,或是预测性等,提供有助于决策和优化的信息。例如,分析学生成绩数据,挖掘其中关键因素,可以发现有哪些因素会影响学生成绩。同时,可以利用数据挖掘发现异常的学生成绩,进一步优化系统,提高教育教学质量。
4 结束语
多源数据的整合和利用正成为高校实践教学改革中的一个重要方向,它能够为教育领域带来许多新的机遇和挑战。本文从多个方面介绍了多源数据的整合和利用方法,以及其在实践教学中的应用场景和实践方法等,旨在帮助读者更好地认识多源数据在高校实践教学改革中的重要作用和应用价值。
高校实践教学改革是教育发展的必然趋势,多源数据的整合和利用是高校实践教学改革的重要内容之一。我们相信,在未来的新时代背景下,多源数据的应用将会越来越广泛,不仅是学校和政府机关,还包括企业和社会组织等各方面。多源数据的应用将会为实践教学提供更加精准的数据指导,为人才培养和教育改革提供有益的支持和保障。最后,我们希望本文能够对高校实践教学改革和多源数据的应用提供一定的参考和借鉴。
主要参考文献
[1]王颖,戴祖旭. 大数据时代高校思想政治教育评价方式改革探究[J]. 学校党建与思想教育,2018(16):52-54.
[2]李维. 大数据时代高校内部审计改革及发展策略研究[J]. 教育财会研究,2021,32(1):83-87.
[3]吕东刚,谭维智. 高校教学改革的“数据迷思”及其超越[J]. 江苏高教,2022(6):92-101.
[4]张学军. 大数据时代下的高校思政教学思路研究[J]. 教育研究,2022,4(11):32-35.