关于高等教育教学信息的数据统计分析与数据挖掘分析的探讨
2023-07-14张淑红
张淑红
关键词:高等教育;教学信息;数据挖掘统计;分析模型
高等教育是我国教育事业的重要组成部分,其在高等综合人才培养中发挥着重要作用。现代教育理念下,高等教育的背景环境、目标要求发生了较大变化。在高等教育信息化转型发展中,教学信息的容量不断增加,数据类型不断丰富,建立必要的高等教育教学信息数据统计、挖掘、分析和利用模型,能实现这些教学信息的高效利用,这不仅有利于知识共享、教学服务工作的开展,而且对于高等教育信息发布、在线教学工作都具有较大影响。新时期,高等院校有必要对教学信息数据模型进行进一步创新和优化,以此来建设数字化的教学平台,为高等教育教学工作的开展奠定良好基础。
一、高等教育信息化内涵
早在20 世纪90 年代,教育信息化理念便已产生。对比传统的教学模式,高等教育信息化与新技术、新概念的提出和融合应用具有较大关系,其在整个教学过程中表现出网络化、智能化和数字化的特征。
现阶段,信息技术在高等教育中的应用范围不断扩大,高等教育形式也逐漸丰富。结合实际可知,高等教育信息化集中表现在以下四个层面:一是在高等教育中,互联网技术的应用不断深入,其通过网络化的服务实现了教学资源的充分利用,有效提升了教学效率,增强了现代高等教育的自主化程度与互动化水平。二是在高等教育信息化背景下,电子课本等教学资源的应用逐渐广泛,尤其是微课教学资源及ipad 移动设备的应用,减少了现代高等教育对纸质教材的依赖。三是融合使用信息技术后,高等教育还深化虚拟实验室的利用,这为高等教育中的实验操作提供了全新载体平台,拓展了高等教育信息化建设及教学发展的空间。四是伴随着云计算、云存储技术的应用,高等教育信息化发展中的云端水平不断提升,在云平台的作用下,高等教育中的资源配置更加合理,资源使用更加高效,有效地提升了高等教育的整体水平[1]。
二、高等教育教学信息数据挖掘及统计方法
(一)数据挖掘
作为高等教育教学信息数据利用的基础,数据挖掘是一个较为专业的分析过程,其需要从冗杂的低价值数据中,通过抽象提取等方式,选择更加紧凑且具有价值的数据,为教学信息数据的高质量应用奠定良好基础。在过去,高等教育中多采用手工分析和预测的方式进行数据挖掘,但在高等教育信息化发展背景下,这种方式已经难以适应新时期的信息挖掘需要。对此,基于新技术的数据挖掘方式得到了推广和应用。高等教育教学信息化背景下,数据挖掘中所涉及的技术不仅包含机器学习、数据库应用,而且涉及人工智能、模式识别。此外,云计算也是新时期高等教育教学信息挖掘的常用技术类型。在这些技术支撑下,高等教育教学信息挖掘可分为关联学习、分类学习、聚类、数值预测等类型。在具体的数据挖掘中,还需要重视教学信息选择、预处理、变化、挖掘、理解评估等环节的控制,通过有效的数据迭代处理挖掘到符合预期的教学信息数据[2]。
(二)干预规则
干预规则是高等教育教学信息数据统计分析中较为常用的一种方式,其需要通过提出的规则,对特定的目标对象进行干预,在这些干预规则下进行数据的统计分析,能指导高等教育后续教学工作的开展。利用干预规则进行高等教育教学信息数据统计分析时,主要的数据处理方式可分为三种:一是在明确规则的指导下,对教学信息数据进行干预挖掘和利用;二是在干预规则下,找出教学信息数据自身的行为规律,并在这些行为规律的作用下,确定教学干预的最佳时机和力度;三是在考虑教学信息数据目标对象的基础上,对数据中的随机扰动问题进行分析,实现干预规则的最优利用[3]。在高等教育信息化发展及教学信息挖掘和统计分析过程中,关联规则挖掘的应用广度和深度正在不断增加。在实际干预中,高等教育工作者需要考虑两个层面的要素,一方面,在确定干预目标时,应确定具体的干预属性,继而在相关规则的作用下,分析算出挖掘频繁项集,找出相应的关联规则;另一方面,在具体干预中,还需要最明显、变化幅度最大的干预内容,以满足后期教学活动的控制需要。
(三)聚类算法
采用聚类算法同样能完成高等教育教学信息数据统计分析工作。就聚类算法本身而言,其需要在考虑教学信息数据对象内容的基础上,深层次地分析这些数据对象的相似度,然后将其分成若干个群体,由此形成聚类簇。现阶段,聚类算法在数据统计分析中的应用不断深入,仅从高等教育教学信息挖掘、统计和分析过程来看,聚类分析本身是一系列挖掘任务的统称。在实际的数据聚类分析中,聚类算法不仅使用了机器学习、模式识别,而且融合了图形识别等多种工具。
三、基于高等教育信息化的教学数据信息统计分析和挖掘分析模型
(一)数据来源分析
在高等教育工作中,分析教学数据需清晰掌握教学信息数据的基本来源,并做好相应数据的准确分类,这样能为具体数据的分析和利用奠定良好基础。在高等教育教学信息来源分析模型中,可按照数据统计、数据挖掘的实际需要,建立双核心的数据来源分析框架模型。
在数据统计分析来源分析模型中,教师可借助既有的数字模型和平台,快速、准确地收集学生的各类行为数据, 并进行有效评价。在数据统计分析模块中,需从学生行为、课程问题、学生考卷情况等多个方面进行数据收集和统计分析。以学生行为数据分析为例,其数据不仅包括互动答疑及提问次数,还包括互动答疑及提问的内容。此外,课堂参与次数、教学资源查看次数等都是学生行为数据的重要类型,需在既有模型下,保证这些数据来源准确,并实现这些数据的有效统计和分析。
开展教学数据挖掘工作时,具体的数据大多来源于两个层面,一是学生行为统计分析的结果,二是学生的成绩。就数据挖掘模块而言,其能通过多种挖掘手段的应用,发现学生学习的干预规则,随后在考虑数据统计分析模块统计结果的基础上,得到较为准确的干预内容,进而通过互动平台实现学生的有效干预[4]。
(二)数据统计分析
结合实际可知,建立高等教育教学数据信息统计分析和挖掘分析模型后,教育工作者能在既有模型的支撑下,科学使用相关的网络手段,实现用户行为的有效报告。但这些报告的内容本身不够灵活,难以满足后期需要。对此,需要分模块对既有教学信息统计分析和挖掘分析的模型进行调整。新时期,信息化技术在高等教育中的应用不断深入,在教学数据信息统计分析层面,新技术的融合使得既有数据模型的数据统计分析方式得到优化。从数据统计分析过程来看,信息技术对高等教育教学数据统计分析的影响着重表现在两个层面,一是使得学生行为关键表现指标的分析更加明确;二是在学生课程成绩分析中,既有数据统计分析模型能实现相关数据的归一化处理。
在学生行为关键指标分析中,以前的互动教育平台便可实现学生行为的详细记录,这对于学生行为统计分析工作的开展创造了良好环境。在建立高等教育教学信息统计分析模型后,可以准确衔接互动教学平台,还能实现学生登录、退出、浏览等系统性资源的准确把控。在此基础上,信息时代下的高等教育教学信息统计分析模型还对学生的关键行为进行系统归类。从具体分类情况来看,高等教育教学信息统计分析模型下的学生关键行为不仅包含课程资源查看、课堂参与、课程历史资源查看,而且涉及课程作业查看、课程作业上传、论坛讨论,此外讨论参与频率、小组讨论结果查看、小组讨论参与程度都是学生关键行为的重要指标。依托这些指标,教育工作者能对学生参与教学的基本情况做出科学评估,这简化了后期的教学信息挖掘流程,为学生行为数据的挖掘奠定了良好基础。
统计并分析学生成绩是评估高等教育教学效果的重要措施,在过去,高等院校虽然进行了一定的学生成绩统计分析工作,但是这些统计分析过程容易受到多种因素的干扰。新时期,在依托多种现代信息技术建立高等教育教学信息统计分析模型后,教师可在前期数据分类的基础上,按照归一化处理的方式准确获取学生的成绩信息,然后使用学生成绩变化曲线来消除其他干扰因素,以此来掌握成绩的整体水平。在既有模型下,针对学生成绩的统计分析,教师还需要重视归一化处理算法的应用,提升教学信息统计分析的整体效果。
(三)数据挖掘分析
高等教育教学信息挖掘包含了多种方式,在新建数据挖掘模型下,学生复杂系统模型的应用较多。该模型将学生的学习成绩作为分析对象,深层次地分析了学生学习过程中各种可能的影响因素和相关属性。在学生复杂系统模型建设应用中,针对学生成绩的具体分析主要集中在两个层面。一方面,教学信息数据分析需要对干预相关强度进行分析,结合实际可知,学生群体本身具有复杂性的特征,其包含了较多的属性信息,一般除学生学籍信息、爱好、基础学习信息外,日常行为信息、网络教学平台行为信息等都是极为重要的内容,这些内容会对学会成绩信息的挖掘分析产生影响。对此,在亚复杂系统的作用下,可干预相关度较小的数据剔除,然后对剩余数据进行分析,确保学生成绩分析工作的高效开展,提升学生成绩分析的准确性。另一方面,教育工作者还需要对既有的亚复杂系统进行萃取,选择具有较高相关度的属性信息来干预今后的教学,助力高等教育教学工作开展,提升学生的学习成绩。
基于亚复杂系统模型对教学信息进行挖掘分析时,教育工作者在建立相应数据挖掘分析模型后,还需要注重以下要点控制。其一,在教学数据挖掘分析中,教育工作者需重视数据挖掘流程的系统管理。以学生成绩数据挖掘为例,教育工作者在掌握成绩数据来源后,需进行数据处理和离散化分析,然后依托关联规则、干预规则,按顺序进行成绩数据挖掘分析,获得预期的数据挖掘成果。其二,在数据挖掘分析中,教育工作者还应聚类抽取学生群体特征行为,并深化对挖掘分析结果的深层利用,以此来改进后续的教学方法,提升学生的学习成绩[5]。
四、高等教育教学数据信息统计分析和挖掘分析实现路径
(一)重视系统架构建设
教学数据信息统计分析和挖掘分析工作本身具有较强的专业性、综合性和复杂性,为在高等教育中时效内教学信息的统计和挖掘分析,就必须重视相应数据平台的有效建设。在高等教育教学数据信息统计分析和挖掘分析平台建设中,一方面,高校自身需要加大在信息技术层面的资金投入,依托充足的资金建立教学数据平台,系统收集各类教学信息,为后期的教学数据统计和挖掘奠定良好基础。另一方面,在系统软件层面,高等院校需要考虑平台数据统计、挖掘分析系统的安全性和可拓展性,系统建立Struts 框架,并从数据统计、数据挖掘两个模块进行功能模块设计,为后期数据分析奠定良好基础。此外,在系统架构建设中,还需要重视数据库单元的有效设计,实现高等教育教学中各类教学数据的有效归集。
(二)重视数据统计和数据挖掘技术应用
数据统计和数据挖掘技术应用是高等教育教学数据分析利用的核心。在既有的数据统计、挖掘分析模型下,高等院校需要从试卷、学生行为、课程热门问题等模块开展分析工作,并在这些模块的数据统计分析中重视计量资料统计、技术资料统计、等级资料统计方法的创新应用。如在计量资料统计分析中,高等院校可使用参数检验法和非参数检验法进行统计分析,随后可通过四格表和R×C 表利用方式完成计数资料统计分析,另外对于等级数据进行统计分析时,需在考虑这些数据性质和类别等级的基础上,完成具體数据的有效分析。依托数据统计、挖掘分析模型进行教学信息挖掘分析时,高等院校需重视干预规则的有效利用,系统化地对多种教学信息进行挖掘,在具体的数据挖掘过程中,还需要重视统计、在线分析处理、情报检索、机器学习、专家系统等多种工具的应用,提升数据挖掘的效率和精准程度。值得注意的是,在这些数据统计分析和数据挖掘分析方法应用中,高校管理者还需要不断提升自身的信息化意识与素养能力,凭借较高的专业素养推动教学数据统计、挖掘、分析和利用工作开展,助力高等教育教学工作顺利开展。
五、结束语
高等教育教学信息的深层次利用对于整体的教学质量具有较大的影响,深化这些数据的统计、挖掘和分析利用,能创造良好的教学模型和教学管理环境,继而有效评价教学质量,改进教学方法。新时期,教育工作者要充分理解高等教育教学信息数据统计分析的价值,结合实际深化教学数据统计、挖掘和分析方法利用,并在相关数据分析利用中重视相应模型的建设,这样才能最大程度地发挥教学信息数据的价值,指导后期教学工作开展,进而提升高等教育质量,推动高等教育工作的可持续发展。