APP下载

关联规则挖掘在学生综合素质分析中的应用研究

2017-10-26刘潇沈良忠

电脑知识与技术 2017年22期
关键词:Apriori算法关联规则综合素质

刘潇 沈良忠

摘要:素质教育是当前高校教育教学改革尤其重视的一项内容,因为其整体反映了一所高校学生的综合素质水平。该文利用关联规则算法对学生综合素质等级测评的数据进行深入挖掘,对思德品德、学业成绩和体育成绩之间的关系进行分析,发现学生综合素质等级的影响重要因素,为今后学校提高学生综合素质提供相应的决策。

关键词:数据挖掘;关联规则;Apriori算法;综合素质

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2017)22-0023-03

1概述

随着各高校招生规模的不断扩大,以及民办高等教育的蓬勃发展,高等教育已经从原来的精英化教育进入了大众化教育阶段。高校招生规模的扩大直接导致了毕业生数量的逐年增加,使得大学生就业难成了普遍现象。当前,面对疲软的市场经济和激烈的就业竞争,各普通高等院校纷纷通过对接地方经济,改革教育教学内容和方法,强化专业能力培养,实现提高人才培养质量,提升人才就业竞争力的目的。然而,从就业市场特别是用人单位信息反馈看,用人单位最看中的还是毕业生的综合素质,而不仅仅是专业方面的知识和能力。因此,各高校纷纷提出了要加强学生的素质教育,实现专业教育和素质教育的彼此融合。由此可见,对学生综合素质测评影响因素进行分析,发现学生管理部门主控的思德素质与教务部门主控的学业成绩的潜在关系,发现教学管理与学生管理的相融点,并将其运用于实际管理是很有必要的。

高校学生的综合素质包括思德素质、文化素质、专业素质和身体素质四个方面。其中思德道德素质是根本,文化素质是基础,专业素质是本领,身体素质是保证,四者是一个有机整体,其结合的程度越高素质越高。因此,不少学者针对学生的综合素质开展研究,希望能够找到提升高校学生综合素质的一些教学管理方法。陈英以2010年春季学生综合测评表为基础,采用聚类与关联的方法挖掘其中的知识,并得出关联结果,为管理者有效管理提供了决策依据。马广凤通过对数据挖掘技术的应用,特别是关联规则、决策树的分类和预测的合理应用,全面、公平、客观地分析和掌握中职生综合素质指标和就业质量的关系,从而让学校管理人员更好地掌握学生的发展情况,并有针对性地教育提高学生的综合素质;同时也有利于用人单位合理地选拔人才。本文针对我校14信管专业的学生,以思德素质为落脚点,多渠道收集大量反映学生综合素质成绩的数据,使用关联规则算法对其进行挖掘,发现其中隐藏的相关规则,得出一些有价值的信息,为进一步加强和改进高校学生素质教育工作的提供一些建议和事实依据。

2数据收集与处理

按照文献1的要求,本研究中反映学生综合素质的数据主要包括思德成绩、学业成绩和体育成绩。其中,思德成绩主要来源学院学生办公室和班级学习委员统计。思德成绩又由学生评议(XSPY)、寝室表现(QSBX)和奖惩情况(JCQK)三部分组成,其中学生评议由学习委员组织班级同学进行打分后统计得出,寝室表现由本校社区管理处根据本学期检查情况统计得出,奖惩情况由班级学习委员汇总班级同学获奖情况得出。思想品德相关的原始数据如表1所示:

由于寝室表现和奖惩表现在打分的时候并没有按照百分制进行打分,因此需要通过公式1进行数据的标准化处理:

其中,x表示寝室表现和奖惩表现的原始成绩,Y表示两者处理之后的成绩。经过以上处理之后,三部分内容通过公式2计算得到思德成绩:

学业成绩主要来源于学院教学办公室。某课程的成绩经过公式3计算得到该课程的成绩绩点。该学生的所有课程绩点与课程学分通过公式4计算得到该学生的学业绩点。该学生的学业绩点除以班级最高的学业绩点等于该学生的学业成绩,通过公式5实现。

其中,n表示某个学生所有的必修课程数量,m表示学生所在班级的学生数量。

体育成绩以根据浙江省学生体测标准进行的学院体测成1绩为准。首先,将50米跑(记为A)、仰卧起坐/引体向上(记为B)、800米跑/1000米跑(记为C)、立定跳远(记为D)、坐位体前屈(记为E)等的体测分数对照体测评分标准表的得出相应项目的分数,根据公式6计算学生体育成绩:

为了更好地对学生综合素质进行评估,本文采用公式7得出学生综合素质的数据。

ZHSZ=SD×0.2+XYCJ×0.6+TYCJ×0.2 (7)

通过以上步骤的成绩收集以及处理之后,可以得到如表2所示数据。

由于Apriori算法只能针对离散数据进行处理,本文对连续型的学生成绩数据进行离散化操作。按照陈苗等的数据离散化处理方法,将成绩分为三个类别,主要规则如下:①成绩大于或等于75的为A;②成绩大于等于60且小于75的为B;③最后成绩小于60的为C。根据以上处理步骤,经过处理之后的数据如表3所示。

3关联规则算法

关联规则算法主要用于揭示了数据项间的未知的依赖关系,根据所挖掘的关联关系,从一个数据对象的信息来推断另一个数据对象的信息。Apriori是关联规则模型中的经典算法,它主要利用频繁项集性质的先验知识,通过逐层搜索的迭代方法进行计算,具体的计算步骤可以参考文献6。

本文主要基于Weka软件进行关联规则的挖掘,设置最小支持度0.2,最小置信度0.7,生成规则数为100,运行得到相应的规则,通过筛选整理部分学生评议、寝室情况、奖惩情况与思德成绩之间关系的规则如表4所示。

通过对表4的分析,可以得到以下结果:

①性别对思德成绩影响较大。女生思德成绩的等级大多为B,而男生的等级大多为C,说明男生思德成绩的等级较女生来说偏低,所以学校应加强男生的思想品德教育。

②大部分同学寝室情况等级为B,奖惩情况等级为C,说明14信管本1班的寝室情况为一般,而获奖情况较少。因此,学校应建设和利用好学生宿舍这块学生成长成才的重要基地,发挥其在有效提高学生的综合素质方面更的促进作用,同时鼓励学生多花精力在班级、学院、学校组织的课外活动,更积极地参加各种赛事。

③思德成绩评议与学生评议息息相关,而学生评议和人际交往密不可分。所以学校应多开展一些社会活动,增加学生与社会接触的机会,锻炼适应社会的能力。

然后,设置最小支持度为0.1,最小置信度为0.7,生成规则数为100,运行得到相应的规则,通过筛选整理部分思德成绩、学业成绩、体育成绩与综合素质之间关系的规则如表5所示。

通过对表5的分析,可以得到以下结果:

①体育成绩等级为B的,综合素质等级为B,可知,体育对学生综合素质起着至关重要的作用,所以学校应树立以素质教育为指导思德的学校体育观,要加强课程、教材建设,改革单一的教学模式,开展多种多样的学校体育活动,提高学生的身体素质。

②思德成绩等级为B,体育成绩等级为C,推出学业成绩为C;体育成绩等级为A,推出思德成绩为B;体育成绩等级為A,推出学业成绩为B。由此可以看出思想成绩、学业成绩、体育成绩这三者间是相互影响,相互促进的。所以学校负责教学管理与学生管理的部门也应该加强交流与合作,在提高学生学习成绩的同时,兼顾学生思德品德素质和身体素质的提升。学生管理与学生工作是两个相互独立又相辅相成的工作系统,如果二者之间可以协调配合,必将显著提高本校教书育人的质量。

3结束语

《国家中长期教育改革和发展规划纲要(2010-202年)》中把“坚持以人为本,全面推进素质教育”确立为我国教育改革发展的“战略主题”。为了帮助学校做好此项工作,通过数据分析提供科学的决策参考,本文根据学院学生办公室、教学办公室等的数据,基于Weka软件通过关联规则算法挖掘出了相关规则,得到了一些很有参考价值的结论,如学校应多开展一些社会活动,并鼓励学生多花精力在班级、学院、学校组织的课外活动,同时,学校负责教学管理与学生管理的部门也应该加强交流与合作,使教学管理与学生工作达到双赢,使学生培养管理体系更加科学和细致,以此提高本校教书育人的质量。与此同时,同学们也应该意识到提升个人素质的重要性,并配合学校、老师积极主动的采取措施锻炼自己,来提高自己这方面的能力。endprint

猜你喜欢

Apriori算法关联规则综合素质
基于Hadoop平台的并行DHP数据分析方法