基于关联分析的学生活动参与度与高校社团管理实证研究
2016-06-30洪一洋李玥玥
洪一洋+李玥玥
【摘 要】社团活动是高校第二课堂的重要载体,学生参与度不仅为评价高等教育质量提供了新视角,其数据还可成为学生分类研究的基础,对高校社团管理提供科学依据。本研究应用weka软件对学生活动参与度进行数据挖掘的关联分析,通过分析学生活动参与度不同时间的差异变化,将数据分析引入日常学生工作,对高校社团进行更科学有效的管理。
【关键词】关联分析;weka;活动参与度;社团管理;高校第二课堂
0 引言
以学生为中心是现代大学强调的教育理念,特别是在高等教育大众化阶段,学生群体类型随着学生数量的增加出现了新变化,同时高校社团的管理也成为衡量教育质量的一种方式。如今以大学生为主体的高校社团数量上急剧增加,但质量却逐渐产生很大的差异分化,许多社团疏于管理和引导,导致许多大学生对社团活动的参与度逐渐降低。
随着学校共青团深化改革的不断深入和推进,作为高校共青团具有战略意义的制度创新和高校素质教育的新探索——高校共青团“第二课堂成绩单”逐渐引领新的趋势。社团作为第二课堂载体的一部分,对学生从多方面进行性格和能力的补充,要想客观地从第二课堂管理和引导学生,就应对不同类型学生的心理和行为特征进行分类个性化研究。
通过大学生参与社团活动的信息记录,进行数据挖掘和分析,用科学的信息管理方法了解学生活动参与度变化的原因,从感性的方式转变为量化的角度,针对性地改善社团质量、改变管理方式,真正做到“因材施教”。
1 理论与应用
1.1 数据挖掘
数据挖掘(Data Mining)是指从数据库中挖掘信息模式发现知识模式的一个完整过程,是从海量的、非完整的、模糊的、随机的数据集中,提取隐含在人们事先不知道领域且具有潜在价值信息的过程。
数据挖掘的过程,大体分为四步——明确挖掘目的、数据预处理、数据挖掘、后续处理。关联规则挖掘是指从事务数据库、关系数据库和其他信息存储中的大量数据集之间发现频繁出现的模式、关联和相关性。
1.2 Weka软件
Weka全称为怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一个基于纯Java技术并应用于数据挖掘和知识发现的开源项目。历经十多年的发展,Weka已成为如今最完备的数据挖掘工具之一,用于数据挖掘的二次开发和算法研究,被誉为数据挖掘和机器学习历史上的里程碑。
1.3 关联分析
关联分析是一种自动型数据分析与挖掘技术,作为数据挖掘技术最常用的方法,最早应用于分析消费者交易记录中隐藏的购物模式,主要目的是从大量数据中寻找商品间关联性的描述,以制定商品组合的营销策略。
运用关联分析进行数据挖掘时,只需将收集的数据按专业软件的要求进行适当的抽取、预处理,并组织形成分析用的数据集合,在事务数据库中设定支持度和置信度等相关参数等强关联规则,剩下的工作全部由软件完成,用户只需对处理结果进行检验和分析即可。
2 实证研究数据的选取
2.1 数据选取依据和来源
学生活动参与度记录是由笔者所在社团组织部,每次活动指派人员负责现场签到得到的,采取活动开始前和活动结束后两次签到的方式,保证样本数据的科学性和准确性。
笔者所在社团新一届成员共32名,从工作记录中查阅本学期各项工作活动的签到记录,用Excel进行数据的录入,同时将中文字符删除更换为X1、X2、X3……X8,将“参加”更换为YES标签,检查无误后即完成了学生活动参与度的原始数据统计。
2.2 数据处理过程
数据处理过程主要是对数据原格式进行转换,学生活动参与度的原始数据是Excel文件保存的xlsx格式数据,需转换成Weka支持的arff或csv文件格式。由于Weka对arff格式的支持更好,故笔者优先选择arff格式作为分类器原始数据的保存格式,数据预处理如图1所示。
将activity.xlsx另存为activity.csv文件,运行Weka软件,打开刚才通过Excel保存得到的activity.csv,将其保存为Arff data files(*.arff)文件类型,最终得到的数据文件为activity.arff。
3 数据挖掘实证研究
横向对比分析,对原数据设定8个标签(X1、X2、X3、X4、X5、X6、X7、X8),用Excel表格中用函数=COUNTIF(B5:B36,$B$42)计算不同标签出现真值(YES)的频率,并计算其所占百分比。
为从学生社团活动参与度数据中挖掘出更可靠且可能给活动组织举办提供建议的活动项目组合,本实证研究将Weka软件进行关联分析算法的参数——最小支持度lower Bound Min Support设定为0.3,即参加了前一活动的社团成员至少有30%的可能性参加后一个活动;将最小置信度min Metric设定为0.6,即至少有60%的可能性同时参加两次活动。
设定完参数后启动关联规则的数据挖掘,整个规则的挖掘过程都由软件直接自动完成,最终从学生活动参与度的统计数据中获得置信度最高的12条关联规则,如表1所示。
纵向关联分析:
通过Weka分析得出的关联规则共21条,因考虑学生活动实际参与情况的影响,这里只考虑分析置信度最高的10条规则。
1.在参加暑期实践报告会彩排的同学中,79%同时也参加团校培训开班仪式;
2.在参加演讲比赛初赛的同学中,75%同时也参加了内部培训;
……(规则解读类似,此处省略)
9.在参加团校培训开班仪式的同学中,71%同时也参加了内部培训;
10.在参加演讲比赛初赛的同学中,69%同时也参加了团校培训开班仪式。
4 结论与对策建议
4.1 研究结论
在笔者所在社团里,本学期学生活动参与度相比而言处于较低水平,结合当时实际情况,从两个不同角度分析其原因,对社团管理提出建议。
横向对比分析,活动参与比例超过60%仅只有一个活动——X5内部培训,活动参与度百分比低于50%的却有2个活动——X2演讲比赛决赛、X7暑期实践报告会彩排。
新生的入学为高校社团注入了新的活力,将开学以来每次活动按时间进行列举分析(如图2所示),新生在入学后对大学的适应过程存在着一定的波动起伏,对大学生活初次接触的新奇和陌生导致9月初到9月中旬,社团成员对开展的学生活动参与度不是很高,呈下降趋势。
而在9月中旬持续到10月中旬,近1个多月的时间里,社团成员对学生活动的参与度大幅度增加,原因分析有两方面:一方面因为新生进入大学一段时间后,带着全新的认识一定程度上调整了生活状态,逐渐进入正常轨迹;另一方面随着对大学了解的深入,新生对社团活动新奇度不断增加,促使其活动参与度也逐渐提高。
到达峰值点是10月中旬X5内部培训,因为在此活动中是office和Photoshop等常用软件的应用教学,“纯干货”的知识和经验吸引了社团成员对活动的热情,因此学生活动参与度达到22人,占比例68.8%。
10月中旬以后,社团成员对学生活动的参与度又出现降低现象,说明新生在入学后因活动频繁、趣味性不强等原因,逐渐对活动失去了最初的热情,同时因为进入大学生活后可能产生一定的厌倦情绪,导致对学生活动的参与度达不到之前的水平。
纵向关联分析,通过对不同活动之间的关联数据比较,可以发现暑期社会实践与团校培训开班仪式、演讲比赛和内部培训、手绘涂鸦大赛和社团聚餐、暑期实践报告会和内部培训的每两个活动之间存在一定的联系,如果利用好这些内在关联,将活动“捆绑式”策划,对社团人员管理和活动的开展有着重要的意义。
4.2 对策建议
横向对比,在对社团今后的管理上,可结合不同活动举办时的学生活动参与度进行考虑,转变思维从参与人的角度进行策划。举办不同活动时调整活动的形式,结合微博微信等网络新媒体,让活动更贴近青年的生活和兴趣。
纵向关联分析,比较不同活动之间的关联信息,可在社团管理和活动举办前,考虑不同活动是否可以结合,尽可能提高活动的参与度。通过刚才的数据挖掘发现,不同活动间存在一定的联系,将此类活动同一时间举办不仅提高了活动内容的丰富性,还对社团活动的整体效果和实际意义产生积极的作用。
第二课堂是引领青年学生成长成才的“指挥棒”,是促进当代大学生融入社会的“通行证”,高校社团作为第二课堂的重要载体,尝试改革创新,改变原先固定传统的活动形式,以科学的角度在高校社团的组织和管理上进行有效的调整,让大学生真正从社团活动中得到成长和进步。
【参考文献】
[1]卢媛媛,张剑,何海燕.基于WEKA的客户分类信息系统研究[J].计算机工程与科学,2011(5):132-135.
[2]邓晓梅.基于数据挖掘的电信客户细分模型研究[D].大连理工大学,2006.
[责任编辑:杨玉洁]