Apriori算法在新工科学生专业承诺研究中的应用
2019-09-10苗维诚
摘要:目的:应用Apriori算法研究新设工学专业学生的专业承诺与相关影响因素之间的关联性.方法:采用问卷调查法,用Apriori算法进行关联性研究.结果:数据挖掘发现,在诸多影响专业承诺的因素中,“专业认知”“环境影响”“就业前景”这三个因素与制药工程专业学生的专业承诺水平关联性最强,对其有显著影响.结论:Apriori算法相比传统spss方法,更注重分析数据之间的联系,且找出了对学生专业承诺水平影响最大的三个因素,对于提升新专业的质量具有指导意义.
关键词:专业承诺;调查问卷;数据挖掘
中图分类号:G647 文献标识码:A 文章编号:1673-260X(2019)06-0155-03
1 引言
我国高等院校的办学理念已经由扩张型发展模式转变为内涵型发展模式,要求高校的发展要不断创新,办出特色,力争培养一流人才.在这种体制下,很多医学类院校为了提高办学层次,由单一型院校向多学科综合型大学转变,开办了一些近医非医的新专业.
蚌埠医学院近年来新建了三个工学专业,分别为制药工程专业、食品质量与安全专业和物联网工程专业.由于新专业成立时间短,办学经验不足,专业资源有限,使得新专业的发展面临一定的挑战.专业的特色和专业的优势无法体现出来,同时容易造成新专业的学生专业承诺水平偏低,这会导致学生对专业缺乏认同感,专业思想不稳定,学习上容易产生畏难情绪.这种低专业承诺水平对其学习和专业发展会造成严重的不良影响[1].
专业承诺是指个体认同自身所从事的专业或职业,愿意付出努力的积极态度.大学生的专业承诺水平可以通过“情感承诺”“规范承诺”“继续承诺”和“理想承诺”四个维度体现出来[2].本文通过对蚌医新设工学专业的学生进行问卷调查,了解其专业承诺水平的现状,运用数据挖掘Apriori算法找出影响学生专业承诺水平的关键因素.为提高学生专业承诺水平,提升新設专业的办学质量提供理论依据.
2 Apriori算法应用
2.1 算法介绍
在大量、繁杂、模糊的数据中,相互之间可能存在某种关联性,其中隐含着有用的信息.找出事物之间这种潜在关联的方法称为数据挖掘,提取出来的有用信息叫作关联规则.Apriori算法就是最常用的数据挖掘算法之一[3].
数据挖掘算法可以广泛应用在各行各业的数据分析中,Apriori算法就是用来分析找出数据之间的潜在关联性,然后人为去分析产生这种关联性的原因.而使用SPSS软件去研究数据之间的关联性,需要选择数据,建立回归分析模型进行研究,这就需要我们首先要为数据人为设定一个范围,算法的建立比较复杂,得出的结果可能也不准确.使用Apriori算法更简单、直观,是SPSS软件的一种有益补充.
2.2 研究方法
目前专业承诺的研究成果表明,影响大学生专业承诺的因素大致可分成学生个体的心理因素、学校教育因素和社会因素,共三大类.本文把这三大类影响因素再细分成五类,分别为:学生对所学专业的认知程度;学院对开办专业的管理水平;专业课教师的教学水平;学校环境氛围的影响;专业的就业前景.这五类影响因素分别记为“专业认知”“专业管理”“专业课教学”“环境影响”“就业前景”.
制作调查问卷,收集这五类影响因素和学生专业承诺的数据,运用Apriori算法研究这五类影响因素与学生专业承诺之间的关联性,试图找出其中与学生专业承诺水平关联性最大的影响因素[4].
2.3 数据获取
编制了《新设工学专业学生专业承诺问卷》和《专业承诺影响因素问卷》两个调查问卷来获取数据.《新设工学专业学生专业承诺问卷》改编自连榕等人编制的大学生专业承诺量表,可较好地反应大学生的专业承诺水平[5].《专业承诺影响因素问卷》参考目前已有的相关文献资料编制问卷结构和题型,问卷包含了“专业认知”“专业管理”“专业课教学”“环境影响”“就业前景”五个部分共22题,采用Likert 5级记分,完全符合记5分,比较符合计4分,不确定计3分,比较不符合记2分,完全不符合记1分.
调查对象选择蚌埠医学院新建制药工程专业的在校学生,2016至2018级三个年级学生,一共277人.本次调查共计发放问卷277份,收回有效问卷277份.每份《专业承诺影响因素问卷》按照“专业认知”“专业管理”“专业课教学”“环境影响”“就业前景”这五类影响因素进行得分汇总.从每份《新设工学专业学生专业承诺问卷》中获取该学生专业承诺水平的数据,一共采集六组数据.这样就获取了277份原始数据.
2.4 数据处理与分析
Apriori算法要求数据必须是布尔型,因此对收集的六组数据进行处理.六组数据“专业认知”“专业管理”“专业课教学”“环境影响”“就业前景”和“专业承诺”分别记为“A”“B”“C”“D”“E”“F”,统计每份问卷六组数据的得分,计算出277份问卷六组数据的平均分,见表1.
由表1可以看到,制药工程专业学生《专业承诺问卷》每题的平均得分为3.364分,处在Likert量表中的三、四级之间,说明学生的总体专业承诺水平处在中等偏上水平,还不够理想,确实有必要提高.五个影响因素的每题平均得分,“专业认知”因素得分最低,“就业前景”得分最高,可以反映出学生在专业选择的时候,相比于自身兴趣和专业办学内容等因素,更倾向于以专业的就业前景来进行专业选择,学生选择专业有较强的功利心.不考虑自身兴趣和自身特点盲目的进行专业选择,容易造成专业承诺水平偏低,在以后的专业学习上也容易造成困难.
再把每份问卷里六组数据的分数分别和平均分进行比较,比平均分高的就记为“1”,比平均分低的就记为“0”,六组数据就都分成了高“1”、低“0”两个等级[6].这样就把277份问卷的数据全都处理成了布尔型的“1”“0”数据,见表2.
277份问卷六组数据两个等级的总体分布情况,见表3.
2.5 算法计算
把处理后的数据(表2)输入到Apriori算法程序中,目标是找到包含F项的最大频繁项集.设置最小支持度为0.3,最小置信度为0.5,挖掘得到两个最大频繁项集:包含“F1”的最大频繁项集{D1,E1,F1},和包含“F0”的最大频繁项集{A0,D0,F0},详见表4.
由表4可以看到,两个频繁项集的支持度都大于设置的最小支持度30%,符合算法要求,且只有这两个项集的支持度大于最小支持度.项集{D1,E1,F1}表示D、E、F三个因素在一张问卷里同时为“1”的概率为33.21%;{A0,D0,F0}就是表示A、D、F三个因素在一张问卷里同时为“0”的概率为34.66%.数据挖掘发现,“专业认知”“环境影响”“就业前景”这三类影响因素和学生专业承诺水平之间有较强的关联性.
再从两个最大频繁项集中分别获得所有强关联规则,关联规则是一种蕴含形式X→Y,置信度表示的就是X∩Y的事务占项集X的百分比[7],详见表5和表6.
由表5得到关联规则:对自己的就业前景乐观有信心,且专业承诺水平较高的学生中,有88.46%的学生认为学校和同学营造出了良好的专业学习环境.
由表6得到关联规则:对所学专业不太了解,同时认为所在集体无法有效促进学习的学生中,有94.12%的学生专业承诺水平较低.
2.6 结果讨论
对数据挖掘的结果进一步分析,首先对三种因素进行分析:“专业认知”因素分析,调查问卷的数据显示,制药专业有80%的學生,入校时是校内专业调剂过来的,只有很少学生的入校第一志愿填的就是制药工程专业.这就造成了很多学生对本专业的不了解,最典型的例子就是,大多数学生入校时理所当然地认为“制药工程专业也是医学类专业”.对制药工程专业的不了解,导致了有超过一半的学生在校期间“对制药专业有过失落感”.
“环境影响”因素分析,(1)82%的制药学生认为校内环境,尤其是宿舍的学习氛围对自己有很大影响;(2)73%的学生认为学生干部没有在专业学习上充分发挥作用;(3)相对于医学专业,有37%制药专业的学生会觉得自己有点“独特”.在学生的学习和生活中,同伴的作用大于老师,营造良好的宿舍氛围,加强班风、考纪教育,提高班级凝聚力,可以有效提高学生学习的积极性.
“就业前景”因素分析,43%的学生不清楚制药专业的就业形势;48%的学生不了解制药专业的就业收入;63%的学生不满意制药专业的工作环境.制药工程专业需要接触到化学试剂,有可能接触到有害气体,需要在厂房工作,等等特点决定工作环境和学生期望值有差距,这需要学校做好学生就业指导工作,提早开始工作实习,让学生早日适应[8].
只有使非医专业的学生正确认识自己所学的专业,了解专业的办学内容和目标,清晰规划自己的未来,学生才能自觉营造出良好的学习氛围,使学生对专业产生归属感.为进一步了解不同影响因素对学生专业承诺的具体作用,对制药专业部分学生进行了深入的访谈.
3 总结
通过Apriori算法研究发现“环境影响”“专业认知”“就业前景”这三个因素对学生专业承诺水平的影响最大,可以针对这三个影响因素专门制定改善措施,对提高学生专业承诺水平有直接的帮助.下一步的工作即是使用SPSS软件对调查问卷的数据再一次分析,进一步研究医学院校新设工学专业学生专业承诺的现状,探讨提高医学院校工学专业学生专业承诺水平的途径.
参考文献:
〔1〕杨晓燕,肖安.高职学生心理健康问题原因分析[J].黄冈师范学院学报,2013,33(05):136-137+173.
〔2〕林良章,叶钦龙.大学生专业承诺与学习效能感的关系研究[J].黄冈师范学院学报,2013,33(05):107-109.
〔3〕倪东.基于数据挖掘的关联规则研究[J].太原学院学报(自然科学版),2018,36(03):36-39.
〔4〕冯俊,胥莉,闵兰.基于Apriori算法的高校学生考试作弊动机分析与应对[J].西南师范大学学报(自然科学版),2017,42(2):174-180.
〔5〕连榕,杨丽娴,吴兰花.大学生的专业承诺、学习倦怠的关系与量表编制[J].心理学报,2005,37(5):632-636.
〔6〕苗维诚,魏杰.基于关联规则算法的医学生对物理实验学习态度分析研究[J].普洱学院学报,2018,34(03):107-109.
〔7〕苗维诚,朱文婕.基于关联规则Apriori算法的物理实验成绩分析研究[J].赤峰学院学报(自然科学版),2019(01):14-16.
〔8〕叶俊.基于就业现状调查的地方本科旅游管理专业人才培养模式优化研究[J].黄冈师范学院学报,2018,38(01):14-18.