基于特征信息熵的本科生“成才之路”可视化分析及对策
2020-08-16朱燕燕李宜霏聂朦
朱燕燕 李宜霏 聂朦
摘要:教育是民生大计,高等教育更是为国家培养优秀人才的重要环节。为了解大学本科生成长成才现状,我们围绕大学生学习状况、生活习惯、社交状况、心理状况以及部分开放性问题展开问卷调查。本文对数据进行初步分析与展示后,应用信息熵原理计算各特征之间的相关关系得到相关关系矩阵,针对具体的因变量,可以利用熵权法确定指标权重明确影响程度大小;最后选取部分具有代表性和争议性的问题进行数据可视化分析呈现,得到相关结论并给予高校与大学生相关建议。
关键词:信息熵;成长成才;影响因子;建议;相关关系
1 前言
1.1 利用数据分析探究大学生“成才之路”
近年来,社会新闻媒体和舆论大众将视野聚焦在当代大学教育上,并发现了大学教育中存在的诸多不良现象。诸如,一部分大学生在课堂上并不认真,玩手机,走神的情况频发;身体和心理素质过差,抗压抗打击能力薄弱……大部分学生习惯了高中的应试教育模式,在自主学习的情况下往往无法合理安排时间,学习效率低下,导致失去学习兴趣。
在此背景下,如何培养高等教育人才显得极为重要。当代社会是数据的社会,本实践团队将大学本科生的特征数据加以分析整合,得到大学生成才成长道路的特征以及各因素之间的相关关系,对目前的高等教育大有裨益。教育乃是立国之本,在大学本科阶段得到一条创新的普适性成长成才道路对社会和国家都具有重要的战略性意义。这项研究在探究大学生的成才之路的过程中了解大学生在日常生活、学习生活、心理状态、家庭因素等对其人生轨迹的影响,为大学生提供必要的生活指导。
1.2 研究方法
本次研究以自行设计的调查问卷为工具,选取了影响大学生成长成才的诸多因素,围绕大学生的学习状态、生活习惯、社交状况以及心理状况展开,结合大学生对自身現状主观评价展开分析,并在问卷结尾附有开放型意见,以便对未考虑全面的问题做一定的补充。共回收有效问卷508份,其中线上问卷314份,线下问卷198份。调查对象以大学在读本科生为主,共484份本科生数据,另有22份准大一学生的问卷,在问卷数据分析中运用了SPSS、excel和python等多种工具。
2当代大学生成长成才调查现状
本次调查面向的对象是大学本科生,年龄在17-25岁之间,其中女生占比56.1%,男生占比43.9%,总体较符合随机抽样要求。调查范围涵盖河海大学、北京大学等148所高校,其中河海大学(243份)为主要数据来源,去除部分噪声数据后有效问卷498份。
本次问卷从学习、生活、社交、心理等多个维度展开调查,且搜集了大学生对自身生活学习状态的满意度。多数人对自身生活学习状况持较为满意并仍想改进的态度,仅有5%对现状十分不满意,想要尽快改变。
2.1学习状况
调查结果显示,15%的同学名列前茅,42%的同学成绩位于上中等,28%位于中等,11%处于中下等水平,4%直接表示无心学习,成绩不好。其中,80%的同学在为四六级做准备,另20%的同学准备考雅思托福。现阶段有12%的学生计划毕业后出国深造,有24%的学生打算就业,而另外63%则倾向于读研深造。可以看出,英语学习仍旧是重中之重,读研深造仍是绝大多数学生的第一选择。
学习时间方面,大部分的学生可以在每天保持2到5小时的学习,仅有6.6%的学生每天学习时间在8小时以上。学习地点方面,图书馆、自习室这类正式学习场所仍是主要选择。
55%的被调查者表示会主动寻求资源进行学习,14%倾向于需要用到的时候再学习,剩下的同学没有很好的掌握学习的方法途径。总的来说,大学生的学习热情较为高涨,能够自觉主动寻求新知识。
2.2生活习惯
调查显示,大学生生活丰富、娱乐形式多样,几乎每个人都有自己喜欢的一两项运动项目。但大学生普遍运动时间少、运动频率低,大学生在体育锻炼方面仍需加强。作息方面,大部分学生会在8到9点之间起床,只有10%左右的学生能做到在11点前睡觉。可以发现,绝大多数大学作息时间与公认的健康作息相差甚远,“晚睡晚起”已经成为了大学生的常态。令人意外的是,总体来看大学生的饮食习惯较为健康,有54%的同学几乎不点外卖,而天天点外卖的人数不到13%。
2.3 社交状况
交际能力强,朋友圈广的人只有20%,70%的同学有三五好友,46%认为三五好友已经足够,喜欢独处的同学比较少。团队合作中,愿意当负责人的人只有16%,6%的人更喜欢划水,42%的人喜欢接受分配的任务,36%的人爱充当主要角色。从数据来看,有必要调动大家积极性,增强大家的创新能力。
2.4 心理状况
大多数同学的大学生活适应问题不大,只有不到20%的同学需要花费很长的时间适应大学生活。在被人接纳理解方面,58%认为生活中大多数人可以接纳自己,仅有2%认为几乎没有人能理解自己,需格外关注其心理健康状况。80%左右的同学在心情低落时,能够较快调节过来,而在观点发生冲突时,近半数同学会理性地反观自己,接纳可取的部分,另有38%的同学都倾向于坚持自我,让别人接受自己的观点。
2.5 目标 & 成就
通过词频分析,在成就感来源事件方面,关键词排名靠前的以“考研”、“上岸”“四级”等学业成就为主,另外“脱单”“朋友”等社交成就也是成就感的重要来源,而针对年度目标,“考研成功”、“成绩”、“保研”、“高分”等依旧是热门词汇,可以看出同学们对于读研的热情一直处于较高的水平。除此之外,“减肥顺利”也成了当代大学生的不懈追求。
3 信息熵相关特征分析
将调查问卷中每一道选择题作为调查对象的属性之一,探究大学生成长成才现状规律即寻找各项属性之间是否具有相关关系。
3.1相关性分析
通常在进行连续特征之间的相关性计算时,可以直接采用皮尔逊相关的计算方法。然而在本次调查中,收集到的问卷数据均是离散型的分类数据,在对离散特征进行处理时,若使用皮尔逊系数将使得结算结果存在失真。本次调查针对的是大学本科生表现出来的生活、学习习惯、心理、社交方面的特征和偏好,很大程度上来说并无好坏优劣之分,不适宜对各特征值进行评分计算优劣,这里我们引入“信息熵”理论和方法计算离散特征之间的相关性。
3.1.1 实现步骤
设有一组数据集S,其中有两个离散特征分别是A和B,利用信息熵计算A、B的相关系数。实现步骤如下:
1)信息熵
离散特征A的的信息熵:
在进行数据的处理时,为了方便对各项进行相关关系的计算,我们将调查数据中的每个问题定义为一个离散特征,将每个答案选项设置为该特征下的不同类别,并设置不同的数字标签以对不同各类别加以区分。除性别用(0,1)进行划分外,其他选项均已选项顺序ABCDE分别对应标签(1,2,3,4,5)。
3.1.2 算法输出结果
将问卷调查中标签化之后的数据代入,计算任意两列之间的相关系数,得到一个相关相关系数矩阵,如下图所示:最终得到的相关性系数矩阵如下图所示:
为了更直观地对相关性进行观察,使用python工具对该相关系数矩阵进行可视化,绘制热力图如下:
以第11行第10列数据为例,该坐标值代表每周运动次数与每周运动时间的关系,由矩阵可知其相关性系数为0.76,即运动的时间与次数之间有着较强的相关性,由此可以大致判断该相关系数矩阵的可信度较高。因此,通过对每个特征与其他特征的相关系数进行逐一排查,并按降序输出,即可从中选出具有代表性的变量间关系进行下一步的数据交叉分析与深层信息的挖掘。通过信息熵概念的引入、离散型随机变量相关性算法的选择,以及对全部特征的相关性进行逐一排查与选择,避免了使用先验知识进行先入为主的分析,保证了后续对数据挖掘的全面性与准确性。
3.2 熵权法确定指标权重
若想探究因变量与其他影响因子之间的关系,可以利用熵权法根据指标变异性的大小来确定各指标客观权重。
设有k个影响因子,各指标的信息熵为E1,E2,...,Ek,则各指标权重为:
例如,为研究成绩排名的与影响它的离散特征之间的具体关系,这里取K=5,从相关关系矩阵中取出排名前五的特征(英语学习打算w1、学习习惯w2、每天学习时间w3、课外学习兴趣w4、毕业去向计划w5)作为影响因子。计算得出各指标权重为:
根据各指标权重,可以定量的得到各影响因子的影响程度大小,结合相关特征进行分析和预测。
4 数据可视化交叉分析
利用相关关系矩阵和熵权法,我们挑选了几个比较具有代表性和争议性的问题进行针对性的分析。
4.1 关于现阶段生活学习满意度影响因素的交叉分析
绘制大学生关于生活学习状态满意度与其他变量的雷达图可以直观显示相关性大小:
由图可知,与当前状态满意度相关性最强的因素集中在衡量当前社交情况的指标上。包括心情低落时需要的调节时间、对于社会与父母接纳程度的自我感知、不被认可时的表现、在团队工作中的角色认领以及适应大学生活的时间等。
除此之外,在校期间点外卖的频率也与学习生活状态满意度呈现出一定的相关性:
而与我们通常的认知有一定冲突的是,成绩排名与满意度并无太大关联,这也意味着成绩优异并非代表自我满意度高,而成绩较差也并非意味着对自身不满、并且拥有充分的改变动机。
借助马斯洛需求层次理论,可以对满意度与这里体现的三个因素(社交情况、外卖情况、成绩排名)进行一定的分析。?马斯洛理论把需求分成生理需求(Physiological needs)、安全需求(Safety needs)、爱和归属感(Love and belonging)、尊重(Esteem)和自我实现(Self-actualization)五类,依次由较低层次到较高层次排列1。
当代大学生大部分都处于衣食无忧的状态,即生理与安全层次上的需要都基本满足,因此会寻求情感归属以及尊重的需要。其中“情感归属”,即在友情、爱情与亲情中,是否得到了自己需要的理解与接纳,当自己感知到的感情上的理解更多,对于当前状况的满意度也就越高。而“尊重”,则是在社会环境下,自我的认同感、以及在不同的社交场合中的自我定位。当自己能够在社会中得到更多的尊重与认可,譬如在团队工作中能够得到普遍的认可,那么尊重的需求得到满足,从而能提高满意度;
而到“自我实现”的需要时,由于每个人理想抱负均有差异、对自己能力的认识和评价也各不相同,因此在实现自己价值的过程中会由于进度不同而造成满意度的失衡。譬如成绩靠前的同学,由于现有水平仍未达到既定目标而产生对现状并不满意的状况,而成绩较差的同学,由于习惯于一直待在自己的舒适区中生活而不愿做出改变,因此对现状较为满意;这也说明了为何成绩与自我满意度并没有太大关系的原因。
虽然在理论解析中,某一层次的需要相对满足了才会向更高一层次发展,但其次序并非完全固定,在同一时期,一个人各层次的需要相互依赖和重叠,高层次的需要发展后,低层次的需要仍然存在。基于这一观点,反推当自我对现状并不满足时,可能会诉诸最基本的需要,譬如通过点外卖的方式来获得最为快速的满足感,这也在一定程度上解释了为什么在天天点外卖的大学生群体中,对现状十分不满的人数比例相较其他两项有所升高。
4.2 关于成绩影响因素的交叉分析
采取同样的方法对成绩影响因素进行进一步探究。对相关系数矩阵中成績排名特征列进行降序输出后,可以观察到与成绩相关性最强的是英语、毕业计划等学业规划以及学习习惯的因素;而相关性最弱的是在生活学习状态的满意度上,说明由于自我认知的不同或自我要求的差异,成绩与大学生是否对当前生活状态满意并无直接的关系。
此处以学习习惯为例,将其与学习成绩进行交叉分析(见下图),可以观察到:名列前茅的同学,大部分情况下都喜欢一个人去图书馆自习室学习,而成绩在中等以下的同学,大多数都倾向于在寝室学习,或与同学朋友一起去专门学习场所学习。由此我们可以大致得出结论:相较于充满诱惑的寝室,图书馆、自习室这类更为正式的学习场所中学习效率或许更高;同时,若与同伴交流学习困惑,固然可以帮助我们进步,达到“1+1>2”的效果,但若被虚假的“充实感”欺骗,将“与同学一起”作为重点,学习却摆在次要的位置上,则是舍本逐末。大学生应摆正心态,选择最适合自己的学习方式。
除了学习习惯之外,进一步对毕业去向计划、英语学习打算、每天学习时间等几个相关性较强的因素进行交叉分析,可以大致总结成绩优秀学生的普遍规律:目标稳定且长远,能够及早确定毕业后发展方向,在英语学习计划上有明确的目的性,同时对前往更高平台继续深造抱有较大热情;大部分时间习惯一个人去图书馆自习室,避免其他冗杂因素的干扰;能够将每天的学习时间保持在2到5小时及以上,会保证最低学习时间,但不会盲目追求学习时长,而是将学习效率发挥到最高。
4.3 其他交叉分析
除学习生活满意度与成绩外,还可以对大学生的日常运动情况进行探究。对每周运动次数的相关因素分析由相关性雷达图可知,每周运动的次数除了与运动时间紧密相关外,还与性别和每天的学习时间相关,可以通过条形图进一步展示运动与学习之间的关系。
由图可知,每周运动时间能保持在5次以上的同学,在学习时间上表现也较为突出,每天能够学习8小时以上的同学中比例最高,可见运动时间与学习时间之间冲突不大,生活自律的人通常会合理的安排好学习时间、积极锻炼身体。
5 结语
我国大学生多数处于青年中期这一阶段,在这个阶段,人体的生理发育已接近完成,但其心理尚未成熟,容易造成心理冲突,如理想与现实的冲突、独立与依赖的冲突、自卑与自尊的冲突、竞争与求职的冲突等等。为帮助大学生心理健康与综合素质全面提升,结合上述分析成果,可以从大学生群体和高校两个方面给出合理的建议。
首先,对于大学生,结合优秀学生的普适性规律,不断完善自我认知、摆正自我定位,提高自身的思想素质和心理素质,才能更有利于未来的就业、求学、发展、生活的目标规划。
其次,基于对大学生生活学习状态满意度的分析研究,对高校方面也可以给予一定教育反馈。学校应大力加强校园文化建设,注重行为文化、制度文化等方面的宣传,构筑思想性、学术型共存的自由开放的交流平台,打造特色鲜明的校园文化2;同时可以通过多种媒介渠道与社会更紧密地接轨,通过形式多样、内容丰富的讲座与活动等帮助同学们拓宽视野,更好地对未来进行规划,并帮助有需要的同学实现高质量充分就业。
参考文献:
[1]林婷. 马斯洛需要层次理论对应用型高校大学生思政教育的启示[J].科教文汇(上旬刊),2020(03):28-29.
[2]刘静. 影响大学生成长因素的调查分析——以鲁东大学为例[J].黑龙江史志,2009(02):159+168.
[3]姚井君. 从马斯洛需要层次理论谈高校学生管理[J].教育教学论坛,2012(31):220-221.
[4]李兆博. 工科院校本科生成长路径研究[D].哈尔滨工程大学,2014.
作者简介:
朱燕燕 (1999.05-),女,安徽省铜陵人,南京市江宁区河海大学信息管理与信息系统专业 本科生。
李宜霏(1999.08-),女,山东省济宁人,南京市江寧区河海大学信息管理与信息系统专业 本科生。
聂朦(2001.04-),女,江西省吉安人,南京市江宁河海大学法语专业本科生。