APP下载

基于数据挖掘的高校学生社交能力提升路径研究
——以北京师范大学班级社交模型构建为例

2024-01-09郭学茹吕光明刘芳南孙留萍

牡丹江教育学院学报 2023年9期
关键词:社交能力刷卡数据挖掘

郭学茹 陈 平 吕光明 刘芳南 孙留萍

(北京师范大学统计学院, 北京 100875)

2022年党的二十大对教育、科技、人才进行了“三位一体”统筹部署,首次将“推进教育数字化”写入报告中[1],指明了教育数字化在促进未来教育高质量发展的重要使命。2023年1月,全国教育工作会议也进一步指出“纵深推进教育数字化战略行动,重点做好大数据中心建设、数据充分赋能”[2]。可见大数据已逐渐成为驱动教育创新发展的新引擎,也为思想政治教育工作提供了一种认识学生特点的全新思维与夯实思想引领的全新手段。本文将基于高校学生校园社交行为大数据,通过引入共现概念并建立模型,计算挖掘学生的人际关系和社交特点,探索大学生校园社交行为的特征,助力高校在精准掌握学生动态的基础上,设计全方位、多层次和精细化的社交能力提升路径方案,为高校学生社交能力的全面提升精准施策,助力高校精准育人与科学管理。

一、高校学生社交大数据特征挖掘方法

(一)研究方法

共现一词最初是在普林斯顿大学开发的WordNet语义词典中提及,作为普通名词表示同时发生或有关联的事物。相互关联是共现发生的内因,而共现是两个事物相互关联的体现[3]。共现理论起初被用于信息检索、知识网络构建等文本挖掘方向,随后逐渐被引入社交关系研究中。特别是随着大数据与统计分析技术的发展,对高校学生一卡通数据的挖掘分析逐渐成为研究热点[4]。采用共现思想挖掘校园一卡通数据特征,即两个同学在同一时间同一个pos机上刷校园卡为共现一次。对于不在同一时间刷卡的情况,两者刷卡时间越近,说明两者共现的概率越大,其相似度越高。通过对生活场景分析,发现对于食堂就餐、超市购物、体育馆或操场的刷卡场景,相邻两人的刷卡时间差通常均为1-3分钟,故将共现的刷卡时间差设置为3分钟,若两人在同一地点刷卡时间差在3分钟之内,则视其发生共现,据此建立共现模型,并计算学生间的相似度,利用学生间相似度水平的高低来推断两者的亲疏关系。

而相似度又可转换为两者之间的距离,这样通过对距离使用谱聚类算法,可将距离相近的学生归为一类,进而识别学生社交圈层的个数及分类特征。谱聚类算法是一种以图论为基础的算法,利用特征值和特征向量的方法对数据进行聚类,其本质是将聚类问题转化为图的最优划分问题[5]。谱聚类的主要优点是对数据结构要求不高,对校园一卡通这类时空节点数据的聚类更具优势。但该法需要提前给出聚类个数,以减少计算量,提高计算处理速度。本研究使用Calinski-Harabasz Index(简称CH得分)选取聚类数目,当CH得分越大,说明聚类效果越好。

(二)高校学生社交模型构建

当代高校学生是互联网社交的“原住民”,但徜徉网络与现实社交截然不同,社交现场感的长期缺失会严重影响大学生的表达、理解、应变与交流等社交能力。而大数据的迅猛发展为挖掘校园社交行为提供了技术支撑,可使校园社交行为数据分析从定性的描述性统计、升级为定量的精准数据挖掘,从而助力高校夯实精准举措实效,全面提升大学生的线下社交能力。

高校学生的线下社交行为因学业和生活影响,多为本班同学间的人际关系。因此为了客观准确的描述其社交关系,并考虑班级为主体的影响,本文实证分析的数据来源于北京师范大学某班级学生2018年9月至2019年6月校园一卡通数据平台中的6.5万余条消费数据和1.3万余条运动数据。其中消费数据指学生各种消费行为的流水记录,包括食堂就餐、浴室洗澡和超市购物的刷卡时空数据,运动数据指体育馆和操场运动行为的门禁刷卡记录。数据预处理方面,先从初始数据信息中提取学生学号、刷卡日期、刷卡时间和刷卡地点等字段,对刷卡时间的格式进行转换;为了保护学生隐私,再将每位学生的学号随机转换为学生代表编号进行表示。再对刷卡地点编码,将文字形式的刷卡地点转换成码值;最后为了提高数据的准确性和计算效率,将同一位学生同一日期刷卡时间差内的记录汇总合并为一条,建立开始时间和结束时间的数据集。据此建立共现模型,基于Python中numpy模块的矩阵运算相关函数,后依托其networkx包和Graph_Matrix包对谱聚类结果进行可视化,揭示高校班级学生群体的社交亲密关系、社交网络特征和社交圈层分布规律,从而精准指导高校学生社交能力培养和提升工作。

二、基于数据挖掘的高校学生社交能力特征分析

(一)班级活跃度较低学生的“分散式”社交网络特征

通过挖掘绘制班级整体的社交网络图可甄别班级活跃度较低的学生。如图1所示,其中每个节点代表一名同学,两个节点之间的边线代表两者间的社交关系,边线越粗说明两者关系越亲密,且越亲密的两个节点在图上相距越近。从图1中可以看出该班级同学间边线连接紧密,形成了交织密集的社交关系网,说明班级同学之间共同活动的频次较高,整体凝聚力较强。其中同学1、同学2及同学13明显处于距离中心最远半径的边缘状态,未在密集交织区域,且与班级同学连线较细,说明与班级的社交联系相对疏远。距离中心位置半径次远的同学27、53、4、19、16等,处于班级社交网络的次边缘,其班级社交关系未在中部核心“交织区”。因此以上社交网络特征为“分散式”的同学可能存在社交离群的倾向,在日常管理中应予以关注了解和精准甄别。

图1 班级学生社交网络图

(二)班级活跃度较高学生的“凝聚式”社交网络特征

图2 代表性学生社交网络图

在班级学生社交网络分析的基础上,通过构建相似度矩阵可精准判别班级活跃度较高的学生社交网络特征。图2以图1中距离班级社交网络中心距离不同的3位学生作为代表,绘制其个人社交网络图。同学55的社交网络图相较同学6和同学53呈现较为紧密的状态,多数边线很粗,凝聚力很强,是班级内活跃度较高学生的典型“凝聚式”社交网络特征,说明同学55和班级大部分同学关系都较为亲密,与众多好朋友经常一起学习或参加活动。此类班级活跃度较高学生,是发挥班级朋辈帮扶的“核心”力量。

(三)班级活跃度中等学生的“主体式”社交圈层特征

采用谱聚类方法可识别班级活跃度中等学生群体的社交圈层特点。本文通过迭代计算得到聚类数分别为3、4、5、6、7时的得分值,其中当聚类数为5时得分最大,确定最优聚类数为5(图3a)。即可将班级同学的相似度聚为5类,也说明班级存在5个社交圈,并绘制5类学生与全班学生的相似度水平分布情况展示(图3b至图3f),每幅图的横坐标为全班学生转换后的代表数字编号(1-60),纵坐标为学生之间的相似度水平。

从中可以看出,五类同学与全班每个学生的相似度水平都分布于5个明显不同的区间,说明聚类区分度良好,代表性较强。从图3b至图3f五类相似度的具体分布可以发现其平均水平逐渐降低,每个图中的学生主体与全班学生的相似度水平大体分布于20~80、0~80、0~60、0~40和0~20之间。其中相似度分布中等的图3c、3d和3e是包含班级学生人数最多的三个社交圈,依次为22人、15人和11人。这些同学与全班同学的相似度较高,在各自相似度区间内点位分布密集、重合度较高,且大部分学生之间仍存在多个相似度水平大于100的好友,表明这三个为班级活跃度中等的“主体”社交圈层,其内同学活跃度良好。另外,相似度水平分布于“头尾”的图3b和图3f也可进一步佐证前文活跃度较高和较低学生群体的精准判别。整体而言,该班级主体同学线下社交活跃,社交联系紧密、氛围良好,班级凝聚力较强,且班内同学多互为好友,朋辈支持较为稳定。

图3 准则得分和五类学生相似度分布图

三、基于数据挖掘的点线面三位一体高校学生社交能力提升路径

图4 基于数据挖掘的点线面三位一体

通过数据挖掘为判别高校学生社交动态提供了有效途径,并依托三种代表性社交特征结果,结合思想政治教育工作的实际需求,构建点线面三位一体的高校学生社交能力提升路径(图4),以期助力大学生全面成长成才,推动高校精准思政工作的创新发展。

(一)针对“分散式”社交群体,把握三个要点

首先,识别社交网络离群点。依托数据挖掘可精准掌握大学生的社交网络特点,根据量化的学生间亲密关系程度或社交圈的相似度高低初步判别可能的社交离群点。而后再依靠学生干部、宿舍长、班级好友等,通过走访宿舍与课堂等多种方式深入了解具体情况,确保社交离群点的精准识别。其次,找准深入辅导切入点。针对这类学生应将找准影响学生社交行为的关键因素作为切入点。辅导员需透过多重信息精准判别本质问题,并积极采取科学的、持续的多维干预措施,如谈心谈话的循循善诱、具体课程的学业辅导、宿舍关系的调解指导及家庭关系的家校联动等多个维度来深入展开,最大程度的发挥辅导实效。最后,把握心理帮扶时间点。上述问题若持续作用将严重影响学生的身心健康发展。因此需要具体分析不同时段学生社交行为的数据挖掘结果,针对性开展心理帮扶[6]。如新生在入学之初,其性格和情绪若明显不稳定,则需在此“黄金塑造期”予以重点关注和心理疏导。高年级同学若在期末或毕业时活跃度突然变低,可能由于学业、就业或恋爱等问题所致,视具体情况家校联动采取专业的心理帮扶措施。

(二)针对“凝聚式”社交群体,构建两条主线

第一,建立学业辅导与生活指导的朋辈帮扶线。依托学业辅导室和生活指导室,充分发挥活跃度较高学生的社交优势和朋辈教育引领作用。学习方面,组织课程和技能方面成绩突出的活跃学生,定期以团体形式开展课程答疑和技能提升培训;再动员鼓励团体内同学轮流进行知识讲解或心得分享,不断提升社交能力。生活方面,鼓励活跃度较高学生担任生活指导室助理或雪绒花使者(班级心理委员),组织开展贴近学生生活的心理培训活动。如通过箱庭或沙盘等趣味手段有效辅导,依托瑜伽或舞蹈等放松运动疗愈心理,借助彩绘或手工等文化活动促进交流,全面引导同学们彼此理解沟通,相互汲取学习,共同成长进步。第二,形成社会实践和志愿服务的朋辈引领线。调动发挥活跃度较高学生良好的实践活动参与度和人际交往能力,组织带动和积极影响更多的学生加入其中,充分发挥朋辈引领的作用。首先强化爱国情怀,积极组织“凝聚式”学生参与如北京2022年冬奥会等重大活动的志愿服务,并引导其凝练总结重大志愿服务活动的宝贵思想财富,让学生们成为“思政课”的宣讲员,用朋辈的力量带动的更多的青年学子感受家国脉动,肩负青年担当。第二,鼓励其践行学校重大战略,进而引导更多同学到西部基层开展志愿服务工作,在基层调研与乡村支教等实践中,提升社会交往能力和个人综合素质,助力乡村基础教育高质量发展,到祖国需要的地方建功立业。第三,立足专业特色,激发同学们成立实践小组及学以致用的热情,带头引领同学们参与专业课程、科研项目和实践学习,不断把专业知识运用到社会实践中,形成“理论学习—社会实践—提升能力—解决问题—理论升华”的良性循环。最终形成社会实践和志愿服务的朋辈引领线,带领更多青年学子在社会实践中深刻了解国情、树立远大理想、练就过硬本领、锤炼品德修为。

(三)针对“主体式”社交群体,扩展一个层面

依托数据挖掘分析结果,在抓好活跃度高低“头尾”群体的同时,立足活跃度处于中间水平的主体学生,着力搭建人际交往平台,组织开展全方位、多层次的心理发展类和个人成长类集体活动,不断扩展人际交往环境面。在心理发展方面,以日常生活的宿舍“小单元”为对象,开展宿舍文化团体建设活动,并举行宿舍人际交往技巧培训,引导学生认识人际沟通的重要性,初步掌握沟通的核心原则,学会解决人际关系冲突等问题的实用技巧,感受在宿舍中与他人互动的联接感、归属感和幸福感。再以党团班级建设活动为载体,加强学生个人与团体间的交流,不断强化推己及人、将心比心等提高人际交往的意识,助力大学生自觉摒弃自我中心主义,建立和谐友爱、合作竞争的良好人际关系。在个人成长方面,围绕“文、体、美、劳”等开展以增进交往为目标的主题活动;依托优秀传统文化学习、非物质文化遗产参观、名家画作或名曲剧目赏析等陶冶学生情操,加强鉴赏交流;组织球类比赛或健身锻炼等集体运动,增进同学友谊,引导沟通合作,强化集体归属;带领学生参与到花草种植或卫生执勤等校园劳动中来,在相互交流与帮助中了解劳动教育的实际意义。最终,通过扩展上述多维、多元和多层的长效人际交往环境面,全面提高高校学生的社会交往能力,助力大学生成长为立大志、明大德、成大才、担大任的新时代青年。

猜你喜欢

社交能力刷卡数据挖掘
奥尔夫音乐联合体育游戏对轻中度ASD儿童社交能力的干预研究
探讨人工智能与数据挖掘发展趋势
巧用一日生活,提升幼儿社交能力
基于并行计算的大数据挖掘在电网中的应用
刷卡
运用传统游戏集体活动培养幼儿的社交能力
一种基于Hadoop的大数据挖掘云服务及应用
体育教学中体育游戏对儿童心理健康的影响分析
成长日记
刷脸就可以购物