APP下载

大数据思维下科学化开展新生适应性教育的研究与探索

2016-05-14任远朱润凯

亚太教育 2016年7期
关键词:科学化大数据

任远 朱润凯

摘要:本文以北京航空航天大学学生为研究对象,运用大数据思维和分析方法,基于“梦拓计划”搭建信息平台并采集新生行为数据,根据新生的关注热点研究大学新生的群体性特征,以探索新生适应性教育的科学规律。

关键词:新生教育;大数据;科学化;梦拓计划

中图分类号:G40文献标志码:A文章编号:2095-9214(2016)03-0297-01

一、 引言

本文以新生适应性教育为切入点,基于北京航空航天大学“梦拓计划”,通过平台研发、数据采集、模型构建和特征提取,将“Mentor”的静态信息数据与新生“梦拓组队”的动态行为数据进行集成分析,归纳出新生整体性的心理特征和实际需求,从而为新生适应性教育工作提出科学化建议。

二、 研究内容

(一) “梦拓计划”及信息平台。北京航空航天大学基于“朋辈教育”的理念,在新生入学后实行“梦拓计划”:选拔优秀的二年级本科生作为“Mentor”,通过开展文化体验课等交流活动帮助一年级新生更好地适应大学生活,以达到开拓视野、提高素养、共同进步的目标。为支撑“梦拓计划”顺利实施,改变传统的“指派式”的学生工作模式,我们研发了“梦拓”信息平台,新生可根据自己的兴趣点和实际需求在平台中自由选择“Mentor”。数据层记录学生“Mentor组队”过程中的行为数据,用以分析学生总体特征和每个人的个性特征图谱。目前该平台已经应用到北京航空航天大学计算机学院、软件学院、知行书院、宇航学院四个单位,共采集1039人的静态信息数据和动态行为数据。

(二) “Mentor”特征向量提取。本文对数据库中“Mentor”简介进行特征标签标注(与后台日志时间戳一一映射),采用分词系统进行分词处理并得到163个代表“Mentor”特征的离散关键词,并利用LDA模型[1]对关键词进行特征分析。

利用LDA模型对163个关键词进行特征分析,通过对比后台日志时间戳对参数进行调优,最终聚类出最受新生关注的七大“Mentor”特征,构成“Mentor”七维核心特征优势向量,每个分量代表着“Mentor”可能具备的特征项。本文将“Mentor”特征向量表示如下:

[文艺,体育,学习,工作,专业(技术),休闲,社交]

基于聚类得到的样本数据,本文进一步统计得到七维核心特征优势向量占比(即拥有某个分量特征的人占总人数的百分比)分别为[9.71%, 8.01%, 8.98%, 13.83%, 10.68%, 3.40%, 20.87%],占比排序为[4,6,5,2,3,7,1]。

分析分量占比数据,可以看出新生对“Mentor”特征的倾向:新生群体整体偏向选择外向交友型和工作能力突出型的学长学姐作为自己的“Mentor”,具备较强专业能力特征的“Mentor”占比也比较高;另一方面,本文结合北航实际情况将“Mentor”性别作为一个特殊的影响因子加入到研究中,并发现“女性Mentor”在实际组队过程中非常受欢迎,这在一定程度上影响了一般情况下的组队行为,可能与北航男女比例的特殊性有一定关系。

(三) 新生动态行为数据处理模型构建。本文在研究过程中,采用北航“梦拓”信息平台数据库中已记录的用户操作时间戳、相关操作日志以及网页访问日志共计2万余条操作数据,涵盖了新生访问平台的各类操作以及对于数据库访问的慢日志统计下的选择信息。基于以上行为数据,利用数据扫描处理工具Scanner对大量日志文本数据进行扫描处理,去除噪声数据(例如管理员操作的数据等)后对有效区间内的数据进行处理。在此基础上,本文根据降温原理构建分量热度模型,利用数据拟合方法进行数据分析,期望得到新生所选“Mentor”的每个特征分量热度值并排序,以更科学地挖掘学生的行为特性和兴趣关注点。

现将分量热度模型描述如下:

时间刻度:以组队时间的开始和结束为界,对时间线进行均分后得到若干具有一定粒度的时间段;为每个时间段赋予的时间标识值,即为时间刻度值;

热度权重:即每个阶段的热度的量化的衡量值。(本文中最高热度定为100,最低热度定为0,可以用操作数归一化到0-100)。

现将采用的公式描述如下:

总体热度公式:

W=K*(A*T2+B*T+C)

其中,W表示热度权重,K表示归一化系数,T表示时间刻度,C为常数。所示时间段(242-258)参数分别为:K=5.46,A=0.0528,B=-27.123,C=3489.90。

某向量分量的热度值可用该分量在该刻度下被选择数量与热度权重之积的累加和表示:

H=∑(N*W)

其中,H表示分量热度值,N表示分量数目,W表示分量热度权重。

(四) 综合量化分析。由于七维核心特征优势向量的每一个分量所占比重各不不同,因此所具有的热度值不具有可比性,要得到最终的倾向性排序,需要进行归一化综合量化分析。

三、结论与建议

(一)结论。新生入学后的热点关注问题与传统的学生工作经验基本保持一致。研究结果表明,新生对专业的关注度不高,整体呈现出“专业迷茫”的特征。北航作为一所具有理工科优势的综合型大学,各学院学科特色明显、专业性较强,如何顺利迈进专业的“门槛”,是新生面临的挑战。

(二)建议。“老生带新生”式的“梦拓计划”,是新时期新生入学教育模式的创新,是学校优良传统和优秀文化得以传承的有效载体。在选拔高年级“Mentor”时,一方面应该选拔新生关注度较高的体育爱好者、学习优秀者和社会工作能力突出者,这符合新生的实际需求和心理期盼;另一方面,要帮助新生开拓视野,引导学生转变思想观念,将关注度较低的“文艺气质类”、“文化体验类”学生也作为重点“Mentor”候选人,以促进新生素质的全面发展和人文素养的养成。

(作者单位:北京航空航天大学计算机学院)

参考文献:

[1]张韫. 大数据改变教育 写在大数据元年来临之际[J]. 上海教育, 2013 (10): 8-11.

猜你喜欢

科学化大数据
流翔高钙,实现葡萄科学化管理助农增收
以党建调度为抓手 提升国企党建工作科学化水平
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
党建科学化的内涵探析
统战工作科学化:一个整体性叙述
推进党的建设科学化:经验、困境与路向——解读“全面提高党的建设科学化水平”思想