基于大数据分析技术的校友工作创新研究
2020-01-07谭保华任志鹏赵建平王鹏
谭保华,任志鹏,赵建平,王鹏
(1.长春理工大学 校友(基金会)工作办公室,长春 130022;2.长春理工大学 计算机科学技术学院,长春 130022)
校友资源是学校最宝贵的人才资源,近年来,各高校不断加强和重视校友工作,智能信息系统、微信公众平台、APP等现代化的系统相继应用到校友的管理工作中,有效地提高了校友工作的管理层次,高校对校友资源的管理更加科学化、智能化[1]。
随着校友信息数据进入大数据时代,如何将大数据分析技术更好地应用到校友信息的管理和维护中,实现智能化、科学化管理,使校友工作更具创新思路和工作方法,将给高校校友工作者一个机遇和挑战,也将为今后的高校校友工作提供一个有用的参考。
1 大数据分析校友信息的重要意义
大数据作为时下最火热的IT行业词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。
大数据分析在体育、经济、教育、文化等多方面领域进行应用,促进了人类社会科技、文明的飞速发展。基于大数据分析技术的高校校友工作同样具有非常重要的意义。
1.1 对学校产学研合作方面意义重大
通过对校友信息的分析,智能提取校友企业产品与重点研究方向,结合学校具体专业,给出科学的合作方案和重点合作研究方向,助推高校与校友企业开展产学研深度合作。从而建立与校友企业的产学研合作长效机制,不断增强学校培养人才能力,科研能力,为祖国建设可持续性输送人才。
1.2 对校友组织的平台建设意义重大
系统将校友按从事行业、工作地域、兴趣爱好等数据信息智能的分析和提取出来,使学校有针对性地与校友进行双向的沟通交流,使各地校友随时掌握了解母校发展动态,为母校建设提供各种帮助。使学校能够及时联络并成立相应的地区校友组织,为校友搭建资源共享,合作共赢的平台。实时动态信息交互联络图如图1所示。
图1 实时动态信息交互联络图
1.3 对开展利国益校活动起到促进作用
根据信息智能提取出相同行业、相同兴趣爱好的校友,使同行业及共同兴趣爱好的校友们能够快速有效地实现跨区域精准互联,从而能够经常组织起形式多样的利国益校活动。
1.4 有利于年轻校友的快速成长
根据学校每年的就业数据,将毕业生分地区推荐给当地的校友组织,地区校友组织联络人可以准确获取信息内容,及时与新校友取得联络,安排接送站以及迎新服务,不断充实壮大校友组织。使年轻校友能够尽早的得到校友组织的关怀和帮助,有利于他们的快速成长。
1.5 有利于增加校友对学校的捐赠支持
通过对捐赠校友的信息分析,充分挖掘校友对母校的情感联系,能够最大限度地发挥校友对母校的捐款及奉献,以及带动校友邀请同学以班级为单位捐款捐物,形成校友与学校可持续共同发展。按组团捐赠统计分析数据图如图2和图3所示。
图2 按组团捐赠统计分析数据图
图3 按捐赠次数分类统计数据图
2 搭建校友互动信息平台
设计思想旨在为校友建立一个在大数据技术基础上的信息整合分析平台,为校友信息收集、信息管理、信息交流等提供一体化服务[2]。
平台主要包括校友基本信息、校友行为需求预测、校友行为大数据关联、校友行为大数据交互等模块。基本数据模块示意图如图4所示。
图4 基本数据模块示意图
2.1 校友基本信息
校友的信息从入学时即建立起来,包括招生、学籍、培养、毕业论文及就业等信息智能动态的搜集整理好,最后与就业当地校友会数据进行整合匹配,形成完整的校友信息数据库。校友在校期间与工作期间的重要活动、经典瞬间及各种获奖证书等均可分类存储到校友信息库中,随时进行智能的检索及分析。
2.2 校友行为需求预测
通过大数据分析技术,分析校友的专业、从事行业及兴趣爱好等,构建出符合校友需求的行为模式方法,预测校友需要从事的工作及活动,将校友企业的人事信息、产品信息及校友活动信息及时推送,为校友开展事业助力[3]。
2.3 校友行为大数据关联
将各地具有相关行业及兴趣爱好的校友信息关联提取,研究校友行为模式与业绩的关联性,智能提醒和指导校友加入同行业校友商业圈,形成资源共享,合作共赢的良好行为模式。
2.4 校友行为大数据交互
利用大数据技术融合校友数据,实现校友跨地区跨行业数据互联,对校友信息共享平台的数据检索、更新和数据库智能分类存储进行科学管理,完善校友档案信息嵌入式交互。
3 平台信息的关键技术处理
3.1 校友智能信息搜集
智能信息搜索以对象为中心,通过用户循环搜索完善对象描述模型,从而获取到关联对象信息来提高校友信息获取的全面性与准确性。根据校友登录系统后产生的数据信息,利用知识图谱与逻辑推导技术,对已有的校友信息进行相似度匹配,并通过机器学习、容错检测及分析量化,将数据库中的校友信息不断完善,对重复的校友信息给出合并提示并删除冗余信息[5]。
图5 智能搜集结构图
3.2 校友信息智能挖掘
校友信息智能挖掘技术以基于Web挖掘技术为平台,为了应对校友数据海量与动态的特点,采用动态数据挖掘技术,将来自动态数据库与实时数据库的数据进行采集、预处理、挖掘、结果评估与应用解释,构建出一个科学完善且长期的数据采集模式[4]。基于web挖掘技术的校友信息资源智能分析模型如图6所示。
图6 基于Web挖掘技术的校友信息资源智能分析模型
在数据层中,从动态数据库与实时数据库中获取校友信息的初始化信息;在挖掘层中,对初始化校友信息资源库中的素材进行Web的内容、结构、应用挖掘;在分析层中,将挖掘的校友信息处理后进行知识化信息描述,以此来识别与聚类;在应用层中,用户通过软件平台来查看校友信息挖掘分析结果。
3.3 精准信息推送服务
通过对校友相关信息行为的挖掘与需求分析,将校友的各个特征属性信息进行聚合,同时进行相关信息的精准推荐。首先利用聚合方法对校友多源信息特征进行主要特征提取,对其主要特征进行深层次、多属性的挖掘与聚合,将校友信息构建成校友关系网,对特征关联进行挖掘是聚合的优势体现,这为校友关系网的构建创造既可横向拓展又可进行纵向深入分析的有利条件,从而实现校友特征多角度的个性化推荐,完成特定主题的相关信息推送。精准信息推送服务如图7所示。
图7 精准信息推送服务
3.4 多数据分析技术
融合多种校友信息数据,建设统一的数据模型,其复杂数据涉及一些数据的清洗与建模,其中对数据进行清洗,能够保证数据质量,同时根据时间的推移不断的进行数据更新,以完善其数据实体间的关联。在信息积累的基础上利用数据分析技术,建立预测与决策支持平台,该平台依据积累的大量校友数据,对校友特征进行数据挖掘,发现关联信息,从而构建校友关系网,挖掘潜在的价值信息,为校友关系网建设与学校的可持续建设挖掘更富有价值的决策信息。多数据分析技术模型如图8所示。
图8 多数据分析模型
3.5 数据的整合与调度
随着数据获取方式的不断发展,所能获得的校友数据信息量也越来越大,所涉及数据的整合、调度也有了更高的要求。通过一种并行化正向最大匹配去冗余过滤处理方法,利用Map对多数据进行扫描将属性特征暂存,根据数据特征的相似度进行数据关系判断,将提取的特征进行向量化表示,利用Reduce实现冗余去除操作,从而进行数据处理、整合以及修复,并且使用多连接查询优化算法,解决多数据的查询优化问题,进而完善多数据调度问题。数据整合与调度流程图如图9所示。
图9 数据整合与调度流程图
4 结论
高校校友资源是学校的宝贵资产,大数据分析技术为校友工作创新提供了科学的支撑,从关联数据中获取校友的重要信息,充分挖掘校友的潜在信息,制定科学合理的方案,不断创新校友工作思路和方法,对促进校友与学校共同可持续发展具有非常重要的意义。