基于培训数据挖掘的精准培训与智能设计
2018-02-27易晓晔
易晓晔
摘要
针对学员培训学习,通过全程化、多样化的数据采集分析,深入挖掘培训需求,分析培训管理薄弱环节,匹配网络学习资源,实现了能力短板感知、知识精准援助;针对教学培训方案,系统提供智能化辅助设计,提高培训满意率以及加强培训效果。
【关键词】培训 数据挖掘 精准 智能 设计
1 引言
为了加快建设国网公司系统一流党校、培训中心,全面建成“中部领先的城乡电网”和“一强三优”现代公司提供坚强智力支撑的目标,发挥党校“一个中心、三个支撑”作用,国网河南管培中心结合自身的行业特点和业务需求,通过数字化校园的研究和建设,推进管理的规范化、精细化和现代化;以学员服务和培训管理为主线,强化学员的开放式学习模式,改进教学培训的组织形式,丰富教学手段,有效提升自身的管理水平和服务能力,适应国家电网公司人才发展战略的需要。
随着管培中心学习培训的发展,适应“互联网+培训”新形势,需要收集各种反馈,但凭借既有的方式,收集到的正确数据非常有限,或者在量上远远未能达到可以改进培训的规模,“大数据”的出现,使培训管理者在收集培训信息和反馈具备了更好的基础,更容易收集到数据,而且覆盖面广泛。
通过数字化校园系统积累的“大数据”,形成管培中心自有的“课程库”、“师资库”、“学员库”三库体系,收集到更多帮助我们改善企业员工学习培训方法的数据,使培训管理者更多关注培训过程,分析学习进程和结果,进一步改善教学的方式与方法,从而实现改善学习成果,促进自主学习。同时可以对管培训中心的整体培训状况和学员的知识掌握情况产生独到的见解,对学员为提高其培训效果需要实施的行为作出预测。
借助数字化校园系统积累的“大数据”,以三库体系为基础,深入挖掘培训数据,实现精准培训和智能设计的目的,创建个性化、智能化的培训服务平台。
2 项目内容
2.1 项目介绍
借助数字化校园系统积累的“大数据”,以三库体系为基础,深入挖掘学员培训数据,分析学员培训成长关键因素,抽象学员的信息全貌,生成学员的用户画像(UserProfile),从而快速、准确的定位知识短板,明确学员的培训需求,构建学员成长生命地图,通过精准的知识推送,有针对性的开展知识援助;深入挖掘项目、师资、课程、学员、评估等培训数据,通过聚类算法、关联算法、Pearson、Spearman、TF-IDF等算法和技术,对培训 人员进行分类、结合历史需求类别以及相关的课程实施培养计划,实现智能方案设计,准确把握培训需求,提升教学质量以及教学满意率,从而实现加速员工成长、提高成才率,缩短人才培养周期的目标。
2.2 培训模式
传统的培训模式,一般先进行课前调研,了解主办方的培训需求,进行人工分析,策划和设计培训方案,被动接收培训需求,在课题设计方面的主动性弱,具有一定的滞后性,培训课程的设计效果难以达到预期的目的。通过对培训数据的深度挖掘,创新培训模式,实现方案的智能设计,提升培训质量。
数字化校园系统对建设的“课程库”、“师资库”、“学员库”进行数据挖掘,随时对第一手资料进行储备、分析和研究。通过“大数据”挖掘对学员及主办方反馈进行综合分析,建立起了参训主体与培训课题、培训课题与培训效果之间的动态预测模型,为培训设计提供辅助分析,超前的开发出针对性强且学员欢迎度高的培训课程,使管培中心在培训课题设计的主动性和创新性方面均有所突破,提高了培训效果满意率。
2.3 技术手段
目前流行的大数据处理框架Hadoop并行计算框架,能够对海量数据进行并行化处理和分布式存储,有效地缩短数据处理时间,保证数据的实时性和有效性,解决了大数据處理在存储空间和计算速度上所面临的困难。Hadoop分布式系统框架,封装了底层细节,让使用者专注于上层应用程序的开发。Haoop开源项目主要包含分布式存储HDFS和分布式编程模型MapReduce,以其可拓展性、开源性、易编程性等强大的功能,备受青睐。
针对数字化校园系统的“大数据”分析,开发单独组件。使用Hadoop作为基础框架、Hive作为数据仓库、Redis存储系统等大技术手段,解决存储不足、数据量大等问题,使得大数据量的计算与存储更高效,运用聚类算法、关联算法、Pearson、Spearman、TF-IDF等算法和技术,结合学员人才发展模型、能力素质模型等相关模型,迅速的反馈至前台形成可视化数据,为描绘用户画像、智能方案设计、统计分析提供了更有利的支持,实现了运用大数据的技术手段支撑教学培训业务的发展。
3 结论
通过“大数据”,建立了自有的“课程库”、“师资库”、“学员库”三库体系,在培训员工个人用户画像、企业中员工的发展与培训关系、辅助教学计划设计、教学内容的优化与实施等几个方面进行深度挖掘分析,得出了最适合于该类型人才的培训课程,优化了培训的流程,避免资源和人才的浪费,助力培训运营的智能化升级。
参考文献
[1]Chen K,Zheng W M,University T,etal.Cloud Computing:System Instancesand Current Research[J].Journal ofSoftware,2009.
[2]ApachHadoopproject[EB/OL].https://zh.wikipedia.org/wiki/Apache_Hadoop.
[3]刘鹏.实战Hadoop[M].电子工业出版社,2011.