基于机器学习的学生就业技能分析
2019-03-04赵力衡李丽华
赵力衡 李丽华
摘要:随着机器学习技术的迅速发展,机器学习的分析方法也逐渐深入到社会各个领域中,成为行业分析的最重要手段之一。在学生就业前,使用机器学习方法分析学生已掌握的就业技能,能帮助学生明确自己的就业方向和职位,能显著提高学生的就业机会。鉴于此,提出使用机器学习中FP关联规则模型来分析学生掌握的技能与不同职位的匹配度,就可以分析出学生适合的职位。实验结果表明,所提方法能较准确地分析出不同学生所适合的职位,可作为学生就业分析的有效依据。
关键词:大数据;机器学习;就业;tf-idf;画像
中图分类号:TP391 文献标识码:A
文章编号:1009- 3044(2019)34-0190-02
当前很多学生在就业时都存在着迷茫,不知道什么工作适合自己,不知道自己能胜任什么样的工作;在招聘网站上寻找工作时,看到众多眼花缭乱的技能要求,却很多都不甚了解,不知道自己能胜任哪些工作职位。这些都源自学生对自身所学技能和工作所需技能不了解所造成的。
本文从分析学生自身所掌握的技能与不同工作岗位所要求的技能出发,通过机器学习方式寻找同一行业方向的相似工作岗位所需的技能,使学生了解到当前行业所需的技能到底是怎样的,有什么样的趋势,然后通过分析学生个人自身掌握的技能向学生推荐其工作领域。从而帮助学生提升自己能力,并提高找到适合工作的机会,为学生未来的发展提供一个参考。
1 模型分析
1.1 职位通用技能组
实际工作中总会遇到各种不同的项目和问题,这就要求应聘者必须具备处理复杂问题的多种技能。因此,通常一个职位对技能的要求并不是单一的,而是一系列的相关技能的组合,以大数据开发工程师为例,该职位通常会要求应聘者具备Spark,Hadoop,Kafka等一系列分布式数据处理的相关技能,如下表所示:
由表1可知,不同招聘信息中同一职位中要求的职业技能通常是一组相关的技能,这些技能有的在多个招聘信息中多次出现,如表中的Spark和Hadoop等,另一些技能则仅在某个或少数招聘信息中出现,如Perl、MySql。后者所需的职位不多,应聘者即便掌握也不易在应聘中遇到;而前者则具有普遍性,掌握后能符合多数招聘信息需求,这部分技能才是文中进行职位匹配所关注的。因此,通过FP关联模型将同一职位中常用的相关技能提取出来形成该职位的通用技能组,如下图所示:
1.2 个人就业技能画像
要实现对精确到个人的职位推荐,还需要了解每个应聘者所掌握的就业技能。对于学生,这些技能通常来自于课程学习,或者从课外项目或假期实践中学到。因此,个人就业技能画像数据就来自以下两个方面:
1)与学校教务处的课程学习数据库连接,按专业获取每个学生所学课程,从中提取出相关课程所教授的技能;
2)当学生登录系统时,在个人账号中补充自己在课程之外所掌握的技能。
系统中,学生在课外掌握的技能即使以课程内技能补充的形式记录,也可能因为输入者对技能的理解不一致等原因导致同一技能被以不同的名称等形式重复输入。因此,两处数据源中的数据可能存在重复或同一技能不同名称等问题,所以还需对数据整合并通过TF-IDF词频分析和ALS模型进行数据清洗,清洗后就得到了个人就业技能的画像,如下图所示:
1.3 职位推荐
职位推荐不但需要向该学生推荐匹配度最高的职位,还需要为该学生分析出对指定职位仍欠缺的技能。
当向学生推荐匹配度最高的职位时,使用学生所掌握的技能和每个职位的通用就业技能组进行匹配。由于是与职位的通用技能匹配,因此不再考虑技能的支持度与置信度。比较学生掌握的技能与FP模型中每个职业的通用技能组中的技能,以技能匹配个数为标准,匹配个数最多的一个或多个职位就是与该学生最吻合的职位,如图3所示:
上图中左侧是推荐的职位,右侧是学生所掌握的该职位中的通用就业技能。从图2中可以看出,与图2中学生所掌握的技能最匹配的是大数据开发工程师、大数据开发负责人、大数据存储工程师三个职位,每个职位的通用技能组中都有五个技能是该学生所掌握的。这也是该学生掌握的技能中与职位通用技能匹配最多的个数,因此认为这三个职位最合适该学生。
当学生表露出对某一职位感兴趣时,还需要分析该职位的通用就业技能组中的哪些技能是该学生没有掌握的,以此提高学生对自己需要掌握的技能树的认识。将学生感兴趣的职位的通用技能从FP模型中提取出后,再与学生所掌握的技能进行对比,就可以知道该学生为应聘该职位所需要的努力方向了。重新选择另一个只学习了较少大数据知识的学生应聘算法工程师、Web开发工程师和大数据工程师进行技能分析,分析结果如下图所示:
从图4中可以看到系统分析出了该学生应聘这三个职位还需要掌握的技能。
通过系统分析,就能很清楚地看到学生所适合的职位,以及应聘某个职位时还需要掌握的技能。这就为学生进入职场时对自身的认识和就业方向提供了一个可靠的参考。
2 结束语
實验结果表明,所提方法能较准确地通过学生自身掌握的技能和招聘信息中不同职位的通用技能组的匹配来分析出每个学生所适合的职位,以及应聘某个职位时应聘者所具有的优势和欠缺的技能,从而为不同的学生提供一个精确到个人的就业参考。
参考文献:
[1]孙怡帆,潘昆峰,孙正阳,等.大学生毕业去向预测的思路与方法——基于机器学习算法的尝试[J].教育学术月刊,2019(5).
[2]李佐军,大数据时代下关联规则兴趣度挖掘在就业分析中的应用[J].软件工程,2018(9).
[3]赵力衡,陈虹君.基于机器学习的招聘信息中就业技能提取的应用分析[J].电脑知识与技术,2019(13).
[4]姜绍俊,大数据支撑下的机器学习算法[J].电脑知识与技术,2018(2).
[5]王芳,申贵成.机器学习算法在用户行为中的应用[J].电脑知识与技术,2017(9).
【通联编辑:唐一东】
收稿日期:2019-08-16
基金项目:基于机器学习的学生就业技能研究(2018JCKY0019)
作者简介:赵力衡(1976-),男,四川成都人,高级工程师,硕士,主要研究方向为大数据、物联网;李丽华(1985-),女,重庆人,副教授,硕士,主要研究方向为物联网。