基于大数据的大学生就业指导
2018-05-14王昌林
王昌林
[摘 要] 大数据时代背景下,传统的就业指导显现出诸多弊端,利用大数据对当今就业形势进行分析显得尤其重要。
利用爬虫获取某招聘网站近些年相关就业数据,利用已有的数据进行处理分词聚类,确定各个领域的关键词,之后借助频率统计与决策树模型,对各个地区、不同的职业方向和岗位、不同学历带来的招聘优势之间的差距进行分析,为就业指导提供帮助。通过分析可以看出,IT行业为现在最热门的行业,技术领域也最有价值,北京、上海、广州、深圳四大城市依然是人才招聘最集中的地方,有工作经验与高学历的人会更受欢迎。通过基于大数据的分析与挖掘可以为在校大学生根据自身情况、需求、目标量体裁衣,提供一个更有价值的就业选择。
[关 键 词] 就业;人才; IT
[中图分类号] G647 [文献标志码] A [文章编号] 2096-0603(2018)13-0234-02
一、前言与数据预处理
大数据时代背景下职业发展与就业教育存在的问题主要是传统的就业指导工作在新时期显得格格不入,与实际不相符合。就业需求呈现出多样化、个性化的特征[1]。新时期我国高校在开展就业指导工作的过程中,积极应用大数据技术已迫在眉睫,应能够转变传统模式,对大数据优势进行充分的利用[2]。
本文先利用爬虫获取某招聘网站近几年内的招聘信息,整理成表进行分析,由于网站的错误或爬虫的漏洞,获取到的信息有一定的空数据或异常值,我们首先进行数据的清洗与预处理。
(1)空数据,首先使用其他合理的有效记录值填充空白的职业大类(使用同一职业ID的其他有效记录值),如果没有合适的值代替,则直接去除。(2)异常值的处理,分析异常值,对出现异常值的数据直接剔除。(3)去重,分析发现有的公司在一天内多次发布同样信息,对间隔两天内信息完全相同的招聘数据,剔除掉一个,保留其中一个。(4)分析发现有些数据后面有括号等符号标注备注,并将其将备注部分去除。(5)利用平均值代替范围表示该公司工资。
二、热门行业、职位、地域分析
(一)热门行业分析
分析行业的频率,明显可以看出高过20%只有一个移动互联网,可以看出现在移动互联网领域为最热门行业,15%~20%的为电子商务,10%~15%的为O2O与金融,可见现在的最热门的四大行业为移动互联网、电子商务、O2O与金融,而前三项都与IT相关,IT方面为现在最热门的领域。
(二)热门职位分析
对职业大类进行统计,可以看出技术人才是现在需求最多的,市场、运营方面也有很不错的需求,在产品金融设计运营上人才需求较少。
对职位与工资,抽出频率画图并进行树状图分析,可以看出,技术人才与产品方面的人才平均工资更高;对产品领域高端人才需求更多;技术则呈现两头翘的情况,即低收入与高收入人才更多,但是中等收入的需求較少;市场销售则更多的是中等收入的人才,运营在薪资较低的领域分布较多。
(三)热门地域分析
对地域的招聘职位频率进行统计发现,北京一枝独秀,超过30%,上海与深圳较差,以上三个为超过10%的城市,而超过1%的城市为北京、成都、广州、杭州、南京、上海、深圳、武汉、厦门,这九个城市就占据了总招聘的90.2%,相对于299个城市总数来说,目前单位还是有很强的地域集中性,大部分就业岗位分配在少部分地区,对超过1%的城市单独筛选出来进行下一步分析。
平均工资为11867.638元,其中北京、杭州、上海、深圳平均工资均超过了1W元,工资受益方面可能会更好。
(四)工作经验
对工作经验进行分析,97.1%的用人单位期望有工作经验的人来他们单位。期望有一到三年工作经验的占了绝大多数,这也和大部分期望通过网站招聘的人并没有太多工作经验有关,工作经验十分丰富的人往往已经有足够渠道去获得工作,不需要通过招聘这种方式。
可以看出随着工作经验的增长,工资也随之增长,可见工作经验仍然是影响薪资的重要部分。对城市与职业大类进行树状图分析,可见大部分地区依然需要的是技术型人才,而金融人才需求较少。
三、结果分析
从以上建模和模型求解中可得出,目前比较热门的领域有IT、电商、金融等领域;而各领域的平均资薪中,金融业最高,其他的差别不大;在各地域的招聘中,以北京、成都、上海、深圳、武汉、杭州、南京、厦门、广州等比较热门,其中北京、上海、广州、深圳四个城市尤为热门。
四、给在校大学生的就业规划建议
1.对有意双修、辅修,或者转专业的大学生,可以考虑在IT方面进行一定的学习,尤其是移动领域,无论是工资还是就业的机会都会很大,不过想要在技术职位上有更高的薪资,需要在大学就打好基础,踏踏实实学技术,对将来的就业有很大帮助。
2.目前获得更高收入与更好岗位最好的方法仍然是继续深造,如果学生有这方面愿望,最好继续读研、读博,对将来自己的发展有很好的帮助,尤其是有意从事金融和数据挖掘行业的学生,深造对自己的帮助很大,如果是有意从事市场营销运营这些领域,则可以考虑较早地就业,获得更多的工作经验,但是整体来说仍然是学历越高获得高收入的机会越多。
3.对没有意愿继续深造的学生来说,工作经验则是影响他们就业岗位优劣、薪资多少的主要因素,在校期间积极参加社会实践,尤其是争取利用好每一个实习机会,对自己初出大学的第一份工作有很好的影响,不过工作经验低于一年的新人,薪水都不会很高,学生要有一定的心理准备。
4.越好的工作岗位往往意味着对知识能力要求越高,学好大学课程仍然是很重要的一部分,尤其是期望自己从事技术方面工作的学生,学好现有的知识也是非常重要的,不能为了追求工作经验放弃了对知识的学习。
5.现阶段,北京、上海、广州、深圳仍然是最好的四个就业城市,对地处华南的学生来说,厦门也是一个很好的就业城市,在校可以留心这些地方的用人单位,由于地缘因素,广州、深圳、厦门应该是我们着重考虑的就业城市,不过对我们学校的学生来说,由于不在这三座城市,就业时面临的压力可能会大于别的地方,这就需要尽早地确定我们希望去的城市,最好能去实地考察一下当地的环境,便于就业后更快地融入当地。
参考文献:
[1]荣大磊.浅谈大数据背景下职业发展前景与就业指导教育[J].现代职业教育,2017(14):192.
[2]汤龙升,陈冉,徐萍,等.大数据时代下的大学生就业指导思考[J].赤峰学院学报(自然科学版),2016,32(10):201-203.