基于大数据的互联网行业人才薪资影响因素分析
2020-04-05郭丽清蓝康伟朱思霖李泓锴许颖
郭丽清 蓝康伟 朱思霖 李泓锴 许颖
摘 要: 为了实现人才的更好发展,文章对互联网行业人才薪资影响因素进行分析。通过爬取数万条互联网行业的招聘信息,并利用描述性分析、相关性分析方法,得出工作经验、城市、学历、公司规模等多个维度因素对薪资的影响作用。最后文章对互联网行业人才薪资的问题进行总结、展望,以期使从业者把握行业动态,为求职者提供重要参考。
关键词: 人才发展; 互联网行业; 人才薪资; 影响因素
中图分类号:G316;TP391.1 文献标识码:A 文章编号:1006-8228(2020)02-09-04
Analyzing the factors affecting salary of talent in the Internet industry with big data
Guo Liqing, Lan Kangwei, Zhu Silin, Li Hongkai, Xu Ying
(School of Information Science & Technology, Xiamen University Tan Kah Kee College, Xiamen Fujian, 363105, China)
Abstract: In order to achieve better development of talents, this paper analyzes the factors affecting the salary of the Internet industry. By crawling tens of thousands of recruitment information in the Internet industry, and using descriptive analysis and correlation analysis methods, the effects of multiple dimensions, such as work experience, city, education, and company size, on salary are obtained. Finally, the issues of the salary in the Internet industry are summarized and prospected, in order to enable practitioners to grasp the industry dynamics and provide job seekers with important reference.
Key words: Alent development; the Internet industry; salary of talent; influencing factor
0 引言
人才是企业发展的根本。在“互联网+”发展新业态下,企业对相关人才的需求呈现井喷趋势。2017年中美两国的互联网人才需求量是供应量的10倍[1]。
人才供需失衡是制约企业发展的瓶颈。如何招聘到合适的人才,成为企业人力资源部门重点关注的问题。而薪资是人才能力与岗位需求匹配的重要体现,也是人才在择业过程中考虑的主要因素[2-3]。本文从国内某招聘网站抓取2019年6月发布的上万条互联网行业的招聘数据,以薪资水平为切入点,探究各项因素对薪资的影响情况,以期对人力招聘和人才求职的过程提供有益的参考。
1 数据说明
本文数据共包含3万多条招聘信息,每条数据包含求职薪资、公司名称、所在地、公司规模、融资情况、招聘岗位、经验要求、学历要求等9个变量,各个变量详细信息见表1。以薪资为因变量,各个维度的影响因素作为自变量。对于招聘数据中,不同公司岗位名称略有不同,为了更好地分析,我们将岗位名称归类为5大类别,分别是研发、运营、产品、数据分析和设计,分析详情在下文展开。
2 描述性分析
2.1 薪资分布情况
薪资水平高低在一定程度上能够反映技术门槛以及人才供需之间的关系。图1反映了薪资水平的整体分布情况。具体而言,互联网行业的平均薪资水平为17.5k/月(k/月—千/月,下文同),中位数为15k/月,高于平均薪资的岗位数量为11056个,占总量41.16%。从薪资水平的分布柱形图看,整体偏左,也有少量的高薪人才的需求,达到40k/月。
2.2 公司基本信息
2.2.1 城市分布情况
互联网行业对人才需求,主要集中在一线城市和新一线城市,占总数的79.74%。北上广深杭等一线城市对人才的需求量为22269人,占top10城市的84%。图2描述了人才需求量Top10城市的薪资水平,北京的薪资水平最高,月均薪资中位数为20k,上海次之;杭州表现突出,高于深圳和广州。究其原因,一线及新一线城市有着地理及相关政治、经济政策的支持,存在其发展优势,如北京、上海,遍布百度、腾讯、京东等互联网巨头总部;杭州作为强新一线城市,是互联网人才聚集池,聚集以阿里巴巴为代表的大厂,有力地促进当地互联网行业的发展,发展空间大。另外,新一线城市相比一线城市的消费水平较低,对企业及求职者具有相当的吸引力。
2.2.2 公司规模情况
图3反映了公司规模与薪资水平的关系。从公司规模看,随着公司规模的扩大,整体工资水平提高。少于15人的公司规模一般为中小型企业,财力相对短缺,薪资水平相对较低。然而,在该规模下,少数公司的薪资最高值,达到甚至超過其他规模大的公司的最大值,这也验证了小型企业人才机制相对灵活。公司规模在500人以上占比为59%,平均薪资约为20k/月。当公司达到一定规模,公司的体系逐渐完善,薪资也趋于稳定。
2.2.3 公司融资情况
图4反映了公司融资情况与薪资水平的关系。未融资和天使轮的企业处于种子阶段,风险较高,平均薪资约为12k/月;进入A轮融资后的企业开始步入正轨,为了更好地发展,企业愿意提供较高的薪资水平;D轮及以上的公司达到23k/月。然而,上市公司的薪资低于C轮或C轮以上的公司,可能的原因是上市企业整体相对发展较为平稳,工作强度较为合适,同时具有一定的品牌效应,有些人愿意在更好地平台发展而放弃较高薪资。
2.3 岗位需求信息
2.3.1 岗位类别
图5反映了岗位类别与薪资水平的关系。从薪资角度看,数据分析岗位的薪资水平最高,薪资范围为15-25k/月。这间接地佐证了近几年来各大企业渐渐意识到数据是企业的资产,纷纷进行相关人才的战略储备。研发和产品是求职者寻求工作的热门岗位;设计岗位中,平面设计师的工资会相对高一些。运营岗位是根据不同的职位薪资也随之不同,新媒体运营岗位人员的薪资相对较高。
2.3.2 工作经验
图6反映了工作经验与薪资水平的关系。从工作经验看,薪资随着工作经验的积累呈直线上升的趋势。工作3年以内的薪资水平差异不大,大约为12k/月,这主要因为工作的1-3年属于个人成长沉淀期。3-5年的工作经验,薪资明显提升,平均薪资达到了15-25k/月。5-10年的工作经验,薪资显著提升,最高薪资可达40k+/月。这是因为具有5以上工作经验的人才,处于个人成熟爆发期,可以给企业带来可观的价值/收入,此时的员工也期望具有更高地匹配薪资。
2.3.3 学历要求
图7反映了学历要求与薪资水平的关系。从学历看,互联网行业中,人才招聘的岗位大多要求本科学历,要求碩/博的岗位相对较少,薪资伴随着学历的提升也会水涨船高。大专或不限的职位薪资水平差异不大,中位数是12k/月,本科生则提升至18k/月,比大专学历高了50%;硕士和博士学历则明显高于其他学历,博士的薪资上限更高。这与和华为近期给8位应届博士开出百万年薪[4]的消息一样,有力地说明了读书可以创造财富。
2.3.4 岗位要求
为了能够进一步了解企业对于岗位的详细要求,我们运用jieba分词提取关键词信息,并统计了各关键词出现的频率,进而绘制了岗位要求词云图,结果如图8所示。通过词云图可知,互联网行业对于人才的要求在团队合作、沟通、经验、技术的要求最为明显;数据结构算法、管理、设计、应用等要求紧随其后。
3 相关性分析
Pearson相关系数法[5]是一种度量两个变量之间关系密切程度的度量方法,广泛应用于风险预测[6]、舆情评估[7]等各个领域。相关计算公式如下:
[r=Nxiyi-xiyiNxi2-xi2Nyi2-yi2]
r的绝对值越接近1,两个因素的相关性越强。为了更加直观地观察各个自变量与薪资标签之间的关联性,我们引入了统计学上的热力图模型[8]。从图9中可看出工作经验对薪资水平影响的相关度较高,接着依次是城市、学历、岗位类型、融资情况、公司规模。
4 总结与展望
本文通过搭建爬虫框架获取某招聘网站3万多条招聘信息,经过一系列的数据清洗处理后,通过数据分析及挖掘得到如下一些结论:①对于互联网行业,人才需求量主要集中在北京、上海、广州、深圳、杭州等一线和新一线城市;②工作经验积累3-5年后薪资呈明显上升趋势;③在工作岗位方面,Java、Android、iOS等研发技术岗位依旧是主流的热门岗位;④从学历看,拥有硕/博教育背景的人才,薪资水平普遍高于20k+/月,且薪资上限远远高于本科及以下学历;⑤岗位类型方面,新兴起的数据分析相关职位薪资最高,大数据方面薪资诱人;⑥公司规模方面,规模在500人以上的薪资最高,规模少于50人的公司,最高薪资和最低薪资差距较大。最后,本文通过皮尔森系数对薪资影响因素进行相关性分析,结果表明:互联网行业薪资影响因素影响力从大到小排序依次为工作经验、城市、学历、岗位类型、融资情况、公司规模。后续的研究,将尝试引入机器学习相关算法构建人才自画像,实现薪资预测模型,为求职者和HR提供一个相对客观的参考数据。
参考文献(References):
[1] 赵吝加.全球互联网人才发展概况[J].今日科苑,2018.4:31-39
[2] 秦浩, 郭薇.国外人力资源服务业的发展现状及趋势[J].商业时代,2013.8:122-123
[3] 陈远瞩.商业银行应聘人员期望薪资的影响因素[D].华东师范大学,2018.
[4] 新浪新闻.华为百万高薪招聘8名应届博士年薪最高或达201万[EB/OL].https://news.sina.com.cn/s/2019-07-23/doc-ihytcitm3997993.shtml. 2019.07.23.
[5] 陈希孺.概率论与数理统计[M].合肥:中国科学技术大学出版社,2009.
[6] 赵海龙,张丹丹,黄松,莫石,魏浩.基于皮尔逊相关系数的海南省地闪密度与雷击故障关系分析[J].高压电器,2019.8:186-192
[7] 覃玉冰,邓春林,杨柳.基于皮尔逊相关系数的网络舆情评估指标体系构建研究[J].情报探索,2018.10:15-19
[8] 邱南森.数据之美[M].中国人民大学出版社,2014.