APP下载

基于岗位需求特征挖掘的Web前端开发人才培养规格分析

2021-07-28邱尚明邓会敏

北京工业职业技术学院学报 2021年3期
关键词:词频规格维度

李 蓉 邱尚明 邓会敏 何 丽

(广东农工商职业技术学院,广州 510507)

0 引言

随着“大智移云物”新时代的到来,软件产业不断迭代创新,Web前端开发人才的市场需求不断发展变化,供求断层现象始终是市场面临的困境。2019年国务院发布《国家职业教育改革实施方案》,指出职业教育的主要任务是为社会输送适应区域经济发展和产业转型升级需求的具有高素质创新能力的技术技能型人才[1],是我国教育中与经济发展联系最紧密、最直接的部分,其鲜明特点在于培养目标的职业性和技术性[2]。

如何了解和把握社会对Web前端开发岗位技能的需求特征,适应和跟踪产业环境对技能需求的变化,明确岗位需求规格,并以此为依据科学地构建人才培养规格,是职业教育人才培养面临的重要问题。目前鲜有通过分析企业岗位需求特征制定人才培养规格的研究,已有的研究或采用人工分析方法而缺乏客观性[3],或未将特征分析结果与人才培养对接[4]。为此,笔者从企业和机构对人才技能的社会需求入手,从各大主流招聘网站上爬取招聘信息,利用大数据技术和数据挖掘方法,对企业岗位信息进行特征分析,发掘企业对人才技能的需求类型和特征,得出对人才需求较为客观全面的评估。该研究对职业教育需要培养什么样的人,如何有针对性地制定适应市场需求的人才培养规格,具有一定的参考价值。

1 数据获取与预处理

1.1 数据获取

为探求企业对求职者的技能需求,笔者调研了国内多家互联网招聘网站,综合考虑数据抓取难度、发布信息量、服务覆盖范围以及网站权威性等因素,最终选择“前程无忧”“智联招聘”“猎聘网”3个招聘网站发布的相关招聘信息作为项目的实验数据源。分别在招聘网站中以“Web前端开发”“Web前端”“前端开发”等为关键词进行检索,共查询到1 264条招聘信息,借助Python开发语言,使用Selenium技术设计爬虫程序,并配合浏览器驱动获取网站中的招聘文本信息。获取的数据包括招聘岗位、岗位职责、任职要求、薪资待遇、工作经验、工作地区等。

1.2 数据预处理

由于笔者研究着眼点在于社会对求职者的需求特征,因此将岗位职责、任职要求中的信息作为主要研究数据基础,并对获取的相关数据进行预处理。为防止专业短语在分词中被分解,对招聘数据进行分词处理,抽取相关的关键词短语添加到词库,并使用过滤词表,删除量词、介词等无价值词语,并对数据进行去重和统一处理以提高分析准确性。

2 Web前端开发岗位需求规格模型的构建

2.1 岗位需求关键词词频统计

词频指一固定词在数据库中出现的频率,表示词的重复次数与程度。词频分析法是基于词频的处理分析而衍生的一种用于评估某固定词在某一研究领域的重要程度和发展趋势,通常词频与重要性的研究成正比关系[5]。词频统计通常使用TF-IDF(Term Frequency-Inverse Document Frequency)方法,该方法能有效过滤对文档主题没有实际意义的词汇,同时突出关键词汇,相较简单的词频统计更为客观和准确地反映出关键词汇。TF-IDF方法的计算过程为:(1)TF=某词在文本中出现的次数/该文本的词的总数;(2)IDF=log语料中的文本总数/含有该词的文本总数+1;(3)TF-IDF=TFIDF。

借助TF-IDF方法,利用Excel软件对招聘数据中的岗位需求特征关键词进行词频计算,共获取特征词130个,选取TF-IDF大于0.005的前58个特征关键词作为研究对象。岗位需求关键词词频表如表1所示。

表1 岗位需求关键词词频表

表1(续)

从表1发现,词频等级最高的是CSS、后端、JavaScript、经验、协作等与实现技术、开发技能、素养品质等相关的词汇,其中CSS,JavaScript,Html等为前端开发中较为基础的技能,除了在网页制作、动态效果等具有十分重要的地位和作用外,同时也是大前端发展环境下最为重要的技术之一,很多企业对于熟练掌握CSS,JavaScript等技能的需求量巨大;后端作为高频统计词,说明在大前端时代与后端的交互对接也是前端开发从业者所必备的技能之一,需求量较大;框架模式作为较为先进优越的开发技能,不少用人单位对Vue,React等有较高的需求。此外,jQuery,ES,Ajax,Webpack等词频等级也较高,代表了目前前端开发产业环境下所需要的热点技能。

2.2 岗位需求分类

K-Means算法根据相似性原理进行科学分类[6],较人工分类更具客观性。在利用K-Means算法对岗位需求特征词进行聚类分析前,首先采用Word2Vec模型实现文本向量化,生成向量集X={X1,X2,…,Xn},其中第i个关键词对应向量Xi=[xi1,xi2,…,xiD],D表示向量的属性维度。根据生成的关键词向量,按照欧氏距离作为判断向量间相似性的标准进行聚类,计算如式(1)所示。

(1)

假设类簇个数为K,Ck代表第k个类簇,|Ck|代表第k个类簇中所有数据对象的总数,定义第k个类簇中心Centerk的方程如式(2)所示。

(2)

K-Means算法的目标是最小化平方和误差,数学模型如式(3)所示。

(3)

将词频统计得到的高频关键词作为K-Means算法的输入,将类簇个数定为4,对Web前端开发岗位需求特征要素进行分析与归纳,根据聚类分析结果,可得出4个维度的岗位需求规格模型,分别对应任职资格模型(KSAO)中的知识(Knowledge)、技能(Skill)、能力(Ability)和素养品质(Others)4个方面。每个维度所包含的关键词,如图1所示。

图1 聚类分析结果

从图1可以看出,知识维度反映执行某项工作任务需要的专业知识、岗位知识,以及能否用知识指导自己的行为;技能维度反映在工作中运用工具、技术或完成某项具体工作任务的熟练程度,包括实际的工作技巧和经验;能力维度反映个人内在的基本能力,如逻辑思维能力、学习能力、观察能力、解决问题能力、表达能力等;素养品质维度反映有效完成某一工作需要的个性特质,包括工作态度、人格个性、内在动力及其他要求等。

2.3 岗位需求规格模型的构建

针对图1聚类结果中的每个维度,以单因子出现频次占总频次比构成的因子分布比例为依据,每个维度保留频率高于2%的关键词,合并同义词或近义词,并扩展词义表达后,提取了22个特征要素作为Web前端开发岗位需求的具体内容,从而构建4个维度22个特征的Web前端开发岗位需求规格模型,如图2所示。其中每个区域的大小反映了该特征的重要性和企业需求程度。

图2 Web前端开发岗位需求特征模型

3 Web前端开发人才培养规格的特征要素与内涵解释

当前,各企业对Web前端开发岗位应聘者通常要求有系统化的学习经历,因此将Web前端开发岗位需求规格模型引入专业实践过程,以专业内涵式发展为基础,以核心能力和专业能力并举为出发点。构建Web前端开发人才培养规格,形成一个充分健全的规格体系,其特征要素和内涵解释如表2所示。

表2 Web前端开发人才培养规格的特征要素与内涵解释

Web前端开发人才培养规格共4个维度22个特征要素,由各特征的分布可知,“编程思维与开发流程”“网页设计与开发”“动态页面开发”3个特征因子所占比例最大,可见多数企业将这3个特征作为胜任Web前端开发岗位必备的基本要素。在实际项目开发中,掌握一定的工程化思想和技术,熟悉组件化、模块化、规范化、自动化等知识,以及能熟练使用Vue,React,Angular等技术栈是当前的热点需求;团队协作能力和沟通能力体现在项目团队开发过程中的配合和协调方面,应重视对学生的培养;规范意识是对从业者素养品质要求频率较高的特征,需要学生在学习中养成良好的编程习惯;工作经验也是技能维度出现频率较高的特征,在人才培养中应重视产教融合,与企业合作构建真实企业级项目库,开展层级化进阶式项目教学,逐渐积累项目开发经验,契合企业用人需求。

从高职教育改革和发展趋势来看,未来将呈现出高质量内涵化特点,以企业岗位需求为导向的人才培养将成为未来的主流方向,通过笔者建立的“岗位需求规格模型”制定人才培养规格,契合了B.S.Bloom的认知领域教育目标分类,也符合Simpson技能领域教育目标分类。以人才培养规格为目标制定专业人才培养方案,帮助学生做好职业定位和职业规划,将更好地满足社会对高素质创新型技术技能人才培养所提出的需求。

4 结论

在当前经济转型、高职教育内部改革背景下,从企业对前端开发人才的需求入手,通过分析主流招聘网站信息,构建岗位需求规格模型,对专业人才培养规格的制定作出探索性分析,并针对培养规格每个维度的特征要素和内涵意义作出详细解释。所作研究有助于高职院校有针对性地培养适应市场需求的人才,并为求职者的能力构建及就业选择提供参考依据。后期将开展实践研究,根据技术变化趋势和区域市场需求调整人才培养目标和课程体系,设计可量化、可操作的评价指标,对模型的实用价值展开进一步探索,为培养优秀前端开发人才提供帮助。

猜你喜欢

词频规格维度
近3成苗企难以维持!规格越大越亏,2022如何让泥鳅赚钱?
理解“第三次理论飞跃”的三个维度
闭月羞花
千里求师
认识党性的五个重要维度
浅论诗中“史”识的四个维度
词汇习得中的词频效应研究
词频,一部隐秘的历史
人生三维度
汉语音节累积词频对同音字听觉词汇表征的激活作用*