APP下载

基于职业轨迹分析的职业潜力测量模型设计

2023-11-16黄蓉扶丽娟

华东科技 2023年10期
关键词:画像潜力轨迹

文/黄蓉 扶丽娟

本文主要分析职业档案与职业轨迹的应用现状,根据职业轨迹的网络拓扑结构特征对职业档案大数据进行职业轨迹分析与表示设计,在完成职业档案数据采集设计、职业轨迹大数据集建模分析后构建职业轨迹画像,并在此基础之上运用大数据技术设计求职者的职业潜力测量模型。

保居民就业是国家“六稳”“六保”工作中的关键内容。因此,围绕如何保就业、实现高质量就业的相关研究工作便应运而生。当前,典型的研究代表有:大学专任教师围绕如何提高学生的专业水平、职业素养和就业竞争力进行分析与研究;职业规划师围绕如何科学进行职业规划、职业指导和就业帮扶展开研究。这些研究都为保就业提供了许多有益的指导和帮助。然而,由于每个求职者的学习经历、工作经历、个人素养和能力倾向等存在差别,不同求职者很难借助统一的模式、套路来解决就业,尤其是实现高质量就业。这个问题如何破解?大数据时代的职业档案给出了解决问题的方向和思路。

当前,许多用人单位通过互联网公开发布岗位招聘信息。与此同时,许多求职者通过互联网上传其个人求职简历,也有许多成功就业者通过互联网构建其个人职业档案作为其个人的展示、宣传主页。相关典型互联网平台有领英、前程无忧、BOSS 直聘等。对这些公开的、海量的求职简历信息(职业档案)进行大数据采集,并进一步建立职业档案之间的关系,就形成了一种职业社交网络。通过挖掘分析职业社交网络中的信息,进行逻辑分析,形成可视化的表示,就可以形成职业轨迹。在职业轨迹的基础上,通过对职业档案大数据进行清洗与分析,即可形成职业轨迹画像。职业轨迹及其画像能够清楚地展示个人、公司甚至行业、区域的发展状况,同时还能够帮助企业更好更快地分析岗位所需,遴选真正适合岗位的人才,实现人才的精准推荐。

为了对求职过程进行管理,职业生涯管理系统(Career Management System)应运而生。职业生涯管理系统在全面考虑职业内外部环境要素的基础上,分析和评价求职者的能力、兴趣、价值观等个体特征,确定求职者的职业生涯目标,监测与评估个人职业画像和职业前景,并制定措施帮助求职者实现该目标。也就是说,职业生涯管理系统基于职业档案大数据的职业轨迹分析及潜力测量系统,以职业档案大数据分析、职业潜力测量为出发点,综合运用职业规划、大数据、人工智能、数学建模等多学科理论与技术,从数据采集、建模分析、职业轨迹画像、职业潜力测量四方面进行职业档案大数据的信息模型研究。

一、职业轨迹分析的表示

职业轨迹分析主要是分析领英、前程无忧、BOSS 直聘等网站公开的职业档案信息。根据职业轨迹的职业岗位分类、行业分类、区域分类的要求和流动性要求,在进行分析时,相关人员一般应提取职业档案拥有者(用加密后的代码表示)的所学专业、毕业时间、就业单位、就业岗位、就业开始时间、就业结束时间、单位所在区域、单位所属行业等公共属性。有这些公共属性就可以充分表达职业轨迹的拓扑属性和可视化要求。

为了方便对职业轨迹进行分析,可引入图形来表示。图能够精确表示职业轨迹,并提高相应的分析效率。图是顶点+边构成的图(其中,顶点是样本点);聚类为顶点的划分;边则是样本点的相似度。图聚类则是通过对图中顶点的划分来完成聚类。图的划分通常采用两种方法:谱聚类和最小割。其中,谱聚类是一种基于图论的聚类方法,其通过对样本数据的拉普拉斯矩阵的特征向量进行分析来完成聚类,通过分析特征向量与特征值,获得聚类结果。最小割则属于离散优化方法,其主要是将最小割转化为最大网络求解。近年来也有关于深度嵌入聚类(Deep Embedding Clustering,DEC)的相关研究成果,深度学习开始被引入特征聚类领域。

二、基于职业轨迹分析的职业潜力测量模型的建立

本文基于职业轨迹对职业档案大数据进行清洗分析,得到了职业轨迹画像,然后采用JavaEE、SpringMVC、Spring、MyBatis、MySQL、Spark 等开源软件技术和大数据技术,建立了基于职业轨迹分析的职业潜力测量模型原型,旨在为各高校学生的专业选择、职业成长和发展规划提供帮助与指导。

在建立职业潜力模型的过程中,本文采用了职业潜力分析基础理论、信息技术、数学建模与分析技术等理论和技术,从信息采集、建模分析、职业轨迹画像、潜力测量模型四个方面进行了深入研究。首先,笔者基于SSM(Spring、SpringMVC、Mybatis)框架与Scrapy 爬虫框架进行数据信息的采集。其次,笔者用Pandas(一种强大的分析结构化数据的工具集)对爬取到的信息进行数据清洗、数据统计分析,并将分析结果用ECharts 以可视化的图表形式展示给普通用户。最后,笔者使用Java 框架技术进行前台展示与后台管理。具体的流程如图1 所示。

(一)职业档案数据采集研究

职业档案数据采集研究是后续的建模分析、职业轨迹画像、潜力测量模型的研究基础,是研究职业轨迹信息模型的关键所在,其具体步骤如下。

①研究职业档案的大数据源。笔者根据职业轨迹与职业档案关系理论,从数据的结构完整性、公开性、有效性和数据量等方面,遴选了一种具有代表性的职业档案大数据源。

②研究职业档案数据采集的步骤与规范。笔者根据职业轨迹的组成要素之间的关系、职业轨迹与职业档案的关系等,确定职业档案数据采集的格式、手段、方式、频率等。

通过以上研究,笔者运用网络爬虫技术,完成了职业档案大数据集的采集,以便更好地挖掘深层信息,辅助决策。

(二)职业轨迹大数据集的建模分析

职业轨迹大数据集的建模分析需要应用到职业教育论、数学建模分析理论、计算机数据统计与分析技术、职业能力发展理论、职业潜力测量理论等多学科理论和技术。目前,国内关于这方面的研究与实践不多,国外相关参考资料翻译也困难,故此部分内容将成为本文研究的重点。职业轨迹大数据集的具体建模分析流程如图2 所示。

(1)数据清洗研究。笔者运用删除缺失值、均值填补法、热卡填充法等方法对缺失的职业档案数据进行处理,运用统计分析、聚类、模型检测等方法对离群数据进行处理,运用回归法对数据噪声进行处理,最终完成了职业档案数据的清洗与整理工作。

(2)针对清洗后的数据,笔者用ElasticSearch 搭建搜索引擎。在完成搜索引擎搭建后,用户需要将数据导入搜索引擎中。导入数据可以使用数据源连接器、API 等方式,用户可根据实际情况选择合适的导入方式,但在导入数据时,要注意数据格式、字段映射等问题。在完成数据导入后,用户可以使用搜索引擎进行查询和搜索,搜索引擎可以定义一个Mapping 索引。在使用搜索引擎时,用户通常需要定义查询语句、搜索条件、排序规则等,以便快速找到所需的信息。搜索引擎将搜索结果以某种形式呈现给用户,如表格、地图等形式。

(3)针对搜索引擎搜索到的结果数据,笔者利用ElasticSearch搭建了分析引擎。ElasticSearch主要是通过聚合来进行统计分析的。聚合主要有两种形式:指标聚合和桶聚合。笔者主要采用桶聚合的形式对搜索到的数据进行分析。笔者先把搜索到的数据按照不同类型分成不同的索引,然后再进行聚合运算,在指定类型的索引中聚合出相关结果并进行反馈。

(4)建模研究。笔者运用自然语言处理技术并结合岗位胜任力分析模型,对处理过的数据进行理解、标注。

(三)职业轨迹画像设计

职业轨迹画像设计步骤如下。

(1)职业轨迹画像组成要素设计。笔者根据已有的职业档案大数据和分析模型,研究设计职业轨迹画像的组成要素以及要素与要素之间的关系,重点提取职业档案拥有者(用加密后的代码表示)的所学专业、毕业时间、就业单位、就业岗位、就业开始时间、就业结束时间、单位所在区域、单位所属行业等要素。

(2)形成职业轨迹画像。笔者依据职业轨迹画像组成要素,采用可视化技术如ECharts,运用树状图、网状图、雷达图等图例,构建了某一行业的职业轨迹画像、某一类职业岗位发展画像、行业间人才流动画像、区域间人才流动画像等。

(四)职业潜力测量模型设计

职业潜力测量模型设计步骤如下。

(1)根据收集的简历集合,对相关数据进行处理,并整理成职业档案大数据集,实施建模分析等操作,得到职业轨迹画像。

(2)为得到更精确的模型,引入知识潜力和协调潜力等因素,设计职业潜力测量模型。

(3)将第一步得到的职业轨迹画像作为输入内容,确定职业潜力测量的测量数据、测量方法、测量结果的展示等,进一步优化职业潜力测量模型设计。

经过上述步骤设计完成后的职业潜力测量模型,既可以帮助用户进行职业轨迹分析,又可以为职业轨迹画像转化提供方法和手段。

三、结语

本文以职业档案大数据分析、职业潜力测量为出发点,综合运用职业规划、信息化技术、数学建模等多学科理论与技术,采用开源软件技术和大数据技术建立基于职业轨迹分析的职业潜力测量模型原型。笔者及所在的项目团队拟在部分高职院校对该模型进行实证研究,根据研究结果对模型进行优化,再将模型推广至其他院校,以期为各高职院校学生的专业选择、职业成长、发展规划提供帮助和指导。

猜你喜欢

画像潜力轨迹
威猛的画像
“00后”画像
画像
轨迹
轨迹
轨迹
潜力榜
进化的轨迹(一)——进化,无尽的适应
PPP模式怎样发挥最大潜力?
学习潜力揭秘