大数据视域下职业轨迹画像构建与应用探索
2023-04-27黄蓉
黄蓉
关键词:职业轨迹;画像;大数据;职业教育
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2023)08-0071-03
1 问题提出
职业教育作为一种类型教育,具有职业和教育的双重属性[1]。其中,职业起到了先天的决定性作用。从某种程度来说,先有某类职业,才有职业相对应某类专业。于是,产教融合、校企合作、工学结合则成了职业教育在学校、专业、课程三个层面高质量发展的生命线[2]。围绕质量生命线,如何高质量地对接职业,进行职业分析也就成为办学职业教育中的关键一环。
目前,对接职业,进行职业分析普遍采用的方式方法是通过线上或线下形式,对企业员工进行访谈、问卷调查等方式进行。此类方法因访谈对象的深入程度有限、掌握的信息有限、重视的程度有限等原因,对职业信息掌握不精准、不深入,无法进行职业的量化分析、全面分析,造成对接职业、进行职业分析的效果一般。因此,需要一种更科学、更全面、更有效的手段进行职业对接分析。随着互联网进入2.0时代后,一方面,各行各业所需招聘的职业岗位信息,几乎都会通过互联网进行发布;另一方面,越来越多的从业人员也通过互联网发布自己的职业生涯信息或求职简历信息,这两方面的信息,使得基于互联网的职业岗位大数据进行数据分析,可构建职业轨迹画像构。使用职业轨迹画像进行职业对接分析,將更加精准、有效,是互联网、大数据时代,实现产教融合、校企合作、工学结合,进一步提高职业教育质量的必由之路。
2 职业轨迹画像构建
2.1 职业表示
1) 职业岗位基本信息分析。经分析前程无忧、领英等国内主要招聘网站的招聘信息后,归纳并提取出招聘网站的职业岗位信息如表1所示。
2) 职业岗位表示设计。为了对上述职业岗位基本信息进行数字化存储设计,并与后续的职业岗位画像进行对接,文章设计了“实体-属性图”表示职业岗位信息的逻辑设计。
“实体-属性图”主要用来描述现实世界中的概念模型,表示物理逻辑结构,“实体-属性图”包括实体和属性两个要素。其中,实体是指现实世界中可以区分的事物。实体可以是抽象的概念或名字,也可以是具体的人或物。一般来说,使用“矩形框”表示实体,矩形框内写明实体名称。属性是指实体所拥有的某一特性,它是用来描述实体情况的要素。一般来说,一个实体通过1个或多个属性来描述、刻画;属性不能脱离实体而存在,属性是相对实体而言的;属性使用椭圆形表示,并用无向边将其与相应的实体连接起来。
运用“实体-属性图”对职业岗位信息进行描述,如图1所示。其中,职位作为实体,并使用职位名称作为实体名称;职责、任职资格、单位信息、薪资福利、发布时间、工作地点、招聘数量、其他说明则为职位的属性。
一般来说,一个具体的职业岗位信息就需一张“实体-属性图”来表示。互联网上的大量职业岗位信息,就可以构成职业岗位信息的大数据——“实体-属性图”数据库。“实体-属性图”数据库数据越多、数据越精准,则越有利于职业岗位信息分析。
2.2 职业轨迹表示
1) 职业轨迹分析。经分析前程无忧、领英、BOSS 直聘等国内主要招聘网站求职人员的工作简历和用人单位发布的职业岗位信息之后,不难发现:绝大部分人的职业生涯中,都存在多个岗位的工作经历。通过分析岗位经历变迁过程,就可以形成个人的岗位职业轨迹。形成个人的职业轨迹的原因是多方面的,主要包括岗位升迁、个人转行、同行业内跳槽等多种原因。在分析个人的工作简历基础上,进而分析海量的个人工作简历,就可以形成更多的职业轨迹。按职业轨迹的划分层面不同,一般可以将职业轨迹划分为如下三个层面:
①微观层面。微观层面的职业轨迹是指个人层面的职业发展轨迹,它体现的是某一个体某一段时间内的职业岗位信息变化情况。如图2所示,体现了工作岗位、工作单位、工作时长等变迁过程。
通过构建微观层面的职业轨迹后,就能清楚地表示出某一个体的工作经历情况,其核心意义是通过与中观层面的职业轨迹进行对比,用于指导个人职业生涯成长设计和路径选择。微观层面的职业轨迹是构建后续中观层面和宏观层面职业轨迹画像的信息基础。
②中观层面。中观层面的职业轨迹是基于大量的个人层面职业发展轨迹数据,进行分析与统计后,形成某一个行业技术领域的职业岗位发展轨迹。如图3所示。
通过构建中观层面的职业轨迹后,就能清楚地表示出某个技术领域中,职业变化与发展的轨迹,反映出从某一个职业岗位到另一个职业岗位的概率情况(如示意图中的百分比)和路径选择情况。
③宏观层面。宏观层面的职业轨迹是基于大量的个人层面职业发展轨迹数据,进行分析与统计后,形成一个更为宏观领域的职业岗位迁移轨迹画像,如城市间职业轨迹画像、技术领域间职业轨迹画像。如图4所示。
通过构建宏观层面——城市间职业轨迹后,就能清楚地表示出城市间职业变化与发展的轨迹,体现出某一时间段职业岗位从一个城市迁移到另一个城市的概率情况(如图4示意图中的百分比),也可以构建宏观层面——技术领域职业轨迹,用于体现从一个技术领域迁移到另一个技术领域的概率情况。
2) 职业轨迹信息模型构建。为了充分表达三个层面的职业轨迹,并与职业岗位信息进行有效衔接,采用链式数据库表结构构建职业轨迹信息模型。链式数据库表结构如图5所示。
对上述数据库表的字段设计说明如表2。
运用上述链式数据库表存储职业岗位信息后,进行大数据的统计与分析,运用可视化技术,就可以很好地满足职业轨迹的微观、中观、宏观三个层面的信息展示。
2.3 职业轨迹画像构建
1) 画像构建的技术方案。课题组充分利用已有的简历大数据、招聘信息大数据,使用网络爬虫技术、自然语言识别、大数据分析等技术,构建了大数据视域下的职业轨迹画像[3],具体设计的技术方案如图6 所示:①数据采集层。运用Requests、XPath、Scrapy等爬虫技术,定期对智联招聘、BOSS直聘、中华英才网、领英等求职网站公开的招聘岗位信息、个人简历信息进行抓取,形成岗位与简历信息的大数据集。②数据存储层。运用MongoDB对抓取的招聘岗位信息和个人简历信息进行初次存储。然后,使用Python语言对残缺数据、错误数据、重复数据等异常数据进行清洗,并根据职业岗位要素信息表、职业轨迹数据表字段做进一步的数据整理,形成关系型数据后,存入MySQL 数据库。③数据分析层。运用自然语言处理技术对招聘信息和简历信息做进一步分析与处理,找出两者之间的关联信息,并进一步挖掘出更多的信息。同时,使用人工智能中的深度学习相关算法,进行招聘岗位需求信息的推荐与预测、简历信息中工作的智能匹配、推荐与预测等。④数据呈现层。主要运用echarts.js、matplotlib等技术实现可视化,采用带权重的图形展示轨迹画像,包括微观、中层、宏观三个层面的职业轨迹画像[4]。
3 职业教育应用场景分析
3.1 专业建设方面
通过构建大数据视域下的职业轨迹画像,能使职业院校更精准地对接职业,科学地进行职业量化分析,为专业人才培养方案找准定位、培养规格、服务面向、就业岗位群提供决策的数据依据,实现更精准、更有效的产教融合、校企合作和工学结合,从而大幅提高人才培养质量,推动我国职业教育高质量发展,真正实现“人人可成才、人人可出彩”的目标。
3.2 学生成长方面
通过构建大数据视域下的职业轨迹画像,一方面能直接用于指导职业院校学生的专业选择、成才路径设计,进一步挖掘个人能力倾向、成长与发展空间;另一方面,职业轨迹能够清楚地显示出个人、公司甚至行业、区域的发展状况,有利于职业院校更好了解行业发展现状与前景,提前做好职业生涯规划,助推学生成长成才。
4 结束语
随着数字时代到来,数据已成为生产要素[5]。数据将会起到越来越重要的作用,基于职业岗位信息和求职简历信息大数据的职业轨迹画像,在人工智能技术的助推下,也势必将进一步完善职业轨迹画像,并在职业教育人才培养定位、课程体系设计、课程开发等方面得到更深入、更广泛的应用。