基于OLAP技术的岗位信息多维分析辅助决策系统设计
2022-11-17禤鲜
禤 鲜
(柳州城市职业学院,广西 柳州 545036)
0 引言
大数据在物理学、生物学、环境生态学等领域以及军事、金融、通信等行业早有运用。近年来,大数据技术广泛渗透于人们生活的方方面面。大数据技术通过对海量数据的挖掘、获取、筛选、分析,能够更精准地进行决策。目前,我国的大数据技术走在国际前沿,成为全球大数据应用的先锋。大数据技术作为决策参考已逐渐应用到商业运行中,全国各大招聘网站在自己内部实现了大数据决策,但大多是以企业视角、基于数据统计的方法分析人才资源,例如分析求职者的数量、求职意向、薪资意向、工作技能等,使用大数据技术分析后得出求职者“画像”,方便用人单位做人力资源规划。但从地区人力资源储备与规划视角、高校人才培养视角、求职者精准求职视角去分析人力资源信息的做法相对较少,面对各类人才资源网站的数据,政府决策层无法从此类招聘网站中获得岗位需求分析、岗位技能分析等可以进行人力资源投资规划和人才培养决策的数据分析结果,求职者也无法从求职招聘网站获得相关信息,造成巨大的资源浪费。大数据技术在异构数据库的基础上,使用联机分析处理(OLAP)的多维分析方法,分析数据仓库中的相关数据,能够获得相关信息,以辅助决策。
1 岗位信息大数据分析辅助决策系统的现状评述
目前,招聘网站都是营利性网站,大多数是为企业和求职者服务的。大数据时代下,企业依托大数据技术,人力资源管理部门可以对企业岗位设置有清晰全面的定位,以及整理出企业发展所需要的岗位信息和人员数目、岗位所具备的能力,以简化招聘流程。大数据技术在近两年开始应用到招聘系统中,其建立起的生态模型主要是作为一个交流的平台,为求职和招聘服务。但即便是应用了大数据技术,也大多仅涉及数据统计技术,用于“用户画像”、人才需求多元分析等为企业服务的业务、网站系统生态数据信息的收集、分析也限于企业招聘。而对政府或企业决策层所需的一些人才趋势报告、人才流动报告、行业岗位人才需求分析、专业领域薪酬分析等分析结果,仍然依靠“领英”“麦可思”等专业的调研公司单独调研,没有形成规模以上的招聘网站信息收集、大数据分析一体化智能系统,使用联机分析处理(OLAP)技术对岗位进行分析并辅助上层机构对人力资源进行决策的软件也并不多见。
辅助决策系统可以由政府人力资源部门主导,也可以是高校管理部门,比如教育厅招标投标系统建设。系统建成后,组织单位企业在上面发布招聘信息,求职者在互联网上注册使用,企业填写招聘信息时,可以获得企业岗位需求数据,求职者填写求职信息时,可获得求职者信息,通过对供需双方的大数据分析,可以获得某时、某区域内某行业领域的供需关系,或者某区域、某岗位技能要求,政府在人力资源政策制定、高校建设、行业资源投入时参考分析结果,能得到较为准确的行业人力资源供需信息。高校在专业建设时,参考区域岗位供求关系、岗位技能要求占比等可影响人才培养方案制订,快速准确地获得课程内容、教学要求。综上所述,研究招聘网站中的联机分析处理技术(OLAP)和大数据技术有积极作用。
2 使用岗位信息大数据多维分析辅助决策
随着大数据技术的发展,大数据逐渐成为人们获取对事物和问题更深层次认知的决策资源,特别是人工智能技术与大数据的深度融合,为复杂决策的建模和分析提供了强有力的工具。利用大数据分析能够总结经验、发现规律、预测趋势,这些都可以为辅助决策服务。掌握的数据信息越多,决策才能更加科学、精确、合理。在人力资源储备、管理上,同样可以通过岗位大数据的多维分析,提升管理、决策水平,提升社会效益、经济效益。
目前覆盖面甚广的招聘网站不能仅仅是一个用人单位与人才的交流平台,而应当成为人力资源信息大数据分析的数据来源,以原生招聘网站为主,结合网络招聘网站进行数据抓捕收集,通过联机分析技术和大数据技术对信息进行分析和处理,获得人力资源投资规划分析数据,辅助政府或高校进行决策。因此,在对招聘网站做系统设计时,不能仅仅考虑用人单位和应聘个人的信息需求,而应当以大数据分析的角度,设计招聘系统及数据仓库,获取有助于数据分析的数据,以人力资源市场决策者的视角进一步分析、盘活数据,并将分析结果可视化,根据分析结果,获得人力资源管理、规划、培养的决策参考意见。同时,招聘网站与岗位信息数据分析相辅相成,构建可持续的生态系统有利于整合盘活招聘网站数据,充分利用数据分析结果指导人才培养规划、定制。
3 基于OLAP技术的岗位信息多维分析辅助决策系统设计
3.1 系统的功能设计
岗位信息多维分析辅助决策系统是集招聘功能与岗位信息大数据分析功能为一体的平台。系统不仅提供给企业和个人招聘和应招的功能,招聘信息还会成为岗位信息大数据分析的数据来源,对招聘网站进行数据抓捕收集,对数据进行分析和处理,获得人力资源投资规划分析信息,辅助政府或高校进行决策。因此,在做系统功能设计时,以大数据分析的角度设计招聘系统,除分析求职者的数量、求职意向、薪资意向、工作技能外,还可以进一步分析年龄与薪资关系、工作熟练度与薪资关系、地域与岗位供求关系,同一领域不同岗位内各技能点重合情况、各技能点熟练度、需求分布及职业教育人才培养与市场供需关系等,以多维视角对岗位数据进行分析。以人力资源市场决策者的立场进一步分析、盘活数据,并将分析结果可视化,根据分析结果,获得人力资源管理、规划、培养的决策参考意见。同时,招聘网站与岗位信息数据分析相辅相成,构建可持续的生态系统平台。
3.2 系统的总体结构
基于OLAP技术的岗位信息多维分析辅助决策系统总体设计如图1所示,系统的数据来源由两部分构成:第一部分是系统自带的招聘网站中的用户信息;第二部分则是较大型的招聘网站数据,此部分可通过企业协议、网络合法抓捕获取。此时获得的数据库需要建模重组,依据模型进行数据筛选、清洗、转换,才能进入数据仓库,成为有效数据。数据仓库中的数据此时尚不能成为决策参考,需经过OLAP技术处理,建立多维数据模型,然后根据用户需求,经过钻取、切片、切块等技术,转化为可视化图表,提供给用户以辅助决策。
图1 基于OLAP技术的岗位信息多维分析辅助决策系统总体设计图
3.2.1 用户角色
页面用户包括招聘企业、应聘个人、决策机构3种角色,面对不同的用户,系统呈现出不同的功能。面向招聘企业和应聘个人角色时,该系统就是一个招聘系统。不同的是,系统提供更为智能化的功能,通过各种维度的分析使得企业和个人获得精准信息,能够影响招聘结果的判断,提高招聘效率。而对于决策机构来说,该系统主要提供分析后的数据,以备各类人力资源管理、培训机构作为决策参考。
根据角色需求,设计了不同的功能界面。“应聘个人”角色包括填写个人信息、求职信息、简历编写、岗位信息收藏、我的消息、虚拟面试官、查看数据分析等。用户可以在平台中查看招聘信息、发送求职信息;在“我的消息”中与企业联系人直接对话,使用多维数据分析入口查看岗位各类信息分析结果,并使用“虚拟面试官”功能进行云面试。“招聘企业”角色设计了简历收集、历史招聘、共享面试官、多维数据分析入口等功能,在平台中可以填写企业相关信息、发布招聘岗位信息、与用户交流并通过数据分析入口查看应聘人员相关历史资料。“决策机构”角色主要包括政府人力资源管理机构、教育管理机构、各类面向职业的中高等学校。决策机构通过查看各岗位分析,了解人力资源配置情况。
3.2.2 人力资源大数据分析模块
人力资源大数据分析模块,主要是对岗位信息、岗位技能、岗位薪酬及相关岗位人力资源的储备进行多维分析,以可视化的形式展示给客户。
(1)岗位需求分析。岗位需求分析包括岗位类别分析和岗位数量分析。在该功能中,可以看到岗位的分类和每类岗位不同时间、不同地点的需求数量、薪资情况、技能要求、资历要求等。多个不同维度的岗位数据分析可以作为企业招聘方案的参考,提高招聘效率,帮助求职者了解区域岗位情况,提高入职成功率。
(2)岗位技能分析。岗位技能分析是针对某岗位所需技能进行多维可视化分析。例如,统计某地区2022年Java软件开发工程师岗位所要求的技能,95%的岗位提到java语言,80%的岗位提到开源框架Spring和Spring-Boot,70%的岗位提到SQL数据库,65%企业提到VueJS技术等。系统将这些分析数据用柱状图的形式呈现出来,求职者能清晰了解各区域的技能要求,有针对性地选择区域企业和岗位。如果分析时加上时间维度,对比不同历史时期某个岗位所需技术的占比,总结出该岗位技术要求的历史趋势,有助于决策机构把握人力资源投资方向,也有利于高校制订人才培养方案。
(3)岗位薪酬分析。岗位薪酬分析包括区域薪酬、领域薪酬、岗位薪酬、资历薪酬的数据分析。通过不同区域维度、时间维度、岗位类别维度、工作资历维度的分析,可以看到薪资变化,有助于招聘企业和求职者共同协商,给出符合实际情况的薪酬。相关部门也可通过分析结果对人力资源市场薪酬情况有精准的了解。
(4)人力资源分析。人力资源分析主要是针对求职者信息进行分析,包括区域人才分析、领域人才分析、人才技能分析等功能。通过统计分析,获得某区域或某领域人才的数量、年龄、技能、资历数据,分析数据加上时间维度后,还可以获得人才流动趋势,这类信息对政府决策机构在人力资源分配、人才引进政策导向、区域高校人才培养专业配置等方面有参考意义。
(5)人力资源储备分析。人力资源储备分析针对高校人才培养方案给出参考意见。主要通过求职者所填信息及高校作为决策者注册用户后所填信息分析人力资源储备情况。包括区域高校分析、专业分布分析、人才培养方案分析、就业趋势分析。人才培养机构通过地点维、时间维数据分析,可以获得某区域高校分布、专业分布、高校学生就业趋势等动态数据作为人才储备、培养政策参考。
3.2.3 岗位信息与其他维度分析汇总模块
除了针对岗位和人才信息的分析可以获得决策支持,岗位信息与其他维度分析同样能够提供决策参考意见。多维分析能够使数据获得最大限度的利用。在岗位信息的基础上,系统还设计了企业与求职需求数据分析、区域与求职需求数据分析、薪资与人才资历数据分析、各岗位技能点分布、高校专业设置与岗位需求供需平衡数据分析、岗位胜任能力模型分析、企业(个人)招聘成功率分析等不同维度的分析。这些分析将在岗位招聘、个人求职、人才政策制度、人才培养方面提供决策参考。
3.3 建立基于OLAP的数据仓库
大数据多维分析辅助决策系统的核心是数据仓库及用何种工具算法进行访问。在岗位多维分析决策支持系统中,数据仓库用于数据的存储和组织,它从应用系统中抽取相关数据,同时对数据进综合、集成、转换后,提供面向全局的数据视图;OLAP则可视为数据库访问工具,主要负责数据的分析。在本案例中,数据来源有两个:一是本系统中用户注册信息,企业和求职者使用本系统作为求职应聘的平台。在用户使用过程中,系统即可获得各类岗位相关信息。二是通过各类协议和网络爬虫,在合法合规的基础上,获得其他同类网站的岗位相关数据信息。
由于数据来源不同,形成异构的数据库系统,而对于决策制定,只需关心宏观的、全局模式所描述的信息,所以本案例中,数据仓库可以以岗位信息多维分析系统的数据库模式作为基本模式,从异构数据库系统中收集信息,并建立统一的全局模式。同时收集的数据还支持对历史数据的访问,用户通过数据仓库提供的统一数据接口进行决策支持的查询。
3.4 OLAP技术在系统中的应用
与关系数据库相比,多维数据库增加了一个时间维,它的优势在于可以提高数据处理速度,加快反应时间,提高查询效率。OLAP查询引擎的概念模型可以看作数据仓库的多维视图,在多维数据模型中,有一组信息作为分析对象的数字度量方式。在本系统中,岗位分类、岗位数量、岗位技能、资历要求、区域名称都可以看成数字度量方式。多维数据把一个度量视为维的多维空间内的一个值,每维由一系列属性来描述,岗位维可以由4种属性组成:分类、区域、时间、数量。岗位名称可通过维的层次关系与分类和区域属性相关联。这种数据组织方式消除了大量数据库表中由于空穴造成的空间浪费,以及在每个元组中存储的外键信息,它由统一的维与数组的对应系数限定数据,大大减少了存储空间。
联机分析处理OLAP是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。它具有FASMI(Fast Analysis of Shared Multidimensional Information)特征,即共享多维信息的快速分析的特征。根据上述用户分析的功能进行应用分割,例如岗位信息分析、岗位技能分析、就业趋势分析等,每个分析就是一个OLAP应用,所有的OLAP应用实际上是所建立的数据仓库系统的一部分。
OLAP的基本多维分析操作有钻取、切片、切块、旋转等。钻取是改变维的层次,变换分析的粒度。它包括向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)。Drill-up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而Drill-down则相反,它从汇总数据深入到细节数据进行观察或增加新维。图2是一个岗位信息模型,向下钻取和上卷的过程。此数据模型由岗位分类维、时间维、地区维构成,数据上卷后,减少了地区维,所看到的仅为江苏某时间岗位情况。
图2 使用OLAP对岗位信息数据模型进行钻取、上卷、切片操作
切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有2个,则是切片;如果有3个或以上,则是切块。旋转是变换维的方向,即在表格中重新安排维的放置。岗位信息数据模型切块和旋转操作后如图3所示,其意义在于更为细致地剖析岗位数据,获得更多的信息资源。
图3 使用OLAP技术对岗位信息数据模型进行切块、旋转操作
4 结语
本文对基于OLAP技术的岗位信息多维分析辅助决策系统设计进行了探讨。论述了相关系统的现状,分析了系统角色分类、系统需求,对系统功能进行了详细设计;探讨了数据仓库建设方法,并对基于OLAP技术的岗位数据分析做了剖析。有利于指导企业建立基于OLAP技术的岗位信息分析系统,以OLAP为基本框架的决策支持系统有助于企业、求职者、政府决策机构、高校从更广泛、更全面的视角对岗位信息和人力资源数据进行有效、快速的分析,帮助决策者了解情况,掌握有效、精准的决策信息,提高决策水平。