基于云计算的高校就业信息化平台模型研究
2017-05-18蒋鹏
摘 要:针对高校就业信息化面临的诸多问题,借助云计算和大数据技术,提出了一种基于云计算的高校就业信息化平台模型,并对模型的整体架构和功能设计进行了深入探讨。本模型整合各高校和网上的就业信息资源,避免重复建设,为高校提供个性化、智能化、可共享的就业信息服务。
关键词:云计算;大数据技术;就业信息化;SaaS;智能分析
中图分类号:G473.8 文献标志码:A 文章编号:1673-8454(2017)09-0091-03
引言
伴随着我国高校就业工作向服务型、社会化和网络化的发展,基于互联网的高校就业信息化平台成为一种日趋常见和普遍的模式。[1]目前高校就业信息化建设过程中也普遍存在以下几个方面问题:就业信息化技术人才缺乏; 重应用轻理论,缺乏系统性和个性化的研究;缺乏统一规划,信息孤岛现象严重,无法共享;系统的管理维护困难,不便于整合和再开发。[2]这些局限与不足限制了高校就业信息化的发展与深入。
云计算作为一种基于Internet以服务方式提供的新型计算模式,正在深刻改变着传统的用信息技术解决管理问题的方法。[3]基于云技术的高校就业信息化平台模型具有以下特点:
(1)实现了就业信息系统开发和应用的分离,各高校只需关注业务创新与系统应用;
(2)实现了统一规划,可以实现区域高校与高校、高校内部、高校与社会的数据共享;
(3)支持系统的持续整合与改进。
基于云技术的可定制的就业信息系统,还具有开发成本低、使用维护简单、软件项目部署周期短、风险低等优点,为进一步提升我国高校就业服务水平提供了直接和有效的方法与技术。
一、平台的整体架构模型
建立一个基于云技术的就业信息化平台。首先需要通过云计算平台搭建一个开放的、基于网络的基础设施环境,然后提供一整套包括分布式数据存储、大数据处理、就业信息检索、就业信息推荐、个性化咨询、信息反馈的基础服务平台。以满足用户弹性访问的需求,还要提供与高校和企业进行数据交互的系统接口服务、供内部开发运维人员使用的开发管理运维服务。最后高校和企业以租用的方式申请这些服务,管理自己的就业服务,从而节省了开发运维、基础设施等方面的成本。其整体架构模型如图1所示。共分为三层,从下到上依次为云基础设施层、基础服务层、自定义展示层。云基础设施层是平台的基础,提供硬件支持;基础服务层是平台的核心,负责数据的存储和处理;自定义展示层是平台的前端和入口,用户定制自己的个性化服务。
1.云基础设施层
为满足多个高校与企业租赁高校就业信息化服务,平台需要承担海量的数据、文件、数据库里数据的存储和计算等。这就必然需要可扩展的、廉价的、可靠的和高性能的硬盘,高速的内存Cache系统,具有弹性计算能力的CPU等硬件资源,以减少业务系统的响应时间,云计算平台就可以解决这些问题。亚马逊的EC2(Amazon Elastic Compute Cloud)、阿里巴巴的ECS(Elastic Compute Service)是国内外两个最常用的商用云计算平台,用户根据自己的需求租赁云服务器。[4]云服务器是一种处理能力可弹性伸缩的计算服务,其管理方式比物理服务器更简单高效。用户只需专注于构建应用,而将运维工作交给这些专业的厂商。除了商用的云计算平台,也可以选择开源的云计算技术搭建私有云计算平台,加州大学研发的Euclyptus、NASA研发的OpenStack均属于这类技术。[5]
2.基础服务层
基础服务层是就业信息化平台的核心,它的三大功能包括分布式数据存储、大数据处理与就业信息检索、就业信息智能分析。就业信息主要分为聘用单位信息、招聘信息、毕业生信息、学校信息四类。将这四类信息有关数据存储在分布式的存储系统中,便于整个平台的横向扩展。就业的数据量很大,传统的串行处理方式就会成为系统的瓶颈,需要用到以MapReduce为代表的并行大数据处理技术。一个平台的就业信息难免不全面,通过就业信息检索来获取其他平台的就业数据,为学生提供更多的就业信息。传统的就业信息系统将最近的就业信息全部展示,作为数据量很大的就业信息化平台,使用智能分析模型,结合学生的专业、兴趣和企业的岗位要求为学生推荐最适合的就业信息。
3.自定义展示层
引入基于SaaS的多租户技术,实现高校就业信息化平台能够做到“一套网站代码,多个网站实例”的共享程度,而且这个共享不能以牺牲租户的个性需求为代价。[6]根据租户的这些个性差异化需求,多租户网站自定义技术解决页面组织、页面风格、业务字段、业务种类重组、工作流程可配置定义。[7]
如图2所示,基于这个平台,有专门的运营商负责技术、运维,而将就业信息化作为一种服务提供给各个高校和企业。各个高校只能访问自己专有和共享的服务,按照自己的需求配置个性化的Web界面。
二、就业信息化平台功能设计
1.云计算平台
随着云计算成为十二五规划的重要部分,将云计算应用到高校就业信息服务平台很有必要。每年的9-11月份和3-6月份是用人单位集中招聘期,同时毕业生也集中在这几个月份求职。毕业生,用人单位都是集中在某一个时间段去访问高校就业服务平台,这就会给系统带来很大的压力,系统经常会崩溃。如果按照系统的最大访问量去配置硬件资源,在招聘的淡季就会浪费很多的资源,同时也需要人员去维护这些硬件。而云计算技术就是为了解決这些问题应运而生的,将高校就业服务平台部署到云计算平台里,云计算平台就会根据系统的访问量去动态地增加或者减少硬件资源,这样既可以保证系统的稳定性也避免了资源的浪费。
2.分布式存储系统
目前高校的就业信息系统都以集中存储的方式组织数据。集中式存储虽然便于管理但是读取和写入数据只有一个入口,因为每一种数据库的可用连接数都是固定的,随着访问量的增大这种模式也会成为系统的瓶颈。越来越多的数据需要存入系统,按照集中式存储,当存储资源不足时只能增加内存和硬盘资源。如果将毕业生信息、学校信息、企业信息、招聘信息等分布式地存储起来,当存储资源不足时只需线性地增加存储器。当前流行的解决方案就是Hadoop的HDFS分布式存储系统。
3.大数据处理服务
数据量急增是传统的IT系统处理时就会遇到三个瓶颈:一是数据展现非常慢;二是数据运算速度难以忍受;三是采用传统的ETL(数据抽取、转换、装载),数据更新慢。当前常用的MapReduce大数据计算框架(见图3)就可解决这三大问题。MapReduce处理大数据时,不是将数据移动到计算节点,而是将计算推向数据节点。MapReduce的原理就是计算数据时,主机会启动一个任务,先会对这些数据进行分割,再将大任务切分成多个小任务。再将这些小任务分配到集群上,每一个任务处理其所在节点上数据,最后将数据汇总到一个节点最后输出。
4.就业信息检索服务
任何一个就业平台都无法收纳所有的就业信息。国内三个大型的招聘网站——智联招聘、51Job、大街网,每一个网站都有其他网站不具备的招聘信息。对于高校就业信息化平台,仅依靠企业和高校发布招聘信息的方式,信息量难以满足数量庞大的毕业生。所以新的高校就业信息化平台必须要有一个就业信息检索服务,能够检索互联网上重要的就业信息。
5.智能分析模型
传统的高校就业信息化平台以高校和企业发布信息为主,学生从海量的招聘信息中去查看自己感兴趣的招聘信息。这种方式需要学生投入很大的精力去逐条查看招聘信息,同时也有可能漏掉一些重要的信息。新的高校就业信息化平台需要有一个智能分析模型,这个模型包括就业信息推荐、个性化咨询服务、就业信息反馈。在就业信息推荐服务中,根据学生的技能和感兴趣的工作结合企业的招聘信息,为学生做个性化的就业信息推荐。为了能够及时地提高推荐的准确度,也需要学生反馈推荐的就业信息是否准确,以及是否适合该学生。
就业信息的数量很多,作为高校就业信息化平台的主要用户学生,只需要和自己专业、技能、兴趣有关的就业信息。这就需要为每一个学生个性化地推荐就业信息。本系统针对学生进行就业推荐,为此在学生注册的时候,系统要求学生填写其掌握的专业技能、兴趣等信息,同时在企业发布招聘信息时,系统同样要求企业填写相应岗位的技能要求。根据这两组数据,就可以从中抽象出学生和招聘信息的特征向量。举例来说,特征向量为(java,c,c++,html),某学生具备java和html技能,则该学生可抽象为A = (1,0,0,1),某企业招聘岗位要求掌握java,c++,则该招聘信息可以抽象为B=(1,0,1,0)。显然,特征向量为(0,1)离散的的向量,因此根据此特点选用余弦相似系数来计算相似度。
作为一个基于云计算的高校就业信息化平台,必须要提供就业信息服务自定义的功能。高校可以根据自己的需要定制不同的功能,也可以自定义自己网站的主题、样式等。国外的ERP巨头Salesforce的ERP产品就允许用户自定义,用户付费购买功能服务,也可根据自己的个性化需求定制服务。就业信息化平台需要外部的数据,例如毕业生的信息、企业招聘信息等。依靠人工的录入是很费时间的,所以就业信息化平台需要将数据的导入、个性化的咨询作为接口提供给高校。
三、结语
本文针对我国高校就业信息化所存在的问题,基于云计算和大数据技术,提出了一种基于云计算的高校就业信息化平台模型。并对模型的整体架构和功能设计进行了深入探讨。本模型整合各高校和网上的就业信息资源,避免重复建设,为高校提供个性化的、智能化的、可共享的就业信息服务。在未来工作中,应该对文中所提的架构进行验证并且上升到就业信息服务平台层次,以求更好地指导以后类似平台的开发,最终达到大幅提升我国高校就业信息化水平的目的。
参考文献:
[1]方伟.大学生就业工作信息化新探索[J].中国大学生就业,2013(4):45-46.
[2]蒋鹏.高校就业信息化建设研究[J].广东技术师范学院学报,2015(8):55-57.
[3]刘鹏.云计算[M].北京:电子工业出版社,2011.
[4]陈康,郑纬民.云计算:系统实例与研究现状[J].软件学报,2009(5):1337-1348.
[5]陳全,邓倩妮.云计算及其关键技术[J].计算机应用,2009(9):2562-2564.
[6]刘士军,张勇,杨成伟.基于 SaaS 服务的中小企业业务协同系统[J].东南大学学报(自然科学版),2011(3):458-462.
[7]王卓昊,赵卓峰,房俊,王希诚.一种 SaaS 模式下的服务社区模型及其在全国科技信息服务网中的应用[J].计算机学报,2010(11).
(编辑:王天鹏)