基于云计算的高校就业信息服务平台的应用研究
2015-08-22荣艳冬
荣艳冬
摘要:本文论述如何构建基于云计算技术的高校就业信息服务平台,文中首先阐明了就业信息服务平台的必要性和技术可行性,分析了当前就业相关管理信息系统的现状和存在的问题,提出平台构建的解决方案。文中讨论了三个关于平台构建的主要问题,首先论述如何利用Hadoop的分布式文件系统解决就业海量数据的云存储,其次采用SaaS构建就业相关业务,以云服务方式将业务提供给客户,最后论述如何应用Hadoop并行计算技术解决就业信息服务平台数据计算问题。
关键词:云计算;就业信息服务;Hadoop;SaaS
中图分类号:TP39 文献标识码:A DOI:10.3969/j.issn.1003-6970.2015.05.010
0 引言
高校毕业生逐年增加,国内就业形势严峻。政府、高校、用人单位和家庭都从不同的角度高度关注就业工作,就业信息化服务的建设刻不容缓。
云计算技术具有高效、可靠、高可扩展性和易用性的特征,被很多领域广泛的使用。本文讨论的内容是如何将云计算技术应用到就业信息化服务中,从而高效率、高质量的做好就业服务工作。
Hadoop是由Apache开源组织提供的分布式系统基础框架,能够有效的解决海量数据分布存储和分布计算,是云计算技术应用层面很好的解决方案。
1 高校就业信息系统研究现状
高校就业管理信息研究和应用已经开展了很长时间,现在几乎所有高校都建立了就业信息管理系统或者平台,但是这些系统存在以下几方面问题:第一,系统侧重毕业生和就业信息管理,或者只是学生管理信息系统的一部分,缺乏服务机制,无法实现学生、教师和用人单位的联动。第二,系统资源利用率低,系统运行效率低、安全可靠性和可扩展性差,给学生数据安全带来很大的隐患。第三,系统数据利用率低,多数集中在简单的查询,很难获得有益的知识,提供决策服务。第四,系统缺乏个性化定制,很难适应当前就业工作不断调整的需要。
2 构建基于云计算的高校就业信息服务平台
本文从三个方面论述如何构建基于云计算的高校就业信息服务平台:一是,如何构建就业信息云服务平台,为政府、学生、高校和用人单位等用户提供服务。二是,构建基于云存储的数据平台,提高资源利用率,使系统高效可靠,并且具有高可扩展性。三是,利用云计算技术进行并行、高效、可靠的数据处理,最后将平台的数据服务提供给用户。
2.1 构建高校就业云服务平台
根据提供服务资源的类型,云服务被分为三个类别:SaaS(软件即服务)、PaaS(平台即服务)、IaaS(基础设施即服务)。
高校就业信息云服务平台采用SaaS模式,通过浏览器和移动终端将软件作为云服务提供给所需用户。用户无需购买软件和维护软件,用户根据业务需求购买相应的云服务,云服务提供商管理相关软件并实施软件的维护。这种方式大大降低用户在软件购买和维护上人力和物力的开支。高校就业信息云服务平台自底向上分别是“云数据层”、“数据服务层”、“业务服务层”、“云服务层”和“应用层”,每层之间采用松耦合,提供相互访问的接口,用户不必关注层内部逻辑,平台架构如图l所示。
(1)数据存储层
高校信息服务平台的数据主要包含学生数据、用人单位数据和高校相关数据,数据是作为平台的基础。为了提供便捷、高效、可靠的数据访问,数据存储层采用云存储技术实现,后面会详细论述。
(2)数据服务层
数据服务层建立专门进行云数据层访问的接口程序,用户通过webservice或者API进行加密数据的访问,数据的具体存储对用户是透明的,这也有效的提高数据安全性,并且为数据的扩展提供基础。
(3)业务管理层
业务服务层包括高校信息服务平台所有业务,具体包括应聘招聘、就业指导、毕业生困难帮扶、创业等服务内容,这些业务服务于政府、用人单位、高校、学生和社会等不用的用户。由于就业工作随着时间的推移会受到就业形势、政策等很多因素影响,从而导致就业工作业务和用户发生不断变化,所以就业信息服务平台业务服务层要具备高扩展性。基于以上的要求,我们构建了业务服务控制台,业务服务被设计为可插拔式,每项业务可以被挂载在控制台,或者从控制台被卸载,也可以设定业务接口、执行业务升级操作等服务。
(4)云服务层
云服务层将业务服务层的内容以应用接口的方式提供给应用层,提供的方式是为业务服务层建立API接口和webservice接口。应用层可以通过编程的方式调用业务接口,实现业务访问。
设定中文信息处理和语音识别接口,用户可以通过输入中文关键字或者语音调用业务,在应用层和业务层之间建立更加友好的数据传送,也为移动终端用户提供更加便捷的操作方式。
(5)应用层
应用层直接面向实际用户,实现就业信息云服务平台不同类型的用户图形界面,从而能够适应不同用户的不同需求。用户既可以通过个人电脑上的浏览器访问获得云服务、也可以使用智能移动终端的应用程序或者微信访问云服务。
2.2 建立基于Hadoop的云数据存储
高校就业信息服务平台需要大量的数据进行支持,而且数据逐年增加。利用云存储技术主要解决快速、高效的处理海量数据,从而达到易扩展、低成本、易管理、高效和安全的设计原则。Hadoop软件框架的HDFS(分布式文件系统)提供了具备高扩展性、高容错性、高可靠性、高效等特点,并且可以部署在低廉的硬件上,从而降低成本。基于以上内容,高校就业服务平台的数据存储通过HDFS分布式存储技术实现云存储,Hadoop的具体部署如图2所示。
2.3 建立基于Hadoop的数据服务
数据服务是就业信息云服务平台重要的业务,用户需要了解学生年龄、民族等数据分布,需要了解就业数据分布,需要了解用人单位人才需求分布,需要了解就业数据内部和外部存在的各种联系。数据服务从海量数据的计算中获得,利用云计算技术能够高效、低成本的解决计算问题,Hadoop为云计算提供了有效的解决方案,它提供了MapReduee模型,这个模型解决了传统并行计算在易编程性上的瓶颈,程序员可以更容易的开发分布式并行计算程序。MapReduce同HDFS一样采用一个主控节点和多个计算节点的架构,如图1所示。将大规模数据集分成多个小数据集,然后这些数据集分给多个map节点进行并行处理产生中间结果,最后在reduce阶段对这些结果汇总,得到最终结果。
3 总结
本文通过对云计算基础知识和Hadoop分布式云计算平台的学习与研究,设计了基于云计算技术的高校就业信息云服务平台,本平台采用五层体系架构,基于SaaS构建业务,以云服务方式提供给用户,利用Hadoop分布式文件系统实现基础数据云存储,层与层之间利用webserviee和API进行调用。最后,利用Hadoop的MapReduce云计算模型解决就业信息服务平台的数据服务。