基于数据可视化的毕业生就业推荐平台的设计方案
2019-09-10赵曌
赵曌
摘要:针对毕业生就业难,无就业方向等问题,利用往届毕业生的就业数据做出就业推荐则能很好的给应届毕业生提供就业参考,帮助他们选择就业方向。现如今毕业生的就业信息数据量大,统计难度大,只有采用高效的数据可视化方法才能有效分析出往届学生的就业信息,做出就业推荐。因此基于数据可视化的毕业生就业推荐平台的设计就非常重要。在此平台的设计过程中,主要采用基于Python的推荐算法,以及数据可视化技术。
关键词:大数据;数据可视化;就业推荐
一、研究意义
目前针对毕业生的就业推荐算法已有成熟的解决方案,但基本都是通过简单的数据分析来做出就业推荐,针对毕业生的就业信息的数据可视化分析研究却很少见,以及基于Python的Web项目建设也较少见。
(一)采用数据可视化技术深入分析历届毕业生的就业情况
在大数据时代背景下,数据量剧烈增加,呈指数型增长,对于数据处理、数据可视化提出了新的要求【1】。需要采用数据可视化技术对数据进行分析处理,提取出有意义数据。
(二)针对毕业生的需求,为毕业生提供就业推荐
随着毕业生人数的增加,就业岗位的增加,对于高职毕业生而言,如何有效择业成为了一大难题。多数毕业生选择就业岗位较盲目,没有合理的就业规划与较好的就业推荐。因此利用往年毕业生的就业信息筛选出有效就业信息,并作出就业推荐是较好的方法。因此建立基于数据可视化的毕业生就业推荐平台则显得尤为重要。
二、平台建设分析
(一)研究内容
本项目重点研究基于毕业生就业信息的数据处理方式、基于Python的数据可视化实现、基于协同过滤的推荐算法。其中难点在于基于毕业生就业信息的数据可视化实现方式,拟解决可视化实现中平台兼容性等问题。预期能够实现多维度多角度视图呈现。主要指标为以全面的视角做出可视化效果,以得到对就业信息的深入分析,从而对毕业生做出就业推荐。
(1)大数据背景下的毕业生就业信息数据可视化方法的研究
数据可视化方法较多,主要从数据预处理,数据建模,数据的二维三维显示等方面来实现数据的可视化。在数据采集阶段,我们通常采用python爬虫的方法来从网络上爬取大量的高职生就业岗位,同时从学校的就业系统中读取出大量的毕业生就业岗位。接着就是数据预处理阶段,给数据去噪,剔除无意义数据。同时将已经获取的数据进行分类,根据专业将网络上爬取的就业岗位进行分类,为后期的就业推荐打下基础。同时将学校就业系统中获取的数据进行分类处理,将毕业生的无效就业信息祛除。第三步为数据可视化,我们通常是采用python的numpy库来实现数据的可视化,调用numpy库中的建模方法,将数据以二维或三维的形式呈现。
(2)基于Python的推荐算法的研究
待数据可视化形成后,就需要完成推荐算法,由于整个平台是采用python语言完成,因此推荐算法选择了基于python语言的协同过滤推荐算法【2】,本算法是基于用户的就业数据来实现的就业推荐算法。通过计算用户之间的相似性,在相似的用户之间作出推荐。
(3)基于数据可视化的毕业生就业推荐系统的建设
如何将数据有效的呈现,则需要建立基于数据可视化的毕业生就业推荐系统,此平台采用python语言编写,使用Flask框架来完成平台的代码编写【3】。Flask框架以简洁、扩展性强的特点使平台的建设更容易实现。整个就业推荐平台分为以下几个模块:
(1)用户登录模块
此模块实现的功能为用户登录,分为普通用户和管理员模块,普通用户可实现查看数据可视化信息,查看就业推荐信息。
(2)分专业的数据可视化模块
此模块实现的功能为以专业分类来实现数据可视化,可选择可视化的方法如柱状图、饼图、三维图等。当用户选择想要查看的专业后,则出现了可视化的效果图,效果图以学生人数和就业方向为两个统计维度来显示就业信息。
(3)就业推荐模块
此模块实现的功能为就业推荐功能,当选择专业信息后,系统根据就业推荐算法给出推荐的就业方向,并按照相关性给出多种就业推荐,以相关性大小排序显示。
(4)信息反馈模块
该模块实现的功能为毕业生的就业信息反馈,以发送邮件的形式对毕业生进行就业回访,将就业回访的数据与就业推荐模块结合,完善就业推荐算法【4】。
(二)研究工作的总体安排及进度
第一阶段:数据收集阶段,收集毕业生就业信息,以及数据预处理。
第二阶段:设计数据可视化方案,实现对就业信息的多维度分析。
第三阶段:基于Python的就业信息推荐平台的项目需求分析。
第四阶段:基于Python的就业信息推荐平台的项目详细设计及代码编写。
第五阶段:项目功能测试。撰写项目报告。
(三)研究基础
1.本项目参与的研究人员有副教授2人,其他成员具有较强的软件开发能力,其他参与研究人员也都是硕士研究生学历,具有较高的科研能力。
2.已有较完善的历届毕业生的就业数据,为后期的数据分析服务。
3.进行了有关HTML、MySQL、Python的相关知识储备,做过基于Python的图形图像识别项目,对数据可视化有一定的基础。
4.有Web开发的实践经验,能完成基于Python的Web项目开发。
(四)研究方法和路线
本课题研究采用了调研、数据收集、项目设计、功能测试等方法。
步骤:(1)就业信息数据收集;
(2)采用数据可视化模式做出就业数据分析;
(3)基于可视化分析数据完善推荐算法;
(4)融合可视化分析及就业推荐算法,完善基于数据可视化的就业推荐项目。
参考文献
[1]黄堰,程晓荣.大数据背景下数据可视化方法研究[J].电脑知识与技术,2016年5月
[2]隋占丽,李文.面向大学生就业的协同过滤推荐算法与推荐系统研究[J].山东农业工程学院学报,2017年
[3]严婷,文欣秀.基于Python的可視化数据分析平台设计与实现[J].计算机时代,2017年12期
[4]陈钧.大数据时代条件下大学生就业促进论析[J].继续教育研究,2017年第5期.