基于数据分析的人才培养定位研究
2025-02-20曲天伟运海红杨泽雪李雅吕丽婷
摘"要:随着信息技术的迅猛发展,计算机科学与技术专业的人才培养面临着新的挑战和机遇。本文旨在提出一种通过大数据分析的方法紧跟计算机行业发展需求制订人才培养方案的思路。首先,通过抓取国内大型招聘网站上的招聘信息,再对抓取的信息进行清洗,保留有效信息。其次,通过统计和分析招聘信息中的岗位名称、技能要求、素质要求等关键信息,将分析统计结果运用可视化等手段进行展示,获得计算机科学与技术专业领域所涵盖的岗位及专业技能要求和素质能力要求。最后,结合学校人才培养定位、专业自身特点、毕业生岗位信息反馈及行业专家建议,科学精准地定位人才培养目标。
关键词:大数据分析;人才培养;招聘信息;数据爬取
中图分类号:G424""文献标识码:A
随着信息技术的迅猛发展,特别是近年来人工智能大模型呈现出快速增长的态势,导致计算机技术领域技术不断推陈出新。计算机科学与技术专业已成为当今社会的热门专业之一,这对计算机科学与技术专业的人才提出了更高的要求。如何科学精准地定位人才培养目标,以满足市场的不断变化和需求,是当前高校面临的重要问题。传统的人才培养模式往往侧重于理论知识的传授,而忽视了市场需求导向的专业技能、实践能力的培养。高校参考社会招聘信息对人才的要求进行人才培养是培养应用型人才的重要途径,很多学校和专业都对此做了研究和尝试,取得了很好的效果[13]。本文通过基于大数据分析技术对招聘网站上的数据进行抓取和分析,旨在探讨计算机科学与技术专业的人才市场需求和定位,为学校的人才培养提供有益的参考。
一、总体研究思路
本文综合参考了对大型招聘网站信息提取、处理、利用的相关文献后[46],结合本校本专业的特点,制定了主要研究思路,具体包括以下五个方面的内容。
(一)数据抓取与处理
在国内大型招聘网站上抓取关于计算机科学与技术专业的招聘信息。通过使用Python语言编写爬虫程序进行数据采集,获取大量的招聘信息数据。然后对抓取的数据进行清洗和预处理,去除重复、无效和错误的数据,确保数据的准确性和可靠性。
(二)数据分析与挖掘
采用大数据挖掘和机器学习等手段,对清洗后的数据进行深入分析。通过统计和分析招聘信息中的岗位名称、技能要求、素质要求等关键信息,揭示计算机科学与技术专业领域所涵盖的岗位类型、技能要求以及素质要求的特征和规律。
(三)可视化展示与深入分析
将各项分析结果通过柱形图、折线图、词云图等可视化的方法展示出来。通过对可视化结果进行深入分析,我们可以更加直观地了解计算机科学与技术人才的市场需求和定位,并对岗位进行分类和归纳。
(四)人才培养目标定位
结合学校“应用型人才”培养定位、计算机科学与技术专业自身特点、毕业生岗位信息反馈和行业专家建议,对计算机科学与技术专业的人才培养目标进行科学精准的定位。通过对比市场需求和当前人才培养模式的差异,提出改进和优化人才培养方案的建议。
二、数据抓取与处理研究思路
选择国内大型招聘网站作为主要数据来源,通过编写爬虫程序作为数据采集工具,获取招聘网站上的计算机科学与技术专业相关招聘信息。在数据抓取过程中,遵守网站的爬虫协议和法律法规,确保数据的合法性和合规性,注重数据的完整性和准确性,确保所抓取的信息能够真实反映市场对该专业人才的需求。抓取到的数据通常包括岗位名称、工作地点、薪资待遇、学历要求、技能要求、素质要求等多个字段。然而,原始数据中往往存在重复、无效和错误的数据,如过期职位、非计算机科学与技术专业职位等。因此,需要对抓取的数据进行清洗和预处理,通过去除重复数据、填补缺失值、纠正错误数据等方法,确保数据的准确性和可靠性。在数据处理过程中,使用Python中的Pandas库进行数据的清洗和整理。Pandas提供了高效的数据结构和数据分析工具,使得我们能够方便地对数据进行处理和分析。本研究需要重点关注企业对有5年工作经验的计算机专业人才的技能要求、素质要求,以此对数据进行进一步的处理和转换,以便后续的分析和挖掘能更好地支撑人才培养目标的确立。
三、数据分析与挖掘研究思路
在数据清洗的基础上,采用大数据挖掘和机器学习等手段,对有5年工作经验的计算机科学与技术专业的招聘信息进行深入分析。首先,对职位名称进行了聚类分析,以识别出该专业领域所涵盖的主要岗位。通过聚类分析,我们发现计算机科学与技术专业的岗位主要包括软件开发工程师、Web前端工程师、数据分析师、网络安全工程师等。接着,对职位描述和技能要求进行了文本挖掘,提取出各岗位所需的专业技能和素质能力要求。在文本挖掘过程中,使用Python中的NLTK库进行自然语言处理,通过分词、词性标注等手段,提取出职位描述和技能要求中的关键词和短语,进而分析出各岗位所需的专业技能和素质能力要求。通过文本挖掘,发现不同岗位对专业技能和素质能力的要求各不相同。例如,软件开发工程师需要熟练掌握编程语言、具备算法与数据结构理解能力、熟悉软件开发工具等;而数据分析师则需要具备数据挖掘、数据分析、数据可视化等能力。同时,还发现所有岗位对求职者的综合素质也有较高的要求,如沟通能力、团队合作能力、创新能力等。
四、可视化展示与深入分析部分研究思路
为了更直观地展示分析结果,采用了柱形图、折线图、词云图等可视化的方法。通过柱形图,展示了各岗位的招聘数量和占比,以了解市场的热门岗位和冷门岗位。通过折线图,可以展示各岗位的技能要求和素质能力要求的变化趋势,以把握市场的变化和发展趋势。通过词云图,可以展示各岗位的关键词和技能要求,以更直观地了解岗位的特点和要求。
第一,通过柱形图,展示了各岗位的招聘数量和占比,以了解市场的热门岗位和冷门岗位。在Python中,使用Matplotlib库来绘制柱形图,将各岗位的招聘数量和占比这些数据存储在Python的列表中。开始绘图时,先导入Matplotlib库中的pyplot模块。然后使用pyplot中的bar函数来创建柱形图,将岗位的列表作为x轴的数据,将招聘数量的列表作为y轴的数据。为了增强图表的可读性,可以添加标题、x轴和y轴的标签以及图例。最后使用pyplot的show函数来显示图表。这样,就可以直观地看到各岗位的招聘数量和占比。通过柱形图,可以清晰地对比不同岗位之间的招聘热度,从而更准确地把握市场的热门岗位和冷门岗位,这为后续的深入分析和决策提供了有力的数据支持。
第二,通过折线图,展示了各岗位的技能要求和素质能力要求的变化趋势,把握市场的变化和发展趋势。在绘制折线图时,选择了使用Matplotlib库,它提供了灵活的绘图接口,能够方便地绘制出各岗位技能要求和素质能力要求的变化曲线。在具体的绘制过程中,首先,使用已经抓取并整理后的各岗位的技能要求和素质能力要求的数据,这些数据包括不同时间点或不同条件下的数值变化。其次,利用Matplotlib库中的pyplot模块的plot函数绘制折线图。将时间点或条件设置为x轴的数据,技能要求或素质能力要求的数值设置为y轴的数据。为了提升折线图的可读性和直观性,可以添加标题、x轴和y轴的标签、图例以及数据点的标签。最后,通过pyplot的show函数来展示折线图。通过观察折线图,可以直观地分析出各岗位的技能要求和素质能力要求的变化趋势,从而更好地理解市场的变化和发展方向,这为接下来的分析和决策提供了坚实的数据基础。
第三,通过词云图,展示了各岗位的关键词和技能要求,以便直观地了解岗位的特点和要求。在Python中,使用WordCloud库来生成词云图。WordCloud库能够根据文本中词语的出现频率生成相应的词云图,能够直观地看到各岗位的关键词和技能要求。具体生成词云图的过程中,首先,准备好已经抓取并整理后的各岗位的职位描述或技能要求文本数据。其次,使用WordCloud库中的WordCloud类来创建一个词云对象,并将文本数据传递给它。在这个过程中,可以设置一些参数来调整词云图的外观,比如背景颜色、字体大小、最大词语数量等。最后,调用词云对象的generate方法来根据文本数据生成词云图,生成后可以使用Matplotlib库来显示这个词云图,或者将其保存为图片文件。通过观察词云图,我们可以直观地看到各岗位中最重要、最频繁的关键词和技能要求,从而更深入地了解岗位的特点和要求,这为专业岗位分析和职业规划提供了有力的数据支持。
通过深入分析,发现计算机科学与技术专业人才的市场需求呈现出多元化和差异化的特点。不同岗位对专业技能和素质能力的要求各不相同,且随着技术的发展和市场的变化而不断变化。因此,学校需要根据市场需求和定位,科学精准地定位人才培养目标。在这个过程中,Python的可视化工具提供了强大的支持,能够更直观地展示分析结果,为人才培养目标的定位提供更客观有力的依据。
五、人才培养目标定位的建议
结合学校的应用型人才培养定位以及计算机专业方向为移动互联、数据可视化、网络安全的特色,参考行业企业专家给出的建议及毕业生反馈的信息,对人才培养目标进行了科学精准的定位。
首先,注重培养学生的实践能力和创新能力。通过校企合作进行项目实践、实习实训等方式,将企业实际的项目经验引入人才培养中,可以提高学生的实际操作能力和解决问题的能力,这将有助于学生更好地适应市场需求,提高就业竞争力。
其次,注重培养学生的跨学科融合能力。在掌握计算机技术的同时,我们鼓励学生结合其他学科知识进行创新和应用,鼓励学生积极参加学科竞赛,特别是跨学科的竞赛活动,这将有助于学生拓宽视野,提高综合素质,为未来的职业发展打下坚实的基础。
最后,注重培养学生的持续学习和适应变化能力。计算机技术发展迅速,市场需求也在不断变化。因此,我们鼓励学生紧跟技术前沿,进行先进技术的在线学习,不断提升自我,以适应计算机行业不断更新的技术发展和变化。
基于上面的结果分析,对人才培养目标做出了如下建议:
(1)优化课程设置:根据市场需求和技术发展,不断更新和完善课程设置。纳入最新的技术和应用,确保学生掌握最新的知识和技能。这将有助于学生更好地适应市场需求,提高就业竞争力。
(2)加强与企业合作:与知名企业建立合作关系,共同开展人才培养和项目实训。这将有助于学生更好地了解市场需求和行业动态,提高实践能力和创新能力。同时,企业也可以为学生提供更多的实习和实践机会,使学生能够更好地适应市场需求。
(3)注重培养学生的综合素质和能力:除了专业技能和知识外,还需要注重培养学生的沟通能力、团队合作能力、创新能力等非技术性能力。这将有助于学生更好地适应市场需求和职业发展要求,提高综合素质和竞争力。
结语
本文介绍了基于大数据分析的高校应用型人才培养定位的研究思路,利用网络公开的招聘数据资源,采用计算机爬虫技术、数据分析技术及数据可视化技术,跟踪行业、企业对计算机专业人才的最新需求,获得计算机科学与技术专业领域所涵盖的岗位、专业技能要求以及素质能力要求数据。再结合学校的人才培养定位及企业专家建议和毕业生就业岗位情况反馈,利用多角度的数据构建科学的人才培养方案的研究方法,为高校人才培养定位研究提供了一种有意义的参考。
参考文献:
[1]郝琳琳.招聘大数据分析在优化人才培养方案中的应用[J].河北软件职业技术学院学报,2024,26(01):2729.
[2]孙学军,齐俊景,阚曲欣.基于招聘数据挖掘的高职人才培养方案构建研究:以物流类专业为例[J].职教论坛,2019(08):159164.
[3]张晓玲,倪月犁.基于招聘信息的电商数据运营人才培养路径研究[J].商场现代化,2024(17):2628.
[4]常逢佳,李宗花,文静,等.基于Python的招聘数据爬虫设计与实现[J].软件导刊,2019,18(12):130133.
[5]潘成花,王丹.基于Selenium+PyECharts的智联招聘数据采集与可视化[J].科技创新与生产力,2024,45(07):130132.
[6]许丹亚,贾雨潇.网络招聘信息抽取与分析系统设计[J].无线互联科技,2022,19(21):8285.
基金项目:2021年度省高等教育教学改革研究项目:基于大数据分析的人才培养定位研究与实践(项目编号:SJGY20210747);2021年度黑龙江工程学院教育教学改革研究项目:基于大数据分析的人才培养定位研究与实践(项目编号:JG202109)
作者简介:曲天伟(1976—"),女,汉族,黑龙江绥化人,硕士,副教授,研究方向:计算机应用技术、高等教育。