基于大数据的四川高职院校乡村振兴专业匹配度探析*
2022-12-05四川商务职业学院刘磊赵礼
四川商务职业学院 刘磊 赵礼
1 研究背景
为响应中央乡村振兴战略,2019年9月23日,四川省委、省政府召开了建设现代农业“10+3”产业体系推进会,出台了《关于加快建设现代农业“10+3”产业体系 推进农业大省向农业强省跨越的意见》。“10+3”产业体系[1],将进一步擦亮农业大省金字招牌,加快四川由农业大省向农业强省跨越。“10”是指,加快建设川粮油、川猪、川茶、川菜、川酒、川竹、川果、川药、川牛羊、川鱼10 大优势特色产业,这些都是四川发展基础较好、竞争能力较强、种养规模和产量均居全国前列的优势产业。“3”是指,大力发展现代农业种业、现代农业装备和现代农业烘干冷链物流三大先导性支撑产业。种业是农业的“芯片”,装备是农业腾飞的“翅膀”,烘干冷链物流是农产品进入市场的“最先一公里”,发展这三大产业就是要补齐四川现代农业的短板。在乡村振兴战略实施的背景之下,我国的农村发展方向也做出了一定的调整,对农业产业结构有了新的调整和优化,而为了进一步推动乡村振兴战略的实施进程,对人才的数量和人才的质量都提出了更高的要求。但是就目前的发展状况而言,乡村振兴战略背景下涉农高校人才培养当中存在的问题日益凸显,人才培养方向和人才质量要求存在矛盾。涉农高校人才培养仍然是传统培养模式。由于传统的培育观念比较落后,培育手段缺乏创新,培育模式没有进行优化调整,所以培育出来的专业人才具有一定的局限性,很多专业人才对理论知识非常熟悉,但是实际运用能力比较差,动手、操作、实践方面的能力有待提升。
2 研究方法
2.1 Scrapy 爬虫框架与表格文字识别
Scrapy 框架是用Python 语言实现的可以爬取网页,获取结构化数据的应用框架。Scrapy 框架包含Scrapy Engine、Scheduler、Downloader、Spiders、Item Pipeline以及Middlewares 等组件。爬取的网页主要是各个院校的官网,比如成都农业科技职业学院:Scrapy 的使用比较简单,运用Scrapy 爬虫框架,根据院校列表可以爬虫逐一获取各个高职校的招生数据信息。
另一种情形是大量的数据来源于图片格式的表格,或者是网页上的图片或者是纸质资料拍照得到的图片。当把这些图片信息转换为结构化数据时,可以采用百度AI 接口实现。这里需要使用表格文字识别OCR(Optical Character Recognition),运用百度成熟的OCR 产品可以方便的实现招生信息的导出。
2.2 匹配度模型
本文将只截取其“数量紧缺”度作为量化指标,与1中获得的专业类别的毕业生数量做相关性计算获得匹配度,具体做法如下:
(1)四川省现代农业“10+3”产业急需紧缺人才目录统计了“10+3”共13 个产业门类的“专业技术类人才”“社会生产服务和生活服务人才”“农业生产及辅助人才”“生产制造及有关人才”“其他人才”五个维度岗位需求,挑选出每项产业每个维度“数量紧缺”度最高的职位,相同的职位累加求和,这样就得到了“10+3”产业的紧缺岗位表以及对应的“数量紧缺”度,“数量紧缺”度相同的岗位选择“综合紧缺”度最大的岗位[2];
(2)然后将紧缺岗位的“数量紧缺”度再按照专业中类(比如农业、林业等)分别累加;
(3)用“数量紧缺”度与专业毕业生人数做相关性分析,获得专业匹配度数值。
3 模型结论
3.1 2019-2021年四川省高职院校涉农专业招生情况
通过爬虫获取的数据进一步清洗和统计可以获得2019—2021年四川省14 所涉农高职院校招生占比的情况。将农林牧渔大类的招生计划除以当年的招生总数可以得到招生占比,同时结合2019—2021 的毕业生统计数据可以得到2019—2024 总共六年的毕业生占比情况,其中2022—2024年是通过招生计划推算出的毕业生情况,如图1所示。
图1 2019—2024年专科(高职)院校农林牧渔大类毕业生占比变化Fig.1 Changes in the proportion of graduates in agriculture,forestry,animal husbandry and fishery in junior college (higher vocational) colleges from 2019 to 2024
从图1可以看出,农林牧渔大类在2022年受到单招扩大的冲击,占比略有下降,之后迅速攀升,2024年将达到2.5%的高位,这主要是由于2019年和2020年新建的两所涉农院校大量招生所致[3]。
3.2 四川农业“10+3”产业对口人才匹配度
2019—2021 年四川省高职院校毕业生人数分别为:204553,216404,234403,根据四川省教育考试院的数据,2019—2021年四川省专科(高职)院校招生人数分别为:28.04 万、33.1 万以及31.36 万。通过大数据分析统计出现代农业体系“10+3”专业相应专业毕业生数量如表1所示。
从表1可以看出,之前比较热门的财经商贸大类近年来略有降温,其招生人数占比略有下降,招生大户装备制造大类和交通运输大类变化不大,其他的生、化、环、水利等冷门专业招生计划或持平或略减少。总的来看,现代农业“10+3”相关专业大类占比呈逐年略降的趋势。
表1 2019—2024年现代农业体系“10+3”相应专业毕业生数量Tab.1 The number of graduates in the "10+3" corresponding majors in the modern agricultural system from 2019 to 2024
四川省现代农业“10+3”产业急需紧缺人才目录数量紧缺指数统计获得如下31 个最紧缺的岗位及其数量紧缺指数。
由于很多岗位涉及到市场营销、机械设计等毕业生数量庞大的大类,直接在数量截面上研究其匹配度意义不大,且前面的数据结果已经表明农林牧渔大类招生占比与10+3 相关大类的总招生占比其实呈现反向趋势,本文只做农林牧渔大类毕业生的数量截面做匹配度(相关性)研究,挑选出上表中农、林、牧、渔四项中类相关的岗位将其数量紧缺指数相加,然后计算其与2021—2024年毕业生招生数量的相关性,如表2所示。
从表2可以看出,随着四川省对乡村振兴及现代农业“10+3”产业越来越重视,农林牧渔大类的招生计划增加的很快,同时其与人才市场需求端的匹配度也越来越高。直观上来看2019年攀枝花攀西职业学院、2020年德阳农业科技职业学院的建成直接增加了2000 多名农业类招生计划,极大的提高了岗位匹配度。园艺、茶艺以及森林培育等林业类岗位依然受到毕业学生数量不足的困扰,是匹配度(相关系数)上的短板。
表2 农林牧渔岗位匹配度(相关系数)Tab.2 Matching degree of farming,forestry,animal husbandry and fishery positions (correlation coefficient)
4 总结与展望
本文采用网络爬虫获取四川高职院校2019—2021年的毕业生统计数据以及招生计划,并通过文字表格识别技术将获得的信息进行清洗、统计和分析,从而获得了2019-2024年共六年的高职院校毕业生相关信息,进而从数量界面讨论其与乡村振兴专业匹配度问题。研究过程中参考了大量官方专业数据,进行了仔细的数据修订和提炼[4]。研究得出的主要结论包括:
(1)由于市场化的先择,现代农业“10+3”相关产业的毕业生比例呈略微下降的趋势;
(2)农林牧渔大类的毕业生比例逆流而上,呈逐年增加的趋势,但总体招生占比还是很低。同时其与岗位的匹配度(相关性)也呈逐年上升的趋势,2024年将达到约0.9,这体现了农林牧渔大类专业悄然变热以及政府的大力引导,林业类毕业生紧缺依然值得重视;
(3)涉及乡村微观治理的村镇建设与管理、城乡规划等专业热度增加,具有地方特色的酿酒技术、民族表演、民族技艺等专业就业渠道稳定,招生计划呈逐年增加趋势[5]。
下一步的研究可以关注涉农院校未来三年的就业情况,毕竟招生计划不等于毕业生在该岗位就业,这中间差了一个就业情况调查。事实上,根据2020年的统计数据,农林牧渔大类仅仅只有52.85%的毕业生继续留在本专业的岗位,而多达13.16%的毕业生希望考取公务员,这在大类专科毕业生中是很高的比例,这说明了农林牧渔专业的毕业生对乡村工作的排斥。当然,在政府的大力鼓励下,随着对乡村振兴重视程度的提升以及投入力度的加大,回乡发展也将逐渐成为大学生尤其是职业类院校高技能型的人才的重要就业途径。