基于网络文本分析的茶叶行业电子商务人才核心技能需求研究
2018-12-14吕梁
吕 梁
(黄河水利职业技术学院,河南开封 475004)
茶叶由于其易运输、易储藏、易包装、标准化程度高等特征成为在网上热销的农产品之一,据2017年中国农产品电子商务报告显示,茶叶的网上销售额在所有农产品中居第二位。行业的兴旺势必对人才产生吸引力,但据茶产业经济研究室2017年调研数据显示依然有一半以上的茶叶企业认为电子商务人才的缺乏影响了企业的赢利能力。所以了解茶业行业对电子商务人才的技能需求并针对性的开展人才培养,就成为人才培养机构尤其是开设电子商务专业的高校急需要考虑的问题。
1 传统电子商务岗位技能分析方法面临的问题
传统的岗位技能分析主要是基于岗位调查问卷法和企业专家座谈法,存在成本高,产生结果的周期长,企业覆盖率低,企业和专家质量无法保证,无法满足学校与企业之间即时性的快速反馈和响应等问题。本文在广泛阅读文献资料的基础上,经过多种方法的实践比较,提出了基于网络文本挖掘的茶叶电子商务专业岗位核心技能需求分析方法。该方法综合使用了网络文本自动采集技术、中文分词技术、方差分析、数学模型建立等技术,为解决电子商务专业建设中无法动态跟踪用人单位岗位需求信息的问题提出了一个低成本解决的方案,同时也为其他专业解决类似问题提供了借鉴。
2 基于网络文本分析的茶叶电商人才核心技能分析流程
本文将茶叶行业电子商务类岗位核心技能需求的分析过程分成了7步骤。首先是数据源选取,其次是编写网络文本自动采集程序辅助于人工分析,将采集到的文本汇集成网络文档集,然后使用php html phraser技术对文本进行识别,然后编写文本词典,作为网络文本分词的依据,同时使用ICTCLAS软件对分别进行分词并统计器出现的频次,最后建立数学模型对抽取出来的关键词进行重要性程度分值评价,最终推导出岗位核心技能需求。
图1 基于网络文本分析的茶叶电子商务岗位核心技能分析流程图
3 数据源选取
数据源的选取要遵循较小资源耗费,更高查询质量的原则。本文主要以知名招聘网站上发布的与茶叶行业电子商务相关的岗位信息作为信息源,辅以企业官方网站上的招聘广告和专业博客。
(1)专业招聘网站
据艾瑞咨询《2017年中国网络招聘行业半年度发展报告》显示,2017年上半年在中国网络招聘市场中,前程无忧和智联招聘分别占据市场份额的31.8%和30.7%,领跑整个行业,本文选择这两个国内最大的招聘网站作为网络文本的主要数据源。
(2)企业官方网站
越来越多的茶叶企业将自己的企业官网作为发布招聘信息的渠道,同时茶叶企业在官方网站上发布的信息具有明确的岗位分类和详细的岗位职责描述,所以可以作为重要的辅助性数据源来验证岗位分析的准确性。
(3)茶叶类专业博客、微信公众号社区。
专业博客和微信公众号的作者往往是茶叶领域的专家,所以其发表的博客往往与自身的任职岗位有很多关联,这对于分析岗位工作环境、岗位技能点、岗位任务具有重要的意义。
4 网络文本分析与模型建立
由于采集到的网络文本主要是非结构化的文本,所以需要使用特殊的工具进行文本解析,在文本解析之前首先需要建立专业词典。本文通过三个方面来建立分词词典。一是收集岗位论文关键词和茶叶类电子商务博客文章进行大规模聚类,并形成知识点词典。二是采集《普通高等学校电子商务本科专业知识体系(试行)》中的专业知识点形成专业词典。三是对招聘网站上的文本广告进行自然语言分词辅以人工筛选形成岗位词典。通过建立分词词典再对采集到的数据重新进行分词并汇入数据库,为数据分析和建模提供基础。
岗位核心技能的筛选和描述主要通过分析岗位关键词出现的频次来判定,考虑到后期计算的难度以及代表性本文取均值以上的数据作为核心关键词。同一个岗位的关键词出现的频次越多说明其越重要,但是其重要程度不能单纯用频次来衡量,比如在同一岗位的某个行业出现100次的关键词并不一定就比在另外一个行业出现30词重要,这取决于该行业所有关键词的整体频次,如果某个行业所有关键词出现的频次均高,则其处于最重要位置的关键词出现的频次必然多,反之亦然。所以需要采用一种方法来统一衡量关键词的重要性程度。本文在借鉴同类研究分析的基础上提出了以最大频次关键词为最重要,其他关键词以此为参考计算重要程度的计算方法,计算公式如(1)所示。
Gn表示关键词的对于岗位描述的重要程度,Wn为第n个频次在频次平均数以上关键词,Wmax为同一岗位同一行业出现频次最大的词的频次,P为重要程度的最大值,本研究取10作为最重要的衡量值。
通过分岗位对关键词进行抽取并进行重要程度筛选后,我们对同一岗位筛选出来的关键词进行了累加,在累加结果的基础上进行了二次关键词重要程度计算,以抽取出岗位核心关键词。岗位核心关键词计算方法如公式(2)所示。
CW表示同一岗位中的某一关键词在不同行业中的重要性程度的累加,Wj为第j个关键词的重要程度值。计算出每一个岗位中的每一个关键词的重要性程度累加值后,再使用公式(1)计算关键词在每一个岗位中的重要程度。之所以重新使用公式1计算是为了进行不同岗位核心关键词之间的比较,以筛选出不同岗位的共性关键词,从而进行统一分析,以降低后续工作量。
5 茶叶行业电子商务岗位人才核心技能需求
通过将采集到的网络文本导入电子商务分词分析并在广泛研究相关文献的基础上,本研究将茶叶行业电子商务岗位的核心技能定义为15项,包含两类电子商务岗位,并根据其代表的关键词的重要性程度分值,按照其重要程度分为了1-3级。
表 茶叶行业电子商务岗位核心技能需求情况
6 结束语
通过网络文本分词技术对茶叶类电子商务人才岗位核心技能需求进行分析区别于传统的问卷调查和实地调研分析方法,具有全面性和整体性,避免了由于调查对象选取问题引起的以偏概全现象。通过网络文本分析采集岗位需求中的共性内容进行针对性培养可以显著提升电子商务人才的适应性,满足茶叶行业不同企业的需求。