高职网络营销课程内容改革探索
——基于招聘网站有关任职能力的文本分析
2020-03-13宋金芳
李 鲤, 吴 晔, 宋金芳
(1,3.汕头职业技术学院, 广东 汕头 515078;2.广州大学 华软软件学院, 广州 510990)
目前高职教育培养的人才难以满足社会的发展需求。比如高职网络营销专业所培养的技能人才相对于社会对高技能人才的需求存在一定滞后性,导致很多用人单位的网络营销岗位招不到满意人才,该专业领域的毕业生找不到合适的工作,他们往往从事与自己专业不直接相关的工作[1]。有学者认为我国网络营销课程教学内容的差异严重制约网络营销课程的教学质量[2],以至于出现高职院校网络营销人才培养与市场需求脱节的情况。与现有的相关研究不同的是,本文重点关注高职网络营销课程教学改革中教学内容选择的问题。试图通过机器学习的方法,对数据的处理上,利用R语言对所获得的招聘文本信息进行数据清洗、LDA建模、提取核心关键词,从而达到准确定位企业需求的目的,并最终以此为依据进行课程教学内容的设计。
一、文献回顾
网络营销相关教学改革研究主要集中于对课程体系建设的探索。王知强等人认为国内高校现存在多个网络营销课程体系,而网络营销理论研究的不成熟以及网络营销实践发展落后,是产生多种课程内容体系的主要原因[1]。方玲玉提出可以通过对招聘广告内容进行总结,进而分析职业能力结构,并以此进行课程内容的设计[3]。但这些研究主要是以定性分析为主。使用数据分析进行教学改革的研究主要集中于图书馆情报学及信息技术相关专业。黄崑、刘睿伦等从招聘网站搜集不同岗位的招聘信息,借助文本聚类、主题建模及其他统计方法对人才市场中图情及大数据岗位从业者应具备的技能进行分析,提出学校应加强对学生选修、双学位的引导[4-5]。邓之宏、邵兵家等人通过招聘广告内容对电子商务专业中的三种不同类别岗位核心技能进行数据分析,并以此为依据提出电子商务人才培养的政策建议[6]。
随着社会信息化程度的不断提高,文本分析的方法在许多领域都得到广泛的应用。Bennett通过收集与营销相关的企业招聘广告数据对文本内容进行编码分析,总结出企业认为毕业生从事营销相关岗位所应具备的技能[7]。王健、张俊妮则将ICTCLAS和WDM分词方法在网络新闻数据中的应用,对文本数据进行不同统计模型的比较[8]。
二、研究设计
对企业需求进行数据分析实质上是一个从企业发布的大量信息中发现隐藏信息并进行数据挖掘的过程。招聘广告中的信息无疑最能直接体现其用人需求。鉴于本文主要分析的是岗位任职需求,该信息在招聘广告中往往以文本形式存在,因此文本挖掘是较为理想的分析工具。为了更全面准确地定位企业对网络营销岗位的人才要求,进而把握企业的人才需求趋势,本文设计了任职能力分析模型,如图1所示。
(一)技能识别的数据分析转化
识别企业在网络营销岗位中所要求的技能,就需要根据企业对职业的能力需求进行分类,找出哪些是基本职业技能、哪些是专业技能。在企业的招聘信息中,“岗位任职要求”包含企业对胜任某一岗位应具备的技能的绝大多数信息,因此本文把对企业技能需求的识别问题转化为对招聘信息文本关键词的提取问题,采用词切分技术将文本信息进行数字化分析,用机器学习的方法来对大量企业需求信息进行识别。
(二)数据收集
本文采用开源工具python从网站中“爬取”招聘数据。考虑本研究主要针对高职网络营销课程,以及高职学生的学情和就业范围问题,参考北京易观智库公司近年来对中国网络招聘市场的跟踪调查结果[9],选取市场占有率较高且被认为更具备蓝领招聘特征的“中华英才网”作为数据来源。在网站中采用“数字营销、网络营销、网络运营、网络销售、在线营销、SEM”等6个关键词进行职位搜索,获得包括“公司名称、职位名称、工作地点、工作经验及学历要求、福利薪资、岗位描述及任职要求”为字段名的41397条原始数据作为分析对象。
图1 任职能力分析模型图
(三)招聘信息预处理
信息预处理实质上是将原文信息转换成计算机标准数据,以便开展进一步分析的结构化过程。首先对此进行合并、去重,针对缺失值、错误值进行人工删除,最终保留了7215条有效数据。文本分析是在分词的基础上展开的,接着对清洗过的数据进行分词处理,针对新出现的词以及专业术语、专有名词则可以通过专有名词库来提高分词的精确度[10]。
本文的分词处理采用词典分词法。首先针对“岗位描述及任职要求”字段引入“搜狗细胞词库”中带有关键词“网络营销”与“电子商务”的词库共5个。再使用R工具中的jiebarR、tm、Rwordseg和tmcn数据包对所获取的文本信息进行初步分词处理,最终获得42483条分词结果。
初步分词结果如图2所示,其中存在着一些诸如“与”“的”“及”等实际分析意义不大的虚词及数字。此外,还存在一些网络营销专业名词并未被当作一个整体被单独列出。在保证不降低文本分析效果同时又能实现文本“降维”的前提下,导入了自定义词典和停用词词典,自定义词典来自“搜狗细胞词库”中的“中国职业名称大全、新网络营销、网络营销大全、电子商务专用词库”4个词库。停用词词典采用“哈工大停用词词库”。将专业名词进行整合以及剔除无关词后,最终保留28783个分词结果。
(四)文本数据分析
对数据进行预处理完成对“岗位任职要求”文本内容分析的第一步,即将整篇文档拆分为更便于机器处理的以词为单位的小单元。但目前所得到的词语仍然是杂乱无章的,无法概括企业人才需求的技能,还需要对这些零散词语背后所隐含的意义进一步挖掘。因此本文进行特征提取和主题建模分析。
1.特征抽取
文本在进行了数据预处理后,仍然属于高维度的向量矩阵。特征抽取就是从毫无头绪的数据中提炼出最显著的特征,其实质上是一个对高维数据进行“降维”处理的过程。通过对文本进行词频分析来进行特征抽取。经过前期数据预处理后,对数据进行筛选,筛选出字符串长度介于2~8的词并提取词频排序前50的词语,如图3所示。按照词频数由大到小排列,在此基础上使用wordcloud包绘制高频词的词云图,如图4所示。词云图中的词语按重要性由大到小显示,不难看出在招聘文本中企业对于“网络销售、网络推广、互联网、搜索引擎、SEO、电子商务”等内容的关注度较高,这反映出企业在招聘中对与以上关键词相关的能力较为重视,同时也是分析网络营销岗位人才所需技能的培养中应该注意的地方。
图2 初步分词结果节选
图3 特征关键词筛选结果图
图4 特征关键词词云图
2.主题建模
对招聘文本数据进行分词处理实现对文本进行初步分割的目标,但所得到的词频排序结果仅能识别出企业招聘时最为关心的关键词,这些独立零散的关键词还无法概括成具体的技能项目,为此本文对数据进行LDA主题模型分析,通过了解每个主题特征对应单个词语的分布得分方式描绘企业用人需求。在主题建模前,对数据进行了如下处理:
首先,为了方便运算,有必要将文本转化为向量,用数字来代替文本,实现分词的数字化处理。其次,将列表中的词向量处理成交叉表形式的因子并对每个分词进行编号,再使其按词频进行降序排列。再次,进一步筛选分词结果、创建词库的同时将文本格式转化为LDA包建模需要的格式,为LDA建模做准备。最后,进行LDA初始参数设置。本研究在对已有相关文献查阅的基础上,采用Gibbs方法进行模型分布推断并设置迭代次数为5000次,设置α=0.5、β=0.1,主题数K=3,调用R语言中的LDAvis包将处理后的结果以图形显示出来,如图5所示。
三、数据结果分析
(一)可视化结果分析
首先,图形中的左侧区域为主题模型的全局视图。圆圈代表每个不同的主题,其大小表示每个主题出现的频率。由于图中圆圈的位置由计算机来计算各个主题之间的距离并缩放投影到两个维度中,因此主题间相互位置的远近直接表示了不同主题之间的接近程度。本研究分别运行主题数为3、4和5时的结果,发现当主题数为3时数据能更有效地区分不同类别。
图5 主题模型可视化
其次,可视化图的右侧水平条形图,列出左侧与每个主题对应的重要的词语。由于可视化图中左侧和右侧面板是对应连接的,因此可以通过点选左侧的主题圆圈来对应显示右侧关键词的方式实现对当前主题的解释,当选中某一主题时以黑色标示。
最后,在可视化窗口顶端右边窗口设置一个λ参数值的调整滑动条。该值是对关键词频率和排他性2个要素比例进行调节,以提高主题解释性程度。当λ=1时,关键词以词频由高到低排序显示;当λ=0时,显示的是与该主题相关的更独特的词语。本文将λ值分别设定为0、0.6和1,结果显示“主题1”和“主题2”中排名前5的关键词,随着λ值由0到1的变化全部被其他词替代,而“主题3”对应的前5个关键词中仅有2个词出现替换情况。这表示“主题3”对应的关键词在出现频率较高的同时也具有一定的独特性。最后,本研究综合考虑词频与独特性,将λ值定位0.6。结果如表1所示。
表1 “主题-关键词”对照表
(二)网络营销人才市场需求分析
“主题1”显示出企业对就业者专业能力的重视。根据LDA主题建模结果,“主题1”在整个文本语料库中出现频率最高,其对应的热词包括“推广、营销、产品、活动、策划”。即企业最为重视的是从业者的网络营销推广和策划能力。
“主题2”表现出企业同时也要求从业人员具备对市场的把握能力。其包括是否能完成企业的既定销售目标,是否具备与客户沟通的能力,是否能维护良好的客户关系。
“主题3”主要涉及企业对该岗位的用人条件。由于该部分主要涉及招聘对象的薪酬内容,对教学内容设计影响不大,故在课程内容中不予考虑。
四、结论和建议
综上所述,企业对网络营销相关岗位人才的需求条件可以概括为策划能力、推广能力、运营维护的能力。鉴于此,在对高职学生进行课程教学内容设计时应注意以下问题:
(一)注重网络营销策划能力的培养
尽管网络营销更强调网络这一虚拟市场,但市场分析、消费者行为分析、营销策略等经典市场营销教学内容仍然是网络营销课程学习的重点。在教学手段和方法设计中,应更多采用项目教学、案例教学的方法,突出网络这一虚拟市场与传统市场的差异性,重点培养学生对企业线上和线下渠道整合的营销能力。
(二)注重学生网络推广能力的培养
网络推广方式多种多样,从早期的电子邮件推广到近年来逐渐兴起的微信营销,在推广方式、内容的选择和制作等方面都产生了巨大的变化。因此,培养学生的网络推广能力应从不同推广方式的实现和具体推广工具的使用两方面展开。除了需要详细介绍每种推广方式的具体操作过程外,还需要注意提高学生使用不同网络工具以实现推广目标的能力。
(三)加强学生的综合素质
在主题分析中,注意到企业也同样重视网络营销人才沟通协调、团队合作的能力。在课程的教学改革中,不仅要对课程内容进行整合优化,还要注重课程的组织形式。将职业活动过程引入到课程教学活动中,增加课程实践教学的环节,通过小组协同合作的形式来共同完成学习任务。