特征加权KNN分类算法在跨境电商人才培养中的应用
2020-10-13刘婉莹
刘婉莹
摘 要: 随着全球化的不断深化,跨境电子商务已成为某些行业转型发展的新动力,社会需要更多的专业人才。为了有效提高人才培养的综合水平,需要根据企业的要求,建立跨境电商人才培养标准和评价模型。调研了企业对跨境电商人才的不同素质特征的认同度,采用AHP算法对这些特征在跨境电商人才的培养过程中的重要程度进行定量分析,得到对不同特征的权重值,进行KNN算法的分类,建立对跨境电商人才的评估模型,为跨境电商人才培养提供有益参考。
关键词: 跨境电商; AHP算法; 权重值; KNN算法
中图分类号: TP391 文献标志码: A
Abstract: With the deepening of globalization, cross-border e-commerce has become a new driving force for the transformation and development of certain industries, and the society needs more professional talents. In order to effectively improve the comprehensive level of talent training, it is necessary to establish cross-border e-commerce talent training standards and evaluation models according to the requirements of enterprises. This paper investigates the degree of recognition of different quality characteristics of cross-border e-commerce talents, uses AHP algorithm to quantitatively analyze the importance of these features in the training process of cross-border e-commerce talents, and obtains weight values for different characteristics. The classification of the KNN algorithm is carried out to establish an evaluation model for cross-border e-commerce talents, which provides a useful reference for the training of cross-border e-commerce talents.
Key words: cross-border e-commerce; AHP algorithm; weight value; KNN algorithm
0 引言
近年來,跨境电商企业对跨境电商人才的需求越来越迫切,同时要求也越来越高,跨境电商人才不仅仅需要熟知外贸专业,往往还需要明晰商品优劣势,熟练把握商品竞品分析,能娴熟使用电商平台把公司产品销售到海外市场[1]。在实际跨境电商人才培养过程中,缺乏对应的评价标准,没有统一的跨境电商人才评估模型用于专业人才的评估和培养,导致跨境电商人才的培养方式不明确,培养目标较为模糊,培养层次无法具体化。上述各种因素阻碍了跨境电商行业的发展[2-4]。
针对跨境电商人才培养阶段各种技能所占权重不一样的状况,在已有的调研基础上,找出跨境电商人才培养所需要的各维度素质。使用层次分析法(AHP)确定不同特征对跨境电商人才培养的重要程度的权重值。提出了一种跨境电商特征加权的KNN分类算法(AHP_KNN算法),用于跨境电商人才的培养模型中,预估不同跨境电商人才的等级,以期能够对跨境电商人才的等级进行评估。
1 AHP_KNN跨境电商人才培养模型设计
总体而言,企业对跨境电商人才的要求如下:首先,跨境电商人才应具备一定的商务英语应用能力,使他们能够熟练地运用英语进行商务谈判,正确地描述产品,完成跨文化商务沟通;第二,在进行跨境贸易往来的同时,他们能够有效地分析英文网站上的相关报告,从而获得相关商品的贸易信息,更好地开展实际工作;第三,跨境电商人才应具备电子商务应用能力,在电子商务的业务系统中,除了进行业务谈判外,他们还必须在发布相关信息的同时处理商品,推广和管理网上商店,并有效地实现在线交易和分销管理,相关跨境电商人员应该对该过程和基础工作有清晰的认识,并提高管理水平和综合素质;第四,跨境电商人才应具备电子商务操作能力和国际贸易水平,尤其是B2B和B2C等在线交易平台的网络运营管理,此外,跨境电商人才还需要借助相应的搜索引擎有效地开发潜在客户,整合大数据分析技术向客户推送更多相关有用信息,并最终完成外贸运作;最后,跨境电商人才应具备网络营销能力,根据市场需求选择合适的商品进行采购,分析客户的实际需求,有效开拓海外的零售市场,并通过深度的分析解决具体问题,调查、分析并处理贸易活动。
1.1 跨境电商人才特征权重
经过大量的文献调研,在文献[5]中,对跨境电商人才具有的素质进行了详细的分析,这些具体的特征如表1所示。
从表1中可以看出,从事跨境电商贸易的公司对跨境电商人才具备的素质特征认同度是不一样的,其中最认同的是“外文沟通能力”,最不认同的就是“国际贸易法规熟悉度”,手动剔除重要程度低于60%的特征,剩下的特征有10个,它们分别是:A1“外文读写应用能力”,A2“外文沟通能力”,A3“店铺商品设计能力”,A4“在线交易流程熟悉度”,A5“客户服务能力”,A6“外贸流程熟悉度”,A7“海外零售市场敏锐度”,A8“网络渠道营销能力”,A9“良好的心理素质”和A10“团队协作能力”。A1~A10特征值在跨境电商人才培养算法模型中所占的权重值是不一样的,这些可以从认同度上反映出来,可以采用AHP算法[6]量化不同特征的权重值。
在AHP算法中,需要比对任意两个特征之间的重要程度,而且判断矩阵对称位置上的元素乘积恒为1,本文选用的比对标准如表2所示。
运用表2的判断矩阵的比对方法,对A1~A10这10个特征进行判断,得到的判断矩阵如表3所示。
1.2 KNN分类算法
k最近邻(k-Nearest Neighbor,KNN)分类算法[7],简称KNN分类算法,是一个理论、应用中比较成熟的分类算法,其主要算法思路是:对于一个给定的样本,如果在特征空间中有k个已标记的样本与之最邻近,那么该样本的标签隶属于k个已标记样本中占多数数量的类别,即“服从多数”原则。在KNN算法中所选择的邻居都是已经正确分类的对象(基本上是手工标注的标签数据)。该方法在分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别[8]。KNN方法虽然从原理上也依赖于极限定理,但在类别决策时,只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。
KNN最邻近规则,主要是根据已知的标签样本数据对未知类别的样本数据进行分类研究[9]。主要判断的思想是基于欧式距离计算待分类样本与已知样本之间的距离,选择最邻近距离的k个标签样本,利用“服从多数”的原则,将待分类样本标记出类别,其中k值的选取很重要,理论上一般选取奇数值,便于样本数据的分类[10]。可以阐释KNN算法的大致思路,如图1所示。
KNN算法的运算步骤如下所示:
step.1——初始化距离为最大值;
step.2——计算未知样本和每个训练样本(已标记的样本)的距离dis;
step.3——得到目前k个最临近样本中的最大距离max_dis;
step.4——如果dis小于max_dis,则将该训练样本作为k最近邻样本;
step.5——重复步骤2、3、4,直到未知样本与给定的训练样本之间的距离计算完;
step.6——计算在未知样本的k个最近邻样本中不同类别所占的训练样本数量;
step.7——选择样本数量最大的类别标签作为未知样本的类别编号。
1.3 AHP_KNN算法
AHP_KNN算法集成了AHP和KNN算法,其主要思想是在计算未知样本与已知标签的跨境电商人才样本数据的距离过程中,加入不同特征权重对跨境电扇人才培养模型的影响,量化不同特征值对跨境电商人才分类的影响,然后利用KNN分类算法,对未知样本进行分类研究,求出给定未知样本的类别。AHP_KNN算法的具体步骤如下所示。
假定要对未知跨境电商样本X进行分类研究,这里的类别分为4大类,分别是“优秀”、“良好”、“及格”和“不及格”,给定手工标记的跨境电商样本集合为Y,AHP_KNN算法首先要计算样本X与集合Y样本之间的距离,计算式如(4)。distance=∑10i=1Qi*(Xi-Y′ i)2
(4)式(4)中,Qi表示了不同特征的权重值,具体特征权重值如表4所示,Y′表示集合Y中的任意一个训练样本。
然后根据输入的k值,选择与未知样本距离最近的k个已知标签的训练样本,选择数量最大的类别标记未知样本,即可得到未知样本的类别[11-12]。AHP_KNN算法在计算未知样本与已知样本的距离过程中,区别对待每一维度的特征值。采用AHP算法量化出每一维度对于跨境电商人才的重要性权值,突出了不同维度的属性对跨境电商人才素质培养的不同重要程度,提高了使用KNN分类算法分类跨境電商人才的准确度。
2 实验比对
实验的环境采用的是Windows10的操作系统,CPU型号为Intel(R) Core(TM) i7-8750H@2.20GHz 2.1GHz,内存为8G,算法的实现采用的是基于scikit-learn框架的Python语言实现的。为了测试AHP_KNN算法模型相对传统的KNN算法模型的准确度,对陕西省10个高职学校国际贸易专业的2017、2018年应届毕业生的数据进行分类比对,经调研发现这10个学校2017、2018年国际贸易专业应届生有3 225人,其中2 560人找到了跨境电商相关工作,分别收集2 560人的特征A1“外文读写应用能力”,A2“外文沟通能力”,A3“店铺商品设计能力”,A4“在线交易流程熟悉度”,A5“客户服务能力”,A6“外贸流程熟悉度”,A7“海外零售市场敏锐度”,A8“网络渠道营销能力”,A9“良好的心理素质”和A10“团队协作能力”的得分,根据表现量化不同特征值的取值范围[0,100]。本文跟踪这2 560人所在企业近1-2年的评价,按照“优秀”、“良好”、“及格”和“不及格”的类别进行分类,得到实验数据。
在实验的过程中,k值的选取分别为{3,5,7,9,11},选定特定的k值后,为了防止数据样本数量过小,容易生过拟合的现象,采用十字交叉[13]验证方法,每次随机按照0.8的比例选取2048条数据作为训练数据,剩余的512条数据作为验证数据,实验进行10次,取10次的验证数据的准确度作为平均的准确率,分别对AHP_KNN算法和传统的KNN分类算法进行比对,得到的实验结果如表5所示。
由表5可以看出,AHP_KNN算法相比KNN算法,在k取不同的值时,平均准确度均高于KNN算法,其中平均准确度最低高出了4.3%,最高为7.3%,显示了AHP_KNN算法区别对待跨境电商人才特征的每一维度的特征值,采用AHP算法量化出每一维度对于跨境电商人才的重要性权值,进行了定性和定量的分析,突出了不同维度的属性对跨境电商人才素质培养的不同重要程度,提高了使用KNN分类算法分类跨境电商人才的准确度,在实际的应用过程中,应当选择分类k值为11可以达到最大的跨境电商人才分类准确度97.1%,可以准确预估跨境电商的人才等级。
3 总结
在深入分析了跨境电商企业对跨境电商人才具体需求的基础上,通过调研,获得了跨境电商企业对跨境电商人才素质不同维度的认同度,手动的特征筛选,选出对跨境电商人才特征认同度最高的10个特征;采用AHP算法对不同的特征进行了量化研究,得出不同的特征对跨境电商人才培养的权重值,将这些权重值应用在KNN算法中,提出了AHP_KNN算法,主要用于对跨境电商人才的分类研究。经过AHP_KNN算法与传统的KNN算法的实验比对,显示了AHP_KNN算法在跨境电商人才分类培养模型上的准确度优势,能够准确预估跨境电商人才的等级,起到客观评价的作用。
参考文献
[1] 王君毅. “互联网+”背景下跨境电商人才培养策略[J]. 知识经济, 2017(1):172.
[2] Bhatnagar, Jyotsna. Managing capabilities for talent engagement and pipeline development[J]. Industrial & Commercial Training, 40(1):19-28.
[3] Hui Z, Liu J. Research on E-commerce Applied Talent Training in Higher Vocational Colleges[P]. 2012 Intemational Conference on Management of e-Commerce and e-Govemment, 2012: 3-6.
[4] 袁丽娜, 高文海. 以能力为导向的高校跨境电商人才培养模式研究[J]. 河北科技大学学报(社会科学版), 2018(1):108-112.
[5] 苏曼.跨境电商专业人才胜任素质模型研究[J].高等工程教育研究,2016(3):170-174.
[6] 颜云生,陶骏,夏傅仪,等.基于AHP算法的电子书包评估系統[J].计算机系统应用,2017,26(8):49-54.
[7] 冯璠,严广乐.基于优化KNN算法的线上拍卖价格预测模型[J].信息技术,2015(3):40-43.
[8] 王志华,刘绍廷,罗齐.基于改进K-modes聚类的KNN分类算法[J].计算机工程与设计,2019,40(8):2228-2234.
[9] 赵银龙,安胜彪.基于核化K-means和SVM分类回归的Wi-Fi室内定位算法[J].信息技术,2018(1):113-117.
[10] 李小娟. 基于数据挖掘的输电线路覆冰预测模型研究[D]. 太原:太原理工大学,2016.
[11] 韩林峄,吴晟.通过评分特征优化基于K近邻的协同过滤算法[J].信息技术,2018,42(12):75-79.
[12] 孟志伟,刘惠义,陈霜霜.基于RBM-KNN的脑部磁共振图像分类[J].信息技术,2017(4):169-173.
[13] 郑梦,邬春学,宫熙禹.基于KNN算法的脑电波控制全向机器人研究[J].信息技术,2015(12):134-137.
(收稿日期: 2020.02.25)