基于大数据的跨境电商平台供应商信用评估研究
2018-03-20荣飞琼郭梦飞
荣飞琼,郭梦飞
(兰州财经大学 信息工程学院,甘肃 兰州 730020)
一、引 言
近年来,在中国国内传统贸易增速放缓的形势下,跨境电子商务却持续保持着高速增长的态势,其发展潜力巨大,必将成为中国对外贸易新的重要增长点。跨境电商平台作为新型的贸易中间商,其本身可以直接参与交易,也可以不直接参与交易,即只为买卖双方提供贸易磋商的平台,由交易主体自行达成交易。目前,国内主要以间接参与交易的跨境电商平台为主,由于这种间接参与交易的方式,导致平台上的注册会员(即跨境电商交易中的供应商)的信用失去了保障,由此引发诸多交易纠纷,也限制了跨境电商平台的发展。因此,跨境电商平台中供应商信用评估问题的研究具有很强的紧迫性和必要性。本文试图从跨境电商平台中供应商信用评估的角度出发,寻求完善中国跨境电商平台质量担保功能的方法。
二、文献回顾及评述
国内针对企业信用评估的研究成果丰富。张德栋等用量化离散数据的方法和归一法处理指标数据,设计了一个企业信用评估的指标体系,并根据该指标体系建立了基于BP神经网络的企业信用3层神经网络评估模型[1];何跃等实现了基于BP神经网络的企业信用评估模型,并使用了改进BP神经网络算法[2];陈鑫铭等设计了一套基于基本信用、职业信用、交易信用的信用评估体系以及基于AHP方法的C2C电子商务信用评估模型[3];冷沙沙等结合网下静态指标和网上动态指标,运用层次分析法确定指标权重并建立信用评估指标体系,定义了B2B企业信用评估模型[4];郭亦涵等认为在进行商家信用评估时,应该以产品质量、信息质量、服务质量为核心建立信用评价指标体系,同时综合考虑评价机构信用水平、交易金额和交易时间等指标,并运用模糊评价法确定了指标权重[5];马晓青等使用Logistic模型与因子分析相结合的方法构建了小企业信用评估模型和指标体系,其数据来源是某商业银行信贷数据[6];付永贵等以B2C电子商务为例,提出网络供应商信用评估数据的来源及数据处理流程,使用逐步回归法建立了B2C网络供应商的信用评估指标体系,构建基于部分调整模型及带权重的径向基神经网络模型的B2C供应商信用评估模型[7]。使用大数据技术,很大程度上解决了数据来源单一的问题,这是电子商务交易中企业信用评估的一个新思路,非常值得借鉴。
对上述研究成果进行分析发现:第一,大部分评估模型的数据来源不够丰富,主要以交易系统中交易主体的交易数据为主;第二,由于数据来源单一,导致信用评价指标体系不够全面;第三,缺乏有效的模型评估方法,模型精确度和稳健性缺乏量化依据。
同时,国内关于跨境电商及跨境电商平台方面的研究也比较多。吕雪晴等对中国跨境电商行业发展中存在的问题进行了分析,提出确定品牌化发展、供应链管控和服务纵深化的发展路径[8];陶涛等提出跨境电商平台作为新型贸易中间商,一要解决跨境电商平台的信用和质量担保问题,以真正实现跨境电商平台的在线B2B交易,二要向行业细分的在线交易平台方向发展[9];徐硕提出中国中小企业要结合自身实际情况选择跨境电商平台的原则和方法[10]。从以上研究可以发现,针对跨境电商平台的研究主要集中在发展战略和路径选择上[11],对跨境电商企业的研究则主要集中在传统企业向跨境电商企业转型、跨境电商平台选择战略和跨境电商企业发展战略等方面,而对跨境电商平台中涉及的企业信用评估问题还鲜有涉及。
信用问题是关乎跨境电商交易频率和效率的关键因素,也是制约跨境电商发展的主要原因,而研究跨境电商平台中供应商的信用评估问题,是完善跨境电商平台质量担保功能的重要保障。本文致力于从跨境电商平台中供应商的特点出发,在大数据环境中分析供应商的相关数据,构建跨境电商平台中供应商的信用评估指标体系和信用评估模型,以解决跨境电商平台中供应商信用评估缺陷。
三、信用评价指标体系构建
跨境电商平台中的供应商有三点特殊性:第一,跨境电商平台供应商本质上是网络供应商,与传统供应商面临的交易环境不同;第二,他们从事的是进出口贸易,交易流程和内容与其他网络供应商不同;第三,跨境电商平台供应商的企业规模跨度大。跨境电商模式中最初发展起来的是跨境 B2B 模式,这种模式的参与者主要是大中型企业,其率先尝试跨境电商模式,从中获利,吸引了很多中小企业加入其中,所以跨境电商平台中的供应商,从大中型企业到小微企业一应俱全。要针对跨境电商平台供应商进行信用评估,评价指标的选择就要充分考虑供应商的特殊性,结合其自身特点来进行。
(一)备选指标体系的确定
本文在一般网络供应商信用评估指标体系的基础上[12-14],结合跨境电商平台供应商的特征,经过分析、研究、讨论,给出如下备选指标集合(Ia):线上发展规模(I1)、供应商从事跨境电商时间(I2)、供应商提供信息的完整度(I3)、供应商产品质量(I4)、供应商声誉(I5)、供应商提供产品类型总数(I6)、供应商资产状况(I7)、供应商负债状况(I8)、售后服务水平(I9)、供应商产品质量提升意愿(I10)、供应商对经营流程的熟悉程度(I11)、工作人员专业水平(I12)、品牌知名度(I13)、供应商产品价格(I14)、产品自主知识产权水平(I15)、决策人员跨境电商意识(I16)。
需要说明的是,备选指标的选择是基于三方面因素考虑的:
第一,结合跨境电商平台中供应商特点,客户群体对供应商的关注点及跨境电商平台自身需求进行大方向上的选择。本文借鉴了传统企业信用评估指标选择的方法和原则,主要从产品、人员、技术、资金、管理等五个方面来进行指标选择。
第二,考虑指标数据获取来源,有针对性地确定备选指标。要扩大数据来源,不能让数据的不充足限制指标体系的完整性,所以本文通过网络爬虫程序有目标地抓取数据,在大数据环境下自由获取丰富数据。
(1)
(二)指标构建方法
本文充分考虑可获得数据的种类,运用线性、非线性的数据处理方法,得出了最终的指标构建方法。
1.数据获取。在大数据环境下,可自由获取的数据非常丰富,通过编写网络爬虫程序有目标地抓取数据也是比较轻松的,但是由于大数据具有非结构化特征,产生的数据多样化明显,同时还伴有大量噪音和缺失值,使得清洗数据的工作异常耗时耗力。为了获取充足的指标取值,本文分别从跨境电商平台、第三方信息系统以及供应商自建网站中抓取数据。在抓取数据的过程中,采用了广度优先遍历策略,将程序模块化和结构化。在评估指标基本确定的情况下,实现了全部数据从来源到数据库的自动化,最大限度减少人工干预,有效保证了数据的时效性和一致性。在大数据环境下,只有完全实现数据采集“自动化”,数据量的“大”才有保证,才能把握待评估供应商在每个评估指标上的整体变化趋势。
数据抓取过程中,爬虫算法具体流程分为五个阶段:供应商选择、核心网页源解析、数据清洗、数据集成和数据存储。供应商选择阶段:程序将供应商主页网址作为爬虫入口,并将所有待爬取供应商主页的网址都入栈;核心网页源解析阶段:将爬取到的主页进行解析,解析出含有待爬取信息的网页的链接,并抽取主页中所需信息;数据清洗阶段:用默认值填充缺失值,删除脏数据,将数据做结构化调整;数据集成阶段:在已经结构化的数据中择取和计算评估指标;数据存储阶段:将指标数据存储到提前建好的关系数据库中。上述五个阶段在程序中形成一条指标数据生产线,通过清晰的阶段划分可使程序的构建组件化。
2.数据标准化处理。在进行指标构建之前,需要对抓取的原始数据进行标准化处理,使指标中的各个数据构成作用同趋化。本文采用z-score 标准化法进行数据处理,标准化公式如下:
(2)
3.指标构建方法。指标具体构建方法见表1。
四、信用评估模型
采用神经网络评价系统对不同类型的企业进行信用评估,是近年来常见的信用评估方法。因为基于神经网络的信用评估模型具有比较高的可信度,很少受到分析人员的主观好恶影响,完全以企业的信用资料为基础,其中BP神经网络因其可容纳高度复杂的非线性映射关系而更受欢迎。BP神经网络在无事前描述映射关系的数学方程的情况下,就可以学习和存储大量输入-输出模式的映射关系,只要有足够多的隐层和隐结点,就可以逼近任意的非线性映射关系[16-18]。
表1 指标构建方法
(一)模型算法
BP神经网络能通过输入、隐层和输出层将任意的N维输入映射到M维输出,具体结构见图1。
图1 BP神经网络结构图
结合本文所探讨的问题,将模型简化为N维输入和1维输出。大致计算步骤可分为前向传播和误差反向传播两个方面,整个训练过程采用基于梯度的误差反馈训练算法,具体描述如下:
1.前向传播阶段。
(3)
2.误差反向传播阶段。
1)为计算神经网络预测值与真实目标值的误差,计算二者的均方误差,其计算公式如下:
(4)
其中Pi和Pi′分别代表了第i个样本的神经网络输出值和真实目标值(也称作期望值)。
2)为使均方误差最小化,采用梯度下降算法来调节权值,权值的调节公式如下:
(5)
其中α代表了学习速率,为防止模型不收敛,α一般取0.01左右;k代表了第k次迭代。通过对偏导数部分计算,得出最终计算公式:
Wk+1-Wk=ΔWijk=
(6)
其中ΔWijk代表了第i层第j个神经元与第i+1层第k个神经元的权值增量,Ni+2代表第i+2层的节点数,Oij代表了第i层第j个神经元输出。
δik=
(7)
3)通过上述计算,使梯度从输出层回流至输入层,并不断迭代步骤1~3,最终使整个网络权值达到最优。
(二)改进算法
一般来讲,基于梯度的误差反馈训练算法有两个方面的局限性:第一,在高维空间中空间曲面存在很多的马鞍面,也就是趋于平坦的曲面,造成梯度在这些局部趋于无穷小;第二,算法的loss函数存在较多局部极小值。基于此,在构建BP神经网络信用评估模型的时候,本文采用了两种典型的改进算法:增加动量项和学习速率自适应调节算法[19]28-33。
1.增加动量项。标准BP 算法在调整权值时,只按t时刻误差的梯度下降方向调整,没有考虑t时刻以前的梯度方向,使得在搜索某些参数空间时(如位于马鞍面、极值点构成的面等)梯度会变得相当小,训练进入相当慢甚至停滞的状态。为了提高训练速度,可以在权值调整公式中加一动量项:
Δw(t)=ηδo+αΔw(t-1)
(8)
2.学习速率的自适应调节。学习速率η是神经网络中一个非常重要的超参数,在实际应用中需要经常调整,具体原因是:在误差曲面中,平坦区内η太小会使训练次数增加,此时就需要将η值调整得大一些;而在误差变化剧烈的区域,过大的η使训练出现振荡,导致迭代次数增加,此时就需要将其调整得小一些。为了使收敛过程不断加速,最好能实现学习速率η的自适应调整,也就是说需要大的时候大,需要小的时候小,具体做法是根据网络总误差来调整:在网络经过一次权值更新后,若E总↑,则本次调整无效,且:
η=βη0<β<1
(9)
若E总↓,则有效,且:
η=αηα>1
(10)
五、实证研究
(一)数据获取及模型建立
本文以国内几家独立第三方外贸企业间(B2B)或者外贸企业对个人零售电子商务(B2C)交易平台,如敦煌网、全球速卖通、阿里巴巴国际市场等作为大数据源,从中选取大量的供应商样本进行神经网络训练,判断信用评估模型的准确性,并给出供应商信用评估结果。
1)使用网络爬虫从几个跨境电商平台中采集各供应商的相关信用数据。
2)明确最终确定的指标集合{i1,i2,…,i16}中各个指标的含义及计算方法,确定各样本在不同指标中的取值。
3)将供应商信用评估等级分为差、中、良和优,对应标称值分别为0,1,2和3。在MATLAB自带的BP神经网络中,输出值是一个连续值而非离散值,因此对BP神经网络的预测输出值作四舍五入的处理,使每个供应商最终的分类结果值保持在离散取值上。另外,当输出值小于0时,处理的最终值为0;输出值大于3时,处理的最终值为3。最终值的处理函数如下:
(11)
式(11)中ypre是MATLAB自带BP神经网络的直接输出结果,output代表了最终的分类取值。
4)将选取的供应商样本分为训练集和测试集,训练集用于训练BP神经网络,测试集用来测试BP神经网络模型的准确度。在信用评估模型准确率较高的前提下,给出所有样本的信用评估等级。
基于以上步骤,共选取得到了547个样本,其中供应商行业主要以服装类行业为主。由于本文所采用的指标评估体系基于“减少专家评估”的指标建设原则,故只需对这547个样本进行label评估,即评估出该样本的最终信用评估等级,这样就减少了人工干预的可能,最大限度地排除了主观因素。另外,BP神经网络中模型复杂度非常高,只有使用“真正大量”的样本才能做到更具泛化性和准确性。本文尽可能地降低了人工工作量,使样本数量得到了很大扩充,保证了模型的泛化能力和准确性。同时,为了使模型训练更稳定、更快收敛,又对所有指标进行了二次统一标准化处理。
本文建立了BP神经网络信用评估模型,实现了供应商信用自动化评估。首先,将样本随机分为训练集和测试集,这样处理是为了保证测试结果的客观性和准确性,其中:90%的样本作为训练集,专门用于训练BP神经网络;10%的样本作为测试集,专门用于测试神经网络的泛化性和拟合效果。其次,通过对模型的不断优化和调试,得到如下BP神经网络结构图(图2),其中14个输入变量,20个隐藏层神经元,1个输出神经元,隐藏层激活函数采用tanh函数,以保证神经网络可以学习到非线性规律,输出层激活函数采用直线函数。为防止神经网络训练时在局部来回震荡,学习速率值确定为0.000 01,整个神经网络训练经过6次迭代后停止。这里采用的Levenberg-Marquardt算法迭代,是本文之前谈到的梯度下降算法的具体应用,只是学习速率和动量项略有调整。神经网络训练完成后,其误差的直方图如图3所示。
图2 调整后的BP网络结构图
图3 误差直方图
由图3可知,在MATLAB神经网络工具箱自动划分的训练集、验证集和测试集下,误差多数集中在0的附近,表示出较好的拟合效果;通过对神经网络模型的参数调整,实现了在训练集上92%的正确率,在测试集上89%的正确率;虽然测试集上表现出轻微的过拟合现象,但总体模型精度仍在可接受范围内。
需要说明的是,本文在建立BP神经网络模型时,大部分参数调整都有相应的理论支撑,而隐藏层神经元个数的选择目前还没有明确的理论指导,多数采用经验公式或者通过尝试不同数值来求得最佳值。所以,本文以程序自动化的方式实现不同数值试验,最终确定了最优神经元个数。
(二)模型训练结果
通过对手动划分的训练集和测试集的模拟预测,本文得到的结果见图4。
图4 准确率示意图
由图4可知,每个样本都得到了准确评级,评级取值分别为0、1、2、3,依次代表信用评估等级差、中、良和优。在训练集中,评级为“中”和“良”的样本数量居多,大约只有10%的样本散落在“优”和“差”的取值范围内。神经网络预测结果和真实评估结果的吻合率达到了0.92。在训练集准确率可接受的前提下,本文对测试集样本进行了信用评估,信用评级结果和训练集相似,大部分样本评级结果为“中”和“良”,只有极少数样本评级结果为“优”或“差”。神经网络预测结果和真实评估结果的吻合率达到了0.89,这说明无论是训练集还是测试集,模型预测结果准确率都在90%左右。
(三)模型效果评估
为进一步确认模型在实际应用中的可靠性,本文采用主流的机器学习模型验证方法K-折交叉验证和混淆矩阵进行验证。
1.K-折交叉验证。
1)算法概述。K-折交叉验证法将数据集分为k份,进行k次模型验证。在第i次验证中,将第i份数据作为验证集,其余作为训练集。每一次训练都在训练集上训练,并在验证集上进行评估。K-折交叉验证法对所有数据都进行了训练,并且对所有数据进行了评估,能有效地检验模型的泛化能力。另外,k一般取10时能达到较好的验证效果。
2)验证结果。在对模型进行十次交叉验证的基础上,又计算了模型的精确度。精确度在二分类问题上的计算公式如下:
(12)
其中TP代表了正确分成正类的样本数量,TN代表了正确分成负类样本数量,FP和FN分别代表了错误分成正类的样本数量和错误分成负类的样本数量。基于此,本文得到的精确度验证结果见图5,其均值为0.866 5。
图5 十次交叉验证精确度图
2.混淆矩阵。混淆矩阵将预测值与真实值集中在一个矩阵里,通过对预测值和实际类别计数的方法,集中反映模型的准确率、召回率等指标。由混淆矩阵的性质可知,当混淆矩阵的数据越集中于矩阵对角线时,表示模型越具有稳健性。研究中十次交叉验证的每一次验证都生成了对应的混淆矩阵,其中一折验证的示例图见图6。
图6 交叉验证混淆矩阵结果示例图
从图6可以看出,只有少量的样本不在对角线上,即绝大部分验证集被正确分类。
本文又对十次交叉验证的所有混淆矩阵进行了精确度评估,得出评估结果见表2。
表2 十次交叉验证下多类精确度均值
表2中的精确度矩阵代表了多类任务下基于混淆矩阵的精确度评估,其中每行代表实际类别,每列代表预测类别,矩阵中每一元素对应着该行所代表的类别预测为该列所代表类别的概率。对角线上元素代表了该行代表的类被正确预测的概率,即精确度,且每一行加总为1。评估结果表明,模型对后三类样本分类的预测准确度较高,这与后三类样本数量较多有关。可见,更多的样本数量会使训练结果更具泛化能力。综合K-折交叉验证和混淆矩阵验证的结果来看,模型具有较好的稳健性和泛化性,是可靠的信用评估模型。
六、结论与建议
本文从跨境电商平台供应商信用评估问题入手,在传统供应商信用评估指标体系的基础上,结合跨境电商平台中供应商的特征,着重考虑指标数据获取来源等因素,构建了较为完善的跨境电商平台供应商信用评估指标体系和基于BP神经网络的信用评估模型,并进行了实证研究。在实证研究中,本文在547个样本中随机选取10%的样本作为测试集,分别得到了每个样本的信用等级预测结果,预测结果和真实评估结果的吻合率达到了90%。最后,采用机器学习验证方法——K-折交叉验证和混淆矩阵对模型进行了评价,证明其评估结果准确,模型稳健可靠,可以推广至实际应用中去。
结合本文的研究结果及跨境电商平台的功能特征,对跨境电商平台供应商信用评价的实际应用给出以下两方面的建议。
(一)技术层面的建议
其一,建议在跨境电商平台供应商信用评估指标体系中,进一步完善和细化供应商资金要素方面的指标。这部分数据关乎企业商业机密,又对供应商信用评级结果影响比较大,但是除非上市公司,否则无法取得关于供应商资产和负债状况的财务数据。在实际应用中,跨境电商平台可以通过多种渠道获取签约供应商的财务数据,对于非签约的供应商,也可以依据以往的交易数据来分析判断,所以跨境电商平台是有条件对资金要素方面的指标进行完善和细化的。
其二,神经网络模型对样本敏感度很高,即样本本身对神经网络的训练结果有较大影响。一旦样本数量偏小时,极易引发模型过拟合,从而导致模型泛化能力差,所以在模型的实际应用中,可以使用本文提供的网络爬虫算法,对样本数量再扩大,保证评级结果的可靠性。
其三,神经网络模型需要手动设置的超参数较多,在实际运用中为了达到较好的训练效果,最好采用随机搜索或者网格搜索的办法搜索参数。
(二)政策层面的建议
其一,跨境电商平台要建立一个科学、准确的供应商信用评价体系,对供应商进行全面、有效的信用评估。跨境电商平台因其强大的信息共享和交易撮合功能,有力促进了中小规模企业出口及零售产品的进出口贸易发展,但是在大宗商品出口及专业化程度高的复杂商品出口方面没有明显的促进作用。跨境电商平台缺乏专业化优势和质量担保功能是引发上述问题的原因之一。另外,交易中各参与方信息不对称也是原因之一,而建立一个针对平台供应商的信用评价体系,可以有效解决跨境电商平台缺乏质量担保功能及客户和供应商之间信息不对称的问题。
其二,跨境电商平台可依照本文所建立的信用评估指标体系和评估模型对平台上的供应商进行信用等级评估。目前,很多跨境电商平台供应商的信用评价还停留在依赖买卖双方在订单交易完成后对对方信用状况进行评价的阶段,这其中掺杂了很多干扰因素和主观因素,不能综合、客观地评价一个供应商的信用水平。因此,可以本文研究成果为依据,有针对性地选择信用等级高的供应商与平台签约,有效提高平台的产品质量和售后服务水平。同时,跨境电商平台交易中的购买方也可以此为依据进行采购决策,避免了信息不对称引发的交易失败和交易纠纷。
其三,建议跨境电商平台建立供应商分类信用评估机制,满足不同方向的信用评价需求。如:针对平台质量担保功能,建立专门的供应商质量信用等级;针对客户对供应商服务水平信息的需求,建立专门的供应商服务水平评级制度等。当然,这需要构建专门的信用评价指标体系和评估模型,但是评估模型的基本算法并未发生变化,本文的研究成果依然有参考价值。
[1] 张德栋,张强.基于神经网络的企业信用评估模型[J].北京理工大学学报,2004(11).
[2] 何跃,蒋国银,刘学生.基于BP神经网络的企业信用评估模型[J].经济数学,2005(3).
[3] 陈鑫铭,冯艳.C2C电子商务信用评估体系研究[J].图书情报工作,2009,3(14).
[4] 冷沙沙,高厚礼.B2B企业信用评估模型的研究[J].山东理工大学学报,2010(3).
[5] 郭亦涵,郑植.C2C电子商务网站信用评价模型研究[J].北京邮电大学学报:社会科学版,2011,13(4).
[6] 马晓青,刘莉亚,胡乃红,等.小企业信用评估的模型构建与实证分析[J].财经研究,2012(5).
[7] 付永贵,朱建明.基于大数据的网络供应商信用评估模型[J].中央财经大学学报,2016(8).
[8] 吕雪晴,周梅华.我国跨境电商平台发展存在的问题与路径[J].经济纵横,2016(3).
[9] 陶涛,郭宇宸.跨境电商平台作为新型贸易中间商的理论基础与现实发展[J].新视野,2016(2).
[10] 徐硕.浅析中小企业跨境电商平台选择问题与对策[J].财经界:学术版,2016(11).
[11] 方灿,杭言勇.我国跨境电商平台的运营模式探讨[J].时代金融,2015,606(11).
[12] 彭丽芳,陈中,李琪.网络交易中信用评价方法研究[J].南开管理评论,2007,10(2).
[13] 柳向东,李凤.大数据背景下网络借贷的信用风险评估——以人人贷为例[J].统计与信息论坛,2016(5).
[14] 李毅,姜天英,刘亚茹.基于不平衡样本的互联网个人信用评估研究[J].统计与信息论坛,2017(2).
[15] 傅德印,张旭东.EXCEL与多元统计分析[M].北京:中国统计出版社,2007.
[16] Li Rongzhou,Pang Sulin,Xu Jianmin.Neural Network Credit-risk Evaluation Model Based on Back-propagation Algorithm[J].Machine Learning and Cybernetics,2002(4).
[17] Wisniewski.Behavioral Data Start up Combines Big Data with Credit ‘Traffic School’[J].American Banker,2013,178(186).
[18] 张道宏,张璇,尹成果.基于BP神经网络的个人信用评估模型[J].情报杂志,2006(3).
[19] 朱大奇,史慧.人工神经网络原理及应用[M].北京:科学出版社,2006.