大数据背景下的电子商务信用风险预警方法
2021-02-02薛淑娟
薛淑娟
(郑州西亚斯学院,河南 郑州 451150)
0 引 言
随着网络技术的不断发展,企业之间信息透明度和共享程度越来越高,竞争也越来越激烈,为了更好地进行竞争,许多企业都有了自己的电子商务管理系统[1-3]。在电子商务管理系统的实际应用中,如何对电子商务信用风险进行评估,提高企业的信用十分关键。为了保证更好地进行电子商务操作,需要对电子商务信用风险进行预警,因此电子商务信用风险预警具有十分重要的研究价值[4-5]。
针对电子商务信用风险预警问题,长期以来,国内外一些专业人员对其不断研究,出现了许多有效的电子商务信用风险预警方法[6-8]。
当前电子商务信用风险预警方法可以划分为两类:一类是定性的电子商务信用风险预警方法;另一类是定量的电子商务信用风险预警方法。定性分析主要从整体上把握电子商务信用风险的变化态势,主要通过专家来实现,但是专家有各自的偏好,所以不同专家得到的预警结果不一样,使得电子商务信用风险预警结果说服力不强[9-11]。定量的电子商务信用风险预警方法又分为线性的风险预警方法和非线性的风险预警方法。
线性的风险预警方法主要有:线性回归分析的电子商务信用风险预警方法、因子分析法的电子商务信用风险预警方法,它们只能预警电子商务信用风险存在的一些周期性风险,无法预警一些时变的风险,缺陷十分明显。
非线性的风险预警方法主要有:神经网络的电子商务信用风险预警方法、支持向量机的电子商务信用风险预警方法,它们可以对一些时变的风险进行描述,因此电子商务信用风险预警效果更佳[12-14]。非线性电子商务信用风险预警方法存在一些不足,如支持向量机的电子商务信用风险预警过程复杂、效率低下,神经网络由于参数优化问题,收敛速度慢、风险预警精度低,因此电子商务信用风险预警有待进一步研究[15]。
为了提高电子商务信用风险预警精度,结合电子商务信用风险预警变化特点,利用大量的历史数据和数据挖掘技术的优点,提出了基于数据挖掘的电子商务信用风险预警算法,并在相同测试环境下,采用具体电子商务信用风险预警实例与其他方法进行对照分析,结果表明,数据挖掘的电子商务信用风险预警精度为90%,电子商务信用风险预警效率明显优于对比方法,验证了本文方法的优势。
1 大数据背景下的电子商务信用风险预警方法
1.1 电子商务信用风险预警原理
通常情况下,电子商务企业由于运行时间不断延长,会产生大量的电子商务信用风险历史数据,可以通过历史数据对电子商务信用风险进行挖掘和分析,找到其变化规律,建模原理如图1 所示。
图1 电子商务信用风险预警的原理
1.2 电子商务信用风险的影响因素
通过一些电子商务管理人员、专家对电子商务信用风险的影响因素进行分析,确定了9 个电子商务信用风险因素,具体如表1 所示。
表1 电子商务信用风险影响因素
1.3 大数据分析方法
最小二乘支持向量机克服了支持向量机的电子商务信用风险预警效率低的难题,同时不存在神经网络的电子商务信用风险预警精度低的缺陷,是一种新型的大数据分析技术,因此采用其对电子商务信用风险预警进行建模研究。
对于一个电子商务信用风险数据,支持向量机的电子商务信用风险预警函数可以描述为:
式中:ω,b 分别表示权值和常量偏置;φ(x)将电子商务信用风险预警问题变换成线性回归问题。
对于电子商务信用风险影响因子xi和电子商务信用风险值yi,它们组成的电子商务信用风险预警的训练集为{(xi,yi)},i=1,2,…,N,根据结构风险最小化原则,式(1)可以变换成为如下形式:
式中γ 为正则化参数。
对式(2)问题的求解,可以采用拉格朗日函数实现,具体如下:
式中αi为拉格朗日乘子。
对式(3)的ω,b,e,α 进行求偏导操作,然后采用矩阵形式进行描述,可以得到:
式中:l=[1,1,…,1];α=[α1,α2,…,αn];Ωij=φT(xi)φT(xj)。
根据式(4)可以得到权值和常量偏置α,b 的值,根据输入xi可以计算出输出值,具体为:
式中y =[y1,y2,…,yn]。
根据泛化函数理论,采用核函数替代式(5)的内积 操作φT(xi)φT(xj),即K (xi,xj)=φT(xi)φT(xj),那么式(5)变为:
选择径向基函数作为核函数,具体为:
式中σ 为核宽度参数。
电子商务信用风险预警的支持向量机决策函数变为:
1.4 大数据背景下的电子商务信用风险预警方法
1)根据表1 中的电子商务信用风险影响因素收集大量的数据,一些专业人员根据自己的知识,对电子商务信用风险影响因素的历史数据进行筛选,去除一些无用的电子商务信用风险影响因素的数据值。
2)从表1 的电子商务信用风险影响因素可以发现,电子商务信用风险影响因素有连续化的,有离散化的,因此对连续化的电子商务信用风险影响因素值进行离散处理,统一影响因素数据的形式。
3)对电子商务信用风险影响因素值做如下处理,使它们的值大小趋于一致,便于后续最小二乘支持向量机的学习。
4)收集电子商务信用风险的历史值,通过专家对它们进行打分,本文采用100 分制。
5)确定最小二乘支持向量机结构,并初始化最小二乘支持向量机的正则化参数和核宽度参数。
6)采用最小二乘支持向量机对电子商务信用风险历史数据进行学习,建立电子商务信用风险预警模型。
7)采用电子商务信用风险预警模型对未来风险进行预警。
具体流程如图2 所示。
图2 大数据分析的电子商务信用风险预警流程
2 电子商务信用风险预警实例分析
2.1 电子商务信用风险的历史数据收集
为了测试大数据背景下的电子商务信用风险预警方法的性能,设计具体仿真实验。选择电子商务信用风险历史数据作为预警对象,共得到了100 个电子商务信用风险值以及它们对应的影响因素数据,其中风险值变化曲线如图3 所示。
图3 电子商务信用风险的历史样本数据
从图3 可以发现,该电子商务信用风险变化复杂,具有一定的规律性,同时又具有一定的随机性变化特点。
2.2 对比电子商务信用风险预警方法的选择以及评价标准的选择
仅采用大数据背景下的电子商务信用风险预警方法进行仿真实验,得到的电子商务信用风险预警结果缺乏说服力,为此,在相同实验环境下,选择BP 神经网络的电子商务信用风险预警方法、支持向量机的电子商务信用风险预警方法进行对比测试。采用电子商务信用风险预警精度以及预警时间作为实验结果的评价标准。每一种方法进行5 次仿真实验,每一次实验从100 个样本中随机选择不同的电子商务信用风险数据的样本组成训练集合,其他样本组成测试集合,具体如表2 所示。
表2 五次仿真实验的训练和测试样本数量
2.3 电子商务信用风险的预警精度对比
统计3 种方法的电子商务信用风险预警精度,5 次仿真实验的电子商务信用风险预警精度具体如图4所示。
图4 三种方法的电子商务信用风险预警精度
由图4 可知:
1)BP 神经网络的电子商务信用风险预警精度平均值为84.15%,精度无法保证电子商务信用的安全,这是因为BP 神经网络经常出现一些偏差大的风险预警结果,使得电子商务信用风险预警错误率高。
2)支持向量机的电子商务信用风险预警精度平均值为88.76%,要高于BP 神经网络的电子商务信用风险预警精度平均值,这是因为BP 神经网络和支持向量机的工作原理不一样,因此支持向量机描述电子商务信用风险变化特点更加准确,但是支持向量机存在电子商务信用风险预警效率低的不足。
3)本文方法的电子商务信用风险预警精度平均值为90.63%,远高于BP 神经网络的电子商务信用风险预警精度和支持向量机的电子商务信用风险预警精度,解决了当前方法存在的电子商务信用风险预警误差大的问题,可以保证电子商务信用安全。
2.4 电子商务信用风险预警的时间对比
统计3种方法的电子商务信用风险预警时间,如图5所示。由图5 可知,本文方法的电子商务信用风险的预警时间更少,改善了电子商务信用风险的预警效率,可以更快地预警电子商务信用风险,为电子商务信用风险防范赢得时间。
图5 三种方法的电子商务信用风险预警时间
2.5 本文电子商务信用风险预警方法的通用性测试
为了分析本文电子商务信用风险预警方法的通用性,选择20 个电子商务企业作为测试对象,统计每个电子商务企业的风险预警精度,具体如表3 所示。分析表3 可知,本文方法的20 个电子商务企业的风险预警精度均超过了90%,能够满足电子商务信用风险预警的实际要求,具有良好的通用性。
表3 20 个电子商务企业的风险预警精度 %
3 结 语
电子商务信用风险预警一直是人们关注的焦点,针对当前电子商务信用风险预警方法存在的一些难题,本文提出了基于大数据背景下的电子商务信用风险预警方法。
首先,收集与电子商务信用风险相关的数据,并对数据进行归一化处理;然后,采用大数据分析技术——最小二乘支持向量机对电子商务信用风险预警进行建模,建立电子商务信用风险预警模型;最后,在相同平台上与当前经典方法进行仿真对照测试,结果表明,本文方法是一种精度高、效率高的电子商务信用风险预警方法,具有广阔的应用前景。