应用大数据分析技术的跨境电商的物流风险评估
2021-09-29王洋
王洋
(杨凌职业技术学院 经济与贸易分院, 陕西 杨凌 712100)
0 引言
大数据分析技术是随着网络不断发展而诞生,大数据分析技术是指分析大规模的数据,大数据主要包括速度快、多类型、真实性、大量数据和高价值5个特征。随着大数据技术不断发展,数据挖掘、数据安全和数据分析等众多技术已成为众多研究学者研究热点[1],大数据分析技术是大数据时代的主要技术。
电子商务近年来发展极为迅速,电子商务快速发展推动物流行业进步,目前电商交易已成为人们生活主要方式,物流系统各项数据随着电子商务发展而直线增长。将大数据分析技术应用于物流行业已成为物流行业的发展趋势[2],尤其是随着国家政策放宽,跨境电商高速发展,使大数据分析技术成为物流行业变革主要方式,众多物流企业利用大数据分析技术提升物流行业服务水平[3]。物流行业的DHL国际快递公司已经利用大数据分析技术较快效率为客户物流数据实现高质量服务。UPS国际快递公司利用大数据分析技术选取最优配送策略,有效节省物流配送成本。电子商务不断发展使物流信息步入大数据时代,大数据分析技术对电商企业高速发展具有极高应用价值[4-6],大数据分析技术可深度挖掘物流信息中包含的有用信息,为跨境电商物流风险评估提供基础。
为了提高跨境电商的物流风险评估准确性,提出了大数据分析技术的跨境电商物流风险评估,利用大数据分析技术实现跨境电商智能物流建设,为推动跨界电商物流行业发展提供理论基础。
1 大数据分析技术的跨境电商的物流风险评估
1.1 跨境电商的物流大数据分析平台
考虑跨境电商物流大数据具有特殊性与信息敏感性,为便于跨境电商物流风险评估[7],研究物流大数据分析平台,平台总体结构图如图1所示。
图1 跨境电商物流大数据分析平台
通过图1可实现跨境电商物流大数据高效分析。物流大数据分析平台充分考虑物流大数据存储与处理,具体包括大数据调度、访问、数据仓库、备份、数据管理以及数据恢复等众多功能。分析平台各部分功能如下。
(1) 利用虚拟机、服务器以及操作系统构建,选取通用虚拟机、服务器以及操作系统即可构建平台,降低平台搭建成本,提升平台扩展性能。
(2) 利用Hadoop架构实现跨境电商物流大数据存储框架,选取分布式文件处理技术实现ZB、PB等不同级别跨境电商物流大数据的清洗、搜集以及存储等功能[8]。
(3) 利用分布式计算技术实现跨境电商物流大数据分析平台内数据计算,分布式计算利用闲置计算机处理与运算多类型、海量数据,将复杂运算简单化,综合闲置计算机的计算结果获取所需计算结果[9],符合大数据计算需求,将数据交换、协同工作与资源共享相结合,实现大数据计算处理。
(4) 物流大数据集成管理技术将各种系统中差异格式、性质、特点的数据集合,利用清洗算法过滤数据集合中无效、错误和冗余数据,使最终集成数据集合具有真实性与稳定性[10]。物流平台中的物流大数据集成管理技术包括数据库技术、数据融合技术、数据抽取以及清洗等技术。
(5) 网络层实现物流大数据的访问,由Pig、Sqoop和Hive模块共同组成物流大数据访问框架,利用该框架实现物流数据访问,其中包括存储系统以及数据仓库中物流数据访问。
(6) 利用虚拟存储设备将各个物理位置存储设备集合的技术,依据系统需求以及不同位置存储资源将物流数据存储至最佳位置,提升大数据分析平台存取效率、可用性以及扩展性[11]。采用HDFS系统作为分布式存储系统,该系统利用DAS模式存储普通物流数据,Hadoop计算获取的重要数据、文件和分析结果等利用SAN和NAS模式存储。
(7) 采用Flume、Hbase、Avro、ZooKeeper等模块组成物流大数据调度框架,通过该框架实现物流大数据的调度与组织。
(8) 物流企业与该平台通过应用接口连接,利用物流企业应用框架实现物流大数据报表生成以及信息统计等功能。
(9) 安全防护子系统实现物流大数据的备份、恢复,通过该子系统实现物流大数据的保护与管理。物流大数据分析平台中包括众多企业与用户信息,以上信息与企业和用户的个人隐私、经济利益和人身安全息息相关,因此物流大数据分析平台的安全性能具有较高需求,利用用户隐私保护、用户访问控制、数据管理以及多租户安全管理实现物流大数据安全防护。
将以上硬件与软件结合,实现物流大数据分析,跨境电商物流大数据分析平台运行流程为:采集物流大数据,将所采集物流大数据汇聚[12],进行清洗、存储等步骤,选取分布式计算技术实现数据计算获取跨境电商物流风险评估基本数据,并将数据通过文字、图片或报表形式展示至评估者,评估者通过该平台获取的大数据实施物流风险评估。
1.2 物流风险评估
1.2.1 因素确定
评估跨境电商物流风险时,需考虑与跨境电商物流有关的所有因素,与跨境电商物流有关的因素具有层次和级别等差别。模糊综合评价法是一种基于模糊数学的综合评价方法。采用模糊数学方法,对受多种因素制约的事物或对象进行综合评判。该方法结果清晰,系统性强,适用于各种非确定性问题,能够较好地解决模糊和难以量化的问题。利用模糊综合评估法的多级别评估方法评估跨境电商物流风险。通过两个层次因素形成评估指标集合。利用跨境电商物流风险评估体系的8个风险因素组成第一层因素[13],将以上8个风险因素设置为评估子因素集合,子因素集合如式(1)。
G={g1,g2,g3,g4,g5,g6,g7,g8}
(1)
式中,G与g1分别表示因素集以及合作竞争因素风险;g2与g3分别表示仓储包装因素风险以及环境因素风险;g4与g5分别表示配送因素风险以及信息因素风险;g6、g7与g8分别表示海关因素风险、装卸运输因素风险以及战略文化因素风险。
1.2.2 模糊评估矩阵构建
利用单因素评判法评判8个单因素gi,选取跨境电商物流专家评估各因素下的风险因子,评估结果选取百分比方法统计[14]。各个单因素下的隶属度矩阵通过专家在不同风险登记下对各单因素的评估比例获取,隶属度矩阵计算式如式(2)。
G×V→[0,1],rij=P(gi,vj)
(2)
式中,P表示评估因素模糊评估矩阵,即评估尺度集G与评估因素集V间模糊关系;rij表示评估尺度因素隶属度。
1.2.3 单因素评估与风险综合评估
单因素gi的综合评估通过单因素的隶属度矩阵Pi实现,获取综合评估向量Di=Qi×Pi(i=1,2,…,8),其中Pi与Qi分别表示单因素gi的1×ni阶权重向量以及ni×5阶的单因素评判矩阵,Di表示gi中的1×5阶一级综合评估结果矩阵。
完成全部单因素和综合评估后,对评估对象实施跨境电商物流风险综合评估[15]。选取Di作为元素gi的单因素评估,获取8×5阶评估矩阵如式(3)。
(3)
跨境电商物流风险一级指标g1,g2,…,g8权重Q如式(4)。
Q=(0.325,0.206,0.117,0.097,0.078,0.074,0.058,0.045)
(4)
获取因素集G中二级评判结果如式(5)。
D=Q×P
(5)
可得全部一级指标综合评估值Yi如式(6)。
Yi=Di×VT
(6)
目标指标综合评估值Y如式(7)。
Y=D×VT
(7)
利用式(7)获取大数据分析技术的跨境电商的物流风险评估结果。
2 跨境电商的物流风险评估实例分析
为验证本文大数据分析技术的跨境电商的物流风险评估跨境电商物流风险有效性,选取某跨境电商物流公司作为实验研究对象,评估该跨境电商物流公司的物流风险。该公司创建于2002年,是国家一级物流运输公司,公司主要业务为跨境电商专业国际物流服务,为大型跨境电商天猫国际、敦煌等大型跨境电商制定专业物流策划,随着该公司不断发展,该公司物流业务已发展至全球180个国家与地区。
采用本文方法获取8个一级指标以及目标指标综合评估值和风险等级,利用以上结果评估该公司物流风险,评估结果如表1所示。
表1 本文方法评估结果
风险评估体制为5分制。通过表1评估结果可以看出,该物流公司总体风险评估值为3.545,该物流公司电商跨境物流风险等级为中等。8个风险因素一级指标综合评估结果从高至低排列分别为仓储包装因素、装卸搬运因素、配送因素、合作竞争因素、海关因素、战略文化因素、环境因素和信息因素,它们的综合评估结果分别为4.261、4.125、4.056、3.915、3.542、3.054、2.845、2.561,其中仓储包装因素、装卸搬运因素、配送因素3个因素的风险评估结果达到了高级,说明该物流公司发生以上3种风险的概率极高;其中合作竞争因素、海关因素、战略文化因素3个因素风险评估结果为中,说明以上3种风险因素有比较大的可能在该公司发生;环境因素、信息因素2种因素的风险评估结果为低,说明环境因素、信息因素2种因素在该公司发生的可能性较低。
该跨境物流公司总风险评估结果为3.545,风险等级为中等,说明该物流公司仍然存在一定风险,该公司需要通过有效的措施降低物流风险,对于风险因素级别较高的风险因素,应重点研究降低风险策略,提升物流公司的物流效率,通过降低该公司物流风险获取更高收益。
通过以上实验有效验证本文方法评估跨境电商物流风险有效性。为进一步验证本文方法对于大数据物流信息的评估性能,统计采用本文方法在不同数据量情况下评估精确度。为直观展示本文性能,将本文方法与OWA方法以及MDHGF方法对比。OWA方法既适用于整体大风险的计算、比较,也适用于具体的风险因素间的比较。同时考虑到了各风险事件的不同的紧急性,具有灵活性。MDHGF集成法,是将德尔菲法(Delphi)、层次分析法(AHP)、灰色关联(Grey)、模糊评判(Fuzzy)集合而成,采用不同的理论和方法对整个评价过程进行不同的步骤,得到最合理的评价结果。将50组训练样本数据在MATLAB平台进行模拟训练学习,检验样本为20组。通过10次迭代达到设定的评估误差,对比检验样本的评估准确度。
对比结果如图2所示。
图2 不同方法评估精确度对比
通过图2实验结果可以看出,本文方法在不同数据量情况下评估精确度高于98%,而另两种方法在不同数据量情况下评估精确度均小于98%,采用本文方法在不同数据量情况下评估精确度明显高于OWA方法以及MDHGF方法,验证本文方法评估性能。
统计采用本文方法在不同数据量情况下的评估灵敏度,为直观展示本文性能,将本文方法与OWA方法以及MDHGF方法对比,对比结果如图3所示。
图3 不同方法评估灵敏度对比
从图3实验结果可以看出,采用本文方法在不同数据量情况下评估灵敏度明显高于OWA方法以及MDHGF方法,本文方法在不同数据量情况下评估灵敏度均高于99%,实验结果有效验证本文方法评估性能。本文方法采用大数据分析技术,因此在大数据情况下仍具有较高的评估灵敏度。
统计采用本文方法在不同数据量情况下评估速率,为直观展示本文性能,将本文方法与OWA方法以及MDHGF对比,对比结果如图4所示。
图4 不同方法评估速率对比
通过图4实验结果可以看出,采用本文方法在不同数据量情况下评估速率明显高于OWA方法以及MDHGF方法,本文方法在不同数据量情况下评估速率均高于40 GB/s,且评估速率并未随着数据量的增加而有所降低,有效验证本文方法的评估速率。本文方法采用大数据分析技术,对于数据量较大情况下仍具有较高的评估速率。大数据分析处理技术以计算机内部数据处理系统为基础,基于大数据物流数据平台而设计,避免传统计算机整体性运算,具有较高的处理速率,实现大数据评估综合运行,提升大数据处理计算速率。
统计采用本文方法在不同数据量情况下的大数据分析平台空间利用率,为直观展示本文性能,将本文方法与OWA方法以及MDHGF方法对比,对比结果如表2所示。
表2 不同方法评估空间利用率对比
从表2实验结果可以看出,采用本文方法评估跨境电商物流风险,不同数据量时评估空间利用率均明显低于OWA方法以及MDHGF方法,本文采用大数据分析技术,大数据分析技术通过虚拟空间存储技术,为物流风险评估提供了较大的存储与计算空间,不仅可保证大数据处理完整性,提升系统评估速率,有效降低空间利用率。
3 总结
大数据分析处理技术具有的高处理速度、高安全性能的优势已广泛应用于各种领域中,将大数据分析处理技术应用于跨境电商物流风险评估中,采用模糊综合评估法利用物流大数据分析平台中数据评估跨境电商物流风险,并选取某跨境电商物流中心作为实验对象,采用该方法评估该公司物流风险,验证该方法评估物流风险有效性,为跨境电商物流行业的进一步发展提供理论依据。