APP下载

基于网络相似性测度的国际贸易产品分类

2021-04-09程静静

电子科技大学学报 2021年2期
关键词:相似性阈值国际贸易

程静静,樊 瑛

(北京师范大学系统科学学院 北京 海淀区 100875)

国际贸易中,各国进出口结构各有不同,其贸易竞争力及经济发展水平也存在不均衡现象[1]。不同产品的国际贸易对国家发展的影响各异,国家间的贸易产品也各有异同。随着经济一体化和全球化迅猛发展,各国间的贸易联系愈加紧密,贸易产品间的联系也愈加复杂,使得所有国家可以看成一个大的经济系统[2-9],这种经济系统可看成是由若干国家(地区)及其相互间的贸易行为构成的复杂网络,即国际贸易网络[10-13],用来进行相关国家贸易竞争力及其复杂性研究。此外,通过构建国际贸易网络[14-20]对国际贸易规律及产品社团结构进行研究,“产品空间”[1]也成为研究热点,用来描述不同国家的生产或出口结构。

构建产品空间可研究国家的产品集和专业化趋势[21-22],也为产品的关联性和多样化提供了度量和分析框架[23-25]。基于“产品空间”理论,文献[26]将一种产品添加到某个国家生产集的能力不仅取决于给定产品与现有产品的距离,还取决于该国家存在的影响产品贸易的非贸易投入能力。由于经济、政策、文化和距离等因素影响,国际贸易产品间关联性有着明显的社团结构[27],存在着贸易关系紧密的区域和相对稀疏的区域及贸易关系紧密的产品和相对稀疏的产品。文献[14]构建1992-2003 年的时序加权网络,其中每一层以国家为节点,特定年份特定商品的国家间贸易流量为权重,研究发现特定商品网络的社团结构和国际贸易网络社团结构越来越类似。文献[28]通过嵌入流量距离进行能源贸易国家间社团划分,突出了国家在能源价值链中的作用。文献[29]以网络视角对全球贸易国家进行社团划分,研究发现发展中国家的群体性崛起使得全球贸易网络结构呈现日益多元化的复杂格局。如上所述,目前对“产品空间”及国际贸易产品社团结构的研究大多是通过产品出口国家来定义产品距离,未考虑到国家间产品贸易构成的贸易网络特性,忽略了贸易网络本身的网络拓扑结构及产品贸易网络间的联系。此外,目前已有的国际贸易分类,即HS(international convention for harmonized commodity description and coding system)分类,仅仅是从产品的自然属性、功能、用途等角度进行产品分类,未考虑产品间的贸易联系。

在该背景下,本文基于网络视角,针对产品国际贸易网络通过网络相似性方法定义产品间相似度,衡量产品间距离。并以产品为节点、贸易关系为连边、产品间相似度为权重,通过最小生成树与设立阈值相结合的方法构建产品网络,进而探究国际贸易中的产品集群及其演化规律。文献[30]提出近年来国际贸易系统平稳发展,国际贸易模式发生着变化,进一步表明本文从国际贸易关系入手探究产品演化规律的有效性。从网络拓扑结构角度出发衡量产品间相似度,通过对比单个产品贸易网络之间的相似性来反映产品国际贸易的相似程度。

1 模型构建

1.1 国际贸易网络

本文使用的数据是联合国商品贸易统计数据库UN Comtrade Database 提供的97 类产品共241个国家或地区的国际贸易数据。

针对每年的97 类产品的国际贸易数据,本文分别以国家(地区)为节点、贸易关系为连边构建每类产品的国际贸易网络。其邻接矩阵是一个241×241 的二进制矩阵 A,行代表出口国(地区),列代表进口国(地区)。由于真实数据具有不对称性,即aij和aji不一定严格相等。因此,对网络做了无向化处理:

由此可得到97 个无向无权国际贸易网络,分别代表每类产品的国际贸易关系情况。对97 类产品的贸易关系进行加总,可得到各年国际总贸易网络。邻接矩阵中0 表明国家(地区)间不存在任何一种产品间贸易往来;1 表明国家(地区)间至少存在一种产品间的贸易往来。

基于此,可构建1995-2015 年各产品的国际贸易网络。为探究各年产品国家(地区)间贸易关系是否存在变化,分别对各产品任意两年间的国际贸易网络进行贸易关系差异性分析。研究发现,各产品的贸易关系均随时间发生变化。分别选取产品1(活的动物)、产品50(丝绸)的部分年份的贸易关系变化情况,如图1 所示。其中图1a~图1d 为产品1 在1995/1996 年、2000/2001 年、2005/2006 年、2010/2011 年的国家(地区)间贸易关系差异;图1e~图1h 为产品50 在1996/1997 年、2003/2004 年、2008/2009 年、2013/2014 年的国家(地区)间贸易关系差异。图中横纵坐标代表241 个贸易国家或地区,圆点表示两年间的国家(地区)贸易关系不同,即对比的两年中其中一年国家(地区)间存在贸易往来,而另一年不存在贸易往来;图中空白处则表示两年中国家(地区)间贸易往来关系一致,即两年均有贸易往来或均无贸易往来。由图可知,两类产品的国家(地区)间贸易关系随时间一直在变化,其中产品50 在1996/1997 年国家(地区)间贸易关系差异最大。表明本文构建的产品无权贸易网络随着时间推移一直在改变,存在贸易关系的两个国家(地区)在未来也有可能中断贸易往来,与文献[30]结论一致。因此本文从国家(地区)间贸易关系入手,选取了每隔5 年,即1995、2000、2005、2010、2015 年的产品国际贸易网络数据探究其演化规律。

图1 产品1(活的动物)、产品50(丝绸)各年国家地区间贸易关系差异性

1.2 产品相似度

以往对产品距离的研究大多是采用以结果为导向的衡量方法,即基于共同出口的要素禀赋假设通过定义接近度来衡量产品间的距离;而本文从网络拓扑结构差异入手通过计算97 类产品贸易网络间的网络相似性[31]来衡量产品间距离,以复杂网络视角探究网络间的相似性。

网络相似性方法通过衡量从网络中提取的网络距离分布、节点距离分布以及节点连接方式3 个概率分布之间的差异来识别和量化网络间的差异。基本思想是基于詹森-香农散度对网络 G的节点距离分布、网络距离分布 μG、网络 G及其补集网络 Gc的α中心性进行衡量,从而得到网络相异性的计算公式:

对各年的97 类产品构建的国际贸易网络进行网络相似性衡量,可得到产品i与产品j的相异度Dij及相似度 Sij,也即产品i的贸易网络Gi与产品j的贸易网络Gj间的产品距离:

基于式(5)可得到各年各产品间的相似度 S,取值范围为[0,1],越接近1 表明网络间相似度越高,越接近0 相似度越低。对各产品任意两年间的国际贸易网络进行相似性测量,各年份的差异性均呈现相似结果,在1996 年后,产品网络结构发生了变化。对上文中提到的产品1、产品50 的任意两年间的国际贸易网络相似性情况进行展示,如图2所示,图中颜色越深表明相似度越高。可以看出1996 年后产品的国际贸易网络与1996 年前的产品贸易网络相似性较低,与图1 的结果表现一致。表明产品在不同年份的贸易关系网络结构一直发生着变化,验证了网络相似性方法在衡量产品国际贸易网络的有效性,也反映了1995 年WTO 组织的建立,使得国际产品贸易关系发生了变化。

表1、图3 为各年产品相似度的偏度及峰度分布、热度图及频率分布直方图,其中热度图中横纵坐标为97 类产品节点的自然编号;频率分布直方图中横坐标为产品国际贸易网络的网络相似度,纵坐标为频率。可以看到各年的产品相似度分布与Hidalgo定义的产品接近度分布呈现相同的左偏态势,即平均数小于中数,中数又小于众数。而随着年份的增加,峰度呈递增态势,且大部分产品相似度均在0.8 以上。表明产品的国家(地区)间贸易往来日益相近,同样也反映了随着1995 年WTO 组织正式开始运作,使得国家(地区)间国际贸易越来越频繁,各国间的贸易联系也越来越密切的现象。

对国际总贸易网络与97 类产品贸易网络进行相似性测度,研究发现,国际总贸易量虽等于各产品的加总,但国际总贸易与各产品存在网络结构的差异。图4 为各产品与国际总贸易网络的相似度分布,与国际总贸易网络相似度越高表明选择该产品进行国际贸易的国家越多。由图4 可知,各产品与国际贸易的相似度均在0.3 以下,但各年的97 类产品与国际总贸易网络相似度大多逐年增加。随着年份的增加,相似度最高的产品也发生了变化,图中新标注产品为与国际总贸易相似度最高的产品。从图中可看出,1995 年为产品80(锡及其制品);2000、2005 年虽然产品80 仍为相似度较高产品,但产品2(肉类及食用肉类内脏)、47(木浆、纤维状纤维素材料、废弃物等)的相似度最高;2010、2015年产品1(活的动物)的相似度开始增加。从图中的趋势来看,国际贸易在行业领域上从重工业、农业、轻工业再到农业的贸易联系紧密度增加,国家 (地区)间产品贸易的产品选择也发生了行业领域的变化。

图2 产品1、50 的历年国际贸易网络相似性

表1 各年相似度偏度及峰度分布

图3 各年产品相似度分布热度图及频率分布直方图

图4 各年份各产品贸易与国际贸易整体相似度分布

1.3 产品网络

基于产品距离可构建产品相似性网络,以此作为产品网络,而由于直接使用产品相似度构建的网络是全连接的网络,虽然保留了完整的原始信息,但网络的结构却是模糊的;此外相似度小的链路对国际贸易产品网络全局影响不大,因此,基于以上两点来简化网络。一般采用提取骨架网络[32-33]的方法简化网络,本文采用最小生成树方法[34]及阈值结合方法构建各年产品网络。首先通过最小生成树方法构建初始产品网络,具体步骤为:1) 任意选择一个产品,将该产品和剩下产品中相异度最小的产品相连;2) 将已连接的产品构成一个组合,依次不断加入新的节点,直到将所有节点连接起来。

通过该方法,可得到初始的产品网络,连边权重为产品间相异度。为了更好地体现产品间相似性,将连边权重改为产品间相似度。此外,为了包含相似度较高的产品信息,采用设立阈值的方法,依次加入符合阈值的链路边。具体阈值选取使得链路边变动的占比最大。链路边增加比例定义为:(当前阈值边数-上一阈值边数)/原网络总边数。这样能保障尽可能多地加入高相似度的链路边,且保持产品网络特性。图5 为各年的阈值选择示意图,可以看到各年的阈值分别为0.97、0.97、0.96、0.96、0.96。

图5 各年产品网络阈值选取示意图

基于最小生成树和设立阈值相结合的方法,最终构建5 年的产品网络,即以产品为节点、产品间相似度为权重的产品相似性网络。

2 产品集群分析

2.1 聚类分析

为验证本文构建的产品网络,采用k-means 聚类,通过共同信息比较法[35]与世界海关组织编制的HS 分类进行分类结果评价。HS 分类将每个产品看作单独整体,按照产品的自然属性或所具有的功能和用途将97 类产品分为22 大类,本文采取kmeans 聚类则是基于产品间相似度从网络拓扑结构出发将产品分为22 类。通过比较二者最终的分类结果,对本文构建的产品网络进行产品网络拓扑结构与产品功能和用途进行比较。

共同信息比较法是复杂网络社团划分中常用的分类评价算法,该方法首先引入混乱矩阵 N,其中行表示分类结果A,列表示分类结果 B。矩阵 N中的元素 Nij为既在分类A 中出现又在分类B 结果中出现的节点个数。 CA表示分类A 的类别数, CB表示分类B 的类别数。基于信息理论可得到两种分类结果的相似程度[35]:

最终的共同信息熵结果如表2 所示。历年与HS 原有分类的信息熵均处于50%左右,各年彼此间的信息熵大多高于50%,甚至最高达到72%。表明本文的产品相似度测度不仅考虑了HS 既定从产品自然属性和功能分类的分类视角,还从网络拓扑性质的角度对产品进行分析,既刻画了产品的自然属性和功能,也考虑了产品间的网络拓扑性质。

表2 各年k-means 聚类与HS 分类的共同信息熵结果

2.2 产品集群分类分析

基于此,对各年产品网络进行社团划分从而探究国际贸易中贸易紧密的产品群及其演化规律。社团划分方法多种多样[36-38],可以基于拓扑结构、动态和模块化的社团划分方法进行操作。本文采用加权极值优化算法[38-39]对产品网络进行社团划分,将产品相似度作为权值判断其对社团的贡献,进而得到产品类别划分。该算法的核心是Q 函数的局部优化,其划分目标是得到使整个网络中的模块度Q 值最大的社团划分,并且可通过多次划分避免优化过程陷入局部最优解的困境。具体步骤为:1) 将网络中节点随机分为等大的两部分;2) 计算每个节点的适合度,将适合度最低的点从一个部分移动到另一个部分,计算全局的Q 值,并重新计算每个点的适合度;3) 重复上述过程直到Q 值最大,断开两个部分之间的所有边;4) 对每一个子部分重复上述过程,直到Q 值不能增加为止。

节点i 的适合度公式为:

式中,wr(i)表示在社团r 内节点构成的连边总权重; wi表示节点i对应的连边总权重; ar(i)表示至少一端在节点所属社团边权的比例。

运用加权极值优化方法对5 年的产品网络进行社团划分,结果如表3 所示。除1995 年划分为4 个社团外,其余年份均为3 个社团,且Q 值在0.37~0.40 之间。表明存在清晰的社团结构,国际贸易存在着联系紧密的产品群。而产品群个数的减少,可自然地观察到国际贸易事件的影响。1995 年WTO组织的建立,很大程度上增加了各国间的贸易联系。随着时间推移,各国贸易日渐紧密,使得各产品相似度日渐增加,从而形成联系紧密的产品群,导致产品分类数目减少。

表3 社团划分结果

2.3 产品集群演化分析

对各年各社团内的产品度值进行分析,如表4所示,各年的大度节点时有重合,但产品度值各有不同。各年的类别3 中,除1995 年外,产品67(鸟皮、羽毛、人造花、人毛)均为最大度值产品,但在2015 年最大度值产品增加了产品2(肉类及食用肉类内脏)、产品66(雨伞、手杖、席子、鞭子等)。体现了随着时间推移,产品2、产品67、产品66处于社团“核心”位置,与其余产品的网络结构相近的变化趋势。采用加权极值优化进行社团划分发现,除1995 年外其余年份均呈现一致的划分结果,但对于社团中的重要节点及其度值各有不同。虽然2000 年、2005 年、2010 年、2015 年的产品群一致,但产品群内部的产品网络结构一直在变化。2015 年所分3 类中的大度产品均在2010 年基础上进行增加。也表明随着年份增加,国家间产品贸易联系日渐紧密。

表4 各年社团内大度产品编号

3 结 束 语

本文选取1995-2015 每隔5 年的产品贸易数据,以国家(地区)为节点,贸易关系为连边构建产品国际贸易网络与国际贸易整体网络,分别进行网络相似性测度来衡量产品距离。并通过最小生成树与设立阈值相结合方法构建新的产品网络。在此基础上运用加权极值优化算法进行产品分类,研究产品集群的演化规律。研究发现,国际总贸易量虽等于各产品加总,但国际贸易关系存在着产品间差异性。国家(地区)间产品贸易的产品选择从重工业、农业、轻工业再变化到农业,贸易联系紧密度也日渐紧密。此外,通过对5 年的产品划分发现,除1995 年外其余年份均呈现一致的划分结果,但在社团内部,产品间的联系紧密度日渐增加。

在对产品的构建过程中,本文没有采用以往方法从贸易量上对产品相似性进行衡量,而是引入网络相似性方法从产品贸易网络拓扑结构差异性入手,结合产品的网络特性进行分析。但本文仅仅是从网络拓扑结构角度对贸易往来关系进行研究,并未考虑国家(地区)间的贸易流量,缺乏对国家贸易额度和进出口关系的考虑,未来还需进一步研究。

猜你喜欢

相似性阈值国际贸易
莱克勒(天津)国际贸易有限公司
莱克勒(天津)国际贸易有限公司
改进的软硬阈值法及其在地震数据降噪中的研究
土石坝坝体失稳破坏降水阈值的确定方法
隐喻相似性问题的探讨
基于小波变换阈值去噪算法的改进
你应该知道的国际贸易
改进小波阈值对热泵电机振动信号的去噪研究
对中国国际贸易中“贫困化增长”的思考
对中国国际贸易中“贫困化增长”的思考