基于产业互联网络节点创新要素的链路预测方法
2023-10-17何建佳廖耀文周洋
何建佳 廖耀文 周洋
摘 要:产业互联网络是一种为“智造”赋能的异质跨界合作网络,会促进创新要素在节点间流通,而节点创新要素又会影响合作链路预测结果。针对这一问题,提出一种基于节点创新要素的链路预测方法。首先阐述产业互联网络的概念和特性,分析网络中创新要素的流通方式;然后分别从两个维度测算网络节点的创新要素量;最后综合利用节点局部信息和节点创新要素信息计算节点相似性。在四个产业互联网络数据集的实验结果表明,所提方法与其他方法相比具有更好的预测性能。
关键词:产业互联网络; 节点创新要素; 链路预测
中图分类号:TP399 文献标志码:A 文章编号:1001-3695(2023)10-022-3028-04
doi:10.19734/j.issn.1001-3695.2023.03.0062
Link prediction method based on nodal innovation elements of industrial interconnection network
He Jianjia, Liao Yaowen, Zhou Yang
(Business School, University of Shanghai for Science & Technology, Shanghai 200093, China)
Abstract:Industrial interconnection network is heterogeneous cross-border cooperation network that empower “intelligent manufacturing” and facilitate the flow of innovation elements between nodes, which in turn influence the predicted outcomes of the cooperation links. This paper proposed a link prediction method based on node innovation elements to address this issue. Firstly, it elaborated the concept and characteristics of industrial interconnection networks, and analyzed the circulation me-thods of innovative elements in the network. Secondly, it calculated the innovation factor quantity of network nodes from two dimensions separately. Finally, it comprehensively utilized the local information of nodes and the innovative element information of nodes to calculate the similarity between nodes. The experimental results on four industrial interconnection network datasets show that the proposed method has better predictive performance compared to other methods.
Key words:industrial interconnection network(IIN); node innovation elements; link prediction
0 引言
产业互联网络(IIN)是异质产业组织用来交换知识和技术等资源,以实现赋能智能制造及创新成果转换的新型跨界合作网络。IIN是传统供应链在新一轮产业变革中所演化出来的产物,它能够容纳多类型、多层级异质合作主体,具有模糊组织边界、促进主体跨界互联及提升联合创新效率等功能[1],资源要素在网络中表现出流动性。随着产业变革的深入开展,IICN的发展也颇为迅速,在网络规模变大的同时,其网络结构也日益复杂,逐渐成为学术界和产业界所关注的重点研究领域,主要涉及产业融合[2]、供应链网络演化[3]、供应链协同[4]和网络韧性[5]等内容。
现实社会中很多事物都可以抽象成复杂网络,例如社交网络、交通网络和产业互联网络等,利用网络节点代表社会实体,网络连边代表实体间的关系。借助复杂网络理论知识有助于研究社会网络结构和演变规律,而链路预测作为一种重要的复杂网络分析工具,能帮助人们从已知的网络信息中寻找潜在的关系,极大提升了关系预测研究的效率。目前学界已经探索出较多的链路预测方法,主要包括:基于相似性方法、似然估计方法和概率模型[6]。其中,基于相似性的方法因其良好的性能而被广为采纳,该方法同时包含了节点相似性和网络结构相似性,本文主要关注节点相似性方法,关于该方法的研究已有很多,文献[7]提出了基于监督的相似性方法,从网络中提取节点特征并表示为向量。文献[8]提出了一种综合节点属性和节点结构特性的链路预测模型,实验表明该模型具有更好的预测效果。文献[9]构建了新型自动编码器模型,该模型可以将提取的定向网络中节点语义信息用于预测链路。文献[10]为了解决异构网络中节点属性信息融合问题,提出了带有局部学习的加权K-means算法,该模型可以有效平衡异构节点的属性信息。文献[11]则利用信息扩散提出了基于模糊标准的链路预测算法,在群体规范下为不同的模糊标准计算节点相似度。文献[12]从节点排序角度出发,利用历史相似性序列自适应地预测每个节点对之间的未来相似性。文献[13]综合分析了前人研究,认为基于拉普拉斯算子的卷积不适合单层图卷积网络,而使用基于节点相似性的卷积矩阵来进行链路预测可提高预测性能。文献[14]提出了基于二级节点聚类系数的链路预测方法,并利用多个静态网络证明了该方法的可行性。文献[15]提出了路径与节点相结合的链路预测方法,并利用五個不同类型的静态网络数据集验证了该方法的良好性能。文献[16]提出了基于节点吸引力的动态网络链路预测方法,计算的潜在链路概率会随着网络的发展而变化。综合来看,节点相似性方法具有复杂度低和预测精确度高的优点,与网络结构和行为特征等属性信息耦合后能表现出更好的性能。但既有的节点相似性方法多用于预测同质网络链路,忽略了真实社会网络中节点的异质性和资源差异,且鲜有学者考虑产业互联网络中存在的跨界问题,也没有阐释清楚网络中资源要素的流动方式,无法为准确预测跨界创新合作关系提供支持。
结合上述分析,本文提出一种基于节点创新要素的链路预测方法,该方法从产业互联网络视角出发,综合考虑节点属性信息和创新要素差异对相似性的影响。首先界定了产业互联网络,阐明了创新要素在网络内部的流通方式;然后在节点相似性方法的基础上,嵌入节点创新要素后构建新的链路预测方法;最后利用真实的网络数据对该方法进行测试。本研究通过实验将该方法与其他五种链路预测方法进行对比,结果表明本文方法具有更高的精确度。
1 相关概念
1.1 产业互联网络
产业边界逐渐模糊促进产业融合与互联,跨界产业或企业及其产生的创新合作关系的总和形成产业互联网络,能够为智能制造赋予创新活力。资源要素的流动和扩散是引领创新的关键动力,而信息流、技术流和知识流等是产业互联网络中资源要素交换的主要形式[17]。将产业互联网络中的全部跨界节点集合记为S={S1,S2,…,Sn},n≥2,其中n为节点总个数,记任意两节点i和j之间的连线为边ij,已知的连边集合为C,此时将产业互联网络记为G,则ij∈G,网络中理论上可形成的连边数量Q=N(N-1)/2。因为节点i和j之间的创新合作关系ij是自愿选择的结果,所以连边ij为无向边,且根据现实考虑,网络G为无向网络。
同时,在非空网络G中,连通节点i和j的所有连边集合构成连接两节点之间的路径集合,每条路径的连边个数为路径长度,连边个数最少的路径即为节点i和j之间的最短路径,而在产业互联网络中,最短路径长度表示为两节点之间的合作关系距离,记为dG(i,j),它也表示节点i和j至少要经过dG(i,j)个其他节点才能实现合作。特别地,若dG(i,j)=∞,表示在网络G中不存在一条路径能够连通节点i和j。
1.2 创新要素流通方式
产业互联网络打通了异质主体间的产业壁垒,可以有效整合和优化资源调配,促进产业融合发展。单一主体无法掌握实现创新活动所需要的全部资源要素,创新要素的流通需通过网络的互连互通功能来实现,为了量化产业互联网络中创新要素的流通方式,现假设网络中跨界主体进行创新活动需要多元化的创新要素储备,主体实现创新活动所需要的各类知识、技术、资本等资源统称为创新要素。将创新要素划分为x和y两个维度,分别以x和y为横、纵坐标轴建立坐标系,并形成一个要素空间θ,每个主体自身都有不同的初始创新要素量,并表示为要素空间θ中不同的坐标。x维度可用结构洞指标—网络约束系数来衡量[18],结构洞属性决定了个体在网络中的位置,反映了不同位置的个体获取资源的能力差异。节点i的网络约束系数具体如下:
3 实验与分析
3.1 实验数据集
相较于传统社会网络,产业互联网络是种新型跨界合作网络,网络节点类型众多,均具有一定的创新能力和进一步的创新需求,常规数据集无法刻画出IIN的特有属性,因此,本研究借助PatSnap全球专利数据库,获取2022年中国大陆地区智能汽车(smart cars)、智慧物流(smart logistics)、智慧医疗(smart healthcare)和智能交通(smart transportation)四个产业领域的跨界合作专利数据集作为实验数据集。专利数据集的具体处理方式为:a)筛选出国民经济行业分类号数量为两个及以上的专利数据;b)再筛选出专利申请人数量为两个及以上的专利数据;c)继续筛选出技术分类号数量为两个及以上的专利数据;d)以申请人为节点,联合申请专利关系为边,构建产业互联网络。具体参数如表1所示,图1为四个网络的可视化图。
3.2 算法评价指标
为了便于测试相似性指标预测的精确度,将已知连边集合C按照90%:10%的比例划分为训练集CT和测试集CP两个部分,并将属于Q但不属于C的连边称为不存在的边,其集合为H。常用来衡量链路预测方法精确度的指标主要有AUC、precision和ranking score三个。本研究选取综合评价指标AUC来衡量预测算法的精确度,其核心思想是从CP中随机选择一条连边的分数值高于从H中随机选择一条连边的分数值的概率[26]。每次分别随机从CP和H中各选择一条连边,若从CP中选择的连边分数值大于从H选择的连边分数值,则加1分;若分数值相等,则加0.5分;否则不加分。重复独立n次实验后,记加1分的次数为X次,加0.5分的次数为Y次,那么AUC的计算公式为
3.3 实验结果
本节针对不同的数据集进行了仿真,描述了NIE方法的性能,并与五种相似性方法进行比较。为了保证预测的稳定性,所有实验结果均是重复30次实验后取平均值而得。
为了分析所提NIE方法的可行性和权重调节参数α和β对AUC结果的影响,先利用四个数据集对NIE方法进行测试,结果如图2所示,由于α+β=1,所以仅展示AUC值随β的变化曲线。从图2中可以看出,当β=0时,本文方法仅考虑节点局部信息,在SC、SL、SH三个数据集中都表现出最低的预测精确度。随着β值的变大,该方法同时考虑不同权重的节点局部信息和节点创新要素,在四个数据集中的预测精确度都逐渐提升,到达一个峰值后逐渐降低。值得注意的是,在SL和ST网络中,NIE方法的预测性能衰退得较为缓慢,而SC和SH网络的预测性能衰退得较为迅速,这说明节点创新要素差异对节点相似性存在影响作用,且需要权衡节点局部信息和节点创新要素两种因素在预测中的影响力。此外,四个网络中,ST网络的平均AUC值最低,这是因为ST网络的稀疏程度要高于另外三个网络。从图中可以看出,当β值在0.5左右时,NIE方法在四个数据集中均表现出最优性能。因此,在后续的链路预测方法对比实验种,将本文方法中α和β值均设置为0.5,这表示在计算相似性SNIE时,对节点局部信息和节点创新要素取相同权重。
本节还测试了其他五种方法的预测精确度,并与所提方法进行比较。表2给出了NIE方法与选取的五种方法在四个产业互联网络数据集上的AUC结果,根据该结果绘制出图3。综合表2和图3可以看出,除了在ST网络中NIE方法的预测精确度AUC值低于RA方法以外,在另外三个网络中NIE方法都能获得最好的AUC结果,基本反映出其预测性能要优于其他方法。其中,CN方法只利用待预测节点对的共同邻居个数来计算相似性,其AUC结果在所有产業互联网络中表现最差。LP方法考虑了三阶邻居对节点相似性的贡献度,其预测精确度AUC值总体高于CN方法,预测性能较CN方法提升了一些。而Kata方法则是在LP方法的基础上,利用全部路径邻居信息计算节点间的相似度,虽然其预测性能优于LP方法,但提升不大,且计算复杂度高。RA和PA方法都以节点度信息作为计算相似性的依据,它们的区别在于RA方法考虑了共同邻居节点的度信息,而PA方法只根据待预测节点的度乘积计算它们的相似性,因此,RA方法在四个网络数据集中的预测性能要优于PA方法。
此外,所提NIE方法在ST網络中的预测精确度AUC值要低于RA方法,排在第二位,是因为ST产业互联网络的节点数大于连边数,网络平均度和聚类系数较低,表明该网络内部含有大量小团体网络,这些小团体网络一般有两到三个节点组成,且几乎不与其他节点互联,导致网络整体稀疏程度较高,对节点创新要素的测量存在一定影响。但综合实验结果来看,本文提出的基于节点创新要素的链路预测方法具有科学性和可行性,在产业互联网络中表现出了良好的预测性能。
4 结束语
本文阐述了产业互联网络的概念,分析了网络中创新要素流方式,提出了一种基于节点创新要素的链路预测方法。该方法首先定义了节点间的创新要素差异,然后根据节点局部信息和节点创新要素信息给出相似性计算方法。在四个产业互联网络数据集的实验表明,所提方法的预测精确度要高于其他方法。在未来的研究中,将探究如何改进基于节点创新要素的链路预测方法,并应用于有向、含权的产业互联网络。
参考文献:
[1]谭晓军,何建佳,王维祺.基于Q-learning算法的产业互联协同调度研究[J].工业工程与管理,2021,26(6):171-178.(Tan Xiaojun, He Jianjia,Wang Weiqi.Research on industrial interconnection cooperative scheduling based on Q-learning algorithm[J].Industrial Engineering and Management,2021,26(6):171-178.)
[2]Schiavone F,Sabetta A,Leone D,et al.Industrial convergence and industrial crisis: a situational analysis about precision medicine during the COVID-19 pandemic[J].IEEE Trans on Engineering Mana-gement,2021,70(4):1456-1467.
[3]Park H, Bellamy M A, Basole R C. Structural anatomy and evolution of supply chain alliance networks: a multi-method approach[J].Journal of Operations Management,2018,63(12):79-96.
[4]Zahraee S M, Golroudbary S R, Shiwakoti N, et al. Particle-gaseous pollutant emissions and cost of global biomass supply chain via maritime transportation: full-scale synergy model[J].Applied Energy,2021,303(1):1-15.
[5]何宇,陈珍珍,张建华.人工智能技术应用与全球价值链竞争[J].中国工业经济,2021(10):117-135.(He Yu, Chen Zhenzhen, Zhang Jianhua. The application of artificial intelligence technology and global value chains competition [J]. China Industrial Econo-mics,2021(10):117-135.)
[6]吕林媛.复杂网络链路预测[J].电子科技大学学报,2010,39(5):651-661.(Lyu Linyuan. Link prediction on complex networks[J].Journal of University of Electronic Science and Technology of China,2010,39(5):651-661.)
[7]Li Longjie, Wang Hui,Fang Shiyu, et al. A supervised similarity measure for link prediction based on KNN[J].International Journal of Modern Physics C,2021,32(9):article ID 2150112.
[8]Mallek S, Boukhris I, Elouedi Z, et al. Evidential link prediction in social networks based on structural and social information [J].Journal of Computational Science,2019,30(1):98-107.
[9]Liao Lizi, He Xiangnan, Zhang Hanwang, et al. Attributed social network embedding[J].IEEE Trans on Knowledge & Data Engineering,2018,30(12):2257-2270.
[10]Li Yafang, Jia Caiyan, Kong Xiangnan, et al. Locally weighted fusion of structural and attribute information in graph clustering[J].IEEE Trans on Cybernetics,2019,49(1):247-260.
[11]Singh S S, Srivastva D, Kumar A, et al. FLP-ID: fuzzy-based link prediction in multiplex social networks using information diffusion perspective[J].Knowledge-Based Systems,2022,248(19):article ID 108821.
[12]Wu Xiaomin,Wu Jianshe,Li Yafeng,et al.Link prediction of time-evolving network based on node ranking[J].Knowledge-Based Systems,2020,195(11):article ID 105740.
[13]Coskun M,Koyuturk M. Node similarity-based graph convolution for link prediction in biological networks[J].Bioinformatics,2021,37(23):4501-4508.
[14]Kumar A,Singh S S,Singh K,et al.Level-2 node clustering coefficient-based link prediction[J].Applied Intelligence:The International Journal of Artificial Intelligence,Neural Networks,and Complex Problem-Solving Technologies,2019,49(7):2762-2779.
[15]Yu Chuanming,Zhao Xiaoli,An Lu,et al.Similarity-based link prediction in social networks:a path and node combined approach[J].Journal of Information Science,2017,43(5):683-695.
[16]Chi Kuo,Yin Guisheng,Dong Yuxin,et al.Link prediction in dynamic networks based on the attraction force between nodes[J].Know-ledge-Based Systems,2019,181(1):article ID 104792.
[17]Caloghirou Y,Giotopoulos I,Kontolaimou A,et al.Industry-university knowledge flows and product innovation:how do knowledge stocks and crisis matter?[J].Research Policy,2021,50(3):article ID 104195.
[18]Burt R S. Structural holes: the social structure of competition[M].Cambridge,MA:Harvard University Press,1995.
[19]Castela B,Ferreira F,Ferreira J,et al.Assessing the innovation capability of small-and medium-sized enterprises using a non-parametric and integrative approach[J].Management Decision,2018,56(6):1365-1383.
[20]Tao Xinmin,Guo Wenjie,Ren Chao,et al.Density peak clustering using global and local consistency adjustable manifold distance[J].Information Sciences,2021,577(8):769-804.
[21]Lorrain F,White H C.Structural equivalence of individuals in social networks[J].Social Networks,1977,1(1):67-98.
[22]Lyu Linyuan,Jin Cihang,Zhou Tao.Similarity index based on local paths for link prediction of complex networks[J].Physical Review E,2009,80(4):article ID 046122.
[23]Yao Yabing,Zhang Ruisheng,Yang Fan,et al.Link prediction based on local weighted paths for complex networks[J].International Journal of Modern Physics C,2017,28(4):article ID 1750053.
[24]Xia Jingjing,Ling Guang,Fan Qingju,et al.Evidential link prediction method based on the importance of high-order path index[J].Modern Physics Letters B,2021,35(33):article ID 2150487.
[25]Zhang Xue,Zhao Chengli,Wang Xiaojie,et al.Identifying missing and spurious interactions in directed networks[J].International Journal of Distributed Sensor Networks,2015,8491:470-481.
[26]Fawcett T. An introduction to ROC analysis[J].Pattern Recognition Letters,2005,27(8):861-874.
收稿日期:2023-03-03;修回日期:2023-04-20
基金項目:国家自然科学基金面上项目(71871144);上海理工大学科技发展项目(2020KJFZ046)
作者简介:何建佳(1981-),男,湖南道县人,教授,博导,博士,主要研究方向为企业管理、企业供需网、产业互联;廖耀文(1997-),男,湖北十堰人,硕士,主要研究方向为复杂网络、产业互联;周洋(1989-),女(通信作者),黑龙江佳木斯人,讲师,硕导,博士,主要研究方向为颠覆式创新管理(zhouyang@usst.edu.cn).