APP下载

基于CiteSpace的智能制造业可视化分析

2022-11-09房路生韩凤雷

中国市场 2022年29期
关键词:类群图谱聚类

芦 燚,房路生,韩凤雷

(长安大学 经济与管理学院,陕西 西安 710064)

1 引言

制造业是国民经济的主要支柱,是关系国计民生的重要行业。我国长期以来是制造大国,却不是制造强国,因此实现“中国制造”向“中国智造”的转变,是当前经济发展的重大任务,其中最主要的短板就是智能制造。智能制造深度融合了新一代信息技术和先进制造技术,贯穿于产品、制造、服务全生命周期的各个环节及相应系统的优化集成,旨在实现制造的数字化、网络化、智能化,不断提升企业的产品质量、效益、服务水平,进而推动制造业实现创新、绿色、协调、开放、共享式发展。

新时期新形势下,各国纷纷以智能制造为主攻方向。美国提出“工业互联网战略”,德国提出“工业4.0战略”,日本提出“机器人新战略”,我国提出“中国制造2025”,都希望在新一轮全球产业价值链的竞争中脱颖而出,进一步提升国际地位和话语权。因此,智能制造既是中国的机遇,也是中国的挑战。通过文献分析了解智能制造国内外研究动态及前沿十分重要。吴珊等通过实地调研,发布了国内智能制造百强企业排行榜,分析了智能制造的发展路径以及未来的发展趋势。臧冀原等总结了智能制造三个基本范式:数字化制造、数字化网络化制造到新一代智能制造,分析了其内涵和特征。Shan等以三一重工(工程机械制造企业)为案例,概述了三一重工的智能制造成长路径,讨论了它未来的发展方向。Ge等从供应链和产业链的角度探索智能制造,研究企业大数据管理能力成熟度。

总结上述研究可见,至今仍然缺乏针对国内外智能制造研究动态及前沿的描写,而这恰恰是研究智能制造演化过程中需要迫切关注的点。为此,本文对CNKI 数据库和WOS数据库相关智能制造文献进行科学计量与可视化分析,通过“文献共被引”“关键词共现”“关键词聚类”和“突现词检测”等指标,揭示智能制造在新时期新形势下的研究前沿及其演变趋势,为中小企业研究智能制造以及相关科研人员提供参考。

2 研究方法及数据来源

2.1 研究方法

基于文献计量方法,运用CiteSpace 5.5R2软件进行“文献共被引”“关键词共现”“关键词聚类”“突现词检测”等操作,通过可视化的方式更好地把握国内外智能制造研究动态以及前沿。

文献共被引方法首先可以生动地展示知识流动演化过程,即后人的文献是如何和先人的文献进行对话的。通过文献共被引网络,可以确定文献与文献相互之间的关联程度。

其次,还可以展示文献共被引最多以及影响力最大的文献。关键词是文献内容高度凝练的标志性词语,运用关键词共现则可以直观地观察出国内外有关智能制造各个文献之间的亲密疏远程度,通过词频和中心度大小排序可以得出研究重点内容。通过关键词聚类方法可以将关键词划分为不同的知识类群,每个知识类群都是一个主题,主体与主题之间也产生交互,它可以告诉人们知识类群与知识类群以及每个知识类群之间是通过什么关键词进行交互的,关键词背后对应着文献,整个过程就形成了知识的演化路径。

最后,通过分析最近时间节点的关键词,可以得出最近的研究热点,通过整个图谱,进一步探析未来研究的发展趋势。突现词检测方法可以从大量的主题词中探测出某段时间内频次变化率大的词,从而帮助人们明确智能制造研究的前沿。

2.2 数据来源

为了综合分析国内外智能制造相关文献,本文将CNKI数据库和WOS数据库两大数据库作为数据检索源。CNKI数据库设置为期刊检索,来源类别设置为核心期刊以及CSSCI期刊,主题为智能制造,设定发表时间1992—2020年,共得到1742篇文献。WOS数据库设置为“WOS核心合集:引文索引”,时间跨度为1992—2020年,主题为“Intelligent manufacturing”,共得到3071篇文献。

3 结果分析

3.1 研究热点

研究热点是指在某段时间内被论文提及的热点话题,它可以通过关键词共现和关键词聚类方法来寻找。关键词是文献内容高度凝练的标志性词语,运用关键词共现的方法则可以直观地观察出国内外有关智能制造各个文献之间的相异程度关系,通过词频和中心度大小排序可以得出研究重点内容。

通过关键词聚类方法将关键词划分为不同的知识类群。文献通过关键词展示,那么知识类群就是某一类的文献集合,通过图谱,人们可以知道是哪些知识类群在相互影响,也就是哪些文献在相互关联。

此外,人们还可以观察单个知识类群的演化过程,知识类群内部又有哪些文献在相互影响。CiteSpace根据颜色和节点大小划分研究热点,节点越大越重要,颜色越黄,表明研究主题越新,进而得出最近的研究热点和展望未来研究的发展趋势。

不仅如此,CiteSpace还提供了判断知识图谱绘制效果好坏的指标。它根据知识图谱的网络结构,提供了模块值Q指标,根据聚类的清晰度,提供了平均轮廓值S指标。通常来说,Q值取值范围在[0,1],Q>0.3就意味着划分出来的知识图谱的网络结构是显著的;当S值在0.7时,聚类是高效率令人信服的;若在0.5以上,聚类一般认为是合理的;若S值为无穷大,则聚类个数通常为1,这样选的网络可能太小,只代表一个研究主题。

3.2 关键词共线以及聚类

首先,本文利用CiteSpace 5.5R2软件将国内数据时间跨度设置为1992—2020年,时间切片设置为1,Top N设置为10,节点类型选择Keyword,绘制关键词共线图谱,选择展示最大的类网络,选择自动聚类,选择LLR算法对聚类的名字进行标注,然后执行Timeline view指令,可以得到关键词聚类图谱,聚类图谱可以通过节点大小以及颜色来生动地展示研究热点和研究趋势。Q值为0.7827,S值为0.8775,说明图谱的网络结构很显著,聚类不仅高效率,而且令人信服。国内智能制造研究关键词聚类知识图谱一共产生了16个知识类群:#0智能制造、#1智能制造系统、#2制造业、#3智能制造技术、#4制造技术、#5智能制造装备、#6大数据、#7多agent系统、#8先进制造技术、#9敏捷制造、#10制造系统、#11我国制造业、#12分子育种、#13cimes2014、#15研究院和#27协作能力。文献通过关键词显示,知识类群就对应着某一类的文献集合,通过图谱,可以知道是哪些知识类群在相互影响,也就是哪些文献在相互关联。此外,还可以观察单个知识类群的演化过程,知识类群内部又有哪些文献在相互影响。根据时间线颜色,黄色部分为最新研究热点。比如#2这个类群里的智能科学技术和#6这个类群里的人工智能产生交互,#2这个类群里的智能工厂和#0这个类群里的工业4.0以及#6这个类群里的数字孪生产生交互,这也从侧面说明了基于大数据背景下,打造工业4.0时代的基于数字孪生理念的智能工厂的重要性。

其次,利用CiteSpace 5.5R2软件将国外数据时间跨度设置为1996—2020年,时间切片设置为1,Top N设置为10,节点类型选择Keyword,绘制关键词共线图谱,选择展示最大的类网络,选择自动聚类,然后执行Timeline view指令,可以得到关键词聚类图谱。Q值为0.3603,S值为0.6404,说明图谱网络结构是显著的,聚类是合理的。国外智能制造研究关键词聚类知识图谱一共产生了6个知识类群:#0 hybrid system、#1 circular economy、#2 structured intelligence、#3 cloud manufacturing、#4 using artificial neural network和#5 constraint-based system。#1这个类群里的cyber-physical system就是研究热点,它和类群内部的design产生交互。同理,#2这个类群里的machine learning就是研究热点,它和类群内部的prediction和algorithm产生交互,即利用机器学习算法做预测。#1这个类群里的big data就是研究热点,它和自身类里的architecture和design产生交互,浅显地解读即大数据平台架构设计。那么类群与类群之间的交互情况是怎样的,这里只介绍#2类群里的algorithm,它和每个类群的内部都产生交互,也从侧面解释了算法确实很重要。

3.3 研究前沿

突现词检测方法可以从大量的主题词中探测出某段时间内频次变化率大的词,可以帮人们明确智能制造研究的前沿。国内数据参数的时间跨度设置为1992—2020年,时间切片设置为1,Top N设置为10,节点类型选择Keyword,可以发现工业互联网,人才培养和人工智能在2018—2020年都是研究前沿。国外数据参数的时间跨度设置为1992—2020年,时间切片设置为1,Top N设置为10,节点类型选择Keyword,发现突现词太多了,无法得出最近研究前沿。因此也将时间跨度拉到2008—2020年,2008年发生了经济危机,笔者认为这个时间节点有一定意义,其他设置和前面保持一致,突现词个数为20个,可以较好地展示研究前沿,可以发现big data和network在2018年和2020年都是研究前沿。

4 研究结论

本文运用CiteSpace 5.5R2文献计量软件分别对CNKI数据库和WOS数据库1992—2020年有关智能制造研究的文献进行分析,结果表明国内外研究在总体概况、关键词聚类和最新的研究前沿等方面都呈现出一定的差异与联系。

首先,从总体概况来说,2015—2017 年,国内智能制造研究发文数量井喷式增加,是多于国外智能制造研究发文数量的。2017年之后,国内智能制造研究发文数量呈波动状态,总体低于国外发文数量。

其次,从关键词聚类图谱来看,国内聚类类群比国外聚类类群更多,研究热点有相似也有不同,比如都强调了循环经济、大数据和人工智能等技术,按照关键词中心度的重要性排序,国内更重视智能制造系统、高端装备制造产业和智能制造技术以及装备等,国外更重视系统、体系架构、并行工程和算法优化等技术。

最后,从研究热点来看,国外的研究显然比国内研究更多,因为国外的研究前沿时间跨度是缩小的,不过从最新的研究趋势来看,还是一致的,都是体现在大数据和网络上。

综上所述,智能制造研究应该重点放在工业互联网、物联网、人工智能和大数据上面,紧跟国内外研究前沿,弥补智能制造研究的短板。

目前,我国在推动制造业创新发展转型升级方面虽然已经取得了不错的效果,但在新时期新形势下,我国还是应该以智能制造为主攻方向。发展智能制造,把握住智能制造带来的机遇,在新一轮全球产业价值链的竞争中脱颖而出,进一步提升国际地位和话语权;发展智能制造,加快数字经济和实体经济的融合,培育一批具有国际影响力的数字产业集群,补上目前智能制造的缺口;发展智能制造,打造和谐的产业生态链。制造业的发展方式将不再是原先简单复制的粗放式增长模式,而是升级为高质量发展的智能制造,最终实现“中国制造”由“中国智造”的转变。

猜你喜欢

类群图谱聚类
绘一张成长图谱
薏苡种质资源ISSR分子标记筛选及亲缘关系分析
基于DBSACN聚类算法的XML文档聚类
黑石顶自然保护区土壤动物功能类群对季节动态的响应
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
一种层次初始的聚类个数自适应的聚类方法研究
2011年春夏季黄海和东海微型浮游动物类群组成及其摄食的研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例
龙湾自然保护区森林土壤动物群落多样性及功能类群