基于知识图谱的国内外模块划分研究热点与演进分析
2021-02-01崔光珍黄航肖艳秋张国智
崔光珍,黄航,肖艳秋,张国智
郑州轻工业大学 机电工程学院,河南 郑州 450002
0 引言
当前我国制造业正由传统数据资源密集型向知识信息密集型转化,传统机械设计方法已不能满足当前社会发展的需求,将逐渐被新的设计方法取代.模块化设计能够满足多样化、定制化的市场需求,保证高质量、低成本的输出,增强产品竞争力,是实现智能设计制造的有效方法.作为产品模块化的基础,模块划分的合理性将直接影响产品的功能、性能、开发时间、成本、模块的通用程度、维修的方便性等[1]:通过对产品功能的模块划分,为产品创新设计阶段的知识重用奠定基础,有助于设计者快速有效地发现功能新解,实现技术创新[2];采用基于模块划分的模块配置方法,可有效解决桥式起重机功能部件的优配设计问题,实现起重机性能和产品设计效率的提高[3];利用模块划分方法进行结构特征分析,将各生命周期的结构划分为模块,为产品分析和再设计提供参考,节省了开发时间[4];在批量化生产模式下,合理有效的模块划分是实现产品低成本、大批量生产的关键[5];面向订单的定制生产背景,结合产品特点,借助模块划分方法构建独立的工时模块模型,提高了模块的通用性[6];采用基于零部件相关矩阵与动态模糊聚类的模块划分策略,实现了复杂装备产品快速维修[7].综上所述,大量学者基于不同视角开展模块划分的研究,并取得了丰硕成果.面对该领域研究成果,做好知识梳理,把握模块划分方法发展脉络和趋势,掌握当前各学科模块划分技术发展前沿,将进一步促进智能模块化设计领域的发展.
当前,多数学者对模块划分领域知识的获取是通过查阅大量文献资料、凭借自身的经验和专业知识作出总结和判断,这种高屋建瓴的方式对知识储备和专业素养要求较高,同时在文献筛选、热点追踪、方向把控等方面具有主观倾向性,可能存在偏差.在科学技术迅猛发展和知识快速传播的今天,采用科学高效的方法挖掘、梳理、总结文献成果中所蕴含的隐性知识,是推动整个学科领域创新发展的重要手段.因此,本文融合文献计量学和可视化方法,借助科学计量图谱对模块划分领域大量庞杂无序的知识脉络进行梳理、对比,对模块划分的研究热点与演进趋势进行分析和总结,以期为今后该领域相关研究提供参考与借鉴.
1 数据来源与研究方法
1.1 数据来源与处理
科学的检索方法是准确获取数据的基础.本研究采用的中外文献数据来源于中国知网(CNKI)和Web of Science(WOS)核心数据库,以“模块划分”为主题词,时间跨度为2000—2019年,文献类型为文章(Article)、会议论文(Proceedings paper)、综述(Review),人工剔除新闻、报告,以及与本研究不相关的文献.将最终检索到的1276条CNKI有效数据和去重后的2576条WOS有效数据作为研究对象.
1.2 研究方法
本研究采用的CiteSpace软件是由美国德雷塞尔大学陈超美教授开发的一款基于Java的可视化软件.CiteSpace软件绘制的图谱兼具“图”和“谱”的双重特性,被刘则渊教授用“四个一”概括为“一图展春秋,一览无余; 一图胜万言,一目了然”[8].对比其他可视化软件,CiteSpace软件能够更直接地挖掘科学知识中蕴含的隐性知识,并对专业知识领域的数据和文献成果进行筛选、计量,探测关键路径和知识拐点.
2 国内外模块划分领域文献年度发文量统计
年度发文量体现了一个领域的研究程度及发展情况,同时也是判断其研究阶段的重要标志[9-10].国内外模块划分研究领域文献发表年度趋势如图1所示.由图1可知,国内2000—2008年的年度发文量均少于70篇,说明相关研究正处于萌芽阶段,主要研究方向是大规模定制、产品配置、产品族规划等;2009—2015年的年度发文量处于爆发式增长期,且在2015年达到顶峰,其中,面向服务、创新设计的模块化设计理论,以及与模块划分相关的算法研究是该时段的研究热点;2016—2019年为成熟期,发展趋势稳定,这可能是由于该领域研究遭遇了瓶颈,需要挖掘、整合深层知识以辅助后续的创新研究,年度发文量均稳定在80篇以上.当前的研究主要以模块划分为基础,融合知识工程(KBE)、人工智能(AI)等手段以实现机械产品设计制造过程的协同化、自动化和智能化.国外年度发文量从2004—2016年就呈稳步上升趋势,在2016年达到峰值;而2017—2019年年度的发文量趋于平稳.可见,国内外学者对模块划分技术的研究不断深化,关注度持续上升.
3 国内外模块划分领域核心作者统计
3.1 国内核心作者统计
高影响力作者总能主导其科研领域活动的深度和广度,展现一门学科的缩影[11].每个作者都直接参与科研成果,其在领域内的影响力可以通过发文量衡量.国内模块划分领域的作者-机构合作知识图谱如图2所示,国内模块划分研究领域的核心作者统计见表1.分析图2和表1后发现,四川大学殷国富的发文量为11篇,在模块划分领域内名列前茅,其中《工业机器人模块化设计研究》[12]被引40次.该文献通过将模块化设计方法与传统设计方法进行对比,指出了模块化设计方法的关键技术是模块的划分和集成.排名第二的贵州大学尹健在其高被引文献《基于结构模块化的微型山地稻麦联合收割机设计》[13]中提出,模块的划分和组合实现了机器的模块化设计,为实现快速配置不同性能的机器提供了一种方案.广西工学院谌炎辉和山东大学张进生的发文量均为8篇,前者最高被引文献《复杂产品的最小最大划分模块化方法》[14]基于最小最大划分,提出了一种适合复杂产品模块划分的方法;后者最高被引文献《模块化设计中模块划分方法的研究》[15]分析总结了模块划分涉及到原则、角度和聚类方法这3个关键问题,共被引128次.仲梁维、李爱平、刘电霆紧随其后,发文量分别为7篇、6篇、6篇.排名最后的桂林理工大学胡浩平发文量为5篇,作者基于绿色模块划分的多目标模型,提出了一种多目标蚁群算法[16].
图1 国内外模块划分研究领域文献发表年度趋势图Fig.1 Annual trend chart of literature published in research field of module division at home and abroad
图2 国内模块划分领域的作者-机构合作知识图谱Fig.2 Knowledge graph of author-institution cooperation in the field of the domestic module division
表1 国内模块划分研究领域核心作者统计表
3.2 国外核心作者统计
国外模块划分领域的作者-机构合作知识图谱如图3所示.由图3可知,模块划分领域最高被引文献源自美国密歇根大学的M.E.J.Newman[17],作者首次发现许多与科学有关的网络(包括社交网络、计算机网络、新陈代谢和监管网络)都会自然划分为模块,认为检测和表征社区结构的问题是网络系统研究中突出问题之一,由此提出了一种基于模块划分的“模块化”质量函数对问题进行求解,该文献共被引4796次.中科院学者与国外高校学术合作较多,其中代表性作者沈华伟( H.W.Shen)的发文量主要集中在2009—2019年.其最高被引文献《Quantifying and identifying the overlapping community structure in networks》[18]针对复杂网络社区经常相互重叠的问题,提出了一种社区度量方法,即利用任意模块化优化方法对最大派系网络进行分区以识别重叠社区结构.近几年突现最明显的是由R.Rosen等[19]于2015年在IFAC-PapersOnLine期刊上发表的名为《About the importance of autonomy and digital twins for the future of manufacturing》的综述.该综述主要探讨了未来制造业主要由模块化、连接、自主、数字孪生技术4个方面组成,共被引136次.新加坡南洋理工大学的K.Herath 等[20]提出了一种基于模块化设计的通信感知模块放置方法,该方法旨在为FPGA(Field-Programmable Gate Array)选择最佳的模块封装策略.国外模块划分领域的研究核心机构群主要由美国密歇根大学、麻省理工学院(MIT)、新加坡南洋理工大学、伦敦大学学院(UCL)和新加坡国立大学组成.
通过分析国内外作者-机构合作知识图谱发现,与国外相比,国内核心作者群数量较多,表明国内学者之间合作较为频繁,学者之间联系较为密切,产出成果较为丰富.但是,国外核心机构联系紧密,领域之间合作频繁且被引频次高,表明以美国为主的高产国家研究成果突出,影响系数大.国内除中国科学院大学之外,大部分科研机构的学术影响力相对较低,彼此合作存在局限性,机构跨区域合作较少,缺乏跨区域合作意识.由此可见,在模块划分方法研究方面,应加强多学科领域合作,借鉴生物工程、基因工程等相关学科的先进理论方法,进一步促进智能模块化设计理论发展,拓宽模块化方法的应用范围.
图3 国外模块划分领域的作者-机构合作知识图谱Fig.3 Knowledge graph of author-institution cooperation in the field of the foreign module division
4 国内外模块划分领域研究热点分析
文献的关键词能够清晰明了地反映文献中蕴含的主题与思想.因此,依据高频关键词可确定某学科领域的研究热点[21].将图谱分析节点设置为“Keywords”与“Term”,主题词类型调整为“Burst Terms”,选取每个时区中Top50的高频关键词,分别绘制国内外高频关键词-主题共现知识图谱.
4.1 国内研究热点分析
国内模块划分领域的高频关键词-主题共现知识图谱如图4所示,其中每个节点代表一个关键词,节点的大小表示关键词出现的频次,节点间的连线表示两个关键词有共现关系,连线的粗细和颜色分别表示共现关系和出现年份[22].通过筛留语义和主题相关性强的关键词,并按照频率的高低进行排序,得到Top20的关键词如表2所示.通过分析图4和表2发现:关键词频率分布不均匀,表明目前国内研究领域过于单一,除模块划分、功能模块等高频词汇之外,社团结构、生物网络、航空等领域关注度较低;各聚类模块之间连接不紧密,与关键词所对应方向的研究频率存在一定的差异,研究热点相对国外存在局限性,并且领域之间的交叉研究也相对较少.据此分析得出国内模块划分领域的研究热点主要有以下几个方面.
图4 国内模块划分领域的高频关键词-主题共现知识图谱Fig.4 Knowledge graph of high frequency keywords topic co-occurrence in the field of the domestic module division
表2 国内模块划分领域研究热点高频关键词列表
1)模块划分技术的划分策略:当前国内学者的研究重点主要基于产品功能、结构、面向产品生命周期等模块划分策略.由表2可知,基于产品功能、模糊聚类、复杂网络的划分最为广泛,关键词出现频率最高.
2)模块划分技术的应用范围:国内侧重于从产品设计阶段的不同角度进行应用技术的研究,主要集中在产品绿色模块划分、多目标优化、产品设计、大规模定制等方面,其中产品绿色模块划分方法主要面向全生命周期产品的模块设计,在满足传统模块划分功能和结构的前提下,要求兼顾产品功能属性与绿色属性,表明模块划分多维度、细粒度的研究趋势;其次是针对模块划分求解的方法,如基于人工免疫、遗传算法等多目标优化算法.
3)模块划分技术的研究目标:突现较为明显的关键词有绿色设计、生命周期、产品设计、设计结构矩阵等,各聚类交叉明显,结点间连接紧密.受全球化的影响,近年国内新兴的应用领域有基因网络、生物网络、航空、舰船.其中,基因网络利用模块划分方法对其进行模块识别.生物网络研究借助模块划分算法对其进行分解,主要集中在检测蛋白质合体和功能模块,是后续国内学者的重点研究方向.
4.2 国外研究热点分析
国外模块划分领域的高频关键词-主题共现知识图谱和国外模块划分领域研究热点高频关键词列表分别如图5和表3所示.由图5和表3可知,与国内相比,国外模块划分的高频关键词出现的频率分布较均匀,研究热点较多且分散,并不局限于某个单一研究方向,学科交叉研究较多.分析发现,国外模块划分技术的研究热点主要集中在以下几个方面.
1)模块划分技术的应用目标:模块划分在国外兴起时间较早,在机械设计、软件设计、社区结构、对称群中的应用早已成熟,传统的研究内容主要包括建模、仿真优化、功能模块划分等;近年突现度较高的关键词有基因网络、动力学分析、数字孪生等,已经成为国外学者的研究热点,并在实践过程中取得了一定进展.
2)模块划分技术的应用领域:国外模块划分技术应用广泛,在工程机械、计算机科学、应用数学、生物学等多学科中均有涉及,其中,模块划分在生物学中的应用为近年来的研究热点,代表文献为《Detecting functional modules in the yeast protein-protein interaction network》[23],被引443次,该研究利用模块划分对蛋白质相互作用网络中的功能模块进行识别,确保识别的模块具有生物学意义,这是了解细胞功能组织和动力学的首要环节,也为当下机械功能模块划分提供了方法和思路,指出模块划分算法不仅要考虑拓扑特征,也应考虑功能关系.
图5 国外模块划分领域高频关键词-主题共现知识图谱Fig.5 Knowledge graph of high frequency keywords topic co-occurrence in the field of the foreign module division
表3 国外模块划分领域研究热点高频关键词列表
3)模块划分技术的应用方案:模块划分不仅是一种纯粹的理论概念,更是一项发展相对成熟的技术,如何将模块划分技术清晰准确地应用在实际的工程项目中,是目前国外研究的热点;大多数国外学者分别在理论与实践层面总结了模块划分应用的实施框架和技术路线.
5 演进趋势探析
突现词(Burst Terms)是指在短时间内出现频次突然增加的词汇.通过对比不同时段的突现词,能够清楚明了地分析模块划分领域的演进趋势.采用Timeline形式作出的国内外模块划分领域高频突现词的时间线视图分别如图6和图7所示.
5.1 国内演进趋势
模块划分理论在1980年代就已被提出,直到2003年才初具规模.通过不断研究,模块划分在国内已相对成熟.由图6可知,国内对模块划分领域的研究总体上分为4个阶段:基础理论、初级应用、深入应用和领域探索.
1)2000—2006年,处于基础理论研究阶段,主要对“模块化”和“模块划分”的原理及技术进行研究.
2)2007—2010年,处于初级应用阶段,国内突现强度较高的关键词为 “计算机辅助设计”“本体”“绿色设计”,表明在此期间国内学者重视将模块划分技术应用在计算机、模块本体、绿色模块划分等方面,如2008年,任小中等[24]提出将CAD与模块划分技术结合,开发了磨齿机模块化CAD系统;2009年,宋扬等[25]提出将模块化思想引入本体知识库的构建过程中,将本体划分为多个模块的集成形式.
3)2011—2016年,处于深入应用阶段,模块划分技术被国内诸多学者重视,模块划分的优势也不断被认可,该技术被广泛应用于工程机械、现代医院建设、数据通信、计算机网络、教学改革等领域.
4)2017—2019年,随着研究的不断深入与探索,应用范围扩展到生物、航空、舰船等领域,高频突现词有基因网络、航空发动机等.其中,《基于熵值的尿路感染疾病基因网络的模块划分与生物学机制分析》[26]、《航空发动机高空模拟试车台架参数化设计研究》[27]为该领域最具代表性的文献.前者针对尿路感染病因复杂的难点,提出利用MCODE cluseter、MCL cluster和Community cluster(glay)3种模块划分方法对尿路感染疾病基因网络进行模块识别,发现MCODE cluster方法可以识别出疾病基因网络中与疾病生物学功能关系较为密切的基因.这拓宽了模块划分的应用领域和研究思路,并启发了后续将模块划分方法应用于生物学.后者针对我国高空试车台架存在零部件通用性不高、设计周期长等问题,提出利用三维软件开发参数化零部件结构,采用模块划分方法将其划分为结构和功能不同的模块,建立重用件库和标准件库,实现试车台架模块化、半自动化、全三维快速设计,有效降低了台架返修次数,缩短了设计周期,提高了设计效率.随着模块划分方法的不断发展,后续可结合虚拟现实技术和智能化技术进行虚拟设计和智能化设计.
图6 国内模块划分领域高频突现词的时间线视图Fig.6 Timeline view of high frequency emergent words in the filed of the domestic module division
5.2 国外演进趋势
由图7可知,国外对模块划分领域的研究总体可划分为4个阶段,具体如下.
1)2000—2004年,突现强度较高的关键词为Genetic algorithm(遗传算法)和Function analysis(功能分析).其中,遗传算法为模块划分方法提供了算法支持,但存在易陷入局部最优解的缺陷,所以未来需融合模拟退火、神经网络等算法,以提供最优的划分方案;功能分析主要将产品总功能分解成一系列功能单元,根据功能-结构映射分析产品最优结构布局及装配组合方式.2001年,内布拉斯加大学学者针对机器人开发时间长且成本高的问题,开发了一种基于遗传算法的机器人模块化设计系统,实验结果表明,此方法可实现机器人预制模块的快速组装,从而降低设计时间和成本[28].2003年,加州大学首次将生物学与网络结构相关联,网络划分为功能相关的模块和基序[29].
图7 国外模块划分领域高频突现词的时间线视图Fig.7 Timeline view of high frequency emergent words in the filed of the foreign module division
2)2005—2008年,Design(设计)、System(系统)、Complex network(复杂网络)等关键词突现.设计主要包括配置设计、绿色设计、参数化设计等,在此期间,绿色设计最为突出.作为绿色设计最有效的方法,模块化设计既能解决制造周期与生产成本之间的矛盾,又可使产品快速更新迭代,便于产品维修、拆卸及回收,这与21世纪国际研究热点——产品绿色设计理念不谋而合.随着智能、人机协同等关键词的出现,将模块化与计算机辅助技术完美结合形成模块化系统,可替代人类完成大量人工无法完成的复杂计算和重复性工作.2007年,M.Aminian等[30]开发了基于神经网络的模块化模拟电路故障诊断系统,该系统通过连续多次划分模块以确认模拟电路中所需尺寸的故障或模块,具备查找故障组件效率高、相似故障分类准确、鲁棒性强等优点.
3)2009—2013年,Biological network(生物网络)、Multi-objective optimization (多目标优化)等关键词突现,其中生物网络模块性的研究为此期间重要的研究方向.2011年,美国莱斯大学学者讨论了生物系统的模块化和层次性,阐述了模块化是生物学探索生物空间的基础,提出了模块化为生物网络系统提供了强大应对变化的能力[31].
4)2014—2019年,聚类明显的关键词为Community detection(社区发现)、Dynamics(动力学)、Phylogeny(系统发育)、Digital twin(数字孪生),均是国外针对模块划分领域研究的新方向.2015年,美国印第安纳州大学学者提出一种基于模块约束的思想来分解动力系统的方法,该方法有效地将快速模内动力学与缓慢的模内动力学分开扰动扩散,为探索复杂动力系统的模块化组织提供了工具[32].随着多学科交叉和知识全球化的发展,模块划分技术与系统动力学、生物学、物理学等其他学科知识的融合应用也将成为日后值得深入研究的热点.
6 结语
本文使用文献计量学和知识图谱可视化方法对CNKI和WOS中有关模块划分的文献进行了统计分析,从文献的年度发文量、作者与机构合作网络、研究热点及演进趋势4个方面进行可视化分析,指出:1)模块划分领域的研究持续受到世界各国的关注,从年度发文量看,2000—2008年为起步探索期,国内外学者对模块划分技术的研究呈匀速递增的趋势,2009—2015年为快速增长期,文献发文量呈爆发式增长,2016—2019年为平稳增长期;2)从核心作者和研究机构分布情况来看,中国与美国在模块划分领域的研究成果最为突出,表明中国已成为该领域在国际舞台上的中坚力量,但美国等发达国家依旧是主要研究群体;3)对研究热点和演进趋势进行分析发现,产品绿色模块划分、产品设计、大规模定制等是国内外共同关注的热点,此外,国外在该领域主要专注于复杂网络、多目标优化和生物网络模块性的研究,并围绕计算机科学、建筑学、应用数学、生物学等多学科领域展开,而国内更侧重于对模块划分理论方法的研究,且应用范围较窄.
模块划分方法自提出以来,在产品的设计、装配、批量生产、智能制造方面展现出了良好的发展前景与应用成效,其中基于模糊聚类与客户需求分析的模块划分方法研究最为集中.但对于结构复杂、零部件数量庞大的复杂产品来说,总是出现模块更新缓慢、计算量大、模块划分过程复杂等问题.同时,模块划分过程的关联度大多是人为决定,使得主观因素对模块划分影响很大,导致模块划分结果不稳定.这迫使研究人员不但要考虑模块划分的正确性与有效性,还要考虑模块的动态划分和基于市场需求的模块遗传进化.基于以上模块划分研究所存在的问题,提出未来的研究方向主要集中在以下三方面.
1)考虑产品全生命周期中的各种动态要素.根据核心系统模块成本等市场因素的动态变化对模块进行合理规划,将基因调控网络所具备的复杂性、层次性、动态性、功能模块性与动力学分析法相结合,对产品复杂系统模块化进行组织、布局,能够有效解决模块划分过程中缺乏协同和动态调控、复杂度高的问题.未来模块划分技术的动态布局与调控需求将日益增加,如何实现产品模块划分的静动转变将是今后的研究趋势.
2)产品功能模块粒度划分研究.针对目前制造业服务资源复杂多样且数据量庞大导致模块匹配困难的问题,未来应对产品功能模块进行更细粒度的划分,恰当的模块划分不但有利于产品实现功能技术和功能的求解,还有助于生成有效创新设计方案,促进模块的更新与进化.
3)数字孪生可以反映对应实体装备的全生命周期过程,它具备动态、多尺度、虚实结合等特点.实现基于数字孪生的产品模块划分,不但能够提高动态数据获取与管理能力,还能快速响应市场需求.未来产品设计动态化与市场个性化需求将不断增长,如何实现实时产品模块化设计将成为后续模块划分领域的重点研究方向.