基于知识图谱的模糊前端需求结构解生成方法
2022-10-11莫振冲祝德刚
莫振冲,宫 琳,2+,叶 帆,祝德刚,谢 剑
(1.北京理工大学 机械与车辆学院,北京 100081;2.北京理工大学 长三角研究院(嘉兴),浙江 嘉兴 314011)
0 引言
随着制造业自动化水平的提高,产品的更迭速度也在不断加快,产品生命周期中,概念设计阶段决定了70%~80%的成本、性能和质量[1],因而起着至关重要的作用[2]。产品概念设计是需求驱动的创造性活动,核心过程是将用户需求转换为产品功能,再由功能出发搜索结构解,最终输出概念方案[3]。在概念设计的模糊前端,自然语言表述的用户需求中包含大量的产品性能期望型需求,导致产品概念设计在需求获取与表征准确性、需求转换效率和设计解搜索全面性等方面受到了严重挑战。作为产品概念设计源动力,模糊前端性能期望型用户需求的结构化表征、补全及设计解生成问题成为了国内外领域学者的研究热点。
传统的客户需求获取方法包括询问观察和问卷调查、深度访谈、营销走访和企业数据分析[4]等方法,相关研究中的前沿技术包括:基于改进需求模板/索引的需求获取技术[5],基于本体的需求表达技术[6],借助计算机技术开发的用户需求获取辅助系统/软件[7],以及产品协同创新设计过程中,客户知识的获取、集成和管理等;数据驱动的需求获取方法大多建立在对产品、市场和技术3个方面的分析技术上,主要包括分析产品性能等数据[8]、面向产品全生命周期的需求获取[9]、基于目标市场的需求获取[10]、基于技术预测的需求获取[11]等。随着客户在产品设计过程中的角色越来越重要,客户对产品或服务的感知成为了需求补全的重要研究对象。LEONG等[12]和RAJA等[13]揭示了产品性能、质量、销售、服务等感知要素与客户需求之间的关系;陈振颂等[14]在经典Markov模型中引入了广义证据理论,充分利用了客户需求重要度信息,对客户需求进行了动态补全;张雷等[15]则突破了传统产品需求的范畴,提出了基于客户特征的产品环境需求补全方法;针对需求的模糊性特征,相关研究还包括基于改进的模糊集理论[16]和灰色系统理论[17]等方法,降低了需求的语义模糊性,并在一定程度上对客户需求进行了补全处理。然而上述研究从研究对象的角度出发,难以深入到用户对产品性能的期望层面;另一方面,上述方法大多基于传统设计问题解决思维,较多过程需要人工完成,受主观性影响较大。
随着计算机技术的飞速发展,研究人员也提出了多种面向概念设计的需求分析与转换方法。CHIOU等[18]提出在满足设计约束时的需求—功能—结构转换映射方法;崔剑等[19]通过建立需求流动链信息功能模型,提出需求—功能—设计特征的转换映射方法;部分需求转换方法采用基于改进的质量功能展开(Quality Functional Development, QFD)或改进的质量屋(House of Quality, HoQ)方法等,如:李延来等[20]以及ZHANG等[21]提出了基于粗糙集理论的质量屋方法,JIA等[22]通过在QFD中融合模糊证据推理方法,提取了工程特性与客户需求的映射关系和关联程度。除与QFD相结合外,张青等[23]利用改进的功能—行为—结构(Function-Behavior-Structure, FBS)模型分析产品得到模糊需求,结合弹性界限概念,运用自然交互技术求解需求;李玉鹏等[24]提出一种基于有向加权网络模型的复杂产品多源设计变更路径优化方法,并用Linkrank算法计算零部件连接重要度,同时考虑节点出度和入度定义变更传播指数建立分析网络模型;CHIU等[25]融合了文本挖掘和感性工程分析在线评论和客户偏好,以实现数据驱动的概念设计自动化;LI等[26]结合知识图谱和概念知识(Concept-Knowledge, C-K)模型,提出一种改进设计方法,以此辅助智能产品服务系统的设计开发。上述研究的问题在于:在针对模糊前端需求的分析与转换过程中,上述方法的自动化实现需要大量需求数据的支持,而在该领域高质量的样本数据量较少,难以支持需求的精准分析与自动化转换映射,因此,该问题的进一步解决需要结合领域设计知识的支持。
为实现设计知识重用以支持需求分析,提出了多种知识重用模型被,以结构化存储设计知识,提高需求分析的效率。例如重叠技术领域图谱[27]、基于本体的设计知识层次结构[28]、基于本体的文献知识图谱和推理网络模型[29]以及几种演化模型[30-31]。在此基础上,结合设计知识重用的手段,可进一步实现概念设计的自动化。此外,基于知识重用支持产品设计的相关研究也逐渐开展。蔡文沁等[32]提出一种基于实例的设计知识重用方法,借鉴以往的设计方案,提取结构设计知识,基于相似度检索实例以获得符合设计要求的方案。王朝霞等[33]基于概念设计的知识需求,利用词法、句法、语义分析等自然语言处理技术,获取不同层次的专利知识来辅助产品概念设计。肖人彬等[34]将公理化设计理论和设计关联矩阵相结合,将产品功能需求转化为设计参数,构建关联矩阵,并进行功能的独立性分析以确定概念设计方案。一些经典知识重用的改进模型也被提出,例如在结构—行为—功能(Structure-Behavior-Function, SBF)模型的基础上的R-SBF模型[35]、将知识位置和扩展路径叠加为网络子图的技术网络模型[36]、基于本体和自然语言处理的自动文献知识图和推理网络模型[37]、改进的维度分析概念建模(Dimensional Analysis Concept Modeling, DACM)框架[38]、结合概念用户中心设计(User-Centered Design, UCD)的潜在语义工程(Latent Semantic Engineering, LSE)等[39]。此外,为辅助用户需求的分析及映射转换,一些工具或方法已经被开发出来,并得到了较为广泛的应用,例如:IHS Goldfire[40]、概念设计功能建模方法[41]、根原因分析(Root Cause Analysis, RCA)[42]、失效模式和效应分析(Failure Mode and Effect Analysis, FMEA)[43]、发明问题解决理论(Teoriya Resheniya Izobreatatelskikh Zadatch, TRIZ)[44]等。以上相关研究中:一方面,知识表征与重用对象和源头大多定位在产品设计方案与设计知识,导致面向需求的知识推荐局限于产品整体需求视角,难以触及到敏感的、细粒度的客户模糊前端需求;另一方面,针对性能期望型需求的辅助知识表征在本体层层面略显粗糙,在数据层面更难以实现性能参数需求的精准识别与面向设计过程的精准自动化转换。
综上所述,作为产品功能需求的重要体现,性能期望型需求极易出现在模糊前端用户自然语言形式的需求表述中,但却未能被结构化分析、表征和精准转换。本文提出基于知识图谱的概念设计模糊前端需求结构解生成方法。首先,针对自然语言表述的模糊前端性能期望型用户需求,进行了需求特性及内在设计问题分析,并基于设计行为构建了产品(专利/需求)—通用工程参数—结构(Product (patents/requirements)—General engineering parameters—Structure, PGS)映射模型;其次,在设计问题及映射模型的引导下,提取专利中的产品设计知识形成领域设计知识图谱,在图谱构建过程中通过本体层性能参数实体的识别,显著提升了知识图谱所含信息的全面性和实用性;最后,融合知识图谱与映射模型,实现了模糊前端需求的结构化表征与补全,并进一步实现了结构解空间的构建,以推动产品用户满意度及创新设计效率的提升。
1 基于知识图谱的模糊前端需求结构解生成框架
本文构建了如图1所示的框架,该框架描述了通过构建PGS映射模型及领域设计知识图谱,实现对模糊前端性能期望型需求结构化表征、补全及结构解构建的过程。在产品概念设计的模糊前端,用户需求中包含大量性能期望型需求,这类需求往往是产品提升用户满意度和实现创新改进的关键。然而,这一类需求由于显著的模糊性、非完备性及主观局限性特征,极难在概念设计过程中被挖掘、表征和转换。通过引入通用工程参数,构建PGS映射模型为该问题的解决提供了理论上的支持;进一步地,对产品专利文件中的设计知识进行挖掘与表征,构建领域知识图谱,支持设计知识更高效的检索与重用;最后,考虑到概念设计阶段是产品创新的重要阶段,而创新意味着在方案组合数量方面的发散性,因此,本研究融合映射模型和设计知识图谱,实现性能期望型需求下的设计结构解空间构建,通过基于形态学矩阵的结构解空间组合爆炸特性,支持设计过程的创新性探索。本文所构建的技术体系,有效地推动了模糊前端需求自动化且精准地向概念设计过程的转换。
2 面向概念设计的产品域—通用工程参数—结构组件映射模型
本章首先基于公理设计理论梳理了产品概念设计过程中基于领域设计知识的重要行为,并进明确了模糊前端性能期望型需求特性和对应的设计问题;其次,针对所述设计问题,引入了TRIZ理论中的通用工程参数[31],构建了支持概念设计行为的产品(专利/需求)—通用工程参数(General Engineering Parameters, GEP)—结构组件(PGS)映射模型定义与表征,并在该模型基础上实现了映射关系构建。产品概念设计中的行为及PGS设计映射总结如图2所示。
2.1 产品概念设计中的行为与模糊前端需求特性
2.1.1 产品概念设计中的行为
公理化设计理论[30]是1990年由美国麻省理工学院(MIT)Suh教授提出的,其目的是引导设计者在设计过程中找准决策方向,并为创新设计或改良已有产品提供设计思维方法。为了将设计流程规范化,该理论将不同设计活动划分界限,统称为域,包含用户域、功能域、结构域和工艺域;相应的每个层域包含相应的设计元素:用户需求项(CNs)、功能要求项(FRs)、设计参数项(DPs)和工艺过程项(PVs)。在产品设计过程中,基于4个设计领域中的设计要素往复映射转换完成设计的方案求解。其中独有之处在于FRs→DPs和DPs→PVs两个映射过程采用的映射方式为“之字形”映射,以功能域到结构域的映射为例,该理论采用了层级的概念,即将功能要求项和设计参数项分为不同的层级,设计过程由功能域的最高层级FR1出发,基于FR1来设计相应层级DP1,然后基于DP1对FR1作进一步细分,迭代此过程直到最高层级功能细分到不能分解为止,并且相应层级的设计结构均能满足相应的功能需求项。
如图2所示,基于公理设计理论,本文归纳的设计行为包括正向设计行为和触发型设计行为两种。
(1)正向设计行为
1)用户需求的多层拆解与转换,包括用户需求向产品功能描述的拆解转换、用户需求向结构参数描述的拆解转换、用户需求向工艺过程描述的拆解转换;
2)产品设计多粒度解搜索,包括产品功能描述的结构参数解检索、实现结构参数的工艺过程解检索。
(2)触发型设计行为
1)基于公理设计理论的层级触发行为,包括工艺过程解的实现对其他结构参数问题的触发、结构参数接的实现对其他功能需求问题的触发等;
2)面向用户需求的反向触发行为,包括功能需求、结构参数及工艺过程的实现对需求的改进或推动式触发行为等。
2.1.2 产品概念设计模糊前端性能期望型需求特性分析
在产品概念设计的模糊前端,绝大多数用户需求中包含对产品性能的期望型需求,例如“提升传送效率”、“减小设备尺寸”等。一方面,性能期望型需求是产品客户满意度的重要评价指标;另一方面,这类需求也是推动产品改进和创新的源泉。本文所述研究以概念设计模糊前端性能期望型需求为研究对象,首先针对该类需求挖掘难、表征难、转换难的问题,分析其需求特性,从而为针对性地提出解决方案奠定理论基础。
产品概念设计模糊前端性能期望型需求特性总结如表1所示。
表1 产品概念设计模糊前端性能期望型需求特性
2.2 支持概念设计的产品—工程参数—结构组件映射模型定义与表征
2.2.1 PGS映射表征模型定义
面向产品概念设计行为,针对模糊前端性能期望型需求难以挖掘、表征、转换的设计问题,如图2所示,本文引入通用工程参数作为由设计需求到设计解之间的跳板,构建PGS映射模型。通过引入GEP作为映射过程的跳板,实现了需求、知识和结构等创新设计问题的终端节点,向通用的、本质的表征模型转换过程,是本研究对面向创新设计过程的设计原理表征与映射的探索。
PGS过程模型是通过设计知识在产品域、GEPs模块和结构域的映射转换实现的。其中,产品域是不同类的大量产品专利描述或产品需求描述组成,每类产品(专利/需求)称为一个产品集(Product Set, PS),在映射过程中,产品专利集可以基于国际专利分类体系(International Patent Classification, IPC)小类对单个产品专利分类得到;GEPs模块源自TRIZ理论中的48个通用工程参数,如表2所示,包含了描述技术特征的标准术语,例如物体的能耗、控制的复杂性等;结构域由多个结构实体组成,包含单一结构或结构组件等形式,每一个产品方案包含多个结构或结构组件,统称为结构集(Structure Set,SS),结构以结构知识及关系结构三元组表示,描述了产品专利包含的结构或组件以及它们之间的关系。
表2 TRIZ中的48个通用工程参数(GEPs)
(1)PGS映射模型中,产品模型表征为:
P=(Pid,Pn,{PSEP})。
式中:P表示产品模型,可以为产品专利或产品需求;Pid为产品唯一标识符,产品模型源于产品专利时,对应的id号用专利的授权号或申请号表示;Pn为专利名称,产品模型源于产品需求时,Pn为产品名称;{PSEP}为设计需求中的特定工程参数(Special Engineering Parameters, SEP)集合。特定工程参数是指在产品设计模糊前端的用户需求中,对产品参数或性能的期望型需求描述,如提升运行效率、减小设备体积等。
(2)PGS映射模型中,通用工程参数(GEP)模型表征为:
G=(Pid,Gid,Gn,Gd)。
式中:G表示产品的GEP参数;Gid为GEP唯一标识符;Gn为GEP名称;Gd表示GEP是正向效应还是负向效应,正向表示为“1”,负向为“0”,例如:减小能耗为正向效应,增大能耗为负向效应,由于数据源为产品专利,一般是对产品进行改进行为较多,所匹配的GEP一般为正向效应。
(3)PGS映射模型中,结构组件模型表征为:
S=(Pid,Sid,{Si})。
式中:S表示结构模型;Sid为该结构或组件唯一标识符;{Si}为Gn结构解集合。Gn结构解是指可以实现通用工程参数Gn所代表的产品性能需求的结构或组件。
2.2.2 PGS映射关系模型构建
如本文2.1.1节所述,面向概念设计的正向设计行为与PGS映射关系,基于PGS映射表征模型,本文构建了如下3种PGS映射关系模型:
(1)P-G映射 针对概念设计前端用户以自然语言形式表述的性能期望型需求的非完备性与主观局限性,构建P-G映射关系:对于每一个特定产品需求类型P,均有一个特定的GEPs集合,一方面补全非完备的用户需求,另一方面实现主观局限性需求的通用结构化表征;
(2)G-P-S映射 针对概念设计前端需求的模糊性以及结构解生成问题,构建G-P-S映射关系:对于每一个GEP,首先搜索与之匹配的SEP所属的专利集合,实现G-P映射;其次,提取专利中实现该GEP的结构或组件集合,实现G-P-S映射。通过构建G-P-S映射,一方面将用户的模糊需求落实到具体作用的结构组件上,另一方面实现基于通用工程参数的领域结构解搜索。
(3)P-S映射 概念设计前端用户需求含有少量描述较为精确的结构化需求,或是待设计的产品结构较简洁清晰,针对这样类型的设计问题,构建P-S映射关系,即对于每一个特定产品需求,基于领域设计知识直接匹配其结构解。
3 面向PGS映射模型的领域专利设计知识图谱构建
3.1 领域专利设计知识图谱本体层构建
在产品概念设计过程中,通常从结构、功能、性能和技术等不同抽象层次为设计者提供概念设计方案的设计知识元素,通过知识图谱表征以上设计知识及其之间的关联关系,可以实现概念设计过程中对知识的检索、重用以及支持概念设计解方案生成。
因此,将专利以及专利包含的设计知识以知识图谱的形式表征,节点表示产品专利实体,其中根据概念设计的抽象层次,设计知识实体可以分为结构实体、功能实体、技术实体、工程参数实体等;边表示设计知识实体之间的关系,如结构之间的包含、连接关系等;以头实体,关系,尾实体的三元组形式进行表征。综上所述,本文定义的领域设计知识图谱本体层结构如图3所示。
3.2 领域设计知识图谱实体层构建
基于专利知识模型所涉及的设计知识,需要将专利摘要中包含的零部件、功效、技术领域及其之间的关系术语等数据抽取出来,为知识图谱构建提供基础知识元素,根据抽取的对象将知识抽取方法分为实体抽取和关系抽取。本文所构建的领域设计知识图谱实体层构建流程如图4所示。
3.2.1 基于BERT技术的图谱实体抽取
实体抽取过程也称为命名实体识别过程,即从文本数据中识别出命名实体,并将其分类到事先定义好的类别中[45],该过程是其他抽取任务的基础。面向非结构化文本主要有以下几种抽取方法,包括基于人工的抽取方法、基于规则的抽取方法、基于统计的抽取方法和基于深度学习的方法。2018年,谷歌提出一种语言表示模型——BERT(bidirectional encoder representations from transformers),即来自变换器的双向编码表示。BERT模型采用基于变换器的多层双向编码器作为模型的核心结构,模型架构采用编码器—解码器结构,在此基础上,使用堆叠的自注意力机制,构成编码器和解码器的全连接层。BERT模型的预训练过程使用遮蔽语言模型(Masked Language Model, MLM)和下一句预测(Next Sentence Prediction, NSP)来捕获单词或句子级别的关系特征。在若干自然语言处理任务上的实验证明,BERT模型具有较强的鲁棒性,本文基于BERT技术的专利设计知识实体抽取方法的流程如下:
(1)数据源获取。将已经包含了专利文档所涉及的结构、功能、技术领域和效应等主要信息的专利标题和摘要作为实体抽取任务的语料集,并将它们存储到关系数据库中,用于统计、关系抽取和分析。
(2)数据预处理。专利文档的摘要内容主要是以自然语言的形式展现,文本中涉及到特殊字符显示需要将去除,并避免网页数据加载不完全出现的空值情况。针对上述问题,通过利用正则表达式等方法对文本进行预处理和筛选,获取到可以作为BERT模型的输入语料。
(3)标注训练数据。本研究采用BIO(begin-inside-outside)标注法对专利文档的摘要内容进行手动标注,标注的标签主要包括:“B-”表示实体关键词的词首,“I-”表示实体关键词的非词首的后续词,“O”表示非实体关键词,“S”表示实体关键词属于结构、组件或系统等,“R”表示结构、组件或系统之间的逻辑关系,例如“固定连接”、“焊接”等,“F”表示专利文档中描述功能的实体关键词,“E”表示工程参数的实体关键词,“T”表示技术领域的实体关键词。详细的BIO标注示例如表3所示。
表3 实体抽取过程的BIO标注示例
(4)基于Pytorch框架搭建BERT模型。①将非结构化语料进行预处理,对于超出模型规定尺寸的句子进行截断处理;②对句子进行特征转换,转换为BERT模型的输入数据的特征形式;再次,对BERT模型进行训练和测试过程,保存最佳模型参数;最后,通过加载训练阶段的最佳模型,识别未标注过的但是符合本文需要的实体关键词。
(5)基于训练完成的BERT模型对测试数据进行命名实体识别,获得对应所述类型的实体关键词。
3.2.2 基于自然语言处理技术的图谱实体关系抽取方法
本节主要介绍基于自然语言技术的关系三元组的识别和抽取,其目的是将设计知识构建为三元组,为知识图谱构建提供数据,从而清晰地描述产品专利的设计知识的逻辑关系。本文关系三元组抽取过程中涉及到以下两个难点:①对于摘要中出现的指代词需要进行指代消解任务,将指代词准确地链接到同一设计知识实体节点;②所涉及的关系类型较多,要对关系类型进行归类和标准化,为知识库管理奠定基础。
为了挖掘专利文本中隐含的设计知识之间的关系,本文提出一种基于自然语言处理技术中指代消解和依存句法分析的方法,对专利语料进行关系三元组识别与抽取,具体流程分为图谱实体指代消解、基于依存句法分析的关系三元组识别和基于BERT技术的关系三元组抽取3个阶段。
(1)领域专利设计知识图谱实体指代消解
1)构造模型输入数据及训练数据集。首先,对分句后专利摘要文本进行筛选和截断;其次,对预处理后的文本进行指代词识别,并基于命名实体识别过程获得设计知识,构建模型输入数据;最后,划分训练数据集并进行标注。
2)基于Pytorch框架搭建Roberta模型。Roberta模型是BERT模型的优化方案,指代消解过程使用Roberta模型的原因在于该模型可以对较大的语料进行处理,使结果更加精确。具体地,对输入数据进行特征转换,然后对Roberta模型进行训练和测试,最后保存最佳模型,用于对测试集数据的预测。
3)完成测试集的指代词预测。对测试集进行指代词预测,得到预测结果。然后筛选指代标签正确的数据,对指代词进行替代。
(2)基于依存句法分析的关系三元组识别
1)对专利摘要进行正则处理。为了更精确地对语料进行分析,需要将摘要中涉及到的非指代词的却有指向的词汇进行正则处理,将相关代词用相应的专利标题进行替换。
2)构建分词自定义词典。将命名实体识别任务中识别得到的设计知识添加到自定义词典中。
3)对语料进行分句、分词和词性标注。基于哈工大语言技术平台(Language Technology Platform, LTP)对文本进行词性标注、依存句法分析等处理:对文本进行分句,然后对每条文本进行分词处理,并基于LTP中的词性标注功能对文本进行词性标注,作为依存句法分析的输入数据。
4)构建三元组识别规则。基于LTP分析词汇之间的依存关系,并构建三元组识别原则,对每个词进行规则匹配,识别关系三元组知识,具体的依存关系组合规则如表4所示。
表4 实体抽取过程的BIO标注示例
(3)基于BERT技术的关系三元组抽取
1)若两个设计知识实体存在关联,则将该实体对的核心动词作为关系实体。针对系统、结构或组件等实体对之间的关系进行总结,将关系类型分为3种,分别是包含关系(包括、装设)、结构与结构/组件之间的组合关系(连接、焊接、安装),以及未能识别出的关系“unknown”。
2)基于深度学习精确识别关系三元组。基于BERT模型,以专利摘要为训练语料,通过标注训练数据进行BERT模型训练,对文本中的实体对之间的关系进行概率计算,具有最高概率值的关系词与实体对进行匹配构成三元组,实现关系三元组的抽取任务。
4 融合领域设计知识图谱与PGS映射模型的概念设计解空间生成方法
本文基于所构建的领域知识图谱,实现面向概念设计的PGS映射模型映射关系的生成,从而支持产品概念设计过程中模糊用户需求的完备化、结构化表征与补全,以及概念设计结构解空间生成等阶段。具体流程如图5所示。
4.1 产品概念设计性能期望型需求结构化表征与补全方法
4.1.1 基于专利数据的P-G映射关系生成
本文提出的基于专利数据的P-G映射过程分为3个步骤:首先,IPC对产品专利进行分类;其次,对每一类专利知识中特定工程参数(Specific Engineering Parameters, SEPs)实体进行聚类;最后,归纳SEPs(簇)—GEP匹配关系,实现产品专利到GEPs的映射。
其中,核心过程为专利知识中的SEPs实体聚类技术,基于前文对专利非结构化文本的命名实体过程,可以获取到每个产品专利对应的SEPs实体。然而,输入数据为SEPs,属于短文本,且相应关键词的数据量较少,对应的GEPs种类却有48类之多,较难通过编码或训练样本集的方法实现技术知识分类。因此,基于无监督学习方法将未标注的输入数据自动分类成簇。
本文基于复杂网络的Infomap算法[46]实现SEPs聚类过程。Infomap算法是一种社区发现类算法,初衷是用最短编码表示随机游走路径,采用双层编码结构,将网络的不同节点划分社区。访问频率较高的节点赋予短编码,访问频率较低的赋予长编码,大幅缩短所描述的信息长度。假设通过某种社区划分方式M将节点划分为m个群组,描述随机游走的平均每步编码长度表示为:
(1)
基于Infomap算法进行SEPs聚类的具体流程为:首先,基于工程参数知识对应的标注抽取SEPs知识实体;其次,将SEPs知识实体转换为嵌入词向量作为Infomap的输入;最后,基于Infomap算法对其词向量特征进行社区划分以得到多个SEPs簇。
4.1.2 融合知识图谱与映射模型的设计需求结构化表征与补全
输入模糊前端需求,基于领域设计知识图谱和P-G映射过程实现对需求GEP形式的结构化表征与补全:一方面将特定性能需求进行通用化表征,解决了用户需求受主观专业局限性的问题;另一方面将通过匹配目标产品相关的GEPs集合,实现了非完备性需求的补全,具体过程如下:
(1)基于领域设计知识图谱的需求获取。在领域设计知识图谱中,匹配提取包括目标产品PCN和特定工程参数SEPs在内的知识实体,实现模糊前端用户需求的获取。
(2)基于SEPs-GEPs映射的用户需求结构化表征。输入第(1)步获取的SEPs集合,将SEPs集合中每个SEP转换为相应的GEP,实现通用工程参数形式的用户需求结构化表征。
(3)基于P-G映射的需求结构化补全。基于P-G映射关系生成技术,获取目标产品匹配的GEPs集合,进一步实现产品概念设计通用工程参数形式的用户需求补全。
(4)定义最终完备的、结构化的设计需求表征为GEPs模块,即多个GEP的集合为:
CRs={GEP1,GEP2,…,GEPi,…,GEPm},
i∈(1,m)。
为方便接下来的设计解空间映射生成过程,此处省略了对工程参数的情感期望和动作模式,故此表征不代表用户需求,仅是通用工程参数的集合。
4.2 面向产品概念设计的需求结构解空间映射生成方法
结合所构建的领域知识图谱与PGS映射模型,本文提出面向产品概念设计的需求解空间映射生成方法,具体流程如图6所示。
4.2.1 基于领域设计知识图谱的结构集导向映射关系生成
(1)G-P-S映射。在完备的、结构化的产品概念设计需求驱动下,基于需求中通用工程参数与产品的特定工程参数的关联性,可以找到实现该通用工程参数的相关专利方案,通用工程参数与专利方案解为一对多的关系;进一步地,基于知识图谱,计算GEP实体及其匹配的SEP簇中实体与结构组件实体在同一句话中的共现度,归纳相应通用工程参数的结构或组件解集合,以实现G-P-S的映射。
(2)P-S映射。当产品概念设计用户需求表述专业明确且目标产品结构简介清晰,可以忽略GEPs到结构集的映射过程,直接基于领域设计知识图谱检索并实现产品→结构集的映射。
4.2.2 融合知识图谱与映射模型的概念设计结构解空间生成
基于结构集导向的映射模型,本文提出依托领域知识图谱的计算式结构解空间生成方法。
GEPi对应的产品专利方案集合定义为Pati,
Pati={Pati1,Pati2,…,Patij,…,Patin},
j∈(1,n)。
结构解定义为:
SSij={Patij,{SPOj}}。
其中:Patij表示专利的产品模型,即2.1.1节中对产品模型的定义;{SPOj}表示产品专利包含的结构集合。
具体的结构解空间生成方法如下:
(1)判断概念设计问题的复杂度。若用户需求表述专业明确且目标产品结构简介清晰,则直接检索匹配专利实体,生成结构解空间并反馈给用户;否则,则基于G-P-S映射模型形成结构解集合。
(2)G-P映射。集合中的GEPi作为被检索项,以设计知识图谱为检索库,得到包含实体GEPi或该实体匹配的SEP实体的专利。
(3)计算单个专利与设计需求的相关性分数。通过式(2)和式(3),计算由检索得到的专利所包含的SEPij与目标产品GEPi之间的相关度rel(GEPi,SEPij);基于式(4)~式(8)计算目标产品与检索得到的专利i的语义相似度值sim(PCN,Patij);通过式(9)得到专利方案与需求之间的相关性分数值,当计算结果高于阈值时,保留专利i至候选集中。
rel(GEPi,SEPij)表示GEPi与SEPij的相关度,定义为目标产品的GEPi与专利Patij所包含的SEPij之间的相关程度,可以用来体现目标产品与专利产品的性能要求的一致性,计算方法如式(2)和式(3)所示。
(2)
(3)
sim(PCN,Patij)表示设计需求的目标产品与专利方案涉及的产品关键词的语义相似度,定义为基于目标产品和专利名称两者对应的词向量的余弦相似度,具体公式如下:
PCN=(PidCN,PnCN,{PSEPCN});
(4)
Patij=(PidPAT-ij,PnPAT-ij,{PSEPij});
(5)
eCN=vector(PnCN);
(6)
ePAT=vector(PnPAT-ij);
(7)
sim(PCN,Patij)=cos(eCN,ePAT)。
(8)
其中ei是通过基于BERT模型对关键词i生成的词向量,用函数vector()表示。
相关性分数计算公式如式(9),该公式主要用于评价专利方案与GEPs的相关程度。
SCRij=ω1×rel(GEPi,SEPij)+ω2×
sim(PCN,Patij)。
(9)
式中:SCRij表示专利方案SSij对于GEPi的满足程度的定量计算得到的分数,分数越高,该专利方案SSij对GEPi的匹配程度越高;ω1、ω2表示上述相关度和相似度值在该分数中的权重值。
(4)根据SCRij的值,从高到低进行排序,取分数前m的专利方案作为GEPi的专利候选集。
(5)基于领域知识图谱,计算需求GEP实体或与之匹配的SEP实体与专利中所含结构实体的共现度,定义域值并筛选相关的结构解集合n个。
(6)基于形态学矩阵生成概念设计工程参数形式需求下的结构解空间,支持从结构解空间中选择组合方案并实现概念设计。所述结构解空间形态学矩阵如表5所示。
表5 通用工程参数形式需求下的结构解形态学矩阵
5 实例验证
为验证本文所述领域设计知识图谱构建方法、PGS映射模型构建方法,以及需求结构化表征、补全和结构解空间生成方法的有效性与实用性,实现了机械装备领域知识图谱构建,并完成了一个机械产品概念设计需求实例。
5.1 机械领域知识图谱与PGS映射模型构建
本文的专利数据是基于中国专利库中的中文实用新型类专利文档。由于专利库的数据庞大且计算设备的有限性,选取一定时间范围的专利文档进行获取,即授权公告日在2010年~2020年间的专利数据,可以获得约20万条的专利数据,包含专利的标题、主分类号、授权公布号、摘要等重要信息,利用MySQL关系数据库对所述数据进行存储。基于机械领域产品的专利特征,筛选出机械领域相关的专利约8万条,以此作为设计知识来源。
基于第3章所述过程构建机械领域设计知识图谱,并依托第4章4.1.1节与4.2节所述过程,实现了基于图谱中工程参数实体的PGS映射关系生成,最终,获得实体数量约39.9万个,关系三元组共121.6万条。所述领域设计知识图谱部分截图如图7所示,其中粉色节点为工程参数类实体。
5.2 机械手概念设计实例
(1)模糊需求结构化表征与补全
本文以机械手为设计需求目标产品,真实用户需求如下:
寻求机械手设计方案。要求该机械手需具备较高运行效率、结构简单、可拆卸、保证机器安全与防护。
首先,基于本文4.1.1节所述方法,针对设计需求,通过产品—通用工程参数映射方法,将设计需求的性能要求映射到通用工程参数,则其映射结果如表6所示。
表6 设计实例的特定工程参数—通用工程参数(SEPs-GEPs)映射结果
目标产品在IPC中所属小类B25J,依托4.1.1小节所述映射模型与知识图谱,可以得到该小类的通用工程参数,如表7所示。
表7 B25J产品—通用工程参数(P-GEPs)映射库
基于4.1.2节所述方法,表7对设计需求目标产品机械手进行通用工程参数补全,在用户需求以外补充2~5个通用工程参数,以拓展设计知识检索空间,并且提高用户需求满意度。鉴于此,本研究随机选取两个通用工程参数进行补全,即15(10)力和41(32)可制造性(制造性)。因此,当前的设计需求通用工程参数模块包含5个通用参数,其序号为24、34、37、15、41。至此,完成了设计需求工程参数化表征与补全的过程。
(2)基于P-G-S模型辅助产品概念设计
1)基于4.2.2节所述内容,依托领域知识图谱检索待映射的通用工程参数,针对每个通用工程参数通过计算相关性分数排序筛选以获取相应的产品专利方案候选集。
2)计算相关度分数指标,设定阈值生成专利方案候选集。基于4.2.2节所述相关度分数的计算,本文设定式(9)中的系数为ω1=ω2=0.5,阈值为0.75。依此得到GEPs模块的相关度得分前3位候选产品方案如表8所示。
表8 设计实例的相关度得分排名前3位候选产品专利方案
3)基于产品专利方案集及其知识图谱,提取GEPs对应的结构组件,通过4.2.2节所述过程构建形态学矩阵,构建结果如表9所示。
表9 设计实例的通用工程参数—结构组件(GEPs-S)的形态学矩阵
4)基于形态学矩阵构建结构解空间,得到243组结构解组合,均满足所提出的设计需求。随机选取一组结构解并依此生成完整的概念设计方案:{电机},{(电机,组合,关节)},{(角度检测组件,组合,控制器)},{吸附组件},{基座,传动机构,指段,关节轴}。生成满足设计需求的产品概念设计方案为:该方案包含电机、关节、角度检测组件、控制器、吸附组件、基座、传动机构、指段、关节轴,电机作为驱动力来源,电机连接关节轴驱动关节的旋转运动,将吸附组件固定在指段上,基座固定上述机构安装,传动机构由两个齿轮组成,连接指段;另外,补充气缸控制吸附组件,补充重量传感器检测待抓取物体的质量,补充控制器对运动系统进行中控,基本零件不再赘述。
本研究依托我校工程训练中心机器人创意实践平台,对上述提出的设计方案进行三维图模拟和实物简易搭建,如图8所示。
6 结束语
产品概念设计模糊前端中含有大量性能期望型用户需求,该类需求是产品用户满意度的重要依据,也是驱动产品创新设计的最佳动力,该类需求的获取、表征、挖掘及面向设计转换过程需要大量领域知识的支撑。因此,本文提出基于知识图谱的概念设计模糊前端需求结构解生成方法。分析了性能期望型需求特性及内在的设计问题,基于设计行为构建了产品—通用工程参数—结构(PGS)映射模型,并在模型的引导下基于专利数据构建了领域设计知识图谱,最后依托映射模型与知识图谱实现了需求结构化表征、补全以及设计结构解空间的构建,在机械设备领域进行了图谱构建及实例验证。考虑到本文所提技术方案基于专利数据的知识建模与重用展开,本研究在实际应用过程中主要针对模糊前端用户需求这一问题对象,解决模糊需求的精准结构解空间构建问题,实现基于解空间支持创新设计与概念生成过程的应用效果。
本文创新之处如下:
(1)本文从当前产品概念设计模糊前端大量存在的性能期望型需求及其重要意义出发,对该类需求进行了详细分析,明确了需求特性及其为设计过程带来的问题,丰富了面向产品创新概念设计的需求获取、表征、分析及转换相关研究的理论基础。
(2)本文从支持模糊前端需求精确转换的知识图谱完备性和实用性等实际问题出发,通过对性能参数型实体的成功识别与提取,丰富了领域专利知识图谱本体层内含,提升图谱全面性与实用性,保障了设计问题解决技术的自动化程度与效率。
(3)本文针对模糊前端需求引导下的产品概念设计多阶段问题,融合PGS映射模型和领域知识图谱提出一系列针对性的需求分析方法体系,包括工程参数形式的模糊前端性能期望型需求结构化表征、工程参数形式的产品概念设计需求结构化补全以及性能期望型需求下的结构解空间形态学矩阵的构建等过程。
本研究仍存在一些不足,有待后续拓展和深入,未来可从以下几个方面展开进一步研究:
(1)本文研究对象的局限性问题。本文考虑到用户自然语言表述的模糊前端需求中,性能需求为需求核心和出现频率最高的需求类型,故以此为研究对象,导致研究对象并不能覆盖概念设计中最为突出的产品功能需求。未来研究可以此为方向进行扩展,全面分析模糊功能需求的类型与特性,扩展所提方法的适用范围,推动本文技术的应用发展。
(2)领域知识图谱的知识损失问题。本文所构建的领域知识图谱由于关系实体数量较多,所以将关系实体归纳为两种主要关系,这会损失详细具体的关系实体及实体对关系的层次性。在未来研究中,需进一步对设计知识进行多层级划分,细分关系实体,更加细化专利设计知识的层次。
(3)设计知识映射过程自动化程度不充分。本文所提出的产品—通用工程参数—结构组件的设计过程模型是基于通用工程参数连接了产品域和结构域的映射交换,扩大了设计方案的匹配空间,但是该设计过程属于半自动化过程,部分过程缺乏成熟的算法技术实现映射自动化。未来可以基于概念设计的类比、推理等方法,结合计算机科学方法将推理过程定量分析,同时对于可获得的产品设计方案进行积累并更新,以实现概念设计过程全自动化。
(4)结构解空间生成后的专利规避设计问题。本文所提出的方法基于对专利数据的知识建模与重用,在形成支持概念设计结构解空间后,将面临专利规避设计问题。未来可以基于本文的输出成果,引入专利规避设计伞型、链型、星型和束型模式,旨在生成具备准确性和创新性的概念设计方案。
(5)概念设计方法体系缺乏产品方案的评估。本文所提出的方法体系总体输出为概念设计的结构解空间,在生成过程中,对设计需求和产品专利的相关度进行了评价,但是对于生成的结构解所构成的方案缺乏评价。未来可以引入配置流图、KANO模型等方法,增加对产品概念设计过程的约束,从而增加对设计方案的客观的、科学的评价指标。