APP下载

基于SAO的专利数据驱动产品创新设计

2023-12-01林文广刘晓东肖人彬

中国机械工程 2023年15期
关键词:相似性元件语义

林文广 刘晓东 肖人彬

摘要:借助大数据挖掘技术,提出基于主语-谓语-宾语(SAO)的专利数据驱动产品创新设计方法。首先通过语义依存句法挖掘专利文本数据库中的SAO结构,获取产品元件之间的作用关系信息;其次构建面向产品系统的复杂网络知识模型,并引入结构洞理论计算复杂网络中元件约束性系数,以此确定创新目标元件,并借助Word2Vec计算元件语义相似性系数,利用SAO相似性算法计算功能相似性系数;在此基础上,融合推荐算法以及组合矩阵,分别围绕结构创新、功能创新以及功能优化三个方面实现产品创新。最后以具有典型代表性的卫浴花洒产品为例,对所提方法进行了详细的演示,充分证实了所提方法的有效性和先进性。

关键词:专利数据;主语-谓语-宾语(SAO);语言模型;复杂网络;推荐算法

中图分类号:TH166;TP391

DOI:10.3969/j.issn.1004-132X.2023.15.001

Patent Data Driven Product Innovation Design Based on SAO

LIN Wenguang1 LIU Xiaodong1 XIAO Renbin2

1.Mechanical and Automotive Engineering,Xiamen University of Technology,Xiamen,Fujian,361024

2.School of Artificial Intelligence,Huazhong University of Science and Technology,Wuhan,430074

Abstract: The patent data-driven product innovation design method was proposed based on SAO using big data mining technology. Firstly, semantic dependency parsing was used to mine the SAO structure and interaction relationships among product components from patent text databases. Subsequently, a complex network knowledge model was constructed for product systems, and the constraint coefficients of components in the complex network were calculated by using structural hole theory to identify the innovative target components. Then, the semantic similarity coefficients of components were calculated using Word2Vec, and the functional similarity coefficients were calculated using SAO similarity algorithm. And the recommendation algorithm and combination matrix were integrated to achieve structural innovation, functional innovation, and functional optimization. Finally, a typical bathroom shower product was taken as an example to demonstrate the method in detail, which fully verifies the effectiveness and progressiveness of the method.

Key words: patent data; subject-action-object(SAO); language model; complex network; recommend scheme

0 引言

根据路甬祥院士的观点,设计经历了从传统设计(设计1.0)到现代设计(设计2.0)再到创新设计(设计3.0)的进化历程[1]。因此,大力发展创新设计对建设制造强国至关重要。

随着大数据时代的到来,数据科学理论和数据处理技术得到了快速发展。将数据科学引入创新设计成为制造业信息化的一个重要趋势,数据驱动的产品创新设计已逐渐成为人们关注的焦点。文献[2-4]以数据驱动产品创新设计为导向,提出了相应的研究框架和实施使能技术,本文工作是对其所提出框架的一个技术层面的实现。目前数据驱动产品创新设计的具体实现主要分为以下4类:①基于客户需求数据;②基于历史设计数据;③基于协同类比数据;④基于优化设计数据。其中,基于客户需求的数据挖掘方法通过挖掘用户需求,设计符合用户偏好的产品,但客户需求较为隐晦,具有一定的挖掘难度[5];基于历史设计数据方法,由于历史数据多为非结构化数据,导致挖掘成本较高,效率较低[6];基于协同类比数据方法需要解决不同领域和环节数据的整合问题[7];基于优化设计驱动方法处于发展阶段,需要理清发明问题和解决办法之间的关系[8]。上述方法各有优缺点,但算法效果均与数据质量成正相关,因此如何选择结构规范化且质量高的数据成为提高方法准确率的关键。

专利作为具有法律效力的文档,是记录发明人研发成果的主要载体。合理有效地利用专利信息有助于缩短60%的研发时间,节省40%的研发费用[9]。专利已经成为产品创新研究的主要数据来源。在此背景下,以专利数据为驱动对象的产品创新方法(patent data-driven product innovation design,P-D2PID)应运而生,由于专利中的80%以上信息都是通过文本进行表述的,故基于专利文本驱动产品创新逐渐成为研究热点[10]。邱清盈等[11]利用词性筛选的方式从专利分类号中的文本描述信息中提取功能知识,以功能为节点构建复杂网络模型,结合分布位置差异提出三种创新策略。李少波等[12]利用术语频率-逆文档频率算法(term frequency-inverse document frequency,TF-IDF)构建专利结构以及功能关键词向量空间,并结合类比的方法获取相似的技术方案。陈志泊等[13]利用图排序算法提取行业专利关键词,通过图模型算法对关键词进行聚类成簇,进而实现数据降维,再利用人工方式对簇给予标注。DUFLOU等[14]通过主成分分析对专利数据库中的特征词类别进行挖掘,從而系统地量化产品类别的开发状态,有助于进一步开发感兴趣的产品。PARK等[15]在分析专利文本时提出技术认知诊断模型,为专利关键词分析结果理解目标技术提供了重要技术支撑。CHEN等[16]在专利文本语义基础上通过深度学习提取专利实体词汇和语义关系,从而获取产品结构化信息,保证了专利文本信息的提取精度。CHOETKIERTIKUL等[17]通过深度学习技术无监督学习专利文本中的语义特征,结合文本相似性特征,为产品创新中的问题提供方案。此外,YOON等[18]同时引入隐含狄利克雷分布主题分析及信息熵两种算法过滤专利中的噪声,进而提高专利关键词提取效率。显然,专利文本包含的巨大价值正逐步引起学术界的广泛重视。

综上所述,现有专利文本提取往往是基于概率统计的方法,在关键词获取方面有一定的效果,但仍存在噪声大、价值低的问题,同时还忽略了关键词之间的关联关系,使得在产品设计过程中难以对结构之间的耦合关系进行分析[19]。SAO作为基于文本语义的三元组信息,可以迅速获取文本中心概念,并避免其他非必要语义的干扰,在文本语义理解、文章脉络梳理以及关键字关系推导等方面具有明显优势[20]。HE等[21]在专利文本SAO基础上构建技术路线图,从而识别未来技术方向和行业目标,并指引研发路径。HAN等[22]通过专利SAO词汇及其关联关系信息构建关键词复杂网络,结合链路预测算法对行业技术进行预测。FENG等[23]从专利文本相关研究中的局限性入手,在现有SAO算法基础上提出“主语-谓语-宾语-其他”的SAOx方法,旨在解决文本中一词多义的提取难题。可以看出现有研究将SAO技术应用于专利挖掘功能,但是主要设计专利信息提取和技术分析,对如何将SAO有效应用于产品创新设计较少涉及。

本文引入面向SAO提取的专利文本信息提取方法,用以挖掘专利文本中的语义特征,以文本SAO为基础构筑产品复杂网络,融合结构洞算法、语义相似性算法以及产品功能配置算法,并以具体产品为案例验证产品创新设计方法的可行性。

1 研究方法

1.1 P-D2PID概述

P-D2PID的关键在于提取专利文本中的技术信息和产品信息 [24]。专利文本语义规范化对信息抽取具有积极影响,但如何在大量表层信息中抽取并挖掘深层知识仍然任务艰巨[25],这也是本文的主要研究内容。本文结合专利大数据以及复杂网络实现产品创新,通过使用依存句法获取文本中的SAO三元组数据,进而构建复杂网络,开展产品元件特征研究,最后结合推荐算法和功能优化生成最终设计方案。

1.2 基于SAO的P-D2PID研究流程

依据语义-元件-功能-产品的自下而上设计过程,本文构建了基于SAO的专利数据驱动产品创新设计流程,整个流程共分为四个步骤,具体框架如图1所示。具体实施内容如下:

(1)专利检索与下载。针对具体产品创新需求,确定产品创新方向,同时根据专利发展过程和技术周期确定检索范围,进而确定检索关键词和检索数据库,由布尔关系生成检索式检索行业专利数据,然后下载检索结果中的专利文本数据;对因为续案以及公开导致重复申请的专利进行去重合并,并剔除被驳回、主动撤回以及无效的专利,最大化清除垃圾专利以及低价值专利,提高专利数据的质量,同时利用维持年限以及法律状态对部分“专利烟雾”和“专利地雷”进行排查;专利文本中包含标题及各类噪声,需要对其进行剔除,同时使用正则表达式对专利文本中的语句进行分句,为文本语义标注做准备;随后对文本使用语义依存句法对语句中的词语关联关系进行标注,并确定词语的主语、谓语和宾语等属性信息。

(2)文本SAO提取与复杂网络的构建。通过对专利文本中的语句进行语义标注,提取文本中的SAO结构,构建数据库;分析产品元件之间的作用关系,以另一元件发挥作用的结构作为源节点,被支配的元件作为目标节点,作用方式设为连边,从而构建复杂网络;在复杂网络中运用结构洞算法计算节点特征参数值,据此表示节点在网络中的重要程度;由Word2vec通过词向量计算得到元件语义相似性计算结果,为下一步元件创新设计方案提供参考。

(3)产品设计创新推荐。产品创新设计主要分为两部分,一部分是元件创新性替换,由检索下载的专利文本提取文本中的名词短语,这些名词短语即为产品元件,从而构建元件库,通过在元件库中对元件进行相似性检索,得到元件创新性替换方案;另一部分是功能载体相似性计算,元件是产品功能实现的载体,具有相同或相似功能实现的载体具有可替换性,通过计算元件语义相似性和功能相似性,结合元件约束性系数确定元件创新参数。此外,通过构建功能链优化模型对产品元件功能组合进行分析,实现功能优化,然后创建产品功能组合矩阵,发现可以合并或拆分的功能载体,进而实现功能载体组合或拆分创新。

(4)最终设计方案产出。首先,由元件功能相似计算结果确定相似功能元件推荐;其次,根据元件相似性检索,确定相同构型元件创新推荐方案;根据产品功能-结构映射关系,确定功能载体组合/拆分创新设计;最终对产品创新设计方案进行合成,并对方案创新性做出评价。

1.3 基于语义依存句法的专利文本SAO获取

SAO是一种典型的语法结构,也可表示为SV(verb)O [26]或主语-谓词-宾语 SP(predicate)O [27]。SAO可以用来表示事物之间的联系,其中,主语和宾语一般为名词或代词,表征动作的执行者和被执行者,谓语一般为动词,表征主语和宾语之间的关联属性。经过对专利文本的阅读和分析,发现专利文本中SAO形式共有五种,其结构和示例见表1。可以看出,在专利文本中有些语句不仅包含一组SAO,有些语句可能包含多個主语,有些语句可能包含多个谓语或宾语,甚至有些语句包含多个SAO。在专利文本中,SAO表示技术元素间的关联属性,主语和宾语代表产品技术元素(元件、能量、物料或者信号),谓语代表技术元素间的逻辑关系[28]。因此,SAO能够较好地描述专利产品和技术信息。

依存句法是指以词语的关联特性为依据划分词类,通过该方法可以识别词语在文本中的位置和作用。语义依存句法通过对词语的含义和词语在语句中的上下文进行标注,从而确定词语在文本中的词性和作用,因此该分析方法广泛应用于自然语言处理中的文本处理[29]。以表1中语句为例,语义依存句法分析过程如图2所示。图2中的上半部分为语句中的词语,下半部分为该词语的语义依存句法结果。目前常用的依存句法关系及其具体含义见表2[28-30]。通过对文本语句进行语义依存句法分析,发现主语的词性标签多为名词性主语(nsubj)或被动形式名词主语(nsubj-pass),谓语多为根词(ROOT),宾语多为宾语(obj)或直接宾语(dobj)等。由词语分别对应的标签即可确定语句SAO结构。

1.4 基于结构洞理论的元件特征参数计算

复杂网络由节点和连边组成,其中节点可以代表任何事物,连边表示节点之间的关系,边权重表示关系强弱程度。通过复杂网络可以表示一些具有相互关联的事物组成的整体,由此能够开展网络几何性质、网络演化以及网络结构等方面的研究[31]。结构洞示意如图3所示。图中,A、B、C和D均为节点,r1、r2和r3为节点有向连边。

结构洞是指网络中个体与个体之间由于非直接联系而出现空隙的现象[32]。结构洞理论指出,一个节点与其他节点联系越频繁,说明此节点在网络中扮演的角色越重要,但随着该节点在网络中的联系越来越多,节点受到的约束越多,周围的结构洞逐渐减少,该节点获得新连接的可能性也逐渐降低。节点之间联系强度的计算公式如下:

式中,aij、aji为节点之间相连边的权重;aik、aki为节点i与任一节点k之间相连边的权重总和;Aij为节点i和节点j之间联系强度。

结构洞理论指出,衡量节点在网络中所受到约束的算法是网络约束性系数[33]。设节点i的网络约束系数为Ni,其计算公式如下:

其中,k≠i,j。由式(2)可以看出,当j是i的唯一相连节点时,Ni取最大值1;當节点j与节点i没有直接和间接联系时,Ni=Aij。从网络约束系数的计算公式来看,约束系数越小的节点在网络中掌握的信息越多,该节点在网络中邻域越密集,所受到的约束越高。借助约束性系数分析节点在网络中的重要性,系数越高则重要性越高,即一旦该节点发生变动,整个网络所受影响越大。

1.5 基于词向量的语义相似性计算

计算词语语义相似性时,对词语所处上下文词汇进行向量化后计算的数学模型称为词向量,目前应用较广泛且经典的词向量处理技术是Word2Vec。2013年MIKOLOV等[34]开发出语言处理工具包Word2Vec,通过将文本预料库中的词语转换成维度相同的向量形式,使文本转换为数字形式,从而利于机器识别和处理。根据词语上下文词向量构建序列矩阵,可以用来对词语进行分类、聚类和词语相似度计算。Word2Vec主要分为两个模型:CBOW模型和SKIP-GRAM模型。两种模型的区别见表3,可以看出CBOW模型的训练效率更高,适用于海量专利数据对象的训练与处理。

CBOW是一个三层结构的神经网络,分为输入层、投影层和输出层,在输入层,以目标词为中心,获取目标词前后各n个词向量,在投影层将这n个向量累加求和,在输出层以目标词为根节点、周围词为叶子节点,以词语共现次数为权重构建哈夫曼树,用以预测投影层的结果。SKIP-GRAM模型与CBOW模型的训练方式互逆。CBOW训练模型表示如图4所示。

使用Word2Vec计算词语相似度时,需要使用余弦相似度计算词语词向量。设待比较的词语为x和y,使用Word2Vec计算词语x和词语y的语义相似度方法如下:

1.6 基于S?rensen相似度的节点相似性计算

复杂网络中节点之间通过连边建立联系,具有联系的两个节点互相成为对方的“邻居”,一个节点的所有邻居节点组成的集合称为邻居集合,在两个节点的邻居集合中同时存在的节点称为两个节点的共同邻居。设在复杂网络G=(V,E)中,V为顶点集合,E为连边集合,对于顶点u和v,V(u)为顶点u的邻居集合,V(v)为顶点v的邻居集合,则对于(u,v)∈V,它们的共同邻居C(u,v)的计算公式如下:

C(u,v)=|V(u)∩V(v)|(4)

对于顶点u和v,两者所有邻居顶点的集合称为所有邻居集合T(u,v),其计算公式如下:

T(u,v)=|V(u)∪V(v)|(5)

衡量两个节点的相似度时,可以通过节点之间的共同邻居来判断,其中,S?rensen相似度[36]以节点间共同邻居与所有邻居的比值作为衡量节点间相似度的指标,节点u和节点v的S?rensen相似度S(u,v)计算公式如下:

S?rensen相似度能够较好地衡量两个节点之间的相似性,有利于在推荐算法中实现相似推荐,目前仍然有较多文献采用该算法[37-39]。

2 专利数据驱动产品推荐创新方法

借鉴文献[40]中所提的推荐算法,本文将产品创新过程分为三类:第一类为基于内容的相同构型元件替换,主要聚焦于元件本身;第二类为基于协同过滤的相似功能元件替换,主要聚焦于实现功能的功能载体;第三类为基于功能拆解/合并的创新性方案,主要从产品功能-结构映射角度实现产品创新。其中,第一类和第二类方案为一对一元件创新方案,第三类为一对多/多对一元件创新方案。具体产品过程如图5所示。

2.1 基于内容的相同构型元件替换

对产品进行创新设计时使用相同元件的创新型替换,优点在于相同元件具有高度相似的材料特性、流特性和功能描述,因而在创新过程中牵扯到的产品改动较小。为此,本文提出基于内容的相同构型元件替换。

首先根据目标产品结构,分析组成产品的元件及元件间关系,以元件为节点,以元件间关系为边,构建产品复杂网络;通过产品复杂网络和式(2)对网络中的元件进行计算,得到元件在产品网络中的约束性系数。在考虑对约束性较高的元件进行替换时,需要注意由于该元件牵扯到的其他元件较多,故涉及的改动较多,创新成本较高;对于约束性系数较低的元件,因为牵扯到的其他元件较少,产品改动成本较低,更适合于产品创新。其次,由专利文本获取专利中的元件组成元件库,并以包含该元件的专利频率为权值;以上述目标元件为关键字检索元件库,查找具有相同功能的相同构型元件,从而生成该元件的创新性替换方案。最后,结合元件在专利中出现频次生成最终方案,频次较高的元件说明技术相对成熟,采用这种方案的专利较多;反之,频次较低的元件说明较少被采用,方案更容易“出其不意”。为了对多结构方案进行有效筛选,提高方案的创新性,结合“出其不意”程度,本文提出了元件达到“出其不意”效果的程度值Vi,设共有n个推荐元件,推荐元件i出现频次为Fi,则Vi的计算公式如下:

基于相同构型元件的创新型替换方案更有利于在已有产品基础上开发不同型号,对母产品的改动较小,只需对现有生产线做出部分调整即可,可在更短时间内增加产品种类,快速为用户提供多样化的选择,扩大产品的市场占有率。

2.2 基于协同过滤的相似功能元件替换

对目标产品进行拆分,分析其具体功能及功能载体有助于了解产品结构,进而在产品结构上对产品做出创新性设计。产品的主要价值是实现其特定功能,元件作为功能载体,直接影响产品功能的实现效果[5]。例如,花洒喷头承载着引导水流、控制液体喷出方式的作用,有些喷头的材质为金属,容易与水中的离子发生反应,导致喷头形变,直接影响产品使用体验,而硅胶材质喷头则不会发生此类状况。此外,同样具有调整并固定角度的球铰和棘轮,球铰铸造相对简单,且在调整角度时具有很好的随意性,磨损较低,抗腐蚀性好,但球铰容易滑动;棘轮相对牢固,且调整角度具有规律性,调整时具有声音反馈,但棘轮易磨损,抗腐蚀性较差。由此可见,实现某种功能的功能载体有多种,在对产品功能创新过程中,本文考虑在同一功能下寻找不同的功能载体实现创新。

为获得相似功能载体,本文选用Word2Vec训练专利文本得到词向量,通过词向量和式(3)计算词语相似度,作为元件相似度的参考。通过式(6)计算元件之间的SAO相似度从而得到元件功能相似性参数,结合Word2Vec计算词语语义相似度得到元件可替换性参数。对于元件语义相似性和功能相似性的计算结果,还需要引入频率作为判断使用量的依据,与相同元件替换方案类似:使用量越多的元件,体现出的创新价值越低;使用量越少的元件,体现出的创新价值越高。综合多个指标,得到元件的推荐指数,从而对相同功能不同元件的性能进行评价,具体计算公式如下:

式中,M(i)为第i个推荐元件的总体评价指标;W(i)、S(i)分别为由Word2Vec计算出的推荐元件i与目标元件的相似度和S?rensen相似度;V(i)为推荐元件i出其不意的程度值。

通过功能载体的相似性判断,可以实现产品的创新性设计,有利于对已有产品进行升级改造。确定产品设计方案之后,一旦存在相关专利侵权,就能够进行方案调整,有利于实现专利规避。

2.3 基于功能拆解/合并的创新型方案

设计者在进行产品设计时,根据产品总功能需求,利用“功能白箱”或“功能黑箱”对产品进行逐层剖析,进而确定产品功能原理和具体结构。这种由总功能到子功能的分解延伸方式由于过程较为抽象,分解过程对设计师经验要求较高,且设计过程易受设计师个人偏好的影响,导致最终设计结果出现不必要的结构冗余或功能重合。例如有些功能需要多个功能载体(元件)共同作用实现,但在保证功能实现不变的情况下,可以对功能载体进行创新组合和拆分。

为了形象化产品功能与元件的关系,同时参考文献[41],本文提出构建产品元件-功能映射关系。首先对产品功能及功能载体进行分析,并假设目标产品由n个元件组成,元件共包含m个子功能,则产品元件-功能映射关系如图6所示。

例如,产品的某项功能需要n个元件共同作用实现,实现该功能的元件共对应m个子功能,经过对产品构建功能优化模型,将重复功能合并,得到最终功能优化示意图,如图7所示。由合并后的功能示意图及文献[42]中功能组合及功能关系组合矩阵的设计思路,本文组合及创建了产品功能组合矩阵,该矩阵见表4。通过功能组合矩阵,对实现组合功能的元件进行检索和创新,可以有效实现产品创新,优化产品结构。

3 案例分析

3.1 背景概述

企业在保证卫浴产品基本功能的同时,若能开发出新颖且实用的新品类,将会极大提高企业在行业中的市场份额,提升企业核心竞争力。受本地区相关卫浴合作企业的委托,本文课题组以

该企业目前在售的一款手持花洒(https:∥item.jd.com/100023325172.html)为研究对象,借助专利挖掘技术对产品进行二次创新设计,尽可能降低开发成本,提高产品性能,创造更多卖点。产品结构如图8所示。

1.外保护罩2.面板3.负离子球4.过滤网容器5.手柄上部外罩6.螺纹接口7.麦饭石矿化球8.过滤网容器9.手柄10.软管螺纹接口11.底座12.软管13.密封圈14.过滤网外壳15.电气石陶瓷球16.按钮

3.2 专利数据库与产品元件库的构建

本文选用专利文本作为语料库,通过专利检索網站(https:∥www.patsnap.com/)下载发表于美国专利商标局的花洒专利文本,花洒专利检索式见表5。考虑到美国专利保护最长年限为20年,专利检索范围对申请时间做了约束。通过专利前期清洗过滤,共获取1733件卫浴花洒专利及其全文说明书信息。

专利文本主要包含四部分:摘要、专利概述、附图说明和具体实施方式。通过统计专利文本各部分的内容,专利文本结构对比见表6。可以看出专利概述内容量较大,包含的产品设计信息较丰富,且文本内容有利于SAO结构的抽取,因此,实验选择专利概述作为信息提取内容。

对专利概述部分文本进行噪声清理,通过正则表达式去除标题、不必要的标点符号等。本文使用python作为文本处理程序语言,使用spacy模块对专利文本进行语义依存句法分析,根据依存关系提取SAO,并以此构建专利数据库。最终获取到1703 016组SAO结构,SAO提取结果见表7。可以看出,主语和宾语主要为元件,谓语主要为元件作用关系,从而验证了通过提取文本中SAO获取产品结构和功能信息的可行性。

为验证本文所提信息抽取方法的准确性,实验选取准确率(precision)、召回率(recall)和F-score三种检验指标,其中TP为被正确预测的正例,TN为被正确预测的反例,FP为被错误预测的正例,FN为被错误预测的反例,计算公式如下:

实验选取2021年1月1日至2022年12月31日的卫浴花洒产品专利文本作为验证数据集,将本文所提SAO提取方法与传统信息抽取算法TF和TF-IDF进行了对比,计算结果如图9所示。显然本文方法在三种检验指标中均明显优于其他信息提取算法。

3.3 目标产品分析与元件约束系数计算

通过对目标产品的结构分析,以产品功能链及其功能载体为基础,以图6所示的功能-元件分析图为依据,构建目标产品结构分析图,其结果如图10所示。根据目标产品分析,构建以目标产品元件为节点、以元件间功能作用为边、以元件间联系频次为边权重的产品复杂网络,如图11所示。

依照目标产品复杂网络,用式(2)计算产品元件的约束性系数,计算结果见表8。约束性系数的主要作用是衡量元件在产品中的重要性程度,元件重要性越高,说明该元件在产品网络中越处于中心地位,从该元件流入或流出到其他元件的能量、物料或信号越多,进行产品创新时改动元件牵扯到的其他元件越多,创新成本越高。由计算结果可知,边缘节点的约束性系数为1,约束性系数越高的节点所受到的约束越小,改动该节点对产品总体结构的调整越小。

3.4 相同构型元件创新推荐

由产品复杂网络和约束性系数,结合元件库检索,对元件及其功能实现做出分析,获得元件功能替换方案。由表8中复杂网络约束性系数可知,在base、ball、nozzle以及button等元件位置入手产生的创新成本较低。以button为例,在功能不变的情况下进行功能载体创新,通过元件库检索,得到功能载体button的创新方法,见表9。功能载体创新在原有功能载体上,通过专利数据构建的元件库中查找相关元件进行替换,该方法仅对具有相同功能的元件进行检索和替换,适合对已有产品进行调整,扩展产品型号,提高产品在市场中的占有率。

3.5 相似功能元件創新推荐

关于相似功能载体推荐,使用专利文本语料库、窗口为15、上下文词量为5、训练模式为CBOW训练的Word2Vec词向量模型生成元件的近似替换方案。将每个专利词条的文本转换为一行文本,并对语料库进行噪声清理、去除标点符号等;以python作为编程语言,利用Gensim模块对专利文本语料库进行训练,具体训练过程如图4所示。实验环境如下:(Intel(R)Xeon(R)Gold 5218R CPU @ 2.10GHz)×2,64.00 GB内存,Windows 10 64位操作系统。最终得到Word2Vec词向量模型,以此模型为基础,计算词语间语义相似性。

由于过滤装置是花洒产品比较流行的功能载体,故本文以过滤功能载体为案例开展产品创新设计研究。首先,根据式(3)计算元件语义相似性,得到以“filter”为关键字的相似性词语排名,再筛选出元件描述词语,最终得到与“filter”功能相似的推荐方案,其语义相似性计算结果见表10“语义相似性”列。语义相似性描述的是词语在上下文语境中的相似性,在专利文本中,元件所处的上下文通常为元件的材料特性描述,通过语义相似性计算能够获取元件描述的相似性。但以词语所处上下文为判断依据的Word2Vec并不能描述元件之间的作用方式,因此,以元件SAO相似性更有利于判断元件功能相似性。借由式(6)和表8计算推荐元件的功能相似性,计算结果见表10“功能相似性”列。

对推荐元件语义相似性和功能相似性做出判断后,检索专利语料库中推荐元件出现频次,并依据式(7)获得元件的新颖性指标,计算结果见表10“V值”列。最后,由式(8)以及上述指标的计算结果,得出“filter”功能的相似推荐推荐指数,见表10“推荐指数”列。其中,基于word2vec计算的“porous”为形容词,不具有功能相似性计算结果,因此推荐指数计算结果只包含语义相似性和V值的平均值。

为形象化展示表10中获取到的推荐方案,其推荐结果和案例见表11。其中,方案1为“filter”功能的元件“cartridge”,为墨盒式过滤器,见其图示;方案2为混合式过滤器,其内部为混合类型过滤材质;方案3为多孔式过滤器,可将其配置于花洒头部;方案4为臭氧型过滤器,能够氧化分解一些大分子有机物;方案5为药物过滤器,能够在水流中加入药物,辅助皮肤类疾病的治疗。可以看出基于SAO方法可提供丰富且新颖的功能推荐方案。

3.6 功能载体组合/拆分创新方案

对产品复杂网络及其元件进行功能分析时发现,有些功能需要多种功能载体实现,即元件间通过功能组合生成功能链,功能载体之间以空间、能量、物料以及信号进行功能传递。例如过滤功能,需要过滤网、过滤容器以及过滤球三种元件组合共同完成。然而,在工业设计时,可以将多个载体有机结合,形成功能一体化的功能载体,即复合型元件,不仅可以简化元件的加工、装配等工艺,还能降低成本。为方便起见,本文将此方法称为载体组合法。参考载体组合法的思想,对实现过滤功能的载体进行合成,寻找能够容纳过滤材料且实现过滤水体功能的元件。

首先以图6为参考,对于上述需要组合及拆分的功能载体,将handle、filter以及ball所承担的功能摘取出来进行分析,创建目标产品功能链模型,如图12所示。通过图12中功能链模型,将目标产品中的功能进行优化,合并重叠功能,然后依据图7创建产品功能组合矩阵,见表12。

以表12中“handle-shape filter”为例,参考美国专利US6537455中的方案,将过滤部件和手柄结合为一体。以“special material filter housing”为例,参考US2015/0076254A1中的方案,采用特殊材料制作过滤套筒;以“special material filter”为例,可以参考US9878921中的方案,采用特殊材料制作过滤元件。具体参考结果见表13。由于功能拆分与功能组合互为逆过程,故不再赘述。通过该功能组合矩阵,在保证功能实现的同时实现了结构优化。

4 结论

(1)利用词性标注提取专利文本中的结构及其功能短语信息,借助依存算法获取不同短语对象的层级关系信息,两项相结合以构建SAO组合单元,通过构建设计知识数据库,为产品创新设计提供灵感来源。

(2)通过目标产品结构分析构建目标产品复杂网络,利用结构洞算法计算产品元件约束性系数,进而探测创新目标元件,同时利用Word2Vec训练专利文本获取目标元件语义相似性,进而获取目标元件相似的其他对象。

(3)考虑实际需求,分别从增加产品种类、专利侵权规避以及功能配置优化三个方面借助内容推荐、协同过滤以及功能拆解合并三种策略实现专利数据驱动产品创新设计。

本研究仍然存在不足之处:首先,受制于专利文本存在大量的噪声,本文所提知识提取方法的效率有待进一步提升;其次,由于专利从申请到公开存在时间差,导致市场分析存在一定的滞后性,故有必要借助其他数据进行联合研究;此外,专利数据除了文本还有部分图像信息,这些信息对产品创新设计也具有一定研究价值,本文未开展相应的挖掘研究;最后,根据新颖性及市场价值,产品设计分为原始创新、改进创新及集成创新,鉴于专利的特点,本文主要聚焦于改进创新及部分集成创新,尚未涉及原始创新。未来将考虑改善数据利用效率,开展多数据融合产品创新的研究,同时研究如何实现数据驱动原始创新,以更高的研发效率满足消费者更多的个性化需求[43]。

参考文献:

[1] 路甬祥. 论创新设计[M]. 北京:中国科学技术出版社, 2017.

LU Yongxiang. On Innovative Design[M]. Beijing:Science and Technology of China Press, 2017.

[2] 肖人彬, 林文广. 数据驱动的产品创新设计研究[J]. 机械设计, 2019, 36(12):1-9.

XIAO Renbin, LIN Wenguang. Research on Data-Driven Product Innovation Design[J]. Journal of Machine Design, 2019, 36(12):1-9.

[3] LIN W G, LIU X D, XIAO R B. Data-driven Product Functional Configuration:Patent Data and Hypergraph[J]. Chinese Journal of Mechanical Engineering, 2022, 35(4):108-124.

[4] 肖人彬, 林文广, 赖荣燊, 等. 数据驱动的产品大规模个性化设计研究[J]. 机械设计, 2021, 38(10):1-14.

XIAO Renbin, LIN Wenguang, LAI Rongshen, et al. Research on the Data-driven Product Design for Mass Personalization[J]. Journal of Machine Design, 2020, 38(10):1-14.

[5] 王朝霞, 邱清盈, 冯培恩, 等. 机械产品专利技术方案信息抽取方法[J]. 机械工程学报, 2009, 45(10):198-206.

WANG Zhaoxia, QIU Qingying, FENG Peien, et al. Information Extraction Method of Technical Solution from Mechanical Product Patent[J]. Journal of Mechanical Engineering, 2009, 45(10):198-206.

[6] 吴扬东, 张太华, 刘丹, 等. 复杂产品设计方案的数据驱动多属性优化决策[J]. 中国机械工程, 2020, 31(7):865-870.

WU Yangdong, ZHANG Taihua, LIU Dan, et al. Data-driven Multi-attribute Optimization Decision-making for Complex Product Design Schemes[J]. China Mechanical Engineering, 2020, 31(7):865-870.

[7] 陈亮, 窦昊, 魏煌, 等. 基于质量功能展开、发明问题解决理论和仿生学的产品创新设计[J]. 中国机械工程, 2020, 31(11):1285-1295.

CHEN Liang, DOU Hao, WEI Huang, et al. Product Innovation Design Based on QFD, TRIZ and Bionics[J]. China Mechanical Engineering, 2020, 31(11):1285-1295.

[8] 劉江南, 姜光, 卢伟健, 等. TRIZ工具集用于驱动产品创新及生态设计方法研究[J]. 机械工程学报, 2016, 52(5):12-21.

LIU Jiangnan, JIANG Guang, LU Weijian, et al. Driving Innovative and Ecological Design of Product Development by Utilizing TRIZ Tools[J]. Journal of Mechanical Engineering, 2016, 52(5):12-21.

[9] 林文广, 赖荣燊, 肖人彬. 基于复杂网络的专利数据驱动的产品创新设计[J]. 中国机械工程, 2020, 31(7):842-852.

LIN Wenguang, LAI Rongshen, XIAO Renbin. Patent Data-driven Product Innovative Design Based on Complex Network[J]. China Mechanical Engineering, 2020, 31(7):842-852.

[10] 梁艷红, 檀润华, 马建红. 面向产品创新设计的专利文本分类研究[J]. 计算机集成制造系统, 2013, 19(2):382-390.

LIANG Yanhong, TAN Runhua, MA Jianhong. Study on Patent Text Classification for Product Innovative Design[J]. Computer Integrated Manufacturing Systems, 2013, 19(2):382-390.

[11] 邱清盈, 冀瑜, 冯培恩. 基于国际专利分类表知识社团发现和重组的功能创新策略[J]. 机械工程学报, 2016, 52(23):43-49.

QIU Qingying, JI Yu, FENG Peien. Functional Innovation Strategies Based on IPC Knowledge Community Detection and Reorganization[J]. Journal of Mechanical Engineering, 2016, 52(23):43-49.

[12] 李少波, 吴正, 杨观赐, 等. 基于类比设计的专利知识挖掘算法[J]. 计算机集成制造系统, 2017, 23(11):2344-2352.

LI Shaobo, WU Zheng, YANG Guanci, et al. Patent Mining Algorithm Based on Analogy Design[J]. Computer Integrated Manufacturing Systems, 2017, 23(11):2344-2352.

[13] 陈志泊, 李钰曼, 许福, 等. 基于TextRank和簇过滤的林业文本关键信息抽取研究[J]. 农业机械学报, 2020, 51(5):207-214.

CHEN Zhibo, LI Yuman, XU Fu, et al. Key Information Extraction of Forestry Text Based on Text Rank and Clusters Filtering[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(5):207-214.

[14] DUFLOU J R, VERHAEGEN P A. Systematic Innovation Through Patent Based Product Aspect Analysis[J]. CIRP Annals, 2011, 60(1):203-206.

[15] PARK S, JUN S. Technological Cognitive Diagnosis Model for Patent Keyword Analysis[J]. ICT Express, 2020, 6(1):57-61.

[16] CHEN L, XU S, ZHU L, et al. A Deep Learning Based Method for Extracting Semantic Information from Patent Documents[J]. Scientometrics, 2020, 125(1):289-312.

[17] CHOETKIERTIKUL M, DAM H K, TRAN T, et al. Automatically Recommending Components for Issue Reports Using Deep Learning[J]. Empirical Software Engineering, 2021, 26(2):1-39.

[18] YOON J, JEONG B, KIM M, et al. An Information Entropy and Latent Dirichlet Allocation Approach to Noise Patent Filtering[J]. Advanced Engineering Informatics, 2021, 47:101243.

[19] ZHANG Y, ZHANG G, CHEN H, et al. Topic Analysis and Forecasting for Science, Technology and Innovation:Methodology with a Case Study Focusing on Big Data Research[J]. Technological Forecasting and Social Change, 2016, 105:179-191.

[20] 曹国忠, 杨雯丹, 刘新星. 基于主体-行为-客体(SAO)三元结构的专利分析方法研究综述[J]. 科技管理研究, 2021, 41(4):158-167.

CAO Guozhong, YANG Wendan, LIU Xinxing. Review of Patent Analysis Methods Based on Subject-action-object Ternary Structure[J]. Science and Technology Management Research, 2021, 41(4):158-167.

[21] HE C, LI Z, WANG S, et al. A Systematic Data-mining-based Methodology for Product Family Design and Product Configuration[J]. Advanced Engineering Informatics, 2021, 48:101302.

[22] HAN X, ZHU D, WANG X, et al. Technology Opportunity Analysis:Combining SAO Networks and Link Prediction[J]. IEEE Transactions on Engineering Management, 2021, 68(5):1288-1298.

[23] FENG Y, ZHAO Y, ZHENG H, et al. Data-driven Product Design toward Intelligent Manufacturing:a Review[J]. International Journal of Advanced Robotic Systems, 2020, 17(2):1-18.

[24] 吳颖文, 纪杨建, 顾新建. 基于专利动态复杂网络的产业共性技术预测[J]. 计算机集成制造系统, 2020, 26(12):3185-3194.

WU Yingwen, JI Yangjian, GU Xinjian. Industrial Generic Technology Prediction Based on Dynamic Complex Network of Patents[J]. Computer Integrated Manufacturing Systems, 2020, 26(12):3185-3194.

[25] LI H, YUAN J, TAN R, et al. Design around Bundle Patent Portfolio Based on Technological Evolution[J]. Chinese Journal of Mechanical Engineering, 2019, 32(1). 86-98.

[26] WANG X, REN H, CHEN Y, et al. Measuring Patent Similarity with SAO Semantic Analysis[J]. Scientometrics, 2019, 121:1-23.

[27] HUANG Z, GUO X, LIU Y, et al. A Smart Conflict Resolution Model Using Multi-layer Knowledge Graph for Conceptual Design[J]. Advanced Engineering Informatics, 2023, 55:101887.

[28] OH M, JANG H, KIM S, et al. Main Path Analysis for Technological Development Using SAO Structure and DEMATEL Based on Keyword Causality[J]. Scientometrics, 2023, 1(1):1-26.

[29] LI D, LEI Z L, SONG B Y, et al. Neural Attentional Relation Extraction with Dual Dependency Trees[J]. Journal of Computer Science and Technology, 2022, 37(6):1369-1381.

[30] CHENG K F, YUE Y A, SONG Z W. Sentiment Classification Based on Part-of-speech and Self-attention Mechanism[J]. IEEE Access, 2020, 8:16387-16396.

[31] LU J H, WEN G H, LU R Q, et al. Networked Knowledge and Complex Networks:an Engineering View[J]. IEEE-CAA Journal of Automatica Sinica, 2022, 9(8):1366-1383.

[32] BURT R S. Structural Holes[M]. Cambridge:Harvard University Press, 1995.

[33] LIN W G, LIU X D, XIAO R B. Research on Product Core Component Acquisition Based on Patent Semantic Network[J]. Entropy, 2022, 24(4):549-569.

[34] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient Estimation of Word Representations in Vector Space[EB/OL]. https:∥arxiv. org/pdf/1301. 3781. pdf.

[35] BAEK J W, CHUNG K Y. Multimedia Recommendation Using Word2Vec-based Social Relationship Mining[J]. Multimedia Tools and Applications, 2021, 80(26):34499-34515.

[36] SRENSEN T. A Method of Establishing Groups of Equal Amplitude in Plant Sociology Based on Similarity of Species and Its Application to Analyses of the Vegetation on Danish Commons[J]. Kongelige Danske Videnskabernes Selskab, 1948, 5(4):1-34.

[37] MAMMOLA S. Assessing Similarity of N-dimensional Hypervolumes:Which Metric to Use?[J]. Journal of Biogeography, 2019, 46(9):2012-2023.

[38] ZHAN Y Z, TAN K H, JI G, et al. A Big Data Framework for Facilitating Product Innovation Processes[J]. Business Process Management Journal, 2017, 23(3):518-536.

[39] HE C, LI Z, WANG S, et al. A Systematic Data-mining-based Methodology for Product Family Design and Product Configuration[J]. Advanced Engineering Informatics, 2021, 48:101302.

[40] 黃震华, 张佳雯, 张波, 等. 语义推荐算法研究综述[J]. 电子学报, 2016, 44(9):2262-2275.

HUANG Zhenhua, ZHANG Jiawen, ZHANG Bo, et al. Survey of Semantics-based Recommendation Algorithms[J]. Acta Electronica Sinica, 2016, 44(9):2262-2275.

[41] VITELLI V, SORENSEN O, CRISPINO M, et al. Probabilistic Preference Learning with the Mallows Rank Model[J]. Journal of Machine Learning Research, 2018, 18:1-49.

[42] RENIERS G, SORENSEN K, DULLAERT W. A Multi-attribute Systemic Risk Index for Comparing and Prioritizing Chemical Industrial Areas[J]. Reliability Engineering & System Safety, 2012, 98(1):35-42.

[43] 肖人彬, 赖荣燊, 李仁旺. 从大规模定制化设计到大规模个性化设计[J]. 南昌工程学院学报, 2021, 40(1):1-12.

XIAO Renbin, LAI Rongshen, LI Renwang. From Design for Mass Customization to Design for Mass Personalization[J]. Journal of Nanchang Institute of Technology, 2021, 40(1):1-12.

猜你喜欢

相似性元件语义
一类上三角算子矩阵的相似性与酉相似性
浅析当代中西方绘画的相似性
语言与语义
低渗透黏土中氯离子弥散作用离心模拟相似性
“上”与“下”语义的不对称性及其认知阐释
QFN元件的返工指南
在新兴产业看小元件如何发挥大作用
宝马i3高电压元件介绍(上)
认知范畴模糊与语义模糊
Cu4簇合物“元件组装”合成及其结构与电催化作用