APP下载

基于主体-行为-客体(SAO)三元结构的专利分析方法研究综述

2021-04-02曹国忠杨雯丹刘新星

科技管理研究 2021年4期
关键词:分析方法专利结构

曹国忠,杨雯丹,刘新星

(1.河北工业大学机械工程学院,天津 300401;2.国家技术创新方法与实施工具工程技术研究中心,天津 300401;3.肇庆小鹏新能源投资有限公司,广东肇庆 526060)

1 专利分析概述

专利的技术信息具有新颖性、创造性和实用性的特点,且专利的表述专业、内容详尽、格式规范,是开展技术分析和技术管理的重要技术资料。从专利中挖掘技术信息并予以有效管理和解读,对专利的分析和利用具有重要意义。专利分析通常可分为结构化数据分析和非结构化数据分析。典型的专利结构化数据包括申请日、发明人、IPC 分类号、引用量和被引用量等,通过分析该类数据可获知专利的价值、技术/产品的发展路径和技术/产品的成熟度等[1-3]。专利的非结构化数据通常指专利的标题、摘要和说明书中的文本信息,分析该类数据所展示的技术信息是对结构化数据分析结果的有效补充[4]。近年来,专利对于企业的作用逐渐从保护知识产权扩展为技术信息的管理和应用[5],因此,专利的非结构化数据分析越来越受到学者们的重视。

专利的非结构化数据分析也称为专利文本分析。由于专利的标题和摘要是专利全文的概括性表述,早期的专利文本分析主要集中于标题和摘要,此后随着研究成果的应用推广,人们要求专利分析应当做到更全面、更深入和更准确,因此专利文本分析的研究范围逐渐向权利要求书和说明书延伸。依托文本挖掘和自然语言处理技术的发展,专利文本分析的研究对象也逐渐由关键字向语义倾斜[6]。目前,专利文本分析已被广泛应用于人力资源管理、专利侵权判定、专利新颖性判定、技术机会识别和技术信息管理等。

基于主体-行为-客体,即Subject-Action-Object(SAO)三元结构的专利分析方法,是一种随着专利语义分析需求而兴起的专利分析工具,它不但能提取专利文本中的关键概念,辅助构建专利知识管理系统,还能更有效地挖掘专利知识用以辅助创新设计。近年来,人工智能方法和可视化工具的发展更是促进了基于SAO 结构的专利分析方法的发展和应用,基于SAO 结构的专利分析方法在知识获取、科学研究等领域有着广阔的应用前景[7-8]。本研究通过选取和分析中国知网(CNKI)和美国科学网(Web of Science)数据库平台中基于SAO 结构的专利分析方法的研究成果,总结了SAO 结构研究的主要内容和基于SAO 结构的专利分析流程,讨论了基于SAO 结构的专利分析方法提高传统专利分析方法全面性、深入性和准确性的主要研究成果,并对SAO 结构分析方法在专利情报分析、创新设计、专利知识管理系统和企业管理领域的应用进行了阐述,以期为如何应用基于SAO 结构的专利分析方法更好地服务于知识获取和科学研究提供帮助。

2 SAO 结构研究

Subject-Action-Object(SAO)结构是从文本语料库中提取的三元组。其中,主体(Subject)S 元素和客体(Object)O 元素是名词,行为(Action)A 元素是这些名词的动作或表示它们之间的关系。SAO 结构研究的主要内容包括以下4 个方面:

一是对S 元素或O 元素的分析,即实体分析。例如,计算S 元素或O 元素在文本中出现的频率,用来识别核心技术组件[9]。

二是对A 元素的分析,即关系分析。例如,通过表示系统组成类的动词(如:有、包含等),可辅助构建产品形态结构[10];通过表示系统属性类的动词(如:测量、分解等),可获取特定问题的解决方案[11]。

三是将SAO 结构作为一个整体分析其语义信息,即文本语义信息分析。例如,将S 元素和O 元素视为作用对象和被作用对象,则A 元素代表了S 元素的功能[12];将SA 组合视为产品的功能,则O 元素代表了产品功能的效应[12];将AO 组合视为问题,则S 元素代表了解决该问题的方案[13]。

四是研究不同SAO 结构之间的关系。例如,构建SAO 结构网络,使用社会网络分析技术分析领域中的通用技术、核心技术、新颖技术和技术成熟度等[14]。

3 基于SAO 结构的专利分析流程

基于SAO 结构的专利分析是指从专利文本中获取和研究SAO 结构的过程,其通用流程如图1 所示,包括数据预处理、SAO 结构提取、SAO 结构后处理和图表解释4 个主要步骤。

(1)数据预处理,包括将专利文本拆分为句子、将句子拆分为词语(处理英文文本时不含该步骤)、将词语词干化(具体为将名词的复数形式、动词的过去式、过去分词等转化为原形,但处理中文文本是不含该步骤)、标记词性等自然语言处理步骤,以及基于统计学原理的数据清洗步骤。

(2)SAO 结构提取,主要通过基于符号的方法或基于统计的方法实现。基于符号的 SAO 结构提取方法通常包含元素识别和关系构建两个步骤[15]。其中,关系构建的任务是识别和抽取元素对之间的关系,是最核心、最具有挑战的部分[16]。另一种基于统计的SAO 结构提取方法是指,使用统计模型或机器学习算法学习语言规则,进而匹配词法、语法、语义等特征来提取SAO 结构[7]。目前,学者们多使 用Link Grammar、StanfordNLP、OpenNRE、Jieba等开源自然语言处理工具半自动化提取SAO 结构,或使用Goldfire Innovator、VantagePoint 等专利分析工具自动提取。为了提高SAO 结构在后续分析任务中的可用性,学者们也常将自动化方法、基于符号和基于统计的方法相结合[16]。

(3)SAO 结构后处理,主要是指对SAO 结构进行分类研究,以及绘制基于SAO 结构的专利图表。该步骤依据专利分析的最终目的开展。

(4)图表解释,即是从上一步构建的专利图表中获取知识的过程。

图1 基于SAO 结构的专利分析通用流程

4 基于SAO 结构的专利分析方法研究现状

首先,自然语言处理技术在专利分析中的应用改善了过去需要大量专家参与且费时费力的缺点,基于SAO 结构的专利分析方法作为一种自然语言处理技术与专利分析方法的融合产物,得到了学者们的广泛关注。近年来,机器学习算法的推广,更是提高了基于SAO 结构的专利分析方法处理大型语料库的能力;此外,基于SAO 结构的专利分析方法不但关注文本中的主谓宾结构,还能研究复杂句式中的定状补表等特殊成分[17-19]。因此,基于SAO 结构的专利分析方法相较于传统专利分析方法,不再受到数据量的限制,在研究内容上也能覆盖更多的文本信息,即提高了专利分析的全面性。其次,由于专利分析逐渐由线性向网络化转变,部分学者开展了专利网络的研究[20]。传统专利网络多以专利文献或专利权利人为节点,以文献间的引用关系或作者合作关系为连接;SAO 结构的引入,使专利网络的研究对象深入为文本的语义结构,为研究专利的隐性知识提供了一种新的思路。因此,基于SAO结构的专利分析方法相较于传统专利分析方法,能够解读更加深刻的关系,即提高了专利分析的深入性。第三,专利分析不但需要全面、深入地认识和把握专利中的技术信息,还需要准确获取和理解专利中的知识。相较于基于关键字的专利分析方法,基于SAO 结构的专利分析方法从句法关系角度研究专利信息,解读的是关键字之间的语义关系;另外,基于SAO 结构的专利分析方法不但能提取到专利中的技术主题、技术应用领域、技术功能、技术功能达到的效果以及为达到效果可采用的方案等技术信息,还能解读不同类别技术信息之间的内在关联性。因此,基于SAO 结构的专利分析方法相较于传统专利分析方法,能获取专利信息中的核心概念,能解读核心概念之间的逻辑,即提高了专利分析的准确性。表1 所示为基于SAO 结构的专利分析方法提高传统专利分析方法全面性、深入性和准确性的主要研究成果。

表1 基于SAO 结构的专利分析方法主要研究成果

表1 (续)

4.1 提高专利分析方法的全面性

随着对专利分析方法全面性要求的提升,许多文献的研究对象已由过去的专利标题和摘要扩展为专利权利要求书和说明书。基于SAO 结构的专利分析方法的出现,为提高专利分析方法的全面性提供了一个新的研究方向,即,从研究专利文本中的句法结构扩大到研究词的覆盖范围。例如,温亮等[17]使用基于SAO 结构的专利分析方法研究了复杂句式中状语位置的名词语块,主要采用句子主干提取规则和复杂名词语块分解规则相结合的方式提取一个句子中的多个SAO 结构,具体步骤为:先使用句子主干提取规则提取一个句子中的主要A 元素,然后将句子中的状语作为新的简单句,再使用复杂名词语块分解规则分析介词性名词语块、动词性名词语块和连词性名词语块,并提取SAO 结构。Kim 等[18]提出了一种SAOx 方法来提高专利分析方法的全面性,该方法提取了复杂句式中宾语位置的SAO 结构,同时还从复杂句式中“for”和“to”引导的短语中提取了SAO 结构。苗红等[19]提出使用技术-关系-技术(TRT)结构分析方法与基于SAO 结构的专利分析方法相结合来提高专利分析方法的全面性,其中TRT 结构中的TR 组合相当于SAO 结构中的S 元素,TRT 结构中的T 元素相当于SAO 结构中的AO组合,TRT 结构通过Python 开发的NP-PP(名词短语-介词短语)模块获取。苗红等[19]提出的方法中,TRT 结构分析方法与基于SAO 结构的专利分析方法互为补充,进一步补充了专利分析的词覆盖范围。

4.2 提高专利分析方法的深入性

专利网络作为一种专利分析工具,由于引入了社会网络分析技术,能将专利关系进行量化处理,得到了学者们的广泛关注。SAO 结构的引入,使专利网络的研究对象能够深入为专利文本中的语义结构,据此构建的专利SAO 结构网络能从网络结构、节点位置和节点关系三方面研究更深层次的专利隐性知识,依托社会网络分析技术的量化指标能解读更加深刻的关系,进而增加了专利分析方法的深入性。一种常见的专利SAO 结构网络构建和分析流程如下:(1)获取专利文本中的S 元素、A 元素和O元素;(2)将S 元素和O 元素作为网络的节点,A元素作为节点的连线,按元素的共现频次绘制SAO结构网络;(3)使用社会网络分析技术分析网络中的节点和连线。例如,Yoon 等[21]使用专利SAO 结构网络的子网络密度(density of sub-networks)研究了专利的分类,其中SAO 结构直观表述了不同专利类别的技术特征;Yoon 等[21]还提出,SAO 结构网络的节点度分布(degree sum index)和全局中心性(global centrality index)可以用来解读专利的技术重要度和技术适用性。Choi 等[22]构建的专利SAO 结构网络是一个加权有向网络,主要用于识别技术趋势,网络中的节点由S 元素、A 元素和O 元素构成,节点间的连线由SAO 结构中的S 元素指向A 元素、指向O 元素,权重为直接指向在专利中出现的次数,认为在该网络中:入度高的O 元素是极有可能成为对各个领域均有用的技术,或是某项技术绩效的重要指标;出度高的S 元素是相关领域的一项通用技术;具有高密度和高群聚系数的SAO 结构是核心技术,或是一种少数研究团队开发的技术;具有高密度和低群聚系数的SAO 结构是一项通用技术;具有低密度和高群聚系数的SAO 结构是一项核心技术,或是一种少数研究团队开发的新颖技术。Yang 等[14]提出了一种基于SAO 结构的专利技术发展成熟度分析方法,使用该方法绘制了一组基于时间切片的专利SAO 结构网络,通过观察网络节点度的概率分布在技术发展时间线上的变化,分析了专利技术发展的成熟度;他们还指出,SAO 结构网络中节点的Burt 约束值(Burt constraint 值),即与更多的节点连接但是与它连接的节点没有直接或相互关联的现象,展示了节点的竞争优势。

4.3 提高专利分析方法的准确性

使用增加专利数据量和扩大专利文本研究词覆盖范围的方法,可以有效避免专利分析中数据稀疏和部分核心内容可能丢失的情况,但同时也会带来数据冗余的问题。为了提高SAO 结构在后续专利分析任务中的可用性,进而提高专利分析的准确性,学者们主要从优化SAO 结构提取方法和分类研究SAO 结构两个方面开展研究。

4.3.1 优化SAO 结构提取方法

基于SAO 结构的专利分析方法相较于基于关键字的专利分析方法,还能够获取句法结构中的关系,而关键字和关键字间的句法关系又构成了文本的语义信息,因此,SAO 结构提取方法的性能成为了影响专利分析准确性的关键因素之一。

SAO 结构提取方法可分为基于符号的方法和基于统计的方法。在基于符号的SAO 结构提取方法方面,许琦等[23]提出使用专利结构化数据分析方法与基于符号的SAO 结构提取方法相结合的方式来提取SAO 结构,具体步骤为:(1)构建专利的引证网络,并依据引证路径的连接统计值(search path link count,SPLC)和节点对统计值(search path node pair,SPNP)提取领域知识进化轨迹;(2)使用Link Grammar 语法分析器从领域知识进化轨迹上的专利中提取SAO 结构。使用优化的SAO 结构提取方法提取的SAO 结构具有稳定性、统摄性、遗传性和变异性的特征,是有效的领域知识基因。另外,依存句法分析(dependency parsing)由于主要研究句子中词语之间的依存关系,能准确识别主谓宾、定状补等句子成分,得到了学者们的重视[24-25]。借助依存句法关系,可利用句法分析器自动标注词间关系,进而设定SAO 结构的提取规则。

在基于统计的SAO 结构提取方法方面,使用机器学习算法将文本信息做分类处理是一种最典型的做法,其中,机器学习算法与特征的选择是影响SAO 结构提取性能的主要因素。例如,饶齐等[26]使用一种有指导的支持向量机(SVM)的机器学习算法,依据实体距离特征和句法树特征提取了中文专利中的SAO 结构,实验证明,引入距离特征和简单的上下文词法特征能有效提高SAO 结构中关系提取的准确性;何宇等[27]基于以上特征又加入了关系词距核心关系词的距离、SAO 结构强度和关系词词典等特征,提取了中文专利中的SAO 结构,实验证明,优化特征后SAO 结构提取方法在正确率、召回率和F 值上都优于饶齐等[26]提出的方法。张永真等[28]则是使用了预测准确率高、速度较快、性能较好的XGBoost算法来优化关系提取方法的性能。近年来,面向自然语言处理的预训练模型发展迅猛,且有效地提高了关系抽取任务挖掘出更多非线性语义特征的能力[16]。由此可知,深度学习的方法在基于SAO 结构的专利分析方法上的应用,将为提高专利分析的篇章理解能力提供新的思路。

4.3.2 分类研究SAO 结构

优化SAO 结构的提取方法属于提高SAO 结构在下游任务中可用性的前置优化方法,分类研究SAO结构则属于其后置优化方法。优化SAO 结构的提取方法能有效提高关键字及其关系提取的准确性,进而提高专利分析的准确性;而分类研究SAO 结构的方法则是从提高待解读SAO 结构对下游特定任务和目标的针对性来提高专利分析的准确性。例如,Choi 等[29]使用分类研究SAO 结构的方法构建了一种由产品、技术和功能3 个维度构成的技术树,将从专利中提取的S 元素和O 元素分为产品、技术、材料和技术特4 类,AO 组合分为组成、效果和属性3 类;相较于传统的技术树,使用该方法构建的技术树包含了更丰富、更详细也更准确的技术信息,对于后续设计决策更具指导性。Vicente-Gomila 等[30]使用语义技术创新方法(TRIZ)和基于SAO 结构的专利分析方法相结合的方式,将专利中的技术信息分为了“what”“who”“where”“why”和“how”等5 类;这样的分类同时考虑了技术与其周围元素的关系,使专利分析的结果更具逻辑性。段庆峰等[31]为了能构建一种表达更准确技术信息的专利技术功效图,将从专利中提取的SAO 结构依据其逻辑关系分为问题、功能、效果和方案4 类。Yang 等[9]为了识别具有巨大市场潜力的核心技术组件,开展了SAO 结构的分类研究,将包含“增加”“稳定”“质量”等元素的SAO 结构定义为“与需求具有高度相关性的SAO 结构”,据此提取的待解读SAO 结构对于后续设计任务来说具有更强的指导性。

5 基于SAO 结构的专利分析方法应用领域

在当前数据驱动发展的形势下,为决策者提供数据支持是专利分析的重要职责。基于SAO 结构的专利分析的主要应用领域包括专利情报分析、创新设计、专利知识管理系统和企业管理,其研究成果的应用领域分布如图2 所示。

5.1 在专利情报分析中的应用

专利情报分析的结果主要应用于跟踪科学研究领域的发展变化和预测前沿科学研究[8]。SAO 结构的引入,为传统的基于非结构化数据或基于关键词的专利情报分析补充了语义信息,能展示更详细、更深入的技术信息。专利地图,包括技术功效图、技术路线图、二维分布地图和SAO 结构网络等,是专利情报分析的主要分析模型。基于SAO 结构的专利分析在专利情报分析中的主要应用场景即是构建专利地图。

例如,段庆峰等[31]提出的基于SAO 结构的专利分析方法主要用于构建技术功效图,并由此得到石墨烯传感器领域发展现状和当前研究热点。由于SAO 结构的引入,技术和功效之间的语义关系更易于理解和表达,因此能够快速地从大量专利数据中抽取、分析和凝练出构建技术功效图所需的专利核心技术信息。之后,翟东升等[25]对技术功效图的构建方法进行了改进,并分析了无人驾驶汽车领域毫米波雷达技术的发展现状和当前研究热点。Wang等[32]提出的基于SAO 结构的专利分析方法主要用于构建技术路线图,并通过分析使用该方法构建的染料敏化太阳能电池领域技术路线图,揭示了该领域的发展趋势、详细实现途径以及主要研究主体。该方法将专利文本中的技术信息分为技术、产品、材料、影响因素、组件、目标和未来应用方向等7 类,而这7 类技术信息之间的相互作用展示了技术的进化过程和发展方向。Yoon 等[33]和Park 等[34]提出的基于SAO 结构的专利分析方法主要用于构建专利的二维分布地图,主要构建步骤如下:提取专利文本中的SAO 结构;使用SAO 结构的相似性构建专利的相似度矩阵;将相似矩阵做降维处理;绘制专利的二维分布地图。Yoon 等[33]使用基于SAO 结构的专利分析方法构建了与碳纳米管合成技术相关的专利二维分布地图,提出地图中的空白区域预示着可能创造新技术的机会,而专利聚集区域则代表技术发展最具竞争力的领域。另外,部分学者将专利情报分析的研究对象设定为一组基于时间切片的二维分析地图,而基于SAO 结构的专利分析方法则主要用于构建这样一组二维分布地图,例如,使用这一方法,吴菲菲等[35]构建了一组与石墨烯传感器技术相关的专利二维分布地图,由此识别了该技术在不同时间区间内的应用领域,分析了该技术的跨领域转移现象;王京安等[36]构建了一组与液晶材料技术相关的专利二维分布地图,展示了该技术的发展进程和跨领域转移现象;李欣等[37]则是构建了一组钙钛矿太阳能电池领域的专利二维分布图,展示了该领域的发展脉络并识别了领域内的新兴技术。Yoon 等[21]提出的基于SAO 结构的专利分析方法主要用于构建SAO 结构网络,构建了合成碳纳米管领域的专利SAO 结构网络,并通过该网络识别了领域内的高价值专利、领先技术和技术领先企业;Choi等[22]构建了质子交换膜燃料电池领域的专利SAO结构网络,并通过该网络识别了领域内的重要技术主题和趋势、重要发展目标,并进一步分析了领域内的催化剂技术以及识别了该技术中的重要材料;Yang 等[14]构建了石墨烯技术的专利SAO 结构网络,并通过该网络识别了该技术的当前和未来发展重点,及其在整体性能上具有明显优势的重要石墨烯材料,还通过分析一组基于时间切片的SAO 结构网络的分布变化,分析了石墨烯技术的成熟度。

5.2 在创新设计领域的应用

基于SAO 结构的专利分析方法用于辅助创新设计的构想最初由Tsourikov 等[38]提出,并成功实施于Invention Machine 公司开发的计算机辅助创新设计软件Goldfire Innovator 中。该软件提取用户输入问题中的AO 组合,然后将其与软件后台数据库中的专利文本进行匹配,最后返回专利文本中表述为S元素的设计方案给用户。基于SAO 结构的专利分析方法在创新设计领域的主要应用场景包括产品需求、结构和功能分析、技术系统进化分析以及设计概念推送等。

例如,Yang 等[9]提出了一种使用基于SAO 结构的专利分析方法识别产品市场需求的方法,该类市场需求在专利中表述为包含“增加”“稳定”“质量”等元素的SAO 结构。Wang 等[11]使用基于SAO结构的专利分析方法构建了一种新型的产品形态学矩阵,矩阵的横轴由描述产品的零件、部件和组件的组成特征SAO 结构构成,纵轴由描述产品的技术问题的属性特征SAO 结构构成,待研究专利则根据其包含的SAO 结构的种类和数量分布在该矩阵中,矩阵的空白区域代表可产生用于构建产品创新设计的方案。Cascini 等[10]使用基于SAO 结构的专利分析方法构建产品的功能模型,主要构建步骤如下:从专利附图中识别产品的组件,作为S 元素和O 元素;依据专利附图中组件的编号规则,识别S 元素和O 元素的层级关系;根据组件之间的组成关系或功能关系确定A 元素,并绘制产品的功能模型。另外,Cascini 等[10]还提出,可以使用基于SAO 结构的专利分析方法分析产品的组件和功能,用于辅助后续设计任务,如依据从专利文本中识别的S 元素和O元素的共现频次,可分析产品组件的重要性,共现频次越大的组件越重要;还可将专利文本中SAO 结构的共现频次与其SA 组合、AO 组合的共现频次作对比分析,如果SA 组合的共现频次大于SAO 结构的共现频次,表明该专利能达到的效果是“将S 元素所代表的工具的作用进行集成,以降低成本”,而如果AO 组合的共现频次大于SAO 结构的共现频次,则表明该专利能达到的效果是“增强A 元素所代表的动作”。Choi 等[29]使用基于SAO 结构的专利分析方法构建了一种由产品、技术和功能构成的三维技术树,其中:以产品为中心的技术树,展示了组件和组件之间的关系;以技术为中心的技术树,展示了产品所包含的技术和技术之间的关系;以功能为中心的技术树,展示了产品功能与功能之间的关系。这种新型的技术树由于展示了更多的技术信息,故更利于辅助设计决策。Kim 等[12]使用基于SAO 结构的专利分析方法构建了一种新型功能网络(cause-and-effect function network),由SAO 结构中的A 元素和O 元素依据其原因和效果关系连接而成,可将不同领域的技术信息相互连接,若使用由专利技术信息构成该功能网络来编码创新设计软件的后台数据库,用户可使用该软件快速查询功能或效应,辅助创新设计;另外,Kim 等[12]还提出基于SAO 结构的专利分析方法可与TRIZ 工具相结合来指导创新设计,具体做法为:将从与某项技术相关的专利文本中提取的S 元素、O 元素和AO 组合,分别与每条TRIZ 技术进化定律中的名词和该定律中的每一次向前进化的驱动因素(reasons-for-jumps)做匹配,以此判定该技术当前所处的进化状态并识别进化方向,进而辅助创新设计[39]。吴鸿韬等[40]提出将基于SAO 结构的专利分析方法用于为创新设计工程师推送设计概念。该方法通过引入SAO 结构分析方法,以创新设计为目的,从专利分析中获取了更多样的发明知识。其实现步骤为:使用SAO 结构分析方法从设计人员提供的设计原型专利中提取技术问题、用户需求、功能目标、性能目标和实现原理等发明知识;将上一步中提取的发明知识与专利数据库中文本做匹配计算,推送以AO 组合展示的设计概念,用以帮助设计人员明确设计需求;以设计概念为检索条件,从专利数据库中搜索并推送可用于辅助创新设计的专利文献给用户。

5.3 在专利知识管理系统中应用

Invention Machine 公司开发的计算机辅助创新设计软件Knowledgist,是最早的使用了基于SAO 结构的专利分析方法进行知识存储、读取和反馈的知识管理系统,其中基于SAO 结构的专利分析方法主要用来编码专利知识管理系统中的发明知识。专利知识管理系统的主要功能包括专利分类、技术信息挖掘和展示以及发明知识推送等。

例如,胡正银等[13]使用基于SAO 结构的专利分析方法开发了一款主要用于专利分类的专利知识管理系统,能够帮助用户快速发现领域中专利所采用的技术方案、解决的技术问题、实现的技术功能和取得的技术效果等信息,并能够将专利依据以上技术信息进行分类展示。该系统使用SAO 结构进行专利技术信息编码,扩展了传统专利检索系统的索引结构,细化了其检索粒度。之后,胡正银等[41]又基于该方法开发了一款专利技术信息挖掘系统,同样使用SAO 结构编码发明的关键技术知识,主要功能为面向TRIZ 的知识检索和知识的可视化展示。Park 等[42]使用基于SAO 结构的专利分析方法开发了一款名为TechPerceptor 的专利知识管理系统,可以输出基于SAO 结构的专利地图和SAO 结构网络,集成了Kim 等[12]面向情报研究的SAO 结构分析方法的研究成果,包括识别技术趋势、识别重要专利、检测新技术和识别可能的侵权等。Li 等[43]使用基于SAO 结构的专利分析方法开发了一款主要用于发明知识推送的专利知识管理系统,为了使系统能推送更丰富的解决方案给用户,他们提出使用WordNet中的上位词和下位词扩展A 元素和O 元素,这样,系统能够在一个更丰富、更完整的专利集合中进行知识的搜索;此外,Li 等[44]还提出使用WordNet中词与词之间路径的长度计算语义相似度的方法,将存储在系统中的专利技术知识进行有效搜索和排序,进而提高解决方案的推送准确性。

5.4 在企业管理领域的应用

基于SAO 结构的专利分析方法也被应用在了协助企业管理人员进行专利侵权判定、人力资源管理和组织实施战略等企业管理工作。

例如,基于SAO 结构的专利分析方法通过分析专利间SAO 结构的相似性来判断专利的相似度,进而评估专利侵权风险[45]。Park 等[34]依据SAO 结构相似性参数构建了专利群的语义相似度矩阵,并绘制了专利地图,认为该地图中具有较小平均距离(average distance)的专利群被认为是最可能发生侵权的区域;此外,Park 等[46]创造性地将该方法应用于识别专利与产品之间的侵权行为。Moehrle 等[47]主要使用基于SAO 结构的专利分析方法开展了人力资源管理工作,具体来说,他们将专利发明人的技术能力使用SAO 结构来描述,并依此构建了单个发明人的技术能力概要文件;同时,他们提出可以使用计算SAO 结构、AO 结构和S 元素的相似度的方法来识别具有相似技术能力的发明人群体,基于SAO 结构的专利分析方法还能用于为技术战略决策者提供直观指导。Yoon 等[33]使用基于SAO 结构的专利分析方法构建了专利申请人的研发趋势图(R&D trend map),清晰描述竞争对手之间的研发趋势和技术重叠区域,为战略决策者的专利购买、并购和合作等决策提供指导。Park 等[48]使用基于SAO 结构的专利分析方法辅助并购决策,具体做法为:从相关领域企业的专利中识别与并购战略目紧密相关的技术领域;分析以上技术领域中的专利,将这些专利的所属企业按技术水平、内部技术能力和潜在技术协同作用进行分类;依据不同企业,采取不同的并购策略。Wang 等[49]使用基于SAO 结构的专利分析方法识别和选择潜在研发合作伙伴,使用各企业的专利数据,基于S 元素构建了企业技术合作网络(organization correlation map),其中S 元素代表各企业拥有的技术解决方案,网络中的节点为专利的申请人,节点大小表示解决特定问题的方案的数量,节点之间连线的粗细代表企业技术相似性的高低。该网络有效衡量了每个研究目标,即企业,在技术上的相似性,为企业组织实施战略提供了有益指导。

图2 基于SAO 结构的专利分析方法应用领域分布

6 结论

本研究针对国内外基于SAO 结构的专利分析相关研究成果进行了系统的综述,研究发现:

(1)SAO 结构的研究主要包括SAO 结构中3个元素的独立研究、SAO 结构中3 个元素的两两组合研究,以及多个SAO 结构之间的相互关系研究。这些研究丰富了SAO 结构的内涵,为其进一步发展和应用奠定了基础。

(2)基于SAO 结构的专利分析流程主要分为数据预处理、SAO 结构提取、SAO 结构后处理和图表解释4 个阶段。其中,数据预处理主要包括自然语言处理和数据清洗2 个步骤;SAO 结构提取主要包括元素识别和关系构建2 个步骤;SAO 结构后处理主要包括信息筛选和图表构建2 个步骤。

(3)基于SAO 结构的专利分析方法主要从扩大研究词覆盖范围来提高专利分析方法的全面性,从构建和分析SAO 结构网络来提高专利分析方法的深入性,从优化SAO 结构提取方法和分类研究SAO结构来提高专利分析方法的准确性。这些研究展示了基于SAO 结构的专利分析方法的先进性,但其优势仍有进一步提升的空间。

(4)基于SAO 结构的专利分析方法在专利情报分析领域主要用于跟踪科学研究领域的发展变化以及预测前沿科学研究;在创新设计领域的主要应用场景包括产品的需求、结构和功能分析,以及设计概念推送;在专利知识管理系统中的主要作用是专利分类、技术信息挖掘和展示以及发明知识推送;在企业管理领域主要用来帮助企业管理知识产权和组织实施战略。这些研究证实了基于SAO 结构的专利分析方法有着广阔的应用前景。

基于以上系统梳理,本研究认为,未来可以在以下两个方面进一步开展研究:(1)探寻更高效的SAO 结构提取方法。目前,基于机器学习的方法是最具发展前景的工具之一,且自然语言处理更是被视为人工智能“皇冠上的明珠”。因此,未来可通过对本体、资源描述框架(RDF)和语法树等语义资源的研究,降低提取SAO 结构中非分类关系的难度,同时开发专利语料库和领域语料库,用以实现对SAO 结构的精准提取。(2)将基于SAO 结构的专利分析方法应用于更具体的企业技术创新管理实践。由于企业之间的竞争在某种意义上来说就是专利技术的竞争,因此更精准、快速地分析竞争对手专利将成为提升企业市场竞争力的法宝。未来可使用基于SAO 结构的专利分析方法识别市场关键问题和领域颠覆性技术,用于向企业推送具有颠覆市场潜力的突破性创新或破坏性创新机会。

猜你喜欢

分析方法专利结构
基于EMD的MEMS陀螺仪随机漂移分析方法
《形而上学》△卷的结构和位置
建筑工程施工质量控制及分析方法阐述
论结构
中国设立PSSA的可行性及其分析方法
论《日出》的结构
TD-LTE网络覆盖的分析方法研究
创新治理结构促进中小企业持续成长
2007年上半年专利授权状况统计