基于专利SAO 链的技术预见方法研究
——以工业机器人领域为例
2020-05-29赖朝安侯延行文雄辉
赖朝安,侯延行,文雄辉
(华南理工大学工商管理学院,广东广州 510640)
1 研究背景
当今,国家的发展越来越依赖于技术的创新,分析预测战略性新兴产业发展的轨迹,寻找最具发展潜力的技术领域,已经成为各国政府及企业关注的核心问题。科学地对技术进行预见分析可有效解决这一问题,技术预见的范围包括系统地研究未来科技的发展及其与经济、社会发展的关系,并基于此识别出具有高价值的研究领域,找出潜在的技术机遇,并提前做好准备和规划[1]。
技术预见方法在很大程度上决定着技术预见结果的可靠性和目标实现的可行性,当前主要的技术预见方法可以归纳为定性分析和定量分析两种。其中,定性方法以专家经验为基础,主要有德尔菲法、头脑风暴法、专家咨询法、同行评议法、情景分析法等。定性分析方法在国内外的多次技术预见活动中被使用[2-3],但该方法过度依赖专家的知识和经验,具有很强的主观性,导致预见结果的可靠性不高[4]。基于定量分析的方法主要有基于引文的文献计量法,基于趋势分析法、生长曲线法、层次分析法的数学建模以及专利分析。其中文献计量法以文献整体作为研究对象,忽略掉了技术细节的更新迭代,且存在一定的时滞性,模型分析法由于依赖数学研究,往往只能挖掘出宏观层面的规律,两者对于企业的研发方向难以起到具体的指导作用。专利中囊括了全世界90%~95%的最新科技信息,基于专利的分析是当下开展技术预见研究的重要方法,该方法目前有基于专利数据的统计分析和基于专利文本的价值挖掘两大方向[5],前者本质属于文献计量学的研究领域,存在传统文献计量学研究颗粒度较粗的弊端,而后者则属于新兴的数据挖掘领域,可以对文本展开多维度的分析以获取深层次的信息,随着各项技术分支的不断细化和深入,针对专利文本挖掘的研究受到越来越多的重视。专利的文本特征表示是挖掘分析的基础,关键词(keywordbased analysis,KWA)和SAO(Subject -Action -Object)是常用的表示元素[6-7]。关键词分析法是将专利文本作为一个词袋来处理,由于关键词通常是名词或名词词组,使得词与词之间的关联关系无法得到体现,使用SAO 的方法可以将专利文本以主语-谓语-宾语的结构表示,能够融入更多的语义信息,但是本质上利用的还是碎片化信息,忽略了专利所承载技术的层次性和整体结构[8-11]。因此,本文在已有SAO 方法的基础上考虑了SAO 之间的关联性,将专利文本的技术内容和技术层次融合,以SAO 链的形式表达,并以此作为分析的出发点,结合社会网络学及TRIZ 相关理论展开技术预见研究。
图1 基于SAO 链的技术预见方法框架
2 方法框架及SAO 链的构建规则
本文的分析框架如图1 所示,首先通过专利平台检索下载专利,构建相关领域的专利库,接着借助自然语言处理理论提取SAO 结构并存储,然后通过SAO 连接规则将离散的SAO 连接成链并基于此计算专利技术方案的相似性,接着综合专利的IPC 相似度后获得专利的总相似度,最后结合社会网络学的理论产出可视化图谱,并将图谱中蕴含的信息归纳整理,生成技术路径图、技术预见等结论。
其中,对于专利文本的表达模型是该方法的核心部分,主要涉及SAO 结构的提取和连接。SAO 理论发展多年,已经形成Knowledgist、AlchemyAPI、和Stanford Parser 等多款自然语言处理工具,可以快速地抽取文本中的SAO 结构。而对于SAO 关联分析的研究近些年刚刚兴起,目前仍处于起步阶段,就已有研究来看都是针对小样本通过人工阅读的方法搭建SAO 链,在处理大量数据时效率较低[12-14]。基于此本文针对SAO 链做了系统的研究,提出系列规则以实现链条的自动搭建,并首次将专利文本以SAO 链进行特征表示,从技术方案的层次和内容两个角度计算相似度,使专利相似度的衡量方法更加合理,保证了技术预见方法的有效性。
2.1 SAO 的语义分类
SAO 语义分析有助于理解技术系统的结构及功能[15],根据所包含的语义信息特征对SAO 结构进行分类是进行深层次文本分析的基础。本文通过研究S、A、O 三个部分的结构特征将SAO 结构分为主题T、方案S、功能F 和效果E 四类,如表1 所示。其中,T 类SAO 结构是专利文本对要保护的发明特征最直接简明的表述,一般使用一种特殊的表达形式出现在摘要的首句,本文研究的SAO 链全部以该类作为开端;方案S 类SAO 结构是对专利所陈述的技术主题的拓展性描述,主要包括对新技术元素的结构性描述或过程描述;功能F 类SAO 结构表示的是产品/部件/材料/技术要素间的功能性关系,方案S 和功能F 描述是专利文本摘要部分的主体内容,这两类SAO 结构通常成对出现,因为阐明一种创新活动产生的技术元素时,首先需要说明这是什么(方案S),另外还需要表明这样安排的用处(功能F);效果E 类SAO 结构表示的是发展创新活动的最终目的,是需要增加或减少的技术属性。
表1 SAO 语义分类表
2.2 SAO 链的识别和构建
图2 三种基本的SAO 链式结构类型
专利文本可以看作是多个SAO 结构的集合体,两个SAO 首先连接成上图所示的三类基本链式结构,然后多个链式结构再按照同样的规则连接,最终形成错综复杂的二维网状结构。为了降低无关SAO 噪音对结果的影响,本文构建的SAO 链仅使用包含专利核心内容的SAO 结构,即主题T、方案S 和功能F 类SAO。构建SAO 链需要分析两条SAO 结构相似时的层次关系,具技术形态结构研究[14]指出S/S,O/O,S/O 之间相似时可以根据A 的特征确定S 和O之间的层次关系,A 的类别分为包含和包含于两种。本文提出的SAO 链涉及“S/S”“O/O”“S/O”3 种连接形式,同时A 类型组合共有“A1 包含/A2 包含”“A1 包含/A2 包含于”“A1 包含于/A2 包含”“A1包含于/A2 包含于”4 种,则每一个SAO 结构的S和O 之间共存在12 种可能的层次关系。为了减少关系类别以降低复杂度,本文通过修正SAO 结构将被动关系转换成主动关系,即将表示“包含于”的S 类SAO 结构转化为表示“包含”的S 类SAO 结构。在研究过程中发现,S 类SAO 结构中的谓语A除了表示“包含”“包含于”这类“部分和整体”的关系,还有表示非部分和整体关系的SAO 结构,比如“control unit - connect to - online system”中的S和O 表示的是一种在层级上平等的空间关系,此类SAO 在链条上搜寻到相似的SAO 结构时,如果是形成S/S,O/O 结构,应归入与之相似的SAO 结构的同级层次中;如果是形成S/O 这类基本的链式结构,则代表两个SAO 结构之间存在某种逻辑关系,则归入链上与之相似的SAO 结构的下级层次中。最终的规则见表2,每一种基本的链式结构代表一种层级关系,构建时按照类型1、类型2 和类型3 的顺序识别SAO 的层级,然后借鉴词汇链[16-17]的构建思路连接成为SAO 链。
表2 SAO 链中层级关系识别规则
表2(续)
表3 专利US8761987 文本信息表
为了方便后续的计算,本文在构建SAO 链的过程中为SAO 赋予身份标志信息,表示为()(u ,):
(1)u 表示当前链式结构最新一层中正在搜索链接对象的SAO 的编号;
(2)v 表示当前通过相似度计算新加入链式结构中的SAO 的编号;
(3)x 表示当前新加入链式结构中的SAO 被划入的层级数;
(4)y 表示当前新加入链式结构中的SAO 所属的语义类型;
以表3 专利为例抽取SAO 结构并绘制SAO 链,如图3 所示,图中的箭头代表T 类SAO 结构,实线连接代表S 类SAO 结构,虚线连接代表F 类SAO 结构,身份标识信息前的序号为识别次序。
图3 专利US8761987 的SAO 链式结构
2.3 SAO 链的相似度计算
将专利文本以SAO 链进行特征表示后,可以综合技术链的内容和层次两个角度进行专利文本相似度计算。其中,内容部分的相似度依据传统SAO 相似度的计算方法,即比较两个文档SAO 中相似的词汇个数,然后基于此衡量文本的总相似度。层级相似度本文使用变量µ 表示,处于i 和j 层的两个SAO 的层级相似度计算如式(1)所示:
较只考虑SAO 内容的传统相似度计算方法,考虑链条层级可以有效利用技术的结构信息,提高准确度。例如同样内容的SAO 结构“servo motor - drive - manipulator”,出现在第一层表示一篇专利要描述的是关于“servo motor”如何驱动“manipulator”的创新方案,而在最后一层往往仅表示该专利使用到了“servo motor”来驱动“manipulator”,只是对已有技术元素的应用而已,两者的技术内涵在本质上是不同的,使用µ可以衡量出此差异性。
3 实证研究
工业机器人是智能制造装备产业的重要分支,可以衡量出一个国家科技创新及高端制造业发展的水平,是制造转型的核心产业,也是国家战略产业之一。选取此领域进行技术预见分析,可以指引相关企业针对关键技术和潜在机遇战略性地侧重研发,对于实现我国“制造强国”的目标具有重大意义。
3.1 数据获取
本文通过Innography 专利分析平台检索并下载 专 利,检 索 式 为:@(title ,abstract, claims, body) (( “industr* robot*”~1)or( “industr* manipulat*”~1)) @(title ,abstract, claims) ( “robot*”or “manipulat*”) @* (inno_utility_patent) @* (inno_patent_grant),检索日期为2019 年2 月20 日,同族专利去重检索出17 811 条专利,剔除专利强度为1 的低质量专利后剩余5 018 条,清洗摘要缺失的专利后,最终得到5 002 条专利数据作为后续分析的语料库。
3.2 SAO 链的构建及专利相似度计算
获取专利后,本文使用JAVA 编程语言调用Stanford Parser 自然语言工具提取SAO 结构,初步得到45 028 条有效的SAO 结构。依据表1 的分类规则对SAO 进行清洗及分类,最终共得到5 002 条T 类SAO,25 644 条方案S 类SAO,14 027 条功能F 类SAO 以及5 357 条效果E 类SAO。然后依据表2 的识别规则进行SAO 链的构建,链式结构的输出结果是一张身份标签信息表,代表的是每一个SAO 结构在整个链式结构中的层次信息,如表4 所示。从表中可以看出专利c1 共有12 条SAO 结构,构建的链式结构共有5 层。
表4 链式结构结果输出表(部分)
将专利链式结构的层次信息结合SAO 词汇信息可计算出专利SAO 链的相似度。首先依据式(1)进行层次相似度计算,然后使用java 的开源项目JWS,基于2.1 版本的WordNet 词典结合层次相似度计算出文本相似度。
IPC 分类号能反映专利的应用领域信息,属于同一应用领域的专利拥有相同的编号,反应了专利宏观层面上的相似性。因此,本文在计算出文本相似度的基础上,结合IPC 相似度衡量出专利的总相似度,在计算时本文赋予两类相似度同样的权重,其中IPC 相似度通过依次对比两个专利IPC 的部、大类、小类、大组和小组等信息求得,最终获得5 002 ×5 002 的相似性矩阵,专利网络图和地图的绘制将基于此矩阵进行。
3.3 基于专利网络的分析
专利申请的年分布如图4 所示,由于专利从申请到最后的授权公布一般需要18 个月,所以2018年和2019 年的专利数据未体现在图中。
图4 工业机器人专利的年申请量趋势图
根据数量变化特征本文将工业机器人技术发展历程分为三个阶段:(1)婴儿期的概念提出阶段(1954—1987 年)。20 世纪30 年代,开始出现机器人这个概念。1954 年美国人乔治德沃尔申请了全球第一份工业机器人专利,提供了一种可编程关节式转移物料装置,该阶段属于技术的萌芽期,市场规模较小。20 世纪70 年代后期,许多欧美日公司开始了工业机器人专利全球布局。(2)婴儿期的热潮消退阶段(1987—2005 年)。该阶段发明专利的数量呈逐年下降的趋势,热潮消退的原因主要有缺乏统一的行业标准,跨行业合作壁垒未打破和重要生产工艺技术形成专利垄断导致技术受限,产品价值与大众需求存在错位等。(3)成长期的快速发展阶段(2006 至今)。进入这一阶段的标志及动力是相关人工智能、机器学习等技术有所突破及各国对工业机器人产业发展的政策支持力度纷纷加大。比如在“工业转型升级规划(2011—2015 年)”中,我国政府明确了智能制造装备的发展方向,包括加快发展焊接、搬运、装配等工业机器人。
使用 Ucinet 分析工具,对三个时期的工业机器人专利数据分别绘制专利网络。通过计算各阶段各节点在专利网络中的中心度来识别各个阶段的核心专利,某节点的中心度即指与该专利相连的其他专利的数量,数量越多表示该节点的重要性越高,其在图中呈现的形状也就越大。
图5 生命周期不同阶段的工业机器人技术专利网络图
通过对上图专利网络中核心专利的分析,结合 TRIZ 进化理论得出工业机器人技术的发展路径如图6 所示。
图6 工业机器人技术发展路径
在传感技术方面,体现了提高自动化和智能化程度的进化法则。传感器的类别从最初的力、距离、等传感器发展到光电传感器、视觉单元等多类别的传感器。随着传感器类别不断丰富,工业机器人所具有的感知能力也越来越接近甚至超过人类的感知系统,机器视觉技术是其中最突出的感知技术。当前的发展趋势是多传感器融合形成工业机器人智能感知系统,其研究热点在于有效可行的多传感器融合算法,将多传感器获取的内部及外部环境信息进行有效的整合并加以应用。随着智能感知技术的进一步发展,传感技术的发展将结合增加集成度再进行简化的法则,多传感器融合增加了感知系统的复杂性,这时就需要通过组合具有相近功能的传感单元进行部分简化,或通过应用自然现象或“智能”物替代原来的传感系统进行整体简化。
在网络通讯技术方面,体现了动态性和可控性进化法则、提高理想度法则和向微观级及场的应用进化法则。早期的电缆通讯、光纤通讯等有线通信方式逐渐发展成无线通信方式,在此过程中又细分出远场通信和近场通讯,后者主要包括WIFI、Bluetooth、RFID、Zigbee 等。从有线通信到无线通信这一过程,无形的场代替了有形的电线,通信的范围不再受限于线路布局,通信效率和通信质量得到了极大的提升。同时通讯网络覆盖面在不断地扩大,越来越多的对象能够实现互联互通,系统的可控性得到有效增加。网络化依然是未来的主流趋势,处理越来越多的数据量需要对信息传输、储存方式进行优化,往云端迁移会成为主流的解决方案。
在控制技术方面,体现了增加集成度再进行简化法则、动态性和可控进化法则、提高理想度法则、减少人工介入进化法则、子系统协调性进化法则。控制技术的发展脉络大致可分为程序控制阶段,适应性控制阶段和当前的智能控制阶段,在此过程中控制系统的整体结构也经历了集中式、主从式和分布式三个阶段。在早期的程序控制阶段,主要以示教再现控制技术为主,随着传感器的使用和内外部感知系统的不断丰富,以伺服控制为代表的具有反馈功能的适应性控制方式得以实现,在这一过程中逐渐发展出柔性控制、安全控制、同步控制、远程控制等多使用场景的控制技术,现阶段以模糊控制、最优控制、神经网络控制等为代表的智能控制是发展机器人技术的终极目标之一,这将会是未来很长一段时间的重点研究方向。
在工业机器人作业模式方面,体现了减少人工介入进化法则,动态性和可控性进化法则。早期单个的工业机械手需要人工示教和协助完成工艺流程,随着技术的发展,衍生出协作多机器人系统和工作站作业模式,机器人之间能够通过协作独立地完成一系列工序。自动化生产线则是能够自动完成完整工艺流程的机器群,柔性制造系统在自动化生产线的基础上实现了混合生产的功能,增加了系统的灵活性和适应性,再到发展到现在以智能仓储和智慧工厂为代表的智能作业模式。而在现阶段,由于智能化水平的限制,智能作业模式的实现还无法完全依赖工业机器人,一些高智能的行为还需要人的辅助,所以人机协作的工作模式依然存在。根据动态性和可控性进化法则以及小批量定制生产模式的发展趋势,对非专用系统的完全集成方法的探索和实现将会是重点研究方向之一。
在编程技术方面,体现了减少人工介入的进化法则,提高理想度法则。传统在线示教编程技术通常由操作人员通过示教盒控制机械手进行操作,后来逐渐被离线编程和半自动化编程技术所取代,现阶段基于感知系统的自主编程技术则实现了不需要人参与的自主编程功能,控制器根据传感器反馈信息自动完成轨迹规划,并生成计算机执行程序,自主编程技术是未来的主流编程技术,也是实现智能化的关键技术。今后的发展中,自主编程技术会重点关注如何高效地将感知系统反馈过来的多种信息自动转换成可执行的控制程序。
在交互技术方面,交互设备的发展体现了提高理想度法则和增加集成度再进行简化法则,从早期的示教盒、普通显示屏到现在的智能终端,交互设备从原来的系统中分离出来,既简化了原来的工业机器人系统,又能够实现更人性化的交互场景。在今后的发展中,人机交互将进一步朝着智能、便捷、易于操作和理解的用户友好型方向发展,比如进一步发展通过手势、语言和表情来控制机器人的智能交互技术,此外基于虚拟现实、增强现实技术的远程临场交互将成为重要的研究方向。
在形态结构方面,体现了向微观系统进化法则和提高理想度法则。在形态结构的变化上一个明显的趋势是在满足作业要求的前提下,工业机器人的尺寸越来越小,结构越来越紧凑。由于在众多领域都有着巨大的应用空间,微型机器人将继续朝着超微型机器人方向发展,在超微型化的过程中,核心零部件微控制器、微驱动器、微传感器技术系统的不均衡进化问题是研究的重点。
在移动技术方面,体现了动态性和可控性进化法则。从刚开始导轨移动发展到现在的工业用无人机,工业机器人的可移动性越来越强,随着可移动的范围越来越大,可移动的路径选择越来越多,设备的能耗可能会逐渐提高,移动效率可能会逐渐降低,而设备与设备之间的安全性也会显得更为重要,发展碰撞检测、免碰撞路径规划、最优化路径规划等智能技术将会是解决上述问题的关键,也是未来的研究重点。
3.4 基于专利地图的分析
使用Ucinet工具采用多维尺度法绘制专利地图,如图7 所示,通过专利地图上的技术空位挖掘潜在的技术机遇,本文共识别出5 个有价值的技术空位,基于对空位附近SAO 链及文本的分析可以得出以下技术趋势与机遇。
图7 工业机器人领域专利地图及相关SAO 链
(1)共融工业机器人系统。空位1 专利主要涉及到协作机器人相关技术,包括人机协作、机器人之间的协作以及机器人与环境的信息交互。未来的工业机器人将朝着协作机器人的方向发展,能够与作业环境、操作者和其他机器人之间自然互动,实现人和机器之间、机器与机器之间的协同智能操作,发展人机协作型工业机器人将会是发展机群协同智能型机器人的过渡阶段,能够以较低的成本弥补当前工业机器人智能化水平的不足。协作机器人最核心的两个问题是安全性和可控性,在安全性方面已经实现了安全级监控停止、碰撞检测等安全控制,未来基于虚拟现实和远程操作技术将人和机器进行物理隔离以提高安全性将会是一个主要的发展方向。协作机器人通常集成了机器视觉,并具有六轴以上的自由度,因此控制技术将成为难点,多台协作机器人的联合操控对控制系统与算法的要求将不断提高,这将是发展协作型机器人要解决的问题之一。
(2)硬件模块化、可重构、微型化。空位2 专利主要涉及到模块化机器人、可重构机器人以及微型部件等领域的相关技术。模块化的机器人具有通用性和任务适应能力强两个优点,而且能够有效地降低成本。模块化机器人的升级版是可重构机器人,可重构机器人能够根据具体的任务及工作环境,快速对自身的结构进行调整,从而适用于多种多样的工作环境。可重构机器人使得小批量定制化的生产模式成为可能,特别是对中小企业有着巨大的吸引力。工业机器人硬件还有一个显著的特点就是朝着微型化方向发展,随着电子产品越来越轻薄小巧,对微型机器人的需求也会是一种必然趋势。
(3)软件专用化与通用化。空位3 的专利描述的是工业机器人的软件技术,机器人智力主要体现在软件上,未来工业机器人相关软件将朝着专用化和通用化两个方向发展。专用化方面是指与工艺相关的软件开发,比如点焊接机器人、弧焊机器人从本质上来说就是分别适用于点焊和弧焊工艺的软件产品;通用化方面指的是通用软件平台的开发和实现,目前不同的工业机器人厂商使用的系统及语言各有区别,既限制了工业机器人应用范围又增加了其应用成本,需要通用平台来解决上述问题。未来通用软件平台和专用工艺软件的发展将极大地降低工业机器人的研发门槛,在这样的大背景下,小企业甚至个人都有可能参与到工业机器人相关软件的开发中。
(4)智能感知与智能学习。空位4 的大部分专利提供了与智能感知和智能学习相关的技术方案。机器人的控制和感知系统是核心技术,发展并利用包括临场感技术、虚拟现实技术、放声技术和多传感器融合等技术让工业机器人建立自主判断能力,在不同的环境中自适应工作,是工业机器人发展的主流模式。随着智能工业机器人和工业大数据的发展,未来必将持续提升工业机器人的环境感知能力,增强机器的视觉和预判断能力。随着人工智能的发展,工业机器人将能够通过试错学习、经验分享学习、类比及事例学习等多种方式进行自主学习,成为真正的生产体系主体。未来开发时可综合运用遗传算法、远程监控最优化路径规划等技术,包括参数自整定、抑震算法、转矩波动补偿等控制算法,以增强机器人的自学习能力和智能水平。
(5)云服务工业机器人。空位5 的相关专利都涉及云端与工业机器人融合的技术。随着工业机器人的数据获取、存储和处理越来越多地往云端迁移,未来将进入云服务工业机器人时代。云服务工业机器人是云计算和工业机器人的结合,工业机器人不需要存储全部的信息,也不需要具备计算能力,只需要对云端提出需求,云端进行相应响应并满足,这种信息存取方式能够实现资源共享,减轻工业现场的数据存储和处理负担,而且云端大数据存储与处理系统还能够帮助工业机器人相互学习和知识共享。云服务工业机器人的完全实现,还依赖于远程网络通讯技术和信息安全技术的发展,特别是云端的安全性和云服务的稳定性,这也是未来的一个重要技术发展方向。
4 结论
在科技迅猛发展的时代中,对技术作出正确的预见可以帮助政府和企业针对性地进行战略部署,提高自身竞争力。专利中蕴含了大量的技术资料,以专利为中心构建合理的分析方法可以迅速获取技术情报,把握技术的发展路径及未来的趋势。本文在基于SAO 的传统专利挖掘方法上作出改进,赋予了各个SAO 层级信息,以提高专利相似度计算的准确性。然后将该方法应用到技术预见方法体系中,结合工业机器人领域进行了实证分析,获取到工业机器人在作业模式、控制、编程、传感、通讯、交互、移动和形态结构等8 个领域上的技术路径图,同时结合生成的专利地图和相关的SAO 链识别出了工业机器人未来的5 个发展机遇,为工业机器人相关企业的发展规划和政府人员的政策制定提供了方向,同时也为其他领域的研究人员提供了可参考的研究思路。