APP下载

面向转移转化的专利技术组合方法对比研究*

2022-04-28李姝影张丽华刘春江

情报杂志 2022年4期
关键词:专利技术石墨关联

李姝影 张丽华 刘春江 许 轶

(1.中国科学院成都文献情报中心 成都 610041;2.山西财经大学 太原 030006)

0 引 言

当前中国迎来了技术创新流量与存量爆发性增长的黄金时期,科技成果不断涌现,科技创新供给来源更加丰富,但科技成果转移转化存在瓶颈,好的研究成果没有推广到市场上,主要表现在成果价值没有被认可,对经济发展和其他社会效益的贡献不够。按照现在高技术产品或新技术产品中多技术交叉融合的特点和发展趋势来看,单个专利转化的意义不大,专利技术组合更为符合产品市场保护的需求,技术之间有机整合和具有密切关联的专利组合的转化才更有意义。专利作为创新成果的载体之一,要促进以专利为核心的知识产权成果的转移转化,亟需识别高度关联的一组专利技术。由此,一方面,通过判别可组合打包专利技术,帮助科研机构和大学将有价值的专利成果推向市场;另一方面,通过判别技术创新的知识关联与应用方向,帮助企业获得技术创新解决方案。

国内外普遍认为相似性是识别和测度专利组合的基本工具[1],也是聚类的基础判断[2]。结合专利计量分析,绝大多数方法围绕专利文献字段抽取的特征进行相似性组合,聚焦在专利文献之间的相关性[3],目前的大多数研究集中在基于不同相似原理聚类生成更准确、更相关、更互补的专利技术组合,而识别出可打包的专利技术组合仅仅是第一步,要满足转移转化的不同对象的需求,还需要研究与判断哪种相似原理或细粒度的专利组合更适合转移转化。

本文面向转移转化场景,尝试从专利组合相似原理、实际可行性、聚类结果的客观性和稳定性考虑,筛选并对比分析有助于转移转化的专利组合方法。通过对比研究三种方法聚类生成的专利组合包在专利转移转化上各有哪些优势和劣势,这对于构建高价值专利组合、培育专利技术的转化潜力、盘活我国现有的专利存量、帮助产学研创新主体对接匹配,具有重要的研究意义与实用价值。

1 相关研究进展

转移转化背景下的专利组合研究主要切入点包括筛选具有转化潜力的专利、专利组合识别打包、专利组合估值、专利产业化潜力等方向。覆盖的应用场景包括专利推荐以及为高校和研究机构专利分级管理及运营提供支撑;精准构建高质量专利组合和潜在研发合作机会;评估专利许可、产业化潜力和前景;反向挖掘战略布局意图的专利组合结构,实施技术防御和突破技术封锁等。相关研究方法涉及基于共现的社会网络分析方法、文本挖掘、组合指标等,组合运用多种文献计量和文本挖掘方法已成为该领域的主流分析方向。

面向转移转化的专利组合识别方法主要是基于专利特征和技术关联两种思路。一是从特征的角度考虑具有高价值、转移转化潜力的单件/组合专利评价与识别,包括专利权利要求、专利寿命、引文、发明人、诉讼、技术与市场的关联等[4-7]。Zhang等[8]基于加权信息熵和协同过滤方法迭代去掉负面专利,以评估专利技术创新的转化潜力。许轶等[9]从动态发展的角度构建动态和静态相结合的专利技术转移潜力评价指标体系,基于决策树以转让或许可专利的动态特征作为学习对象进行技术转移预测。韩盟等[10]基于可量化专利识别指标,利用贝叶斯理论和组合赋权方法识别高校可转移的专利。二是从技术关联的角度考虑构建共现网络(共类、共词)、引文网络(共被引、引文耦合)、合作网络、文本相似等聚类识别显性或隐性关联的专利技术组合[11-14]。翟东升等[15]提出基于专利组合内专利间存在的技术关联关系,重构专利技术信息的知识表达,开发基于元路径挖掘的专利组合识别算法。李昌等[16]基于筛选后的核心专利集计算专利相似性与互补性的专利强度,结合MCL算法聚类识别潜在专利组合。随着当前专利运营热点应用场景的不断发展,面向转移转化的专利组合估值问题逐步获得关注。翟东升等[17]提出基于实物期权理论评估专利组合价值,在估值过程中采用LSTM时间序列预测、专利组合分析和最小乘蒙特卡洛模拟等方法,以求达到更好的估值效果。

综上所述,目前的研究改进主要体现在基于不同相似原理关联组合和指标评估上,主要面临的挑战:由于聚类打包或评价体系的分析结果与实际转移转化利用的因果关系不明,结果验证存在困难;潜在专利组合关系仅以专利相似性或互补性来衡量不够全面,很难保证识别结果的全面性和客观性[16]。未来的研究将进一步丰富和拓展应用场景,但在方法的选择和评估效果上将更加细化和注重实效。

本文认为面向转移转化的专利技术组合方法的研究对象是已具有或潜在具有技术关联的专利组合进行转化潜力的评估,以便为后续专利运营活动提供决策支持。本文将尝试将组合打包的分析效果与实际转移转化数据进行对比,以期分析揭示哪种相似原理或细粒度的专利组合更适合转移转化,以便为进一步方法探索提供启示。

2 基于转移转化的三种专利组合识别方法

专利成果转移转化过程中,高校、研究机构的专利技术成果无法满足产业应用的需求,真正实现产业化的科技成果较少,供需双方之间的信息存在明显的不对称,致使专利转化的“信息鸿沟”越来越大,有必要利用专利情报分析支撑供需双方的信息沟通和技术对接。通过分析高校、研究机构和企业在专利成果转移转化过程中不同驱动机制和转化需求,研究筛选了三种专利技术组合来帮助供需双方快速获取有效信息,减少信息不对称,实现以市场为导向、需求为导向的科技成果转化。

图1所示,从高校和研究机构出发,以盘活现有专利存量为目标(回顾性),关心的是对现有专利打包,向产业界推荐具有应用价值的专利技术成果,因此,技术组合A需求是面向产业层面应用方向相似的专利组合。从企业出发,以技术创新或产品研发为目标(前瞻性),关心的是谁拥有相似技术,找到具备技术研发实力的高校和研究机构开展合作,因此,技术组合B需求是面向技术层面研发方向相似的专利。

图1 面向转移转化的专利技术组合

因此,根据转移转化对专利技术组合的要求,本文选择三种专利技术组合识别方法(见图2),在产业层面上的行业应用方向的关联、在技术层面上的技术引用关联以及研发层面的要素关联,分别基于专利共类分析、引文耦合分析以及主题词共现分析识别关联性的专利组合。基于两年后实际发生转移转化的专利数据进行对比分析,从转移转化主题覆盖范围和预测效果两个方面来分析判断哪种相似原理或细粒度的专利组合更适合转移转化。

行业应用方向相似的专利组合方法采用专利共类分析[18],原理是将归属于同一技术类别的专利视为相似[19],例如使用分类向量之间的余弦衡量专利相似性[20],或将共现的技术分类向量映射到相似性矩阵中形成专利集合[21]。为了更好地关联专利活动和经济效益,促进专利与产业的对接,本研究选择了国家知识产权局制定的《国际专利分类与国民经济行业分类参照表(2018)》,它的优势在于制定时间较新,建立了专利与国民经济行业的映射关系,为专利的行业分类提供直接对照。基本思路:单件专利(P1-P5)涉及一个或多个IPC分类号(A-H),例如P1属于A和B类;国民经济行业包含若干IPC分类号,例如TF1包括了A、B、C个分类,通过IPC分类号作为中介关联构建国民经济行业共现网络,从而判别产业应用主题。基本步骤如下:第1步,导入原始数据,进行数据预处理;第2步,读取excel,包含行(专利公开号)和列(国民经济行业分类);第3步,利用数据透视表,获得专利公开号与国民经济行业二维矩阵;第4步,导入Ucinet可视化。

图2 三种专利组合识别方法及对比分析

技术引用相似的专利组合方法采用专利引文耦合分析,原理是引用了同一专利的若干专利视为相似[22],引文耦合通常被认为是若干发明人共同关注的相似技术,或揭示前沿技术热点[23]。选择引文耦合分析的主要原因在于引文耦合在揭示专利间的相似性方面更具优势[24],主要表现在引用耦合时效性更强、聚类更稳定,这更适合本研究的需求。基本思路:首先,使用自编Python程序建立主题领域内所有专利之间的引文耦合矩阵;其次,将专利引文耦合矩阵文件导入VosViewer中进行聚类与可视化,生成可视化图谱。具体计算步骤:第1步读取Excel数据文件;第2步,读取Excel文件中的单个工作簿:全记录;第3步,将“全记录“工作簿中的两列:“公开号”以及“参考文献-专利”放在一个dict中,也就是说为每一篇专利都构建一个dict;第4步,获取不同专利之间的耦合强度,构建所有专利对之间的耦合元组(a,b,2),并将所有元组放入list中;第5步,构建专利耦合强度patent_citation_network.txt文件;第6步,将patent_citation_network.txt文件导入vosviewer文件生成可视化图谱。

研发要素相似的专利组合方法采用主题词共现分析,原理是将专利的特征词向量(研发要素)作为测度专利技术相似度的基础[25],通过计算向量间的欧式距离得到专利相似度[26-27]。基本思路:为了便于专利组合的解读和简化数据清洗工作,鉴于基于核心专利集聚类生成的技术主题覆盖率较大,且不会因阈值选择损失低频技术特征词[28],选择基于核心专利集抽取和清洗技术特征词,构建专利与技术特征词多值矩阵,权重以TF-IDF为准,基于欧式距离计算专利之间的相似度。基本步骤如下:第1步,基于Ha等[31]专利引文强度指标筛选核心专利集;第2步,利用Derwent Data Analyzer抽取核心专利集的标题、摘要以及技术要点中有意义的词或词组,进行文本预处理、数据清洗;第3步,构建核心专利-技术特征词矩阵,权重为TF-IDF得分;第4步,利用Ucinet的二模网络转换为一模网络,利用层次聚类算法基于欧式距离将核心专利进行技术分支的聚类;第5步,导入Ucinet可视化。

3 实证研究

本文基于德温特世界专利创新索引(Derwent Innovation Index,简称DII)构造检索式(见表1)获取石墨烯在生物医药领域的应用领域900件专利全数据集T2017(检索日期:2017年6月7日)。因需对比T0+i时间的专利组合转移转化情况,故采用检索式回溯获取3123件专利全数据集(检索日期:2019年6月7日),其中181件专利发生转移转化(含权属转移、许可备案),作为对比分析的对照专利集合T2019。

表1 石墨烯在生物医药领域应用检索式

3.1三种专利组合识别结果

3.1.1 行业应用方向相似:专利共类分析 按照方法步骤构建T2017专利-国民经济行业共现网络,石墨烯生物医药领域的专利主要分布在C27医药、C28化学纤维、C26化学原料和化学制品等相关制造行业上,具有较高的度数中心度,位居网络的中心,密度较高。根据Vosviewer聚类识别出关联的节点数量大于等于3,共聚类生成了28个类别,Top10产业应用主题见表2。以该类别中最大的国民经济行业为主、结合相关国民经济行业综合命名,石墨烯生物医药领域主要的产业应用专利组合包主要集中在T1医药制造业、T2仪器仪表制造业、T3化学纤维制造业、T4化学原料和化学制品制造业、T5专用设备制造业、T6纺织与服装业。

表2 石墨烯生物医药领域产业应用主题Top10(节点数量≥3)

3.1.2 技术引用相似:专利引文耦合分析 按照方法步骤使用自编Python程序构建石墨烯生物医药领域的专利引文耦合矩阵,将专利引文耦合矩阵文件导入VosViewer中进行聚类与可视化,共包括164个节点(代表专利),808条连线(代表专利之间的耦合关系),根据Vosviewer聚类识别出关联的节点数量大于等于4(见表3),经过人工判读专利,石墨烯生物医药领域基于技术引用的专利组合包集中在T1造影剂制备、T2防腐涂料制备、T3多功能石墨烯复合材料、T4用于制造石墨烯的铜箔、T5 PET/PTT合金制备、T6纤维素复合材料、T7医用石墨烯、T8氧化石墨烯/纳米复合材料、T9石墨烯药物载体/荧光、T10骨填充物。

表3 石墨烯生物医药领域的技术承接主题(节点数量≥4)

续表3 石墨烯生物医药领域的技术承接主题(节点数量≥4)

3.1.3 研发要素相似:主题词共现分析 按照方法步骤首先利用编程计算专利引用强度指标V(P),分别取β间接引用的参数权重0、0.3、0.5、0.7、1,计算Top100的专利引用强度指标V(P)在不同的引用权重下的值,5种不同情形取并集获得119项核心专利集清单。根据专利引用率大于申请同年专利引用最大标准差,最终获得了86项。构建核心专利-技术特征词矩阵,利用Ucinet的二模网络转换为一模网络,利用层次聚类算法基于欧式距离将核心专利进行技术分支的聚类,导入Ucinet可视化。石墨烯生物医药领域基于主题词共现的专利组合包包括T1癌症检测治疗、T2聚合衍生物(生物医学)、T3空气净化、T4红外设备、T5抗菌材料、T6光致变色化合物、T7石墨烯复合材料(医用)、T8石墨烯制备材料、T9石墨烯氧化物、T10聚合物复合材料(医疗器械)、T11纳米结构、T12介入诊断设备、T13合成纤维复合材料制备、T14骨组织修复治疗、T15生物传感器、T16药物载体系统、T17人造膜、T18脑植入冷却装置、T19超声设备、T20石墨烯增强型合金(医用)、T21石墨烯搅拌系统、T22造影剂、T23柔性聚合物导体、T24功能性表面覆盖物、T25紫外线吸收材料、T26石墨烯衍生物合成,具体如表4所示。

表4 石墨烯生物医药领域的研发要素主题

3.2两年后发生转移转化专利技术组合包

3.2.1 产业应用组合包 基于两年后发生转移转化的专利技术组合对比数据集3,构建T2019产业应用组合包与发生转移转化专利共现二模网络(见图3),研究发现,通过专利共类方法识别的28个关联组合,其中:22个在两年后发生了转移转化,占比78.6%;主要集中在T5专用设备制造业、T2仪器仪表制造业和T4化学原料和化学制品制造业;6个专利组合包未发生转移转化,占比21.4%;3件专利未能纳入组合包中。

图3 两年后发生转移转化的产业应用组合

3.2.2 技术承接组合包 基于两年后发生转移转化的专利技术组合对比数据集3,构建T2019技术承接组合包与发生转移转化专利共现二模网络(见图4),研究发现,通过专利引文耦合方法识别的12个关联组合,其中:12个均在两年后发生了转移转化;主要集中在T3石墨烯纳米复合材料,T10医用石墨烯涂层、骨组织修复材料、碳膜等,T11可植入导体以及T6石墨烯/细菌纤维素复合材料的制备;但43件专利未纳入组合包中。

图4 两年后发生转移转化的技术承接组合

3.2.3 研发要素组合包 基于两年后发生转移转化的专利技术组合对比数据集3,构建T2019研发要素组合包与发生转移转化专利共现二模网络(见图5),研究发现,通过专利文本主题词方法识别的26个关联组合,其中:25个在两年后发生了转移转化,占比96.2%;主要集中在T11纳米结构、T5抗菌材料、T24功能性表面覆盖物、T23柔性聚合物导体、T9石墨烯氧化物以及T13合成纤维复合材料制备;1个专利组合包未发生转移转化,占比3.8%;27件专利未能纳入组合包中。

图5 两年后发生转移转化的研发要素组合

3.3专利组合转移转化对比分析根据转移转化对专利技术组合的要求,选择三种专利技术组合识别方法进行实证分析,分别基于专利共类分析、引文耦合分析及主题词共现分析来识别关联性的专利组合。通过与两年后实际发生转移转化的专利数据进行对比分析,分析与判断哪种相似原理或细粒度的专利组合更适合转移转化(见表5)。

表5T2017识别的组合包与T2019发生转移转化的组合包对比

实证分析数据显示:

a.基于专利共类方法识别的产业应用组合包对于发生转移转化专利的覆盖面最广,更适合面向研究机构/高校的回顾性专利打包,而发生转移转化的组合包预测情况可以达到78.6%,具有一定的转化可能;

b.基于专利引文耦合的技术承接组合包虽然在发生转移转化的预测上非常精准,但其覆盖的专利数量最少,很可能会遗漏前沿性的专利技术组合,但是有助于企业精准性地追溯相关技术,开展技术对接。

c.基于专利主题词共现的研发要素组合包细粒度较高,在发生转移转化的预测上较为精准,也能覆盖大部分的专利,更适合面向企业的前瞻性技术对接和技术问题的解决,能够更多且有效地识别潜在的合作对象,提供更多的技术机会选择。

4 总结与讨论

面向转移转化的专利技术组合方法对比研究尝试提出了两个需要讨论的问题:一是探讨了专利技术组合的转移转化场景,即从高校和研究机构出发,以盘活现有专利存量为目标(回顾性),技术组合的需求是面向产业层面应用方向相似的专利组合;从企业出发,以技术创新或产品研发为目标(前瞻性),技术组合的需求是面向技术层面研发方向相似的专利。二是基于专利组合相似原理、实际可行性、聚类结果的客观性和稳定性考虑,筛选并对比分析哪种相似原理或细粒度的专利组合更适合转移转化。

其次,从方法实证角度,面向转移转化需求选取3种关联作为对比对象:产业层面上的行业应用方向相似、技术层面上的技术引用相似以及研发层面的要素相似,分别基于专利共类分析、引文耦合分析及主题词共现分析方法来识别。通过对比研究三种方法聚类生成的专利组合包在两年后专利实际转化情况,分析三种关联组合的优势和劣势。

研究发现,基于专利共类方法识别的产业应用组合包更适合面向研究机构/高校的回顾性专利打包,基于专利引文耦合的技术承接组合包在发生转移转化的预测上非常精准,更适合企业精准性开展技术对接,基于专利主题词共现的研发要素组合包细粒度较高,在发生转移转化的预测上较为精准,也能覆盖大部分的专利,更适合面向企业的前瞻性技术对接和技术问题的解决。三种方法都可以有效地用于识别潜在的合作对象,为技术转移转化提供更多的技术机会选择。

猜你喜欢

专利技术石墨关联
防爆电机专利技术发展综述
石墨系升温球的实践与应用
全新充电专利技术实现车队充电
修饰还原氧化石墨烯的味觉传感器的制备应用
石墨烯桑蚕丝变身传感器
“电力杀手”——石墨炸弹
“一带一路”递进,关联民生更紧
低压差线性稳压器专利技术综述
奇趣搭配
智趣