APP下载

专利信息系统的多维度对比分析研究

2024-01-17赵婷婷

江苏科技信息 2023年34期
关键词:信息系统检索语义

赵婷婷

(南京航空航天大学 图书馆,江苏 南京 210016)

0 引言

2021年9月22日,中共中央、国务院印发了《知识产权强国建设纲要(2021—2035年)》,对我国未来15年知识产权发展前景提出了总目标、描绘了新景象,知识产权作为国家发展战略性资源和国际竞争力核心要素的作用更加凸显。专利作为知识产权最重要的组成部分,是衡量一个国家、地区技术创新能力和经济竞争实力的重要情报源,如何对其进行高效、准确地获取、分析,辅助政府部门、科研机构、高新企业进行专利战略决策、指导技术研发和分析市场态势布局,是情报机构开展情报分析的重要发展方向。专利情报的检索和分析离不开专利信息系统的支持,当前国内外专利信息系统种类众多、功能各异,了解各专利系统的功能,选择适合的系统,是开展专利情报工作的前提。

为了解我国关于专利信息系统的研究现状,笔者以主题为“专利”“系统”“比较”在中国知网上进行检索(截至2023年3月),获得2010—2023年相关论文共计12篇,其中有7篇均未提及Innovation、PatentSight和incoPat专利信息系统[1-7],其余的5篇中,刘玉琴等[8]从数据处理、文本挖掘与可视化分析等角度对包括 Innovation在内的26种国内外专利分析工具进行了对比研究;康婧等[9]从专利检索、专利分析和专利评估对包括Innovation和incoPat在内的5个专利信息系统进行功能比较;王玉婷等[10]从专利数据收录范围、加工方式、清洗程度以及引文数据、同族数据和法律状态数据方面对包括Innovation在内的五大专利数据库进行对比;赵旭等[11]对Innovation在内的四大专利分析软件的功能进行概述及综合比较;谢智敏等[12]介绍了incoPat在内的3个专利价值评估工具的评价模型。综合分析上述文献可见,已有文献对一些专利信息系统进行了研究,也有了相关的研究成果。但是,对DI(Derwent Innovation)、PatentSight和incoPat这3个专利系统进行对比分析,特别是对PatentSight系统的相关研究和结论还较少。基于此,本文拟选取Derwent Innovation德温特创新平台、PatentSight专利大数据检索分析平台和incoPat科技创新情报平台三大专利信息系统,从宏观和微观两个维度进行对比研究,为国内专利情报研究人员选择专利信息系统提供更多参考,同时给系统研发人员提出功能完善建议。

1 三大专利信息系统宏观对比研究

1.1 三大专利信息系统概况

1.1.1 Derwent Innovation德温特创新平台

Derwent Innovation德温特创新平台,简称DI,是科睿唯安(Clarivate Analytics)公司提供的专利检索和分析工具,收录来自全球156个国家和地区超过11 000万件标准化专利数据,75个国家/地区的专利全文数据,以及德温特世界专利索引(DWPI)、德温特专利引文索引(DPCI)等专利信息深加工的数据。

1.1.2 PatentSight专利大数据检索分析平台

PatentSight专利大数据检索分析平台,是LexisNexis(律商联讯)旗下的新一代专利智能分析平台,集专利检索、评价、分析功能于一体,共包含116个国家/地区的专利数据、56个国家/地区的全文数据,配备不同语言(中、日、俄、德、英等)技能的专业团队对数据进行质量规范和专利权人梳理,同时对各个国家4 000多种法律状态代码进行标引注释,确保专利法律状态的准确和实时更新。

1.1.3 incoPat科技创新情报平台

incoPat科技创新情报平台是北京合享智慧科技有限公司开发的,是将全球发明深度整合并翻译为中文的专利信息平台,也是拥有自主知识产权的专利数据库。incoPat涵盖了全球162个国家/组织/地区超过1.7亿件专利数据,集成了专利检索、分析、数据下载、文件管理和用户管理等多个功能模块。

1.2 三大专利信息系统收录范围

本文从专利数据覆盖的时间范围、地域范围以及检索语言来比较3个专利信息系统的收录范围(见表1)。

表1 DI、PatentSight、incoPat收录范围对比

2 三大专利信息系统微观对比研究

本文基于专利分析流程,在对3个专利信息系统的功能进行调研后,从检索功能、专利分析和专利评估3个微观面对上述系统进行具体对比分析。

2.1 检索功能

专利检索是根据一项或多项专利特征,从大量专利文献或专利数据库中挑选出某一特定要求的专利文献或信息的过程[13],全面准确的检索结果是后续各种研究分析、结论获得的基础。

2.1.1 检索方式

目前,各个专利信息系统都提供多样化的检索方式。例如,传统的检索方式(简单检索、表格检索、指令检索等)和功能更为强大的智能检索方式(语义检索),如表2所示。

表2 DI、PatentSight、incoPat检索方式对比

图像检索是基于专利图像的文本标引(图像名称、尺寸大小、压缩类型、主题内容)或内容特征(形状、纹理和颜色等)对其进行检索[14-15],incoPat使用全局的图像特点来进行基于内容的图像检索。

语义检索是指使用字词及组合、文本段落或全文作为检索词以检索相关专利[13],其内涵是一种基于概念及其相关关系的能从语义理解角度分析信息对象和检索请求的检索匹配机制,改进了传统检索存在的检索效率低下、缺乏语义推理能力和无法实现智能检索等方面的不足[16],是专利检索的发展趋势。DI和incoPat具备语义检索功能,DI提供两种语义检索方式:Smart Search和Thematic Smart Search。incoPat提供3种语义检索方式:语义检索、扩展检索和AI检索。

2.1.2 检索字段

每个专利系统都提供丰富的检索字段,方便用户从各种途径进行检索。DI提供超过348个检索字段,除了DI预制的检索字段,用户还可以根据自己的需要,对专利进行自定义标引生成检索字段。PatentSight将各检索字段按分类进行汇总,可浏览选择检索字段,也可以通过关键词检索字段。incoPat 通过全面的数据整合加工,可以检索340多个字段,并提供字段说明。

2.2 专利分析

专利分析是利用文献计量学方法,对其所含的各种信息要素进行统计、排序、对比、分析和研究,揭示专利文献的深层动态特征[17]。本文将专利信息系统的分析功能划分为统计分析、技术分析和战略分析。

2.2.1 统计分析

统计分析指用适当的统计分析方法对大量的数据进行分析,提供基于专利数量的统计分析结果,包括专利权人分析、地域分析、趋势分析、技术构成分析、法律及运行分析、专利组合等。

2.2.2 技术分析

技术分析是对专利信息的具体内容进行分析,以实现对技术领域的历史、现状、发展脉络及未来发展方向等内容的揭示,包括专利家族、权利要求、生命周期、主题演化、引证分析、聚类分析等。

聚类分析是采用数据挖掘中的聚类分析手段对专利数据进行分析[17],DI、PatentSight和incoPat均具备了聚类分析功能(见表3)。

表3 DI、PatentSight、incoPat 聚类分析功能对比

2.2.3 战略分析

战略分析是主要是面向企业或整个行业,进行发展态势和竞争状况的分析,包括技术路线、专利布局、竞争分析等。帮助企业寻找和分析竞争对手,为行业发展提供情报支持。

表4从统计分析、技术分析和战略分析方面展示了3个专利信息系统的分析功能。

表4 DI、PatentSight、incoPat 专利分析功能对比

2.3 专利评估

专利评估是对专利价值进行判断,但是专利作为一种无形资产,无法直接表现出它的价值,需要使用科学的估算方法和模型进行预测[19]。目前,3个专利信息系统均提供专利价值评估功能,实现了对专利的价值评估。表5展示了3个专利信息系统的价值评估功能,通过若干个单一指标和综合指标进行专利价值评估。

表5 DI、PatentSight、incoPat 价值评估功能对比

主要的单一指标包括:引用和被引用次数、同族专利个数和权利要求项数。权利要求项数用以限定专利保护的范围[20],一般来说,引用和被引用次数越高,同族专利个数越多,权利要求项数越多,专利价值越高。

综合指标评估是指结合专利被引数、专利引证数、技术生命周期、技术覆盖范围、文献引证数、说明书页数、权利要求数、审查时长、专利族数、转让次数、发明人数等参数[21],并对参数赋予权重,建立价值评估模型对专利进行打分。

3 对比分析结论

本文从宏观(概况和收录范围)和微观(专利检索、专利分析以及专利评估)两个层面对DI、PatentSight和incoPat这3个专利信息系统进行了对比,在此基础上,进一步总结其各自的优势和局限性。

3.1 DI优势和局限性

DI拥有深度加工数据,例如德温特分类标引、人工改写专利标题和摘要等,便于提升专利检索结果的全面性和准确性;DI的专利分析功能立足于汤姆森公司的前期专利分析工具Aureka系统,提供引证树、专利地图(ThemeScape)等强大的可视化分析功能。

虽然DI的分析功能全面且强大,但不提供专利分析报告,只提供可视化图表及其解读。

3.2 PatentSight优劣和局限性

PatentSight对专利权人进行规范化梳理,专利权人现状准确性较高;支持外部数据导入分析,可导入文本型和数值型两种类型的数据,分析数据总量无限制。

虽然PatentSight检索分析界面功能较多,但是设置复杂,不利于初学者使用;针对技术内容的分析只提供专利家族、主题演化、引证分析和聚类分析,深度技术分析功能有待加强。

3.3 incoPat优势和局限性

incoPat检索分析界面直观清晰,支持中英文双语检索和浏览全球专利,方便中国用户使用;结合语义算法模型和知识图谱及人工智能技术,提供3种语义检索方式,减少了分析人员对专利检索过程的参与,提高了检索效率;incoPat还提供了专利家族、权利要求、主题演化、技术功效矩阵等技术分析,这些分析是在基本统计分析的基础上,对专利信息的进一步挖掘,方便对专利技术情报的把握。

incoPat系统的兼容性不强,仅支持批量输入申请号、公开号和优先权号进行检索,不支持外部数据导入。

4 建议

4.1 基于用户层面,应结合自身需求选择不同的专利信息系统

(1)对专利信息系统用户而言,可以根据专利系统收录专利数据的时间范围、地域范围等并结合自身需求选择不同的专利信息系统。例如,DI因其数据收录相对全面,适用于世界范围内的专利检索和分析。对于外语水平不高的用户,首选incoPat对162个国家/组织/地区专利进行标题、摘要汉化,实现中文检索全球专利信息。对于初入专利情报领域的研究人员来说,可以选择DI对专利发明的内容及用途、优势和技术要点等进行了详细描述,因此,DI更适合初级用户阅读。

(2)如果想获得全面而准确的检索结果,需要根据专利信息系统数据处理功能选择不同系统,例如,要检索某一技术主题的专利,可以选择DI,其数据的标引和加工提高了专利检索的查全查准率。要查找某个专利的最终归属,可以选择PatentSight,专利权人现状准确性较高。当使用传统的关键词检索,如果检索策略复杂不易构建,那么非常适合采用专利信息系统的智能语义检索功能,如DI的Smart Search和Thematic Smart Search,incoPat的语义检索、扩展检索和AI检索。

(3)如果要对自有专利数据或其他专利数据库下载的数据进行分析,可以选择PatentSight支持外部数据导入。

4.2 基于专利信息系统的设计和开发人员层面,应从以下方面优化、改良其系统功能

(1)DI和incoPat都应增强系统的兼容性,未来希望增加外部数据导入分析功能,同时增加这项功能的灵活性,支持多种格式的导入。

(2)各系统都需优化人机交互功能,提升系统的友好性。PatentSight应该研发中文界面,为中国用户提供更为良好的使用体验。

综上,3个专利信息系统在数据收录范围、检索功能、专利分析以及专利评估等方面都存在着明显的差异。对于专利情报研究人员,掌握信息系统的各项功能,了解各系统的优势与不足,对其开展专利情报研究工作具有重要的支撑作用。另外,随着新一代信息技术(人工智能、大数据等)的发展,专利信息系统开发人员应该将更多的新技术应用在专利信息系统功能的拓展上,更好地助力专利情报的挖掘和分析。

猜你喜欢

信息系统检索语义
企业信息系统安全防护
语言与语义
2019年第4-6期便捷检索目录
基于区块链的通航维护信息系统研究
信息系统审计中计算机审计的应用
“上”与“下”语义的不对称性及其认知阐释
专利检索中“语义”的表现
基于SG-I6000的信息系统运检自动化诊断实践
认知范畴模糊与语义模糊
语义分析与汉俄副名组合