APP下载

不同引证主体的专利引文实证比较研究
——以5G 通信技术领域为例

2021-04-19武庆圆赵思迪

农业图书情报学刊 2021年3期
关键词:审查员申请人动机

武庆圆,赵思迪

(1.广东金融学院互联网金融与信息工程学院,广州 510521;2.吉林大学管理学院,长春 130012)

1 引言

专利作为信息时代技术、科学、知识的重要载体之一具有丰富的内涵,就专利自身而言,其引文属性就具有多层次、多维度的特点,如引证主体可分为专利申请人(后文简称:申请人)和专利审查员(后文简称:审查员)。为此,对应的引文数据集可以归为:专利申请人引文群体和专利审查员引文群体。而引文文献类型可分为:专利、论文和技术说明书等[1]。挖掘专利引文数据获得有价值信息已被广泛用于了解技术演化路径、新兴技术热点、发现潜在合作对象等。但以往分析方法少有进行引证主体的区分对比,这可能会丢失潜在有价值信息。为此,本文试图分析比对不同引证主体的专利数据集,发现异同,可帮助专业技术人员了解审查员的审查偏好,为发现潜在技术机会、合作伙伴、竞争对手等提供参考。

中国国家知识产权局指出在专利文件中列出的与本专利申请相关的其他文献,按照引证主体可分为申请人引文与审查员引文[2]。申请人引文是专利申请人用来阐述技术背景、说明现有技术存在的不足或现实中期待解决的问题、指出对已有研究成果思想的借鉴,借以突出自身专利申请的新颖性和创造性。审查员引文是指专利审查员的对比文件,是审查员在专利审查过程中引用的用于判断专利申请新颖性、创造性的文献,主要出现在审查意见中,揭示技术相关和同质态势[3]。专利的引文类型可分为专利引文与非专利引文,后者包含了科技论文、专题著作、使用说明书等文献,对该部分文献的利用可更全面地反映出专利技术主题的研究现状、知识流通状态及知识技术的转换程度等[4]。

2 研究现状

申请人与审查员由于自身特性和引用动机的差异,会产生引用行为和引用结果的不同,一般认为:引用动机会引发引文选取、引用过程、引用结果的区别,学者曾探讨过专利引文的多个引证主体的现实性及类型,并讨论了审查员引文的作用和意义[5,6]。陈云鹏等曾分析比较专利引文和标准引文之间的异同[7]。张玲玲等比较研究了专利引文和期刊引文的科学互联异同[1]。LI 等[8]认为应根据引证主体的不同在衡量专利文献相似度和质量上有优先级指标的考虑。方舟之等[9]提出区别对待引文主体的合理性及区别对待引证网络的可能性。肖冬梅等[10]提出专利审查员引证文献呈现的特性会对分析技术领域的知识交流、应用技术溢出路径方向有重要的影响。赵阳等[4]从理论层面论述审查员和申请人在引证动机上的本质区别及其会导致引文群体的差异。李睿等[11]提出选取高被引专利作为样本进行研究的科学性、必要性。INCHAE 等[12]提出专利存在引文代理人的群体,这类群体的引文数据会呈现出相似性和差异性。其次,有学者专门研究特定的引证主体在行为上的特性及可利用的合理性,PATRICK 等[13]发现国外机构专利审查人倾向引用同一专利代理事务所代理的专利,导致专利授予并不完全基于其技术价值。JEFFREY 等[14]提出专利审查人的严格程度会影响专利的范围,范围越小的专利被授权的可能性越低。

总结上述研究:学者已经发现引证主体的引用动机有本质区别,根据引文的不同属性,进行专利数据的分析可带来新的信息价值,但少有实证研究比对不同引证主体的专利引文数据集的异同。本文试图以通信工程领域的5G 技术的高被引专利数据为实证样本,对同一施引专利数据集分别获取审查员引文、申请人引文数据集,对比分析其异同。

3 研究设计

3.1 研究思路

本文从以下4 个步骤设计具体的研究方法和思路:①获取清洗施引专利的样本数据集;②分析筛选不同引证主体的引文文献数据集;③从不同维度提出异同假设;④利用相关的科学方法,进行实证分析,获得最终结果(图1)。考虑到专利文献的自身特性及研究目的,本文从3 个维度进行假设比对:引文质量、发表时间、技术集中度。引文质量是指引用频次较高,或其专利权人属于本领域的核心企业或核心成员的专利;引文发表时间是指引文的优先权日与被引时间间隔,基于优先权日可作为判断专利申请的新颖性和创造性的时间标准,越成熟的引文表示与被引时间间隔越久,越新的引文表示与被引时间间隔越短;技术集中度主要是指在IPC 分类号的二级子类号的分散程度和覆盖范围。

3.2 引用动机

图1 研究设计思路图Fig.1 Research design process

申请人在引用文献时本质目的是使申请的专利能够获得授权,由此,在引证文献时会采用灵活性、多样性来实现该目标,如全部否定引文的内容、部分否定引文的内容、部分认可引文的内容和全部认可引文的内容等。而审查员在引证文献时是为了标注或质疑申请专利的“三性”(新颖性、创造性和实用性),从而实现制约申请专利的权力范围。如此不同的引用动机产生的引用行为会对被引专利和施引专利的价值产生不同的影响。为此我们从动机类型、动机细节、动机行为、对施引专利的价值和被引专利的价值影响等维度进行分析,如表1 所示。

申请人的引证动机可分为消极动机和积极动机。消极动机总结为:故意隐藏即故意不引用行为,隐藏自身申请的专利可能涉及其他文献的部分;引用不相关,是指通过引用不相关文献来转移审查员注意力以获得专利授权;否定引用,是指虽引用了相关的核心文献,但在引用过程中否定引用文献的技术创新以突出自身的优点,根据否定的范围和程度可分为部分否定和全部否定。积极动机可分为:肯定引用文献的部分技术创新和肯定引用文献的全部技术创新,部分肯定是在肯定被引专利的创新因素的基础上加进自身的创新点,可以体现申请专利自身的排他性;全部肯定对于申请专利而言,有赖于被引专利的实施、需征得被引专利权人的许可,无法体现自身的排他性,这类情况一般可能出现在具有从属关系或本身更易得获取许可使用的专利权人之间。肯定部分创新在积极动机中会占据大多数情况。对同一篇引用文献而言,部分肯定创新和部分否定引用可能会同时出现。

由于自身的职责特性,审查员的引用动机可分为技术披露印证动机和绩效激励引证动机。技术披露引证动机是提供与申请专利技术最接近、最相关的对比文件,是审查员的法定职责,受到法律的强制规范;绩效激励引证动机是指专利申请的驳回率会被加入审查员绩效考核和激励指标中,使审查员对专利审查的态度更为端正。审查员最终目标是通过提供对比文件确定和审查其专利是否有创新性及限定专利排他性范围,形成限定权力要求范围的依据(表2)。

审查员引文不是专利申请时自带的,而是专利提交申请后,由审查员受理并审查时所添加的,审查员往往是根据专利文本的内容(主题、摘要、说明文档)来进行“三性”的推测,会与申请人对专利核心内容的理解有一定的差异。审查员引文往往对专利文献是否能授权具有较大的影响,一旦对比文件否定了专利申请的“三性”,那么施引专利无法获得专利授权;否则,反过来会增强施引专利的价值和影响力。

为了突出比较两类引文数据集群体的异同,我们利用属性分析、引文网络分析法从发表时间、引文质量、技术集中度等3 个方面进行不同引证引文数据群体的对比分析,提出3 个疑问。

表1 申请人引文动机分析表Table 1 Analysis of an applicant's citation motivation

表2 审查员引文动机分析表Table 2 Analysis of an examiner's citation motivation

疑问1:两类群体中谁更倾向于引用发表时间较新的文献?

疑问2:在一定时间窗口期内,两类群体的引文质量有无差异?

疑问3:两类群体中,谁的技术领域集中度更高?

4 实证研究

4.1 数据来源

本文以通信工程5G 技术的高被引专利为对象,获取审查员引文和申请人引文的专利数据。数据来源于德温特专利数据库(Derwent Innovations Index,DII),其在专利引文网络中的数据检索会详细记录各类文献数据,如:论文、网站链接、手册等。本文数据的检索式:

TS=(5G OR "the fifthth generation" OR "the 5th generation"OR C-RAN OR Cloud-RAN OR F-OFDM OR Massive Mimo OR MMW OR "mm wave" OR "Millimeter Wave" OR "Ultra Dense Network" OR "Pattern Division Multiple Access" OR "Nonorthogonal Multiple Access"OR SDN OR NFV OR D2D NOT 2G NOT 2.5G NOT 3G NOT 4G) AND IP=H04*,时间限定为2009—2018 年,共查找到14 813 条5G 技术领域相关专利,时间跨度为1976 年至2019 年。按照高被引频次选取了前100条高被引频专利,并人工筛选出30 篇同时具有审查员对比文献和专利申请人引用文献的高被引专利作为研究对象。专利属性内容包括:所属国家专利号、标题、发明人、专利权人名称和代码、摘要、国际分类号、优先权申请日期、被引用专利、被引文献、被引用申请人等。本文数据集均为已授权的专利,且分为3 个原始数据集:施引专利(3 822 条)、申请人引文群体(3 496 条)、审查员引文群体(542 条)。

4.2 属性特征统计分析

两类群体的属性特征分析,按照时间分布特征、申请地区分布特征、IPC 类型分布特征、专利权人分布特征、引用文献类型分布特征、发明合作人数特征对比等方面展开对比论述。

4.2.1 时间分布特征对比

施引专利的数量总体呈上升趋势,到2016 年达到顶峰为1 433 条,由于临近数据收集期,2017 年至2019 年的施引数量呈缓慢下降趋势。其次,申请人引用专利的申请时间最早可追溯到1970 年,审查员引用的专利最早为1973 年。在时间分布上,二者都呈现缓慢上升趋势,申请人引用集中分布在2011 年前后,审查员引用集中在2007 年前后;在专利发表时长上看,审查员倾向于引用较早的成熟专利数据,而申请人倾向于引用尽可能多的相关且较新的专利数据(图2)。

图2 申请人与审查员引用专利时间分布Fig.2 Time distribution of applicants'citation(red)and examiners'citation(blue)

4.2.2 申请地区分布对比

通常为了尽可能扩大专利的受保护市场,企业的核心专利大都会在多个国家或地区进行部署。通过对施引专利数据集的统计分析,可以发现WO 占比最大为17%,其代表了在国际专利中的申请力度,同时其他地区的分布分别为:美国为17%、欧洲为15%、中国为11%及韩国为11%,这些地区的比例均为10%以上,这是专利重点部署地区。其次,申请人引文数据集的部署地区主要分布在国际申请21%、中国17%、欧洲17%、美国16%及日本11%;审查员引用专利主要部署地区为国际申请35%、美国27%、中国17%及欧洲11%。因此,可看出申请人和审查员专利引文群体的地区分布基本类似,美国、中国、欧洲是5G 技术关键部署地区(图3)。

4.2.3 IPC 类型分布对比

通过IPC 分类号可识别专利所属技术领域。施引专利的IPC 集中于H04B、H01P、H01Q,即传输、波导和天线;申请人引文和审查员引文的IPC 都集中在H01Q、H04B、H04L,即天线、传输和数字信息的传输,其中H04B 主要涉及到发射站的无线传输系统,H04L 主要涉及传输通道的多用户装置、多频码系统和放置信息接收差错的装置等。其中申请人引用涉及的IPC 小类多达54 个,审查员为40 类。相较而言,申请人倾向于引用辐射范围更广的技术领域,而审查员集中于技术相关度高的专利数据(表3)。

4.2.4 专利权人或机构分布对比

施引专利的专利权人主要分布在19 个机构或公司,其中美国电话电报公司(AMTT)拥有该领域绝对的技术优势,其次为美国Enertechnixinc、美国Marvell 和中国华为、美国高通。申请人引文数据集所属公司集中在法国Alcatel-Lucent、日本NTT DOCOMO、美国Marvell、日本Nec、美国高通;审查员引文数据集所属公司主要为贝尔通讯公司、美国高通、日本松下、芬兰诺基亚等(表4)。相比较而言,申请人引用的专利权人明显不同于审查员引用专利的专利权人,前者分布更广多为从事通信行业的公司,后者则相对集中于老牌大型跨国的通信设备公司。

图3 专利部署地区分布Fig.3 Regional distribution of patent applications

表3 不同引证主体专利数据的IPC 小类分布 单位:个Table 3 IPC subclass distribution of patent dataset in different citation subjects

表4 专利权人或机构分布 单位:个Table 4 Distribution of patentees or organizations

4.2.5 引用文献类型对比

申请人引用的文献类型分布为专利33%、论文44%及其他23%。而审查员也会参考专利、论文或其他文献来审查专利,在进行3 种引用文献的对比分析时,可知其引用的文献类型分布为专利63%、论文11%及其他26%(表5)。专利申请人在申请专利时,倾向于引用更多类型、内容更丰富的文献,尤其是含有较新技术或创意的论文来获得专利授权,而审查人倾向于集中使用专利数据进行审查。

表5 引用文献类型百分比分布 单位:%Table 5 Percentage distribution of types of cited publications

4.2.6 发明合作人数特征对比

通过对申请人引文的1 129 条专利数据的发明人属性进行统计分析,其专利的平均发明人数为3.6 人,发明人数最多的一条专利合作人有16 位;审查员引文涉及的340 条专利数据中,所有专利的平均发明人数为4.1 人,略高于申请人引文的合作人数,发明人数最多的一条专利有32 位合作人,远高于申请人引文的数据。可知审查员倾向引用合作人数较多的专利数据进行对比审理。

4.3 专利引文网络分析

网络分析方法有利于将看似孤立的“点”融于全局视角的网络结构中,有利于揭示有用的价值信息。我们利用Pajek 工具挖掘不同专利数据集的深层次信息。Pajek 软件是一款广泛应用的网络分析工具,它不仅可以进行可视化网络绘图,揭示网络中各节点的核心状态和程度,而且可以描述整体网络的凝聚特性等,功能强大且易于操作。

4.3.1 施引专利网络分析

施引专利的数据集进行网络分析主要是为发现核心专利,我们利用Pajek 工具中的“vector→centrality→degree”来进行专利中心性的判断。

结果发现中心度最高的US10284261 引用了20 条高被引专利,中心性第二的US2018159591 同时引用了12 条高被引专利,这两条专利分别是美国电话电报公司于2017 年申请的关于连接超宽带电磁波的接入点技术的专利,以及美国电话电报公司于2015 年申请的关于通信接收装置技术的专利;而其他中心性高的专利依次也同时引用了较多条高被引专利,从而处于整个网络的中心(图4)。

4.3.2 申请人引文网络

共现分析可帮助发现核心技术簇群,进而用于判断潜在的技术机会等。申请人引文数据集形成的网络可以帮助识别引文间是否有明显的社群关系,导入Pajek 后选择“partition→communities”。通过节点颜色可以发现申请人引用文献的数据被分为9 个族群,其中有4 个独立专利或论文属于边缘数据,故对另外5个群体进行抽取以查看详细网络关系(图5)。

图4 施引专利中心网络图Fig.4 The network of patent applications

图5 申请人引文共现网络图Fig.5 The co-occurrence network of applicant citations

如图6 所示(见24 页),子群一为申请人网络中成员数量最多的群体,共包含306 个专利或论文,该子图清晰展示出其中心成员为专利CN102130698,是ZHAO X(个人)于2010 年申请的关于回波检查和自激消除方法的专利,说明5G 相关专利申请会较多涉及该技术。同时在主群图内,该专利也被其他参考文献多次引用,可以说明回波检查和自激消除方法在该领域的重要技术地位。子群二共包含288 个专利或论文,中心专利CN103700442 的技术内容为闭锁电压铝合金电力电缆,其为江苏南瑞淮胜电缆有限公司在2013 年申请的专利。子群三共包含207 个专利或论文,其中US2014355525 与CN104052742 明显处于核心地位,即在该申请人引用文献族群内部二者被较多同时参考,两条专利分别是BARZEGAR F(个人)在2013 年申请的关于远程分布式天线系统技术的专利,以及上海康煦智能科技有限公司于2014 年申请的关于动态加密物联网通信协议技术的专利。子群四共包含168 个专利与论文,子节点间联系较为紧密,多个专利和论文在中心联结,通过对各节点的中心值进行对比,可以发现CN104091987 的连线最多,该专利是中国科学院等离子体物理研究所于2014 年申请的关于百万瓦级波纹波导衰减器技术的专利。子群五共包含107 个专利和论文,说明了中心专利WO2005006706 的核心技术地位,其为耐瑞唯信公司于2003 年申请的关于局域网的创建和管理方法技术的专利。通过5 个子群的详细节点信息,可以发现大部分核心专利为中国申请或在中国部署,说明了中国在5G 技术领域的重要地位。

图6 申请人引文5 类子群共现网络图Fig.6 Five subgroups of co-occurrence networks of applicants'citations

通过子群核心成员的分析可见,公司和科研机构是发明的主体,同时某些个人团体也有一定的技术影响力。其中江苏南瑞淮胜电缆有限公司核心业务是电气机械和器材制造,处于5G 领域的上游,其拥有专利涉及的IPC 分类号为H01B(电缆、导体、绝缘体等材料);上海康煦智能科技有限公司主营科技推广和应用服务业务,处于5G 领域应用下游,旗下所涉及的专利IPC 分类号为H04L(数字信息的传输);耐瑞唯信公司主营软件和信息技术服务,处于5G 领域的下游。其拥有的专利是该领域的核心专利,涉及的分类号主要集中于G06F(电数字数据处理)以及H04L(数字信息的传输)。

4.3.3 审查人引文网络

从审查人引文网络中明显看出审查人引用的专利和文献间形成了5 个社群(每种颜色代表一个社群),蓝色和粉色为边缘专利和论文,故对其他3 个群体进行抽取以便观察其中的信息(图7)。

子群一为网络中成员数量最多的群体,共包含278个专利或论文,中心位置为US8654815,即审查人较多引用了这条专利数据,其为Rearden LLC 公司在2004 年申请的关于无线数据通信方法技术的专利;子群二共包含168 个专利或论文,审查员较多引用了WO2008117973、US2013083705、JP2002111579 和WO2011153504 四项专利,分别为HUTECH21 公司于2007 年申请的关于无线网络微波中继系统技术的专利、INST INFORMATION IND 在2011 年申请的关于时分双工正交频分复用分布式天线系统技术的专利、日本无线电有限公司于2000 年申请的关于移动通信系统的分配装置技术的专利,以及美国高通在2010 年申请的关于通信设备之间分配计算的方法的专利,其核心技术皆为通信系统和结果传输,说明该领域的专利技术较多以此为基础进行研发;子群三共包含51 个专利或论文,从该子图可知审查人较多引用了US2005157676、GB2214755 和US2010177759 三项专利,分别是美国交互数字技术公司于2003 年申请的关于无线传输技术、WALMORE ELTRN 有限公司于1988 年申请的关于分布式天线系统技术以及ADC 电信公司在2009 年申请的关于串行数据流技术的专利,说明这3 项专利技术联系紧密,也是申请专利的焦点技术。

图7 审查员引文3 类子群共现网络图Fig.7 The co-occurrence networks of the three subgroups of examiners'citations

通过对于子群核心成员的类型分析可见:Rearden LLC 公司、HUTECH21 公司、INST INFORMATION IND、美国交互数字技术公司、WALMORE ELTRN 有限公司等通信工程领域的老牌公司,拥有5G 领域的技术专利优势,其专利的分类号主要集中于H04L、H04B、H04J、HO4W、H04Q,即电通信相关技术。

4.3.4 申请人与审查人引文网络对比

通过对各自族群的网络对比,可以发现申请人引文与审查员引文在专利权人或机构、时间以及内容上存在着一定差异。首先,申请人引文的专利权机构集中于中国的通信行业,即在进行5G 技术研发时,有更多的专利会引用中国专利,说明了其技术领先地位,而审查员引文的专利机构集中在美国和日本的5G 技术起步较早的老牌通信企业;在专利的优先权日比对上,申请人引用专利为时间间隔较短的新专利,而审查员引用的专利相较于申请人倾向引用时间间隔更久的成熟专利文献;在专利技术内容分布上,申请人引文不仅关注分布式天线系统及电力电缆等装置研发,同时关注通信协议、波导衰减器、局域网创建等方法研究;审查员引文则侧重无线数据通信方法、通信系统和结果传输等技术方法的研发。

同时,我们发现在两个网络群体中,核心专利集都是属于多人合作的专利。如上述申请人引文的核心专利的合作发明人数平均为4 位,最多的一项为US2014355525,其合作申请人有10 位;审查员引用专利的合作发明人平均为9 位,都在2 人以上,专利US2005157676 有32 位申请人之多。

5 总结与展望

通过本文实证分析及已有研究发现,5G 的核心技术包括大规模天线阵列、超密集组网、新型多址和全频接入等无线技术和基于软件定义网络、网络功能虚拟化(NFV)的新型网络架构。此外,基于滤波的正交频分复用(F~OFDM)、滤波器组多载波(FBMC)、全双工、灵活双工、终端直通(D2D)、多元低密度奇偶检验(Q~ary LDPC)码、网络编码、极化码等也被认为5G 重要的潜在无线关键技术[15]。对应于本文开篇提出的3 个疑问,通过实证发现,得出结论如下。

实证1:审查员会倾向于引用申请时间较早的成熟专利数据;

实证2:两者之间的引文质量无明显差异;

实证3:审查员引文无论是引文类型集中度还是技术领域集中度都会高于申请人的集中程度。

我们还发现大部分专利都会优先进行国际专利申请,同时美国、中国、欧洲是5G 技术关键部署地区;申请人的引文专利权人或机构大多为中国从事通信行业的各大中小型公司或研究所,审查员引文则相对集中于老牌大型的跨国通信设备公司;此外,审查员相比于申请人更愿意引用合作人数较多的专利进行审查。

分析上述结论的原因,由于引文动机的驱使,在进行技术研发时,申请人为了专利技术的创新性和获得授权的成功率,其技术焦点不会过于集中;而审查员对该领域的专利进行审查时,由于专业与经验可以精准地将专利引用文献控制在较少的技术焦点,于是更倾向引用较为成熟的专利而非论文进行审查;在专利技术内容分布上,申请人引用的专利往往会关注通信设备、装置的研发,以及通信协议、技术方法的研究,审查员则侧重通信方法与结果传输等技术研究。

专利引文数据的引用源头存在着丰富性与多样性,利用简单的引文指标来进行分析会导致对于专利价值的评判有所偏差甚至错误,本文尝试从不同引用源角度对比分析了引文簇类的异同,发现了明显的偏好和差异,进一步证明了引用源的引文数据对比具有较大的潜在挖掘价值,如通过比对两类专利数据集可用于发现潜在技术热点,潜在合作伙伴和企业竞争对手等。

不足之处是受数据获取的限制,数据样本仍显单薄。另外,在剔除“噪音”数据方面需要进一步完善,这些都会影响到研究结果的准确性,也是作者今后研究需改进之处。

猜你喜欢

审查员申请人动机
Zimbabwean students chase their dreams by learning Chinese
二语动机自我系统对动机调控策略及动机行为的影响研究
动机比能力重要
浅析基于博弈论视角下专利审查员与代理人间的意见分歧及弱化措施
提升专利质量,树优质审查作风
7月1日起澳洲签证费将全面涨价上调幅度达到5.4%
澳大利亚7月1日起移民签证新规将生效
新加坡启动专利审查非正式沟通渠道
航次租船合同争议案
动机不纯