届满专利的国别差异及其文献计量特征对比分析
2021-12-28张瀚东
李 睿,张瀚东
(四川大学灾后重建与管理学院,成都 610207)
1 引 言
届满专利是指专利权维持至法定保护期满(中国专利法规定最长为20 年)的专利。据统计,中国国家知识产权局授权的专利中,因各种原因失效的专利高达94.6%,维持有效10 年以上的专利仅占0.8%,能维持到20 年届满的发明专利更是仅占专利总数(包括发明、实用新型、外观设计)的0.02%[1]。专利失效的原因主要有两大类:一是被宣告无效,二是专利权人放弃缴纳专利维持费而自动失效。其中,后者是主要原因,由于专利权人判断该专利权已不再能产生足够的市场收益,在权衡专利维持成本后选择停缴维持费,而令其自动失效。
逐年累积递增的专利维持费成为了低质量专利的过滤机制[2],专利的高届满率和高质量在内生成因上是一致的[3]。然而,在中国国家知识产权局授权的发明专利中,届满专利大多数来自日本专利权人和美国专利权人,来自中国专利权人的专利届满率远远落后,仅为日、美两国的1/20 左右。本文统计的届满发明专利国别分布如表1 所示。
表1 届满发明专利国别分布对比表
本文尝试在文献计量学视野下开展对比研究,通过对比高届满率国家专利与中国专利在多重特征上的异同,探讨影响中国发明专利届满率的相关因素,为科技管理部门优化创新政策提供实证依据。
2 国内外关于“届满专利”的研究现状
以“the expiration of patents”或“expired patents”为检索短语,从Web of Science 核心集查得论文1129 篇,研究主题主要集中在business economics、health care sciences service、 government law 等 方 向上。在国际范围内,各国的届满专利均是授权专利中的少数佼佼者。Mansfield[4]研究显示,美国绝大多数专利的维持时间远远小于法定届满期限;Pak‐es[5]实证数据显示,法国和德国分别只有7%和11%的专利维持到届满。Griliches[6]和Grönqvist[7]认为,基于经济理性,专利权人只有在判定其持有专利的预期收益大于成本,或者维持其专利权以保证其专利组合的完整性,即有经济利益可图时,才会选择维持其专利权。目前,国外论文成果主要以专利届满率及其经济学成因作为研究对象,还未发现从国别差异入手研究专利质量以及其影响因素的成果。
以“届满专利”为检索短语,从CNKI(China National Knowledge Infrastructure) 查得国内相关的研究论文125 篇,研究主题集中在知识产权、专利维持时间、专利质量、企业管理等方向上。宋爽等[8]统计数据显示,我国信息技术领域的专利维持到届满的不足1%;乔永忠等[9]在化学冶金领域内,对比了我国和美、日、韩、德、法等国的专利维持时间差异,结果显示,我国授权专利的届满率在各国中最低,授权即终止的现象比较严重;李睿等[10]发现,我国届满专利具有施引水平低的特征;曹晓辉等[11]从部分基因工程领域的美国发明专利样本中发现,届满专利拥有更广的技术覆盖范围和更高的外部合作率,并且届满专利施引更多;姚清晨[12]和宋爽[13]认为,专利创新主体或申请人的类型对专利维持时间存在着显著影响;肖冰[14]则认为,审查时间、权利要求数量和技术领域三个因素,对于专利能否届满存在影响……国内学者主要从某一领域的专利样本入手,统计届满专利的数量,并从创新过程和创新方式上探讨影响专利维持时长的因素,也有学者从专利审查过程以及知识产权法规层面分析影响专利维持期长短的因素。然而,还鲜有学者从文献计量视角聚焦专利届满率的国别差异,更未发现在对比视野下研究中国专利低届满率成因的成果。
3 届满专利的国别差异分析及其文献计量特征对比
3.1 研究样本
如表1 所示,日本和美国的届满发明专利绝对数量和届满率均远超中国,其他国家的届满率虽然高于中国,但绝对数量低于中国,且这些国家在中国获得的发明专利授权总数较少,对中国技术市场形不成规模性的影响,因此,暂不纳入本文的对比分析范围。本文着重对比中国与日本、中国与美国之间的届满发明专利的特征差异。
3.2 研究思路
本文首先在文献计量视角下,对中、日、美三国的届满发明专利的特征进行计量;然后,采用多种差异分析方法进行特征对比研究,尝试通过对比方法来发现影响中国专利届满率的相关因素。
3.3 研究方法
本文将利用卡方检验、克鲁斯卡尔-沃利斯单因素检验(非参数检验中的K-W 检验)和独立样本中位数检验等方法,对来自中国申请人的专利(以下简称“中国专利”)、由来自日本申请人的专利(以下简称“日本专利”)、来自美国申请人的专利(以下简称“美国专利”)的各项文献计量指标进行差异对比,分析各项指标数值的分布差异性和水平差异度。
3.4 研究过程
3.4.1 数据获取
自1986 年中国专利局开始进行专利授权以来,由中国专利局(国家知识产权局)授权的发明专利中,查得届满的中国专利3213 项及其同族专利9611 项,届满中国专利的前向引用(被引)专利4811 项、后向引用(施引)专利8168 项;查得届满的日本专利8767 项及其同族专利110443 项,届满日本专利的前向引用(被引)专利3468 项、后向引用(施引)专利26323 项;查得届满的美国专利6931 项及其同族专利155523 项,届满美国专利的前向引用(被引)专利2674 项、后向引用(施引)专利46734 项。
3.4.2 指标设置
本文设置了被引频次、施引频次、非专利文献引用数量、IPC (International Patent Classification)号数量、IPC 号跨越度、被引跨越度、施引跨越度以及同族成员数量等8 个指标,对中国、日本、美国的届满发明专利进行差异对比。
(1)被引用频次:即一项专利被其他专利引用的频次。情报学界通常认为,被引用频次越高的专利,其质量和价值也就越高。事实上,专利被引用频次已经被广泛用作评估专利价值的重要指标。
(2)施引频次:即一项专利引用的其他专利的数量。情报学界通常认为,一项专利所引用的专利是该专利的背景技术和基础技术。
(3)非专利文献引用数量:即一项专利引用的除专利以外的其他参考文献(著作、论文等)的数量。情报学界通常认为一项专利所引用的非专利文献代表着该专利的科学基础,非专利文献引用数量可用于度量技术创新与基础研究之间的知识关联程度。
(4)IPC 号数量:专利以功能作为分类标准,一项专利被授予多个IPC 号,则意味着该项专利具有多重功能,专利的功能丰富度应当也是影响成果价值的因素之一。
(5)IPC 号跨越度:一项专利的多个IPC 号之间,在功能类目上的跨越程度代表着该专利技术所拥有的多重功能之间的差异程度。有些专利的多个IPC 号之间的分类逻辑距离较近(多个IPC 号均属于相同的大类,甚至小类),即IPC 号跨越度较小;有些专利的多个IPC 号之间的分类逻辑距离较远(多个IPC 分别属于不同的大类,甚至不同的部类),即IPC 号跨越度较大。本文设计了IPC 号跨越度这一指标来描述上述现象,计算方法为:对同一项专利的所有IPC 号进行两两对比,计算分类逻辑距离:IPC 号前4 位相同,4 位之后不同的两项专利IPC 号跨越度=1;IPC 号前 3 位相同,3 位之后不同的两项专利IPC 号跨越度=2;IPC 号前2 位相同,2位之后不同的两项专利IPC 号跨越度=3;IPC 号仅第1 位相同,第1 位之后不同的两项专利IPC 号跨越度=4;IPC 号从第1 位开始就不相同,即属于不同的部类,则两项专利之间的IPC 号跨越度=5。对任意两项专利组成的一个专利对而言,两者间的“功能跨越度”等于该两项专利的所有IPC 号两两对比所得的IPC 号跨越度中的最大值。专利的IPC号跨越度代表着该专利技术在有差异的多样环境中的可实施性,应当也是影响成果价值的因素之一。
(6)被引跨越度:一项专利与引用它的专利之间的IPC 号跨越度,即本文所设计的被引跨越度,计算方法与上述IPC 号跨越度的计算方法相同。被引跨越度代表一项专利作为对比技术被引证时,所面临的新专利技术的挑战的多样性。
(7)施引跨越度:一项专利所引证的多项专利之间的IPC 号跨越度,即本文所设计的引用跨越度,计算方法与上述IPC 号跨越度的计算方法相同。引用跨越度代表一项专利所引证的专利技术的用途广泛性和多样性。
(8) 同族成员数量:一项专利的同族成员数量,是指该专利的申请人以相同(或有所改进但基本相同)的技术内容,在其他国家申请的专利数量。同族成员越多,该专利的家族(family)就越大,对全球市场的占有能力就越强。
3.4.3 数据分析
本文通过SPSS 软件,利用多种差异分析方法,对来自中国、日本、美国的届满专利进行了8 个指标的差异分析。
中、日、美三国届满专利计量指标的描述统计结果如表2 所示。利用方差分析ANOVA 对各项指标在三个国家之间进行检验,各指标的组间(不同国别)F值最小为50.513,各项指标的差异显著性均小于0.001,则说明各项指标在不同国别间存在显著性差异,可以进行非参数检验。
表2 中、日、美三国届满专利计量指标描述统计结果
采用非参数检验中的克鲁斯卡尔-沃利斯单因素检验(K-W 检验)和独立样本中位数检验对中、日、美三国届满专利进行差异分析,结果如表3所示。
表3 各项计量指标K-W检验和独立样本中位数检验结果
差异分析的结果显示:
(1)中国专利的被引频次分布与日本和美国存在显著差异,被引频次水平显著高于日本和美国,中国专利的被引跨越度水平也显著高于日本和美国;
(2)中国专利的施引频次分布与日本和美国存在显著差异,施引频次水平显著低于美国,中国专利的施引跨越度分布和水平都与日本和美国存在显著差异,且水平显著低于日本和美国;
(3)中国专利的非专利文献引用数量分布与日本和美国存在显著差异,水平显著高于美国;
(4)中国专利的IPC 号数量和IPC 号跨越度分布均与日本和美国存在显著差异,水平均显著低于日本和美国,且差距巨大;
(5)中国专利的同族成员数量分布与日本和美国存在显著差异,水平显著低于日本和美国,且差距非常大。
4 影响届满率的因素分析
4.1 “高被引”并不是“届满率”的正相关影响因素
本研究的对比结果颠覆了文献计量学界的传统思维,情报学界普遍公认的“高被引,即高质量”的成果评价思维在本研究中被否证。各国届满专利的实证数据显示,届满率高的日本专利和美国专利的被引频次水平反而显著低于中国,如图1 所示。
图1 届满专利被引频次K-W检验和独立样本中位数检验箱图
在科学计量与科学评价的视野下,“被引”可以作为论文评价的依据,但专利不是论文,专利不仅是技术文献,也是一种主张经济权益的契约性文件。论文被引用,意味着公有知识被无偿地学习和使用;而专利作为一种具有垄断权属性的专有知识,不允许被无偿地学习和使用。专利被引是在专利审查制度约束下的引证行为的结果。
各国专利审查制度对专利的引证行为赋予了特定的意义:引证意味着“对比”,即为证明专利申请的新颖性和创造性提供对比文件,用作判定专利申请能否授权以及可授权范围的依据。如果某专利作为同级概念格的对比文件被新的专利申请引证,那么就意味着该专利面临了同级概念格上的新技术的挑战。从这一意义上讲,专利被引越多,则说明竞争越激烈,市场份额会被分割得越小[15]。而市场份额直接决定着专利的经济价值,决定着该专利是否值得被专利权人继续缴费维持。本文的统计数据显示,高届满率的日本和美国专利的被引水平显著偏低,而低届满率的中国专利的被引水平却显著高于日本和美国,其原因可能是:专利被引越多,则面临的新技术的挑战越多,专利的市场价值萎缩越快,专利维持到届满的可能性也就随之而越小。
4.2 “施引”水平与届满率正相关
文献计量学界在进行论文成果评价时,通常着重关注“被引”情况而较少关注“施引”行为,即通常以论文成果的被引频次作为评价依据,而几乎不会去计量论文成果所引用的参考文献的数量。而各国届满专利的实证数据显示:届满率高的日本专利和美国专利的施引频次水平均显著高于中国,如图2 所示。
图2 届满专利施引频次K-W检验和独立样本中位数检验箱图
专利的引证(施引)行为,不是论文作者对公有知识的无偿学习和利用行为,而是新旧技术之间的对比行为。新专利引证旧专利的实质,是通过对比说明自身的先进性(对旧专利的补充、改进,甚至替代),新专利被授权后,自然将夺取旧专利原有的市场份额。从这一意义上讲,引证(施引)的专利数量越多,则意味着新专利争夺的市场面越广。
引用跨越度描述的是新专利所引证的旧专利在技术功能分布上的宽阔度。新专利对旧专利所进行的补充或改进,可以是通过不同途径、在不同环节上的补充或改进,新专利的引用跨越度越大,则说明其补充或改进旧技术的途径和环节越多样。
综合来看,一项新专利的施引(频次和跨越度)水平越高,就意味着其夺取市场份额的竞争力越强、覆盖面越广,维持到届满的概率随之越高。
4.3 非专利文献引用数量不是影响届满率的因素
届满率高的国家(日本、美国)的专利,在非专利文献引用数量分布上与中国存在显著差异,美国的非专利文献引用数量水平显著低于中国。情报学界通常认为,非专利文献引用数量代表着发明专利对基础科学的关联程度(CHI 公司创建了Science Link[16]指标计量非专利文献引用数量)。但从本文的对比数据来看,若得出“美国发明专利与基础科学的关联程度显著低于中国”的结论则显然与事实不符。
本文认为,中国届满专利的非专利文献引用数量显著偏高,这一现象背后另有科研体制和评价机制的原因。如表4 和表5 所示,中国专利权人类型中“院校/研究所”这一类型的学术机构的占比与日、美两国相比具有显著的差异性(经卡方检验差异性显著),“院校/研究所”占比数值是日、美两国的近10 倍。这一类型的学术机构在体制上属于公立大学或科研院所,在评价机制上同时受制于“论文”指标和“专利”指标。“院校/研究所”的研发人员属于“学术型发明人”,其既是论文作者,也是专利发明人,来自“院校/研究所”的发明人自然地会在技术背景部分,引用自己的或自己所熟悉的论文(非专利文献)。由于中国届满专利中来自“院校/研究所”专利权人的占比是日、美两国的近10 倍之多,所以在非专利文献引用数量上,自然会表现出远远高于日、美两国的水平。本文认为,中国专利的非专利文献引用数量水平高于日本和美国,在很大程度上,应该是由中国的科研体制和评价机制造成的,非专利文献引用数量并非影响专利届满率的内在因素。
表4 中、日、美三国届满专利的专利权人类型分布
表5 中、日、美三国届满专利的专利权人类型结构比卡方检验
4.4 专利的功能丰富性是影响专利届满率的因素之一
本文的分析结果显示:届满率高的国家(日本、美国)的专利,在IPC 号数量水平上显著高于中国。功能越丰富的专利技术,存活的可能性越大,生命力越强,专利的功能丰富性是影响专利届满率的因素之一。
4.5 专利的功能普适性是影响专利届满率的因素之一
本文的分析结果表明:届满率高的国家(日本、美国)的专利,在IPC 号跨越度水平上显著高于中国。功能普适性越强的专利技术,能够完成的终端功能越多,或者能够衔接的中间技术越多,实施的概率越高。专利的功能普适性是影响专利届满率的因素之一。
4.6 专利的国际市场占有能力是影响专利届满率的因素之一
同族专利数量能够较好地体现专利权人的全球战略布局[17],是识别核心专利的关键指标[18]。事实上,向他国申请专利往往会面临更大的风险,以欧洲专利局为例,由于审查制度严格、市场竞争十分激烈,在“三元专利局”(日本局、美国局、欧洲局)之一的欧洲专利局申请专利是十分困难的[19],并且任何同族成员的一个异议,就会导致在所有成员国专利权的丧失[20],而向他国申请专利就意味着专利具有相当的技术自信和技术实力。因此,同族专利数量所代表的国际市场占有能力[21],是影响专利届满率的因素之一。
5 不同时间窗内中、日、美三国专利的文献计量特征跟踪对比
5.1 跟踪对比的目的和意义
本文的第2 节和第3 节对来自中、日、美三国专利权人的届满专利进行了静态对比。由于届满的发明专利至少是20 年以前申请的专利,因此,研究结论在时效性上受到限制。本文设计了系列时间窗,进一步进行中、日、美三国专利的动态对比,即分别在20 年前、10 年前和5 年前这三个时间窗内,对中、日、美三国在某一样本领域内(IPC 大类为A61 医药学或兽医学、卫生学)获得授权的发明专利进行文献计量特征跟踪对比,以观察相应的时间段内,中、日、美三国的发明专利在文献计量特征上的动态变化,从而对前文的研究结论进行样本领域内的实证和补充。
5.2 三个时间窗内的动态观察
查得20 年前时间窗内(2000 年授权)的样本领域,中国专利1494 项及其同族专利3399 项,并通过引证和被引证查询查得其前向引用(被引)专利539 项、后向引用(施引)专利3399 项;查得日本专利109 项及其同族专利2928 项,前向引用(被引)专利29 项、后向引用(施引)专利634 项;查得美国专利167 项及其同族专利7678 项,前向引用(被引)专利61 项、后向引用(施引)专利1877 项。
查得10 年前时间窗内(2010 年授权)的样本领域中国专利7598 项及其同族专利16838 项,并通过引证和被引证查询查得其前向引用(被引)专利1925 项、后向引用(施引)专利16797 项;查得日本专利1153 项及其同族专利13763 项,前向引用(被引)专利158 项、后向引用(施引)专利7250项;查得美国专利1249 项及其同族专利28305 项,前向引用(被引)专利282 项、后向引用(施引)专利16920 项。
查得5 年前时间窗内(2015 年授权)的样本领域中国专利16692 项及其同族专利38879 项,并通过引证和被引证查询查得其前向引用(被引)专利1892 项、后向引用(施引)专利65160 项;查得日本专利2197 项及其同族专利27040 项,前向引用(被引)专利85 项、后向引用(施引)专利17634项;查得美国专利2773 项及其同族专利69013 项,前向引用(被引)专利478 项、后向引用(施引)专利47009 项。
三个时间窗内,中、日、美三国的发明专利在文献计量特征上的对比结果如表6 所示。
表6 中、日、美三国发明专利的文献计量特征动态对比
5.3 中国专利相较于日本和美国专利的文献计量特征变化
被引频次和被引跨越度方面,中国专利的被引水平在20 年前时间段内始终高于日本和美国。施引频次和施引跨越度方面,中国专利的施引水平在20 年前时间段内始终低于日本和美国,而且差距显著。
在非专利文献引用数量方面,中国专利的非专利文献引用数量水平在20 年前时间段内始终高于日本和美国;尤其是在10 年前和5 年前这两个时间窗内,差距越发显著。如图3 和图4 所示。
图3 10年前时间窗内非专利文献引用数量K-W检验和独立样本中位数检验箱图
图4 5年前时间窗内非专利文献引用数量K-W检验和独立样本中位数检验箱图
IPC 数量和IPC 跨越度方面,中国专利与日本和美国专利之间的差距在20 年前时间段内不断缩小;在最近的5 年前时间窗内中国专利的IPC 数量和IPC 跨越度水平都反超了日本和美国。
同族专利数量方面,中国专利的水平在20 年前时间段内始终低于日本和美国,而且差距非常显著,如图5 所示。
图5 20年前时间窗同族专利数量K-W检验和独立样本中位数检验箱图
6 研究结论及建议
6.1 专利评价重心应从“被引”向“施引”转移
在科学社会和技术社会学层面,论文被引主要体现的是公有知识的社会共享机制,而专利被引则更多体现的是私有知识之间的社会竞争机制。论文被引大多意味着认同,因而高被引论文通常被认为具有相对更高的学术价值和影响力;而专利被引则意味着被用于技术对比,可能因竞争对手的涌现(被越来越多的竞争对手引证)而丢失市场份额,因此,“高被引,即高质量”的论文评价思维不应当在专利评价领域被沿用。
论文“施引”(引用参考文献的数量)指标几乎没有被学界用于论文评价,但对专利而言,这一被忽略的指标却具有重要的评价意义。本研究发现,日本和美国专利的“施引频次”和“引用跨越度”显著偏高,并解读了“施引频次”和“引用跨越度”对专利竞争力的正面表征意义。因此,本文认为,科研管理部门在创新评价中,应当弱化对专利“被引”的计量,转而强化对专利“施引”的分析和研究。
6.2 持续提升专利的功能丰富性和普适性
中国专利的IPC 数量和跨越度水平在近5 年时间段内实现了对日本和美国的反超,这是一个积极乐观的现象,说明中国专利技术在功能丰富性和普适性方面已经有明显的进步。IPC 号数量越多,意味着该项专利技术嵌入到全球价值链中的不同的分支的机会越多,在上下游技术链环节的匹配需求下,该专利实施(成功实现成果转化)的概率就越高。在IPC 号数量相同的情况下,一项专利的IPC号跨越度越大,则表明该专利技术所嵌入的技术链的行业差异越大,说明其跨行业适应力越强。
综合而言,IPC 号数量和IPC 号跨越度能够共同反映一项专利的实施可能性和长期维持有效的可能性。在专利研发的顶层设计和规划部署阶段,科研管理部门应当倡导和组织跨学科、跨行业的交叉创新团队,催生具有更高、更广技术链衔接能力的专利技术,持续提升中国创新成果在全球技术生态系统中的适应力和生命力。
6.3 专利评价指标应轻“数量”重“家族”
中国专利的非专利文献引用数量水平始终显著高于日本和美国,本文认为,这一现象在很大程度上是由中国的科研体制和评价机制造成的。据本研究统计,截至2020 年4 月,中国发明专利总授权量为2439687 项,除企业占比55%以外,“院校/研究所”是中国专利申请的主力军,占比近30%,共681194 项。
“院校/研究所”的专业技术职务晋升考核标准大都将“专利授权数量”纳入其中,因此,追求专利数量、为发明而发明,成为了“学术型发明人”的普遍心态,同时,论文或专著等也是主要评价依据,专利往往是论文或专著的附属品[22]。这就造成了“院校/研究所”产出大量专利,大量“院校/研究所发明人”引用大量论文或专著等非专利文献的现象。
此外,我国“院校/研究所”普遍实行“雇主优先”原则,理论上大学教师和科研人员的职务发明专利权归机构所有,这在一定程度上抑制了“学术型发明人”实现有效创新的内在积极性[23]。“院校/研究所”发明人为职称晋升、完成考核指标而产出越来越多的专利,专利总量日益膨胀的同时,为专利而专利的成果质量却始终维持在较低的水平。缺乏技术高度的专利,当然难以具备参与国际竞争的自信,更不敢承担申请同族专利不成反而连累本国专利一并无效的风险。本文认为,上述内容是中国专利的同族专利申请数量一直显著偏低的原因之一。
建议“院校/研究所”的晋升、考核,应当从聚焦“专利数量”转向聚焦“专利质量”,在专利评价方面,应当轻“数量”重“家族”,即鼓励和奖励申请多国同族专利,将专利家族的规模大小作为评价专利质量的核心指标之一,通过激励专利内在质量的提升,来打造中国专利的国际竞争实力。
总结全文,通过对届满专利的国别差异进行对比分析,本文发现了与情报学惯性思维相悖的事实:“高被引”对于专利而言并不具有积极的评价意义。同时,也发现了被情报学常规思维所忽略的有趣事实:“施引”对于专利而言具有显著的正面评价意义;揭示了中国专利的“非专利文献引用数量”偏高现象背后的体制和机制原因;强调了“专利家族”的重要性,并给出了提升中国专利质量的若干建议。
然而,专利质量的提升是一个复杂的系统工程,影响因素众多,本文仅从文献计量的视角进行了相关因素分析,在动态跟踪对比过程中,所使用的样本数据也具有领域局限性。但复杂问题的求解需要多视角、多途径的共同努力,本文以文献计量尤其是引文分析为路径的情报学研究,以期为求解“专利质量的影响因素”问题提供有参考价值的客观依据。