APP下载

基于反馈关联图的专利价值评价研究

2017-06-06张建华

商情 2017年16期

【摘要】分析专利价值评价研究现状、分类及主流研究方法。提出了一种基于反馈关联图的专利价值评价模型,在技术热度、新颖度、引证数量和反馈热度等多种机制的作用下,实现了较为客观的专利价值评价机制。

【关键词】专利价值 关联图 热度反馈

1 引言

专利价值评估从专利的法律状态、技术状态、市场状态等方面出发,对专利交易、专利融资、知识产权投资等活动进行科学量化的过程,是实现知识产权产业化发展最重要的环节。在经济全球化发展的时代背景下,为增强企业的市场竞争力和提升国家的核心竞争力,我国实施知识产权发展战略,以企业作为知识产权运用的主体,促进自主创新成果的的知识产权化、商品化、产业化,引导企业采取知识产权转让、许可、质押等方式实现知识产权的市场价值。在推动企业创造、运用知识产权的过程中,需要对知识产权特别是核心专利进行客观、快捷的价值评估,科学地量化专利技术的费用和效益,专利价值评估应用而生。

专利文献是指专利说明书、专利公报、专利摘要等与专利相关的法律文件、技术资料,凭借其巨大的技术、经济价值被情报界称为“科技金矿”。据世界知识权组织WIPO报道,专利文献中包含全世界每年90%-95%的最新科研成果,比其它科技文献有更高的科技含量,其中有70%-90%的信息在专利文献中发表过。如果企业能够充分利用专利文献指导技术创新,将可以有效节约40%的研究经费和60%的研究时间。然而,如此巨大的信息资源却未被有效开发和利用,因此,对专利文献进行价值评估对企业的创新研究具有重要的意义。

2 相关研究

专利涉及到的是企业的利益和权力。在当今信息化程度如此高的情况下,专利数据的价值远远未被利用起来。通过从大量的专利文献中可以抽取企业竞争的情报信息,使公众的专利资料为本企业所用,实现专利经济价值的放大作用。专利价值评价通常包括经济价值和技术价值两个方面的评价。专利的经济价值评价是以专利的市场流通信息作为评价依據。当前专利价值的市场信息不完善,交易信息收集困难。因此,本文主要针对专利在技术价值方面评价模型进行深入研究。

专利的技术价值评价方法有基于训练的方法和基于引用的方法。Jin等人基于专利元数据、 新颖度、技术趋势以及发明人等信息,构建了一种用于专利付费决策的模型。Baron等人采用因子分析法,通过输入专利声明数量、同族专利数量、授权时间、专利申请人的权威度等信息,构建专利价值评价模型,实现对单个专利样本范围内的价值评估。Nicolas研究的方法相对特别,其评价专利价值的因素包括专利续费时间、是否被反驳、专利授权速度、同族专利数量等输入组合来构建不同的专利分类,通过分类机制对专利价值进行评估。基于多种专利因素输入的价值评价方法,多由主观经验判断因素的重要性,容易忽视客观存在的引用价值。汪雪锋等人采用引证指数作为专利价值评估的核心指标。其模型中专利被引用的次数越多,专利的潜在基础价值越高,专利领先性越高。显然基于单一引证的价值评估方法,忽视了潜在的引用关联,并且忽视了多种专利价值影响因素,容易导致片面评价。

针对上述对专利价值评价研究存在的缺陷,本文提出一种基于反馈关联图的专利价值评价模型,主要因素有专利关联度、技术热度、技术新颖度,并且融合专利的引证关系,加入热度反馈机制,从主观和客观多方面进行价值评价。

3 专利关联图价值模型

定义1 专利文档相似度。专利文档P的主要内容包括摘要、权利要求和说明书。令向量A=(WA1,WA2,...,WAn),R=(WR1,WR2,…,WRm),M=(WM1,WM2,…,WMk),其中WAi表示摘要A中的关键词语的权重系数,WRi表示权利要求R中关键词语的权重系数,WMi表示说明书M中的关键词权重系数,n, m, k分别为A, R, M的关键词数量。对于专利文档P1和P2,其专利文档相似度表示为Sim(P1,P2),则Sim(P1,P2)定义如式(四):

其中,ωa, ωr, ωm分别是摘要、权利要求和说明书对专利文档相似度比重系数。显然,摘要、权利要求和说明书对专利文档相似度的重要性是不相等的。对于P1, P2,Sim(P1,P2)值越大其相似度越高。专利文档相似度从文本处理角度将不同专利文本内容的相关程度标注出来。

定义2 专利技术热度。令专利P的发表时间为T,其关键词集合为K={k1,k2,...,kn}, n>0。取专利样本集合S={P1,P2,...,Pm}, m>1, P∈S,且对于Pi的发表时间Ti有,Ti∈[t0,t0+τ],其中t0是当前时间,τ是热度评价限制时间。t0至t0+τ期间,关键词ki在S中出现的频率为Fi。则定义P相对于S的技术热度如下:

其中Fit表示时间(年份)t下关键词ki在S中出现的频率。显然,专利P中的关键词在S中出现的越频繁,其技术热度越高;距离当前时间越远的年份的数据,对热度的贡献越小。因此τ值的选择对评价技术热度至关重要,应当根据技术领域适当调整。专利技术的热度反应的是该专利所包含技术,在最近τ年内相关技术领域对该项技术研究投入的综合反映。专利技术热度越高,专利技术的价值相对越高。

定义3 专利新颖度。对于专利P,发表时间为T,则P的专利新颖度NOV(P)定义如下:。衰减,历史出现关键词少。

其中,T0是当前时间(年份),Ts是专利P关键词首次出现的时间,Ft是专利P在时间t的所有关键词频率,α是专利价值衰减系数。显然,专利的发表时间对专利的新颖度有决定作用,专利新颖度会随着时间的久远逐步衰减。另一个影响专利新颖度的因素是专利关键词首次出现时间和历史出现频率。关键词出现的越早,表明该专利技术越成熟,其新颖度降低。

定义4 专利关联图。对于专利集合S={P1,P2,...,Pm},令有向图G=(V,E)G=(V,E)是S构建的专利关联图,vi与Pi对应。若Pi直接引用Pj,则构建vi到vj的路径,最终得出专利关联图G。如下图所示。

图1

定义5 专利独立价值。考虑专利P仅在专利热度和新颖度因素影响下,其价值定义为专利独立价值,记为RV(P):

RV(P)=γh H(P,S)+γn NOV(P)

其中,γh 和γn分别是热度、新颖度的权重系数。

定义6 关联专利支持度。在图G中,若Pi到Pj存在路径Lm,则Pi的引用对Pj的价值产生了影响,称为路径关联专利支持度,记为)SVP(Pi ,Pj |Lm ),定义如下:

在G中,Pi可能有引用了多个专利。显然引用的专利越多,对所有引用的单个专利影响力越小。Pi到Pj直接可能存在多条路径,每条路径产生的支持度总和,称为关联专利支持度,记为SV(Pi,Pj ),定义如下:

对于Pj,可能存在多个引用它的专利,所有引用关系的总和组成了在S中,Pj的价值,记为V(Pi),定义如下:

4 反馈机制

一般情况下,专利P的专利技术热度H(P,S)H(P,S)由时间窗口τ限制在了一定的时间范围内,因为技术的近期的活跃程度在当前时间才有意义。而久远的活跃度可能一直处于非常低甚至活跃度为零的情况。在样本S足够大的情况下,所含专利的发表时间跨度可能非常之巨大,近期的专利文档Pi可以引用了非常久远的专利文档Pj,这样就会对Pj在关联图G 中提供了价值支持。显然这种价值支持也隐藏着对技术热度的影响。于是,定义以下反馈函数:

通过反馈函数在G中不断迭代,各个超出t的结点会重新调整参数,进而反馈到t内的结点,形成稳定状态。这样的反馈机制很好的解决被多次引证但专利历史久远导致价值计算产生较大偏差的问题。通过反馈机制,使得专利价值关联图形成较为客观的状态。

5 结论

多种因素输入的专利价值评价模型,融合专利引证模型可以较客观的反应专利的技术价值。但仍然可能存在较多的时间久远专利的评价偏差。本文提出的价值反馈机制,很好的解决了该问题。通过构建专利价值关联图模型,加入价值反馈机制,可以有效的对大规模、跨度大的专利文本进行技术价值分析,并且效果良好。

参考文献:

[1]韦嵘晖,颜德昊,陈忠.论专利价值评估对企业科技创新的影响[J].中国发明与专利,2015(10):6-11.

[2]王晋.基于领域本体的专利地图研究[D].苏州大学, 2011.

[3]Jin X, Spangler S, Chen Y, et al. Patent Mainte- nance Recommendation with Patent Information Net- work Model[C]//IEEE, International Conference on Data Mining. IEEE Computer Society, 2011:280-289.

[4]Baron J,Delcamp H.Patent Quality and Value in Dis- crete and Cumulative Innovation[J].Ssrn Electronic Journal, 2012.

[5]Nicolas van Zeebroeck. The puzzle of patent value indicators[J].Working Papers Ceb, 2007, 20(1): 33-62.

[6]汪雪鋒,刘晓轩, 朱东华.专利价值评价指标研究[J].科学管理研究,2008,26(6):115-117.

基金项目:校级课题《基于数据挖掘的专利分析策略研究》(2016C047)

作者简介:张建华,女(汉族),(1986-),河南新乡人,硕士,主要从事数据挖掘和分析、教学软件开发、教学管理等方面的研究。