APP下载

高校专利价值评估模型构建
——以云计算领域为例*

2021-04-09冉从敬

图书馆论坛 2021年1期
关键词:专利权利价值

冉从敬,宋 凯

0 引言

在经济全球化时代,企业竞争愈加激烈,随着新兴技术复杂度的提高,单一企业完成技术创新的难度愈发增加。因此,通过专利权利转移获取外部技术支持,成为企业提升技术创造力的重要形式。高校在技术研发、人才资源、实验条件方面具有天然优势,截止到2018年12月,国内大专院校发明专利有效量为537,953件[1]。面对海量的高校专利资源,部分企业通过专利权利转移方式,实现了高校专利成果的技术价值转化为产业价值。但是,《2019年中国专利调查报告》显示,我国高校专利权人科技成果转化率在10%以下的占到80.1%,高校有效专利产业化率仅仅只有3.7%[2],这说明我国高校大量专利成果束之高阁,高校专利应用比例偏低,导致大量科技成果严重闲置。企业是技术创新的主体,高校是科学研究的殿堂,高校应该更多从事技术转移工作,将科技成果申请专利后,以专利权利转移方式与企业合作,由企业去进行工程化试验和量产,最终实现成果转化[3]。因此,探索提升高校专利权利转移效率的实践路径,对实现高校专利技术价值,推动区域和国家科技创新水平,实现校企联动发展具有重要意义。通过对高校专利进行有效评估,一方面可以发掘高价值度专利,通过规范化的专利运营模式,以权利转移方式,实现专利技术的产业化应用;另一方面,可以剔除低价值度专利,通过断缴年费、声明放弃等形式宣告专利失效,以节省科研成本,加大对前沿技术的投入。因此,如何构建一套具有较强科学性和可操作性的专利价值评估方法,成为高校科技成果管理效率提升以及企业寻求高校核心技术所应重点关注的问题。

对专利价值评估的研究,学者从多方面展开探索。首先,通过构建评价指标体系,采取定量分析进行专利评估。Hiller等将综合市场数据与BLP模型结合,提出实践性较强的专利价值评估方法[4]。Cerqueti等将实物期权方法应用到专利评估中,通过指标体系构建对已有专利评估方法进行有效改进[5]。Kabore等将国家市场规模赋权到专利族数量上预测专利价值,评估效果优于基于专利引文的评估方法[6]。谢萍等利用德温特世界专利索引,从企业专利权人实力和专利技术两个角度构建企业专利价值评价体系[7]。资智洪等比较国内外专利价值评估的关键指标和专利价值的影响因素,构建用于评估专利价值的二元分类方法[8]。杨思思等参考《专利价值分析指标体系》操作手册的经济价值度评估方法,选取7个指标,总结了一套专利经济价值度的通用评估方法[9]。相关学者也借助机器学习算法进行专利价值度评估。Ercan等提出将支持向量机算法应用于专利申请,依据评估结果对专利是否授权或驳回进行判断[10]。Trappey等收集特定技术领域的专利数据,采用BP神经网络对专利潜在价值进行评估[11]。王子焉等构建包含网络平台特性的专利价值评估指标体系,提出基于灰色关联分析—随机森林回归的专利价值评估模型[12]。周成等根据专利的价值指标,设计基于自组织映射—支持向量机的专利价值评估及分类模型[13]。邱一卉等提出基于分类回归树模型的属性选择方法,用于构建专利价值评估的指标体系[14]。

已有研究集中探讨构建专利评价指标体系,通过定量分析对专利价值进行评估,以及采取机器学习算法进行二元分类,以获取高价值度专利列表。通过构建专利评价指标体系的方式,一方面需要对专利进行逐件评估,效率较低;而采取机器学习算法进行专利价值评估,往往是粗粒度的标记标签,不能从更加细粒度的层面计算专利实现权利转移以及存在失效风险的概率。因此,本研究在借鉴与吸收已有研究成果的基础上,从科学性、适应性和可操作性角度出发,提出一种高校专利价值评估模型,以新一代信息技术产业领域——“云计算”为例,搜集专利基本指标构建数据库,利用评估模型对技术领域内的高校专利进行预测,筛选具备权利转移潜力的专利,以及具有失效风险的专利,旨在为高校科技成果管理人员在进行专利运营时提供实践路径,也为企业在寻求高校高价值度专利时提供决策参考。

1 评估指标与研究方法

1.1 评估指标选取

依据国家知识产权局《专利价值分析指标体系操作手册》,结合已有研究应用的评价指标,本研究选取11个指标对专利权利转移概率进行预测,见表1。在选取过程中,一方面关注指标数据是否易于寻找和统计;另一方面考量所选取的指标是否能综合体现专利价值。例如,发明人数量反映了技术研发过程中的合作关系以及核心研究团队规模,权利要求字符数反映了专利技术的保护全面程度,被引用次数反映了专利的技术价值。

表1 专利指标汇总表

1.2 研究方法概述

为验证指标选取的有效性,提升模型的评估性能,在构建识别模型前,首先利用主成分分析法对指标进行分析。主成分分析法是一种分析、简化数据集的技术,经常用于减少数据集的维数,同时保留数据集对方差贡献最大的特征,能够展现数据最重要的方面[15]。在分析过程中,使用KMO和Bartlett检验评估变量是否能够使用主成分分析法来进行研究,KMO 值的范围为0-1,其值越接近1,且Bartlett球形度检验的显著性概率均为0,代表各个变量间相关性显著,表示适合作主成分分析。

本研究在识别模型构建过程中,采用机器学习中的二元分类算法实现。常用的分类算法有逻辑回归、K近邻、支持向量机、人工神经网络、决策树、随机森林、Adaboost等。为选取适用于识别模型的分类算法,本研究采取K折交叉验证,选取最优算法,进而通过参数调优训练识别模型,并绘制ROC曲线。ROC曲线所覆盖的区域面积为AUC值,AUC值越大,表明分类器效果越好,通常AUC的值大于0.7时,表明模型具备预测价值。为从更细粒度的层面区分高校具备权利转移价值的专利和存在失效风险的专利,避免简单地对专利进行二元分类,在对专利进行评估时,获取专利能够实现权利转移的概率值,借鉴标准十分的分级方式,设置从AAA→D共十级得分,根据专利的权利转移概率值进行划分,最终实现识别权利转移专利和存在失效风险专利的目标。

2 高校专利价值评估模型构建

通过选取专利评估指标,在多元统计以及机器学习的支持下,构建高校专利价值评估模型(见图1),帮助高校科技成果管理人员快速定位具有权利转移价值的专利以及存在失效风险的专利,为制定专利运营策略提供决策支持。同时,为企业在寻求高校核心技术时,通过模型评估,筛选存在权利转移价值的专利,为选择合适高校进行知识产权合作提供决策参考。

图1 高校专利价值评估模型图

由图1 可见,模型共分为3 大部分,涵盖“数据采集与存储→指标选取及算法评估→模型构建及专利识别”的全过程。

(1)数据采集与存储。构建的模型要具备较好的识别性,必须依赖大规模专利数据的训练。在评估指标选取阶段,选取的指标都是易于统计且能综合反映专利价值度,因此,需要通过专业化的专利数据库进行专利指标数据的采集。在采集数据过程中,从3个方面出发:一是获取国内发明授权专利中发生权利转移且法律状态有效的专利指标数据;二是获取国内发明授权专利中未发生权利转移但法律状态已失效的专利指标数据;三是获取国内高校发明授权专利中未发生权利转移且法律状态有效的专利指标数据。最终形成专利指标数据库,用于评估模型的构建。

(2)指标选取及算法评估。为提高模型训练性能,借助于主成分分析对评估指标进行分析。在分析过程中,以KMO和Bartlett检验评估指标之间的相关性,保留重要评估指标。其中,以“权利转移次数”作为评判专利是否实现权利转移的标准,构建模型训练集、验证集和预测集。训练集和验证集均包含国内授权专利中已发生权利转移且法律状态有效的专利指标数据以及国内授权专利中未发生权利转移且法律状态已失效的专利指标数据。为得到适用于识别模型的分类算法,采用十折交叉验证对7 种分类算法进行初步评估,通过性能比较获取最优算法。

(3)模型构建及专利识别。获取最优分类算法后,使用训练集对算法进行参数调优,构建评估模型,并使用验证集对模型性能进行检验,绘制ROC 曲线,以AUC 值评估当前模型的有效性,当AUC值高于0.7以上,表明评估模型具有预测价值。最后,使用评估模型对预测集中高校未发生权利转移且法律状态有效的专利进行预测,借鉴标准十分的评估标准,依据概率值不同进行十级划分,最终识别出具有权利转移价值的专利以及存在失效风险的专利。

3 高校专利价值评估模型实证

3.1 数据采集与处理

本文数据从Patsnap专利数据库进行采集,技术领域限定为“云计算”,检索式为:“云计算”or“云平台”or“云存储”or“云数据中心”or“数据云”or“医疗云”or“云计算中心”or“云计算系统”or“大数据云”or“云计算技术”;时间不限。首先以“中国发明授权专利&法律状态→有权&法律事件→权利转移”,检索到1,971件专利;以“中国发明授权专利&法律状态→无权&法律事件→未缴年费|放弃权利”,检索到1,663件专利;以“中国发明授权专利&专利权人→大学&法律状态→有权&法律事件→未发生权利转移”,检索到1,948 件专利,依据选取的专利评估指标,获取每件专利的基本数据,构建专利指标数据库。

在专利指标数据库构建完成后,划分训练集、验证集和预测集。其中将“有权&权利转移”中的1,500条数据与“无权&(未缴年费|放弃权利)”中的1,500条数据合并成训练集;将“有权&权利转移”中的471条数据与“无权&(未缴年费|放弃权利)”中的163 条数据合并成验证集;将“大学&有权&未发生权利转移”中的1,948条数据作为预测集,分别用于之后的模型训练和专利识别。

3.2 指标筛选及算法评估

在进行算法评估前,首先将训练集和验证集合并进行主成分分析,确定评估指标之间的相关性,以确定评估指标选取的有效性。利用SPSS进行主成分分析,通过多轮指标数据迭代,结合相关矩阵数值和KMO数值,确定保留11个评估指标,以获取较好的主成分分析结果。对结果进行分析,发现相关矩阵表中,大部分非对角线元素都大于0.3,小于0.85,且对应的Sig值较小,说明变量之间具有相关性,能够进行主成分分析。KMO度量值为0.698,Bartlett球形度检验显著,进一步体现各个变量间相关性显著,适合作主成分分析。依据主成分解释的总方差表和碎石图,当保留5个主成分时,累计方差贡献率为71.4%,说明这5个主成分能够解释绝大部分的原始变量信息。结合成分载荷矩阵中各个影响因素相对应的载荷量与主成分之间的紧密关系进行划分,对主成分进行重新命名,见表2。

表2 专利评估指标重要成分表

由表2可以发现,根据各个成分下的影响因素进行归纳,11个指标涵盖专利的经济特征、技术特征、法律特征、应用特征和战略特征,能够较为全面地反映专利的价值度,所以以这11个指标进行专利价值评估是合理的。利用包含11个指标的训练数据集,分别对“0→逻辑回归”“1→K近邻”“2→人工神经网络”“3→支持向量机”“4→决 策 树”“5→随 机 森 林”“6→Adaboost”等7种算法进行性能评估,采取十折交叉验证计算分类准确度平均值,并绘制折线图,见图2。从图2可发现,在没有进行参数调优的情况下,人工神经网络的分类性能最优,因此,在识别模型的构建过程中采用人工神经网络算法实现。

图2 分类算法性能评估图

3.3 模型构建及专利识别

通过算法评估选取人工神经网络构建模型,首先利用包含3,000条数据的训练集对模型进行训练,采用十折交叉验证对模型进行调优,当激活函数使用relu、优化算法采用Adam、包含3层隐含层、每层20个神经元,最大迭代次数设置为1,000 时,分类准确度约0.76,损失度约0.26。使用包含634条数据的验证集,测试模型对未知数据的分类性能,绘制ROC曲线,见图3。由图3可见AUC的值约为0.77,表明模型具备较高的预测价值,能够应用到高校权利转移专利及存在失效风险专利的识别。

图3 验证集ROC曲线图

在验证模型有效性的基础上,利用模型对预测集中的高校专利进行识别,获取每件专利能够实现权利转移的概率及存在失效风险的概率,借鉴标准十分评估方法,设置专利实现权利转移概率的十级阈值,形成评估表3。从表3 发现,在“云计算”领域,处于AAA 级的专利比重为10.68%,而CCC 级→D级的专利比重约22.64%,反映出高校具备权利转移价值的专利比例较少,近四分之一专利存在失效风险。

表3 高校专利权利转移概率统计表

在十级评分的基础上,依据每件专利的权利转移概率绘制柱状图,并添加趋势线,见图4。分析图4发现,高校专利权利转移概率呈二次多项式分布,R2=0.99,方程拟合程度较好,体现了高校在“云计算”领域中,少部分专利具备高价值度,大部分专利价值度较低。这种状况产生的原因,一方面是部分高校专利的申请是由研究课题驱动产生的,与已发生权利转移的专利相比,在技术深入度、经济产业化、法律完备性方面存在差距;另一方面,为了保护核心技术,高校在专利申请时往往会进行专利布局,产生了大量不具备权利转移价值的专利。因此,结合以上情况,在“云计算”领域,通过专利识别模型确定出10.68%具有权利转移价值的专利,并不是处于一个较低水平,这部分专利应该得到高校科技成果管理部门的重视,围绕高价值度专利,构建专利技术包,并制定专利运营策略,寻求技术转移。同时,对其他存在失效风险的专利,应展开遴选,放弃专利权,节约高校科研成本,将其投入到研究团队的研发中,进一步提高发明专利的核心竞争力,提升产业应用价值。

图4 高校专利权利转移概率分布趋势图

3.4 分析与讨论

通过构建专利价值评估模型对高校“云计算”领域存在权利转移价值和失效风险的专利进行识别,并依据权利转移概率,借鉴标准十分评估法对专利进行打分,其中AAA级的权利转移概率最高,D级存在失效风险的概率最高,对这两个级别下的专利指标数据进行重点分析,首先基于熵权法计算已发生权利转移专利中各个指标的权重,探析哪些指标是影响专利权利转移的重要因素,进而对AAA级和D级中的高校专利进行指标平均值计算,统计结果见表4。

表4 高校专利权利转移概率(AAA、D)基本指标平均值统计表

分析表4发现,采用熵权法计算的11个指标权重,其中引用专利数量的权重最高,引用专利数量体现的是专利技术吸收复杂度,引用专利数量越多,表明专利基于的前沿技术越多元,技术基础越扎实,是专利技术价值的重要体现。3年内被引用次数和5年内被引用次数的权重大小也位居前列,这两项指标体现了领域内研发人员对该专利技术的认可,被引用次数越多,表明该专利对领域内其他专利的技术创新具有重要的指引作用,是专利经济价值和应用价值的重要体现。权利要求字数这一指标也具备较高权重;权利要求限定了专利的保护范围,是判定侵权的主要依据,直接影响了专利的技术创新能力,是专利法律价值的重要体现。以上四个指标对高校专利权利转移概率具有较大的影响作用,在高校进行专利申请和专利运营时应该得到重视。

进一步对表4中AAA级和D级的专利指标平均值进行对比分析,发现除“X1→IPC分类号数量”和“X10→摘要字数”两个指标之外,在其他9个指标中,AAA级专利的指标平均值明显高于D级。结合上述对占据重要权重指标的分析,对高校和科研团队进行技术研发和专利申请提出了更高要求,应该重视高权重指标对高校专利权利转移的影响作用。因此,在高校层面,高校知识产权信息服务中心要为科研团队的专利创造、管理和运营提供全方位支持,对科研团队提出的研究内容进行广泛深入的科技查新,保证研究内容的前沿性和尖端性;在技术交底书的撰写过程中,专利引证数量、权利要求数量、权利要求字数等方面要做到全面扎实,保证专利的质量和保护范围;针对核心技术,要做好专利布局工作,通过申请同族专利,形成技术竞争优势,这也为提高专利的被引证次数奠定基础。在科研团队层面,专利技术的提出要建立在对前沿技术进行全面整合的基础上,保证技术的复杂度和创新性;在科研团队组建方面,要保证足够数量的技术人员实现专利技术的产业化应用。综合以上分析,本文所提的专利价值评估模型不仅能够识别高校中某一技术领域存在权利转移价值和失效风险的专利,推动高校专利技术向产业界转移,还能在此基础上对识别结果进行深入剖析,发掘核心专利指标对专利权利转移的影响,对于强化高校专利质量,提升高校科技成果管理部门、高校知识产权信息服务中心的专利管理和专利服务效率具有重要的参考价值。

4 结语

本文从科学性和易操作性角度出发,选取高校专利价值评估指标,将主成分分析法与分类算法结合,为高校科技成果管理人员提供了行之有效的方式,快速识别已有的授权专利中,具备权利转移价值和失效风险的专利,为高校制定专利运营策略以及企业快速定位高校核心技术提供参考支持。本文存在的不足之处有:所构建的评估模型仅使用“云计算”领域的专利数据,数据样本较少;另外在指标选取过程中,为了指标的易获取性,仅选取11个指标形成评估体系,科学性有待进一步验证。因此,在后续研究中,将探索构建全领域的专利数据样本,扩充专利评估指标体系,实现对高校不同技术领域中具备权利转移价值专利的识别。

猜你喜欢

专利权利价值
专利
我们的权利
发明与专利
论不存在做错事的权利
一粒米的价值
“给”的价值
权利套装
专利
爱一个人
节能——环保——专利