高校专利技术转移价值评估研究
——基于熵权TOPSIS模型和梯度提升树算法
2021-07-20宋凯
宋 凯
(武汉大学信息管理学院 武汉 430072)
0 引 言
专利作为人类知识创造的产物,蕴含了巨大的技术和商业价值,根据世界知识产权组织的相关数据,全球有90%以上的发明创造信息来源于专利,世界上所有技术知识的80%都能够在专利文献中找到[1]。因此,通过专利转让、专利许可,获取外部技术支持,成为当前企业提升技术创造力的重要形式。高校在技术研发、人才资源、实验条件方面具有天然优势,截止到2018年12月,国内大专院校发明专利有效量为537 953件[2],面对海量的高校专利资源,企业也积极通过技术转移的方式,实现高校专利成果的技术价值转化为产业价值。于此同时,依据《2019年中国专利调查报告》,高校专利有效实施率为13.8%、产业化率3.7%、许可率2.9%、转让率3.2%[3],说明仍有大量的专利成果被束之高阁,专利的应用比例偏低,导致了大量的科技浪费与闲置。因此,如何构建一种具有较强科学性和可操作性的专利技术转移价值评估方法,成为高校探索专利运营以及企业寻求高校核心技术所重点关注的问题。
本文的研究目标是:a.选取高校专利技术转移价值评估指标(以下简称“评估指标”),运用评价较为客观的熵权TOPSIS模型设置评估指标权重,采用人工方式对高校专利技术转移价值进行评估,获得具有转让/许可价值的专利以及存在失效风险的专利。b.运用梯度提升树算法,通过机器学习的方式对高校具备转让/许可价值以及存在失效风险的专利进行评估。c.将基于熵权TOPSIS模型的人工计算方式与基于梯度提升树的机器学习评估方式相结合,对我国高校人工智能领域授权发明专利中具备转让/许可价值以及存在失效风险的专利进行评估,为高校专利运营以及企业寻求高校核心专利提供方法参考。
1 相关研究
专利是一种具有极高的使用价值和交换价值的无形商品,专利评估本质是对专利价值进行评估,通常涵盖技术、经济、法律三个价值维度[4]。国内外学者也就专利价值评估方法展开了多角度的探索,主要涵盖以下三个方面:
首先,学者通过构建评估指标体系,采取定量分析进行专利价值评估。国外学者如Kabore等人将国家的市场规模赋权到专利族数量上预测专利价值,其评估效果优于基于专利引文的评估方法[5]。Cerqueti等人将实物期权方法应用到专利评估中,通过指标体系构建对已有的专利价值评估方法进行了有效改进[6]。Hiller等人将综合市场数据与BLP模型结合,提出了一种实践性较强的专利价值评估方法[7]。国内学者如吕晓蓉考虑技术、市场、竞争和法律因素对专利价值的影响,建立专利价值评估指标体系[8]。李振亚等人构造基于数量指标、质量指标和价值指标的“专利三维评估指标体系”,重点采用典型相关分析模型对专利质量与价值之间的相关关系进行推演[9]。张耀天等人为降低外部因素影响,凸显稀缺性指标导向作用的需求,对基于自适应层次分析法的企业专利质量评估方法进行深入研究[10]。
其次,学者借助于机器学习算法进行专利价值评估。国外学者如Chung等人以半导体产业领域为例,采用卷积神经网络,并融合专利语义信息对专利技术价值进行了评估[11]。Trappey等人收集了特定技术领域的专利数据,采用BP神经网络对专利潜在价值进行了评估[12]。Ercan等人提出将支持向量机(SVM)算法应用于专利申请,依据评估结果对专利是否授权或驳回进行判断[13]。国内学者如赵蕴华等人采用机器学习方法中决策树、SVM和神经网络三种算法对专利价值评估指标进行测试,验证了机器学习方法在专利价值评估的作用[14]。王子焉等人构建了包含网络平台特性的专利价值评估指标体系,提出了基于灰色关联分析—随机森林回归的专利价值评估模型[15]。周成等人根据专利的价值指标,设计基于自组织映射—SVM的专利价值评估及分类模型[16]。邱一卉等人提出了一种基于分类回归树模型的属性选择方法,用于构建专利价值评估指标体系[17]。
在理论研究的基础上,目前已存在多个机构和专利服务平台能够实施专利价值评估。如ProQuest Dialog 公司推出的Innography平台,综合10 多个影响因素构建了复合指标算法模型,提出“专利强度”作为评估指标,以挖掘核心专利价值;合享汇智信息科技集团有限公司开发的IncoPat 科技创新情报平台,创建了专利价值评估指标—专利价值度;PatSnap专利检索分析系统由智慧芽信息科技有限公司开发,整合了专利价值相关的 25 个不同维度,基于机器学习算法,以货币形式给出专利估值[18]。
分析发现,已有的专利价值评估方法研究主要集中在专利价值指标体系构建,在此基础上通过定量分析评估专利价值,或者采取机器学习算法进行价值预测,获取高价值度专利列表。采取构建指标体系进行定量分析的方式,对专利价值进行逐件评估,效率较低,对专家评估依赖程度较高,评估结果主观性较强;而采用机器学习的方式,过分依赖模型训练,不能发挥人的主观能动性,缺少对结果的人工验证。同时,使用PatSnap、IncoPat等专业平台进行专利价值评估,虽然对每件专利赋予了价值标签,但通过在线调研发现,存在部分高分专利已失效的情况,所以依赖分析平台对专利进行价值评估,判断专利是否有转让/许可价值或失效风险略显不足。本文将专利技术转移价值定义为:对于权利有效但尚未实现权利转让和许可的专利,具备实现转让或许可的特征和可能性。因此,本文在吸收已有研究成果的基础上,提出了一种高校专利技术转移价值评估方法,将基于熵权TOPSIS模型的人工评估与基于梯度提升树的机器学习评估相结合,对我国高校人工智能领域中存在转让/许可价值或失效风险的专利进行挖掘,以验证本文所提方法的有效性。
2 研究步骤与研究方法
2.1步骤一:高校专利技术转移价值评估指标选取
评估指标选取是高校专利技术转移价值评估的基础。本文在借鉴前人研究成果的基础上,通过查阅国家知识产权局的《专利价值分析指标体系操作手册》,基于指标的可得性和科学性,从法律维度、技术维度、市场维度和战略维度四个方面出发,选取了12个评估指标,见表1。总体来看,这12个评估指标能够较为全面反映专利特征,将在后续应用于对高校专利技术转移价值进行评估。
表1 高校专利技术转移价值评估指标汇总表
2.2步骤二:基于熵权TOPSIS模型的专利技术转移价值评估在确定评估指标的基础上,首先采取人工计算的方式,对高校中未发生技术转移的专利进行评估,确定具有转让/许可价值和存在失效风险的专利。为了实现以上目标,本文采用熵权TOPSIS模型进行计算。熵权TOPSIS法是将信息熵和TOPSIS相结合的评估方法,可以克服传统TOPSIS方法不能够反映变量之间相对重要程度的局限,能客观确定指标的相对权重,更具有科学性、和可行性[19]。因此,本文采用熵权TOPSIS模型设置评估指标权重并测算各件专利的技术转移价值。主要计算过程如下:
a.将高校中已发生技术转移的专利和权利已失效的专利构成标准集,将高校权利有效但未发生权利转移的专利构成评估集。
b.假设标准集中有m件专利、12个评估指标,则构建的原始评估指标矩阵为:
(1)
进而,对原始评估指标矩阵进行归一化处理,公式为:
(2)
再者,计算各评估指标的熵值:
(3)
最后,计算各评估指标的权重,公式为:
(4)
c.使用余弦距离度量对原始评估指标矩阵X进行向量规范化,xij为第i件专利第j个指标的初始值,公式为:
(5)
由此,得到归一化后的评估指标矩阵Z:
(6)
进一步,确定最优方案和最劣方案,其中最优方案由Z中每列元素的最大值构成,最劣方案由Z中每列元素的最小值构成,公式为:
Z+=(max{z1,1z2,1…zm,1},max{z1,2z2,2…zm,2},…,max{z1,12z2,12…zm,12})
(7)
Z-=(min{z1,1z2,1…zm,1},min{z1,2z2,2…zm,2},…,min{z1,12z2,12…zm,12})
(8)
在此基础上,计算每件专利与最优方案和最劣方案的欧式距离,其中,wj是通过熵权法计算得到的指标权重,计算公式为
(9)
最后,计算各件专利与最优方案的相对接近度Ci,其中,0≤Ci≤1,Ci值越大,表明专利越具备技术转移价值。
(10)
d.在对标准集计算相对接近度Ci的基础上,对标准集中已发生技术转移专利和已失效专利分别计算相对接近度平均值Ci_avg_transfer和Ci_avg_invalid,作为评估高校未技术转移专利中存在许可/转让价值和失效风险的专利。
e.考虑到标准集中包含了已发生技术转移的专利和权利已失效的专利,通过熵权法计算得到的评估指标权重具有较好的代表性,能综合反映各个评估指标的重要程度,因此,对于同属一个技术领域的评估集,将沿用标准集的评估指标权重,以保证前后计算一致性。针对评估集中的评估指标数据,重复(c)的过程,获取评估集中每件专利的相对接近度Ci,并分别统计大于Ci_avg_transfer和小于Ci_avg_invalid的专利作为熵权TOPSIS模型评估出的具有技术转移价值和存在失效风险的专利。
2.3步骤三:基于梯度提升树的高校专利技术转移价值评估采用熵权TOPSIS模型能够实现对高校未发生技术转移专利的人工评估,而当前机器学习作为人工智能的一种关键技术,让机器通过利用现有知识来获得新的技能,极大提升了各个领域研究问题的解决效率。本文尝试采用机器学习中的梯度提升树算法(Gradient Boosting Decision Tree,GBDT)对高校专利的技术转移价值进行评估。在模型评价方面,采用曲线下面积(Area Under Curve,AUC)作为衡量模型预测性能好坏的主要标准,该指标是指受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)所覆盖的面积,通过依次遍历真正率(TPR)和假正率(FPR)这两个指标阈值来绘制ROC曲线。AUC的取值范围在0.5→1之间,面积越大,则模型性能越高[20]。
2.4步骤四:基于混合方法的高校专利技术转移价值评估通过上述基于熵权TOPSIS模型的人工评估和基于梯度提升树的机器学习评估,分别获得高校未发生技术转移专利中存在许可/转让价值和失效风险的专利集合。对两种方法评估得到的专利集合取交集,最终实现基于人工方式和机器学习方式混合的高校专利技术转移价值评估。在此过程中,一方面是采取了客观的人工评估方法,充分发挥人脑智能,另一方面,发挥了机器学习在推理学习方面的优势,充分使用了机器智能,通过两种混合方法实现的交集结果,进一步保证了评估过程的科学性和合理性。
3 实验过程及分析
3.1数据来源与处理本文数据来源于IncoPat专利数据库,选择分析的技术领域为“人工智能”。在数据检索过程中,专利来源选择为中国发明授权专利,检索式设置为:标题/摘要=(“人工智能” or “智能系统” or “物联网” or “人机交互” or “智能技术” or “智能机器人” or “深度学习” or “语义网络” or “图像识别” or “图像检测” or “神经网络” or “机器视觉” or “专家系统” or “智能搜索” or “智能控制” or “智能问答” or “机器学习”),申请人模糊匹配“大学”,时间不限,共检索到11 016件专利。依据选取的评估指标进行数据导出,对数据缺失的专利进行筛选,剩余10 896件专利,其中许可/转让专利761件,权利失效专利2 132件,权利有效但未发生技术转移的专利有8093件。
3.2基于熵权TOPSIS模型的高校专利技术转移价值评估依据熵权TOPSIS模型的实验流程,首先对将检索到的高校许可/转让专利和权利失效专利数据融合形成评估指标数据标准集,共包含2 893件专利,然后采用熵权法计算12个评估指标的权重,结果为:w={0.105,0.035,0.101,0.070,0.018,0.060,0.184,0.020,0.112,0.222,0.017,0.056}。其中,家族被引证次数的权重最高,家族被引证次数越多,一方面体现了申请人对专利技术的重视以及布局,另一方面体现了专利技术创新度在不同国家和地区得到认可,对后续相关方向上的技术创新具有重要的指引作用,相对于被引证次数,其更能综合体现专利的自身价值度,是专利市场维度和战略维度的重要体现。引证次数和家族引证次数的权重排名第二、三位,家族被引证次数体现的是专利的技术扩散影响力,而引证次数体现的技术吸收复杂度,引证次数越多,体现了专利参考的前沿技术越多元,技术基础越扎实,是专利技术维度的重要体现。而权利要求数量和独立权利要求字数的权重也大于0.1,这两个指标限定了专利的权利保护范围,是判定侵权的主要参考依据,直接反映了专利的技术创新能力,是专利法律维度的重要体现。通过对熵权法计算得到的结果进行分析,验证了评估指标进行不同赋权的合理性。
在获取评估指标权重的基础上,依据TOPSIS模型的计算流程,对标准集中的每件专利计算相对接近度Ci,经过计算可得,许可/转让专利的平均Ci值为0.083,权利失效专利的平均Ci值为0.079,将这两个数值作为判断专利是否具备技术转移价值或失效风险的阈值。在此基础上,将高校未发生技术转移的8 093件专利形成评估集,采用TOPSIS模型计算流程,得到每件未发生技术转移专利的Ci值,对其中Ci值大于0.083的筛选出来作为具备技术转移价值的专利集合,共包含2 517件专利;Ci值小于0.079的筛选出来作为存在失效风险的专利集合,共包含5 121件专利。上述熵权TOPSIS模型计算过程是以人工方式完成,因此,整个过程可以视作通过人工方式实现对高校专利技术转移价值进行评估。
3.3基于梯度提升树的高校专利技术转移价值评估依据梯度提升树算法进行专利技术转移价值评估的实验流程,首先将高校许可/转让专利和权利失效专利数据融合形成模型训练集和验证集,按照“二八分配”的比例,训练集包含2 314条数据,验证集包含579条数据,其中“技术转移次数”作为判断专利是否实现技术转移的标准,当存在一件专利被许可多次的情况,技术转移次数将统一设置为1。然后,利用包含2 314条数据的训练集对梯度提升树模型进行训练,采取十折交叉验证对模型参数组合进行调优,当最大迭代次数n_estimators = 500,最大深度max_depth = 7,学习率learning_rate = 0.1,子采样比例subsample = 0.7时,模型的评估准确度约为0.976。进而,使用包含579条数据的验证集,测试模型对未知数据的评估能力,并绘制ROC曲线,得到AUC的值约为0.959,表明模型具备较高的评估价值。在完成模型构建的基础上,利用模型对包含8 093件专利数据的预测集进行评估,共获取到具备许可/转让价值的专利3 398件,存在失效风险的专利4 695件。通过以上方式,实现了以机器学习方式对高校专利技术转移价值进行评估。
3.4基于混合方法的高校专利技术转移价值评估
综合上述基于熵权TOPSIS模型和基于梯度提升树的实验流程,对高校人工智能领域未发生技术转移专利进行了评估,得到具备许可/转让价值的专利集合和存在失效风险的专利集合。对通过两种方法得到的专利集合取交集,最终获得高校具备技术转移价值的专利700件,存在失效风险的专利2 605件,对两个集合中的评估指标数据进行平均值和中位数计算,结果见表2。
通过两种方法评估得到的具备许可/转让价值的专利,其占比约为8.137%,而存在失效风险的专利,占比约为30.28%。这种状况产生的原因,一方面是部分高校专利的申请是由研究课题驱动产生的,与已发生技术转移的专利相比,在技术深入度、经济产业化、法律完备性方面存在差距;另一方面,为了保护核心技术,高校在专利申请时往往会进行专利布局,产生了大量不具备技术转移价值的专利。因此,结合以上实际情况,在人工智能领域,评估出8.137%具备技术转移价值的高校专利,并不是处于一个较低水平,这部分专利应该得到高校科技成果管理部门的重视,围绕核心专利,构建专利技术包,并制定有效的专利运营策略,积极寻求技术转移。同时,对于其他存在失效风险的专利,应展开遴选,放弃专利权,节约高校科研成本,将其投入到前沿技术的研发中,进一步提升专利的技术竞争力。
表2 具备技术转移价值和存在失效风险专利的评估指标计算表
另一方面,分析表2发现,具备许可/转让价值的专利,其12个评估指标的平均值都高于存在失效风险的专利,6个评估指标的中位数也高于存在失效风险的专利,这也给高校和科研团队在进行技术研发和专利申请时提出了要求,对高权重评估指标在专利技术转移中的影响因素予以重视。在学校层面,高校知识产权信息服务中心要为科研团队的专利创造和管理提供全方位支持,对科研团队的技术切入点进行深入的技术查新,保证技术的前沿度;在技术交底书的撰写过程中,在引证次数、家族引证次数、权利要求数量、独立权利要求字数、专利页数等方面做到全面扎实,保证专利的质量和技术创新度;针对核心技术,要做好专利布局工作,通过同族专利申请,形成技术竞争优势,这也为提高专利的被引证次数奠定基础。在科研团队层面,专利技术的提出要对前沿技术进行全面整合,保证技术的复杂度和创新度,在科研团队组建方面,要保证足够数量的技术人员对专利技术实现开发应用,这些都对专利是否具备技术转移价值产生了重要影响。综合以上分析,本文所提的高校专利技术转移价值评估方法,不仅能够为高校对某一领域具备许可/转让价值的专利和存在失效风险的专利进行评估,推动高校专利技术向产业界转移,还能在此基础上,对评估结果进行更深层次的剖析,发掘核心评估指标对专利技术转移价值的影响,这对提升高校的专利质量,推进高校科技成果管理部门、高校知识产权信息服务中心的专利管理和运营效率具有重要意义。
4 结 语
科技决定国力,加强科技成果转移转化,构建产学研深度融合的技术创新体系,对实现国家创新发展具有重要意义。本文以高校专利技术转移价值评估为研究重点,将基于熵权TOPSIS模型的人工计算方法与基于梯度提升树的机器学习方法相结合,对我国高校人工智能领域的发明授权专利进行评估,获得了具备许可/转让价值和存在失效风险的专利。本文所提的方法,充分发挥了人工评价与机器智能的优势,避免了单纯依赖一种方式所造成的结果失真问题,为高校制定专利运营策略以及企业快速定位高校核心专利提供了方法参考。
需要说明的是,本文仅使用了人工智能领域的专利进行方法实证,在领域多源性方面有待进一步扩充;另外,在评估指标选取过程中,为了评估指标的易获取性,仅选取了12个评估指标,合理性有待进一步验证。因此,在今后的研究中,将继续深入探索高校专利技术转移相关问题,为提升高校技术转移效率,推动校企技术创新助力献策。