混合智能下的高校专利价值评估方法*
2021-09-05冉从敬刘瑞琦
冉从敬,李 旺,宋 凯,刘瑞琦
0 引言
当前知识经济迅猛发展,专利权成为企业乃至国家战略资源。截止到2019年12月,国内大专院校发明专利有效量为622,128件[1]。社会各界积极通过许可或转让方式实现高校专利成果的转移转化。比如,华南理工大学轻工科学与工程学院胡健教授团队研发的“芳纶纸专利成果”作价6,684万元入股中车集团合作创办高新技术企业;中国地质大学(武汉)程寒松教授的“常温常压储氢”技术,以2,000万元转让给武汉地质资源环境工业技术研究院。随着专利价值实现路径的拓宽,其在转让交易、质押融资、出资入股、法律维权等方面的作用日益凸显,随之而来的专利权价值评估显得尤为重要,做好专利权价值评估方能充分实现其社会效益和经济效益。因此,构建一种具有较强科学性和可操作性的专利价值评估方法,盘活海量专利资源,实现技术产业化,激活知识产权转移转化市场,成为高校探索专利运营以及企业寻求高校核心技术所重点关注的问题。对专利价值评估方法的研究,学者主要从两方面展开讨论。
第一,在构建指标体系,采取定量分析进行专利价值评估方面,Dahooie等提出结合MADM方法的专利价值评估和优先级确定框架[2];Ma等构建一套包括指标体系、指标权重计算、评分标准确定和专家评分计算在内的专利价值评估体系[3];郭玲等结合技术、法律和市场相关方,提出适于企业内部评估管理、主客观相结合的专利价值评估指标[4];张梦雅等构建一套面向专利顾客的价值评估指标体系,运用层次分析法计算指标权重[5];刘剑锋等立足于企业微观层面的专利价值评价,从可实施性、实施结果科学性角度出发,构建“四位一体”的综合指标体系[6]。
第二,在借助于机器学习算法进行专利价值评估方面,Han等使用文本挖掘来识别与专利价值相关的要素,着重挖掘其生存期,有助于提高专利价值评估水平[7];Ercan等提出将支持向量机算法应用于专利申请,依据评估结果对专利是否授权或驳回进行判断[8];Lai等结合因子分析的扩展神经网络,构建专利指标和损害赔偿的估值模型,有助于专利交易、专利许可、无形资产抵押、专利技术入股等[9];吕霁结合专利价值理论及BP神经网络理论,构建专利价值评估神经网络模型,证明BP神经网络在专利价值评估中的适用性[10];刘伍堂等总结出一种对专利性质和价值评估的指标体系,并将该价值评估指标体系与大数据技术相结合,提出基于文献和大数据的对专利性质和价值的评估分析方法[11];周成等根据专利价值指标,设计基于自组织映射—支持向量机的专利价值评估及分类模型[12]。
已有研究主要从构建指标体系,采取定量分析进行专利价值评估,或借助于机器学习算法进行专利价值评估。通过构建专利价值评估指标体系的方式,在构建指标体系后,需要依据评估体系对专利进行逐件评估,效率较低;采用机器学习算法评估专利,在评估过程中高度依赖机器学习算法,没有发挥人的主观能动性,如果对识别结果进行人工干预,则容易造成结果失真现象。因此,本文首先结合已有研究中应用的专利评估指标,从数据易获取性和科学性出发,创建包含多个指标的专利评估指标体系;进而以“新能源汽车”为例,构建多指标专利评估数据集;最后分别采用熵值法与人工神经网络算法,以人工打分和模型预测相结合的方式,构建混合智能下的高校专利评估方法。该方法结合熵权法的客观性与易解释性,人工神经网络算法的高效性与智能性,对两种评估方法去粗取精,创造性的用人工打分与模型预测相结合的方式来进行专利识别达到了优势互补的目的,理论上具有更高的评估性能。将提出的方法应用于识别高校新能源汽车领域具备转移价值的专利,最终获得了满意的结果,验证了方法的有效性与实用性,也为促进高校科技成果管理部门的专利运营效率,以及企业快速锁定高校高价值专利提供了参考。
1 研究步骤与研究方法
通过选取专利价值评估指标,结合熵权法与人工神经网络算法进行专利价值评估,构建基于混合智能的专利价值评估方法,见图1。该方法可帮助高校及科研院所快速锁定高价值专利,为制定专利运营战略与专利布局提供决策支持。同时,也能为企业快速锁定高校高价值专利提供实践参考。本文遵循“专利价值评估指标选取→基于熵权法与人工神经网络算法专利价值评估研究→基于混合智能的专利价值评估研究”逻辑流程。
图1 高校专利价值评估方法逻辑流程图
1.1 专利价值评估指标选取
高校在专利技术转化时存在专利价值评估能力弱、产学研合作意识弱、市场信息不对称及专利转化成本过高等问题,严重阻碍专利转移转化的积极性与效率,使得耗费大量科研资金获得的专利技术处于闲置或无效状态,直接影响技术创新。为打破专利技术转化障碍,提高专利转化效率,需构建高校专利价值评估方法指标体系。构建该评估方法的第一步为选择评价指标,评价指标的适用度直接关系着专利价值评估方法是否具备可用性和科学性。为保证专利价值评估方法评价的科学性、合理性及可行性,作者在咨询专家意见、结合高校专利特点的基础上,按照可获取性、全面性、重要性、独立性、定性指标与定量指标相结合的原则设计高校专利价值评估方法指标体系。已有研究对评价指标与转移价值的相关性有了充分论证,本文在已有研究基础上,依据国家知识产权局专利管理司《专利价值分析指标体系操作手册》对已有价值评估指标进行扩展与延伸,选取13个指标对专利价值进行评估[13-15]。在选取过程中,一是关注指标数据是否易于寻找和统计;二是选取的指标能综合体现专利价值,如发明人数量反映技术研发过程中的合作关系以及核心研究团队规模,权利要求字符数反映专利技术的保护全面程度,被引用专利数量、被引用次数反映专利的技术价值。综合技术、法律、经济3个维度,遵循易获取性、综合性原则,得到13个基于专利文献自身的二级指标,见表1。
表1 专利指标汇总表
1.2 基于熵权法与人工神经网络算法的专利价值评估研究
(1)熵权法。构建高校专利价值评价指标体系后,下一步是对各评估进行赋权。常用的赋权方法包括主观赋权法与客观赋权法。主观赋权法过分依赖于主观判断,专家素质参差不齐,容易影响评价结果。客观赋权法是基于客观数值的内在联系计算得出指标权重的赋权方法,不受主观判断影响,得出的结果更客观。熵权法属于客观赋权法,本文采用熵值法作为高校专利价值评价的赋权方法。本文将处理后的专利数据根据权利转移次数划分为权利转移实验集与权利未转移实验集,首先将全部专利数据导入指标体系,通过熵权法计算指标权重,根据指标权重对权力转移实验集的每个专利进行打分,算出平均分,而后将权利未转移实验集引入指标体系,也对其进行赋权打分,最后根据权利转移实验集的平均分对权利未转移实验集进行筛选,筛选出高于平均分的权利未转移专利,笔者将其称为有潜在转移价值的专利,并将其归入权利转移数据集,进而得出专利筛选的最终成果。利用熵权法计算指标权重的步骤如下:
①显效:疼痛症状明显减轻,且>2级,骨转换生化指标显著改善。②有效:疼痛减轻1~2级,骨转换生化指标有所好转。③无效:症状、体征、骨转化指标等均无改善,甚至加重。
a.构建原始矩阵。假设有m个被评价专利,n个评价指标,即可构建原始矩阵X:
其中,Xti表示第t项专利,第i项指标的实际值。
b.数据无量纲化处理。消除物理量影响,将各个指标数据进行无量纲化处理:
为了数据运算处理有意义,必须消除零和负值,故需对无量纲化后的数据进行整体平移,即Yij=Yij+α,但为不破坏原始数据的内在规律,最大限度地保留原始数据,α的取值必须尽可能的小,即α为最接近Yij的最小值,本文取α=0.0001。
c.熵值计算。计算第j项指标的嫡值:
d.差异性系数计算。
e.计算第j项指标的熵权Wj:
其中S为被评价专利的价值得分,Wj为指标权重,Xi为被评价专利指标值。
(2)人工神经网络算法。为提高有价值专利识别精准度与专利识别效率,本文将人工神经网络算法中的前馈神经网络引入专利价值评估体系。前馈神经网络是使用最广泛的神经网络结构之一,理论上它可以在任意精度下逼近任意函数[16]。常见的前馈神经网络有神经网络、高阶神经网络、双并联神经网络等。全连接层是神经网络算法中最早出现的计算结构之一,有原理简单、易于实现、调试方便等优点,被广泛应用在神经网络计算架构,通常被用在局部或全局的节点汇总及特征抽取等业务。所以,本文选择全连接前馈神经网络算法进行专利识别。全连接前馈神经网络通常由一个输入层、若干隐藏层和一个输出层组成,输入层负责展开特征,隐藏层负责对数据进行复杂的非线性变换,输出层负责汇总特征。一般隐藏层层数越多,非线性能力越强,而隐藏层参数越多,模型能够拟合的结果越复杂[17]。在前馈神经网络中,不同的神经元属于不同的层,每一层的神经元可以接受到前一层的神经元信号,并产生信号输出到下一层。第0层叫做输入层,最后1层叫做输出层,中间的叫做隐藏层,整个网络中无反馈,信号从输入层到输出层单向传播。全连接层的计算过程可以概括为两步,线性参数计算和非线性激活输出,其第l层的计算公式为:
其中,al与al-1表示第l层与第l-1层数据的神经元输出,fl表示第l层神经元的激活函数,Wl表示第l-1层到第l层的权重矩阵,bl表示第l-1层到第l层的偏置。由于全连接层具有大量线性变换参数与非线激活函数,因此,多个全连接层首尾相连即可用于近似较为复杂的函数。本文使用RELU函数与Sigmoid函数作为全连接前馈神经网络的激活函数,使学习过程更快收敛且更具鲁棒性。模型损失函数为Binary_Cross_Entropy,且将随机梯度下降法作为模型优化器,训练集与测试集的比例为2∶8。本文使用的计算平台为TensorFlow,使用的神经网络实现及训练库为Keras,使用的数据预处理库为sklearn。实现一个由13个特征值的输入层,2个13个特征值的隐藏层,1个输出层的全连接前馈神经网络模型。
1.3 基于混合智能的专利价值评估方法研究
通过熵权法与人工神经网络算法分别筛选出具备转移价值的专利,分别建立专利数据集。熵权法是一种客观赋值法,具有较高的可信度与精确度,人工神经网络算法具有数据处理效率快、对数据进行自主学习与高速寻找优化解等优点,基于此,提出基于人工和机器学习相结合的混合智能方法,糅合二者优点对高校专利数据进行价值评估,对两种评估结果取交集,筛选出两种评估方法下都存在的专利数据,以此作为具有转移价值的专利。
2 数据来源与处理
新能源汽车成为汽车发展方向,新能源汽车技术广受关注。本文对新能源汽车领域专利进行专利价值评估,筛选出高校新能源汽车领域高价值专利,可以深度提升该领域专利转化效率,促进新技术的创新研发。本文数据来源基于IncoPat专利数据库,技术领域限定为“新能源汽车”,申请人限定为“大学”,检索式为:(ALL=(TIABC=(“纯电动汽车”OR“新能源”OR“电动汽车”OR“纯电动车”OR“动力电池组”OR纯“电动”OR“电动汽车动力电池”OR“新能源汽车”OR“电动汽车充电站”OR“电动汽车充电”OR“电动汽车动力电池组”OR“电动汽车电池”OR“电动车辆”OR“动力蓄电池”OR“充电系统”)))AND(AP=(大学)),时间不限,共检索到15,920件专利。通过权利转让次数将数据集划分为“权利已转移”数据集(530件)与“权利未转移”数据集(15,390件),据构建的专利评估指标,获取每件专利的基本数据,构建专利指标数据库。
3 混合智能专利价值评估方法
3.1 基于熵权法的高校专利价值评估方法
(1)指标的熵值、差异性系数及权重计算。依据“新能源汽车”指标数值无量纲化结果,运用熵值法计算步骤得出各评价指标的权重,见表2。
表2 新能源汽车评价指标的熵值、差异性系数及权重
(2)确定评估指标体系。通过前期构建的指标体系并将数据导入体系中进行计算,最终得到高校专利价值评估指标的权重,并且将其作为高校专利价值评估方法的最终指标权重。该权重为评价高校专利价值的最终依据,见表3。
表3 高校专利价值评估指标权重体系
(3)专利价值评估。根据前期得出的评估指标体系,将权利已转移专利数据集与权利未转移专利数据集导入指标体系中,评估两个实验集的专利价值,同时评估出权利转移实验集专利价值的平均分,作为权利未转移专利价值评估的阈值,筛选出价值大于平均分的专利,作为存在潜在转移价值的专利,将其并入权利转移实验集,作为基于熵权法的高校专利价值评估的最终结果。表4为熵权法下权利转移专利价值top10的名称、得分与排名。
表4 基于熵权法的权利转移专利价值排序(Top10)
通过熵权法对权利转移的专利数据进行价值评估,进而得出专利价值,而后将该数据集价值的平均分作为衡量权利未转移专利是否有价值的阈值,经过测算可知,高校权利已转移的专利平均得分为0.0474,那么将权利未转移的15,390件专利引入指标体系,通过熵权法对其进行专利价值测算以得出最终评分。表5为熵权法下权利未转移专利价值top10的名称、得分与排名。
表5 基于熵权法的权利未转移专利价值排序(Top10)
通过测算得知,在权利未转移专利中,专利价值评分最高分为0.2394,最低分为0.0007,由此可见未转移专利中的专利价值虽然参差不齐,但是依旧有许多有潜在转移价值的专利。通过权利已转移专利价值平均分0.0474对权利未转移的15,390件专利进行筛选,笔者得出了3,166件价值得分高于价值平均分的专利,占权利未转移专利总量的20.6%。
3.2 基于人工神经网络算法的高校专利价值评估方法
为构建专利价值评估模型,保证对高校专利价值的有效评估,分别构建数据训练集(1,060条)与数据预测集(15,920条)两个数据集,在模型训练的过程中,将数据训练集的1,060条数据拆分为数据训练集(900条)与数据验证集(160条),其中训练集用来构建评估模型,验证集用来检验模型对未知数据的评估能力。在训练过程中,随着训练次数的增加,该模型的各项指标趋于稳定,表现良好,且没有出现拟合情况,说明该模型性能优良,其对有价值专利的筛选结果有高可信度。根据上述分析,当把训练次数确定为200次时,模型效果最佳,训练结果见表6。通过对模型的训练,当权利未转移数据支持度为105,权利已转移数据支持度为95时,其精确度(precision)分别为0.9与0.99,召回率(recall)分别为0.99与0.88,精确度和召回率的加权平均值(f1-score)分别为0.95与0.93,并且经过模型测算,其准确度(accuracy)高达0.94,表明模型具备较高的预测价值,能够应用对高校权利转移专利及存在失效风险专利进行的识别。而后将数据预测集(15,920条)导入训练好的模型中进行预测,存在转移价值的专利预测标签为“1”,不存在转移价值的预测标签为“0”,经过模型预测得知,存在转移价值的专利有9,332条,占数据预测集的59%;不存在转移价值的专利有6,588条,占数据预测集的41%。
表6 全连接前馈神经网络分类报告
3.3 基于的混合智能的高校专利价值评估方法
利用熵权法在15,920件专利数据中评估出3,696件存在转移价值的专利,占专利数据总量23%;利用人工神经网络算法在15,920件专利中评估出9,332条存在转移价值的专利,占专利数据总量59%。对基于熵权法的高校专利价值评估结果与基于人工神经网络的高校专利价值评估结果取交集,实现基于混合智能的高校专利价值评估,评估结果见图2。
图2 基于的混合智能的高校专利价值评估结果
分析图2发现,通过基于混合智能的高校专利价值评估方法评估出2,146件具备转移价值的专利,占专利数据总量的13.4%,该结果表明高校中少部分专利具备高价值,大部分专利价值较低,之所以会产生这种结果,一方面是部分高校的专利申请是研究课题的伴生品,与已发生权利转移的专利相比,在技术深入度、经济产业化、法律完备性方面存在一定差距;另一方面,高校为了保护核心技术,往往在专利申请时进行专利布局,进而产生了大量不具备权利转移价值的专利。
分析表7发现,采用混合智能方法对新能源汽车领域的专利进行评估筛选,筛选出了具备转化价值专利与不具备转化价值专利两个数据集,对两个数据集的指标均值进行计算,发现除“专利寿命”这一指标之外,具备转化价值专利的其余12个指标均值明显大于不具备转化价值的指标均值,验证了模型的有效性。这说明该模型可以为促进高校科技成果管理部门进行专利价值评估与提高专利运营效率提供借鉴意义,也为企业快速锁定高校高价值专利提供了实践参考。因此,结合上述情况,在“新能源汽车”领域,通过基于的混合智能的高校专利价值评估方法识别出13.4%具有权利转移价值的专利,并不是处于较低水平,这部分专利应该得到高校科技成果管理部门的重视,围绕高价值专利构建专利技术群,制定专利运营策略,积极寻求技术转移。同时,对存在失效风险的专利,应进行二次评估,针对有转移价值的专利制定专利转移战略协助转移;针对失效风险大的专利,放弃专利权,节约科研成本,将其投入到研究团队的研发中,进一步提高发明专利的核心竞争力,提高产业应用价值。
表7 基本指标平均值统计表
3.4 分析结果讨论
通过基于混合智能的高校专利价值评估方法对高校新能源汽车领域15,920件专利进行评估,评估出2,146件具备转移价值的专利,针对上述专利指标数据进行重点分析,深度探析哪些指标是影响专利价值的重要因素。本文采用多元线性回归算法对具备转移价值的专利进行回归运算,其中R2(相关系数)值为0.9993,说明自变量之间存在高度相关关系,模型效果较好,运算结果见表8。分析表8发现,采用多元线性回归算法运算的13个指标权重,其中申请人数量权重最高,申请人数量体现专利权利人的数量,专利权人越多,那么承担该专利相关义务的人就越多,则转让该专利的相关风险就越小,进而大幅度降低了专利转化的相关成本,同时申请人数量越多,表明技术的复杂度越高,融合了多个机构的集体智慧,是专利法律价值与经济价值的重要体现;专利寿命的权重占比也位居前列,该指标体现了专利的使用年限,在专利技术的性质、质量、应用价值和需求状况一定的情况下,专利的转移价值与专利寿命成正比,使用年限越多,该专利创造的经济价值与社会价值就越多,是专利经济指标的重要体现;被引次数这一指标也具有较高的权重,该指标体现了领域内研发人员对该专利技术的认可,被引用次数越多,表明该专利对领域内其他专利的技术创新具有重要的指引作用,是专利技术价值的重要体现[18]。以上三个指标对高校专利权利转移概率具有较大的影响作用,在高校进行专利申请和专利运营时应该得到重视。
表8 多元回归算法下指标权重分布
结合上述对具备转移价值的专利指标数据权重的分析,对高校技术研发和专利申请有着很高的借鉴意义,应重视高权重指标对高校专利权利转移的促进作用。基于此,在高校科技成果产出阶段,高校知识产权信息服务中心要为科研团队的专利生命周期运营提供全方位支持,结合科研团队研究内容积极进行科技查新,保证研究内容的前沿性与创新性;在申请专利过程中,注重把控申请人的数量与专利引证数量,对高价值专利要注重维持其专利年费缴纳与进行专利布局,通过申请同族专利,形成技术竞争优势,这也为提高专利的被引证次数奠定基础,保证其时效性。综合上述分析,本文构建的专利价值评估模型不仅能够识别高校中某一技术领域具备转移价值的专利,推动高校专利技术实现转移转化,还能在此基础上对评估结果进行深度剖析,厘清专利指标对专利指标对专利转化价值的影响,这对强化高校专利质量,提高科技成果管理部门、知识产权信息服务中心等部门的专利运营质量具有参考价值。
4 总结与展望
本文从科学性和易操作性角度出发,首先构建了高校专利价值评估指标,分别采用熵权法与人工神经网络算法,以人工打分和模型预测相结合的方式,识别高校新能源汽车领域具备转移价值的专利,为高校科技成果管理人员提供了行之有效的方式,快速识别已有的发明专利中,具备权利转移价值专利,为促进高校科技成果管理部门的专利运营效率,以及企业快速锁定高校高价值专利提供了实践参考。
(1)首先从技术、经济、法律等方面,选取13个能较为全面反映专利价值的指标,且保证了指标数据的易获取性。
(2)通过对赋权方法与算法性能的调研,选择具有高可信度且可以进行人工识别的熵权法与具有自主学习且可以进行机器识别的神经网络算法对专利进行评估提取,保证了评估结果的全面性。
(3)通过基于的混合智能的高校专利价值评估方法,对熵权法下高校专利价值评估结果与深度学习下高校专利价值评估结果取交集,测算出具备高价值的专利,保证了结果的科学性与合理性,适应于复杂多变的专利市场,精准识别高价值专利,为高校专利研发与专利运营提供决策支持,也为企业探寻高校核心专利提供技术借鉴。
本文构建的评估模型仅使用了“新能源汽车”领域的专利数据,数据样本较单一;在指标选取过程中,为了指标的易获取性,仅构建包含13个指标的评估体系,科学性有待进一步验证。在今后研究中,将探索构建全领域的专利数据样本,扩充专利评估指标体系,实现对高校不同技术领域中具备权利转移价值专利的识别。