基于专利计量的校企合作伙伴选择方法
——以人工智能领域为例
2021-12-09宋凯
宋 凯
0 引言
技术创新是社会生产力发展的源泉,是企业保证可持续竞争优势的内在动力。约翰·洛克菲勒提出:“企业想要成功,应该朝新的道路前进,不要跟随被踩烂了的成功之路。”2018年美国制裁中兴事件、2020年美国断供华为芯片事件对我国企业的技术创新意识引发强烈震动,凸显了技术创新对国家发展、科学进步、企业竞争意义重大。2020年习近平总书记主持召开科学家座谈会,指出:“要把原始创新能力提升摆在更加突出的位置,努力实现更多从0到1的突破。”[1]技术创新是一个国家兴旺发达的不竭动力,但对企业而言,技术创新具有高智力、高投入和高风险的特征,当前我国企业面临复杂的国际动荡格局和国内竞争态势,单纯依靠自身研发能力进行技术创新的难度愈发增大,所以,通过吸纳外部力量提升技术创新效率成为众多企业的选择。高校在人才资源、技术设备、基础研究方面具有天然优势,企业通过与高校开展产学研合作,对节约研发成本,发挥高校在促进区域经济发展和产业升级、建立企业可持续竞争优势方面具有重要的推动作用。Estrada等[2]认为,校企合作优势的发挥取决于合作伙伴的选择;Howells等[3]指出,企业在如何选择合适的高校开展合作时存在挑战。因此,探索校企合作伙伴的选择方法,对提升校企合作效率、推动企业技术创新具有重要意义。
本文的研究目标主要有3个:一是以Z分数表示技术主题创新度,以Sen’s斜率表示技术主题授权趋势,将两个指标映射到二维空间,实现对技术主题的划分,在此基础上,依据特定企业在不同技术主题中的专利布局情况,明确与高校的合作方向,解决企业“合作什么”的问题。二是对各个技术主题下的高校科技创新能力进行评估,在融合高校专利授权量、专利被引用次数、专利许可/转让次数以及高校与特定企业竞争对手的专利文本相似度,为了进一步提升评价的科学性和合理性,将离散度指标Gini系数引入到计算中,并采用熵权法区分不同指标的重要程度,最终形成高校技术竞争度指标。三是利用本文所提的校企合作伙伴选择方法,以人工智能领域为例,选择特定企业进行实证研究,为企业选择合适的高校合作伙伴提供方法参考。
1 相关研究
(1)关于校企合作影响因素的研究。国外学者如Kyung等认为在校企研发合作过程中,政府资助因素发挥着重要的调节作用[4]。Wong等发现审查机制、法律政策、奖励机制是影响校企合作成功的关键因素[5]。Sjoo等明确了影响校企合作协同创新的7个关键因素,包括资源、高校组织、跨界效应、合作经验、文化、地位以及环境[6]。李正卫等以浙江省为研究对象,通过对高校、企业和高校科研人员进行问卷调查,分析了浙江省校企合作现状与影响因素[7]。潘海生等对中国高职教育校企合作现状及影响因素进行了分析,并对如何加强校企合作给出了实践路径[8]。路平基于利益相关者理论,对企业参与校企合作的影响因素和对策进行了探讨[9]。
(2)关于校企合作推动作用的研究。Shutenko等分析了高校学生在校企合作项目中的自我价值实现,发现其对强化学生心理健康具有重要的影响作用[10]。Guerrero等对新兴经济体中高校对企业技术创新能力的推动作用进行了分析[11]。徐盈之等构建了多个分析模型,对高校官产学合作创新对区域经济增长的影响进行了探索[12]。陈丰等构建了校企研发合作、R&D投入与高校科研产出间的关系概念模型,运用回归模型进行实证分析,探索了校企研发合作与高校科研产出的关系[13]。
(3)关于校企合作网络演进发展的研究。Csizmadia借助社会合作网络分析(SNA)对匈牙利校企技术合作网络的特征、空间分布、发展态势进行了分析[14]。Lyu等基于SNA探索了中国中关村企业、高校和科研机构的合作创新发展趋势[15]。洪伟构建了4个历史时期的校企知识流动网络,讨论了中国区域创新系统的演变[16]。温芳芳采用SNA方法、多维尺度分析、可视化分析,对我国高校和企业之间以专利为载体的科研合作现象进行了计量分析[17]。李雨浓等构建了“985高校”的校企专利合作网络,分析发现能源型企业在校企合作网络中处于重要地位[18]。
本文构建高校技术竞争度指标,对高校科技创新能力进行评价。部分学者也对此展开过研究,如胡成等从技术创新活跃度、技术创新优势度、技术创新扩散能力、技术创新影响力4个维度,选择了13个专利指标,对高校技术创新能力进行了比较研究[19]。陈振英等从专利的数量、有效维持情况、专利保护范围、被引用情况等多个角度揭示了高校专利的核心竞争力表现[20]。陈运平等建立了高校科技创新能力评价指标体系,并采用主成分分析法对2000-2004年我国中部6省的高校科技创新能力发展态势进行了分析[21]。李红等从8个层面对浙江大学的技术创新特征进行了全面细致的阐释,从多个角度揭示了浙江大学的技术创新能力[22]。李文静从专利授权、有效专利及技术领域等方面对广东省企业和高校的技术创新能力进行了对比分析[23]。
针对校企知识产权合作的相关研究,主要集中在校企合作影响因素、校企合作推动作用以及校企合作网络演进发展3个方面,但较少从校企合作伙伴选择的角度出发,为企业提供最佳合作高校的选择策略;而涉及高校科技创新能力评价的相关研究以专利基本指标统计分析为主,缺乏对专利指标的有机融合,形成更加科学有效的评价方式。因此,本文从企业视角出发,提出一种基于专利计量的校企合作伙伴选择方法,采用LDA模型对技术领域涵盖的技术主题进行提取,对技术主题的创新度和授权趋势进行计算,参考波士顿矩阵对技术领域涵盖的主题类型进行划分;在此基础上,针对特定企业在不同类型主题上的专利布局,确定合作的技术方向;构建高校技术竞争度指标,实现对各个技术主题下高校科技创新能力的排名,帮助企业明确高校合作伙伴,最终解决企业在校企合作过程中面临的“合作什么”和“与谁合作”困境,为提升校企合作效率提供创新方案。
2 研究步骤与研究方法
如图1所示,校企合作伙伴的分析流程共涵盖三大步骤:技术主题提取、技术领域主题类型划分以及高校科技创新能力评价。
图1 校企合作伙伴选择方法流程
2.1 技术主题提取
技术主题提取即通过技术手段探析一个技术领域涵盖的多个技术主题。由于专利摘要高度概括了专利的技术功能和科学效应,因此被普遍作为实验数据进行分析。主题提取的方法通常包括基于文献计量学的词频分析和共词聚类法、基于机器学习的LDA模型等。由于LDA模型具有良好的文本潜在主题挖掘能力[24],因此本文确定采用LDA模型,从专利摘要中提取技术领域涵盖的技术主题。在具体实验过程中,首先,采用R语言的jiebaR包对专利摘要数据集进行分词、去停用词、TF*IDF算法等自然语言处理;然后,应用R语言的lda包进行主题提取,并结合R语言的LDAvis模型进行最优主题数目确定和主题内容的可视化展示;最后,将LDA模型和Kmeans算法融合实现专利文本聚类[25]。
2.2 技术领域主题类型划分
技术主题的被引用次数反映专利技术的重要程度,可以认为被引用次数越高,则该技术主题在所属技术领域的创新度越高。而通过分析技术主题的专利逐年授权量,在一定程度上能反映技术发展态势和科学研究趋势。因此,本文分别采用Z分数和Sen’s斜率估计法计算每个技术主题的创新度和授权趋势(值)[26]。为了实现对技术领域主题类型的划分,将技术主题创新度和技术主题授权趋势映射到二维空间,通过阈值设置,并借鉴波士顿矩阵的命名方式,将技术主题类型划分为明星类技术主题、金牛类技术主题、瘦狗类技术主题和问题类技术主题。在技术领域主题类型划分的基础上,企业可依据在不同类型主题中的专利布局以及最大技术竞争者,审视自身的技术研发优势和劣势,明确校企合作技术方向,合理规划企业发展战略。
2.3 高校科技创新能力评价
企业在解决了“合作什么”问题后,需要进一步明确“与谁合作”。因此,高校科技创新能力评价包含3个部分:一是对技术主题下的高校进行汇总,分别计算高校专利被引用次数和专利许可/转让次数的离散度;二是将离散度与高校专利授权量、专利被引用次数、专利许可/转让次数、高校与特定企业技术竞争者的专利相似度进行融合,并采用熵权法计算指标权重,区分指标在评价过程中的不同重要程度;三是计算结果作为高校技术竞争度指标(University Technical Competition Index,UTCI),对技术主题下的高校科技创新能力进行排名,为企业选择高校开展产学研合作提供决策支持。
2.3.1 离散度指标——Gini系数
对高校科技创新能力进行评价,通常按照“数量为王”的原则,以专利授权量作为评价的重要指标。高校存在部分专利是以科研项目驱动产生的,在技术含量、市场前景等方面略显不足。相对于专利授权量,专利被引用次数和许可/转让次数更具有说服力,其中专利被引用次数体现了高校专利的技术价值,而专利许可/转让次数表明了高校专利的市场价值。所以,相比于专利授权量,高校专利平均被引用次数和高校专利平均许可/转让次数的评价结果更为合理。虽然平均被引用次数和平均许可/转让次数在一定程度上提高了高校科技创新能力的评价效果,但均忽视了指标离散度问题。
高校专利被引用次数和许可/转让次数的平均值反映的是高校专利技术价值和市场价值的平均程度,而离散度反映的是高校专利技术价值和市场价值的差异化程度。以W和H两所高校为例,假设W高校有10件授权专利,其中仅有1件专利被引用10次,1件专利被许可2次,而H高校也拥有10件授权专利,其中存在5件专利被引用次数共为10次,2件专利被许可各1次,如果按照平均值进行计算,两所高校的专利平均引用次数和平均许可/转让次数皆为1和0.2,两所高校科技创新能力相同。但透过数据,发现H高校的专利在被引用次数和许可/转让上呈现的结果更为均衡,其内部专利的技术价值和市场价值差异化程度更小,可以认为在等数量、等引用、等许可/转让的基础下,高校专利被引用次数和许可/转让次数越均衡,则高校科技创新能力越高。因此,本文选用经济学中常用的Gini系数(Gini Coefficient,GC)来衡量高校专利被引用次数和许可/转让次数的均衡程度。Gini系数是经济学家A.OHirschman基于洛伦茨曲线提出的一种度量收入分配平均程度的指标。具体计算公式如下:
其中,Pi、Pj分别表示某个高校第i件、第j件专利的被引用次数,N表示高校的专利授权量。GC的取值范围为0-1,GC值越接近于0,表示高校内所有授权专利的被引用次数越接近,即高校专利被引分布越均衡;GC越接近1,表示高校专利被引用频次差异性越大。
2.3.2 高校技术竞争度指标
通过上述分析,仅使用专利授权量、专利被引用次数、专利许可/转让次数进行高校科技创新能力的评价均存在不足。本文在参考已有研究的基础上,为保证高校科技创新能力评价的科学性和合理性,将这3个指标融合形成高校技术竞争度指标,并综合考虑专利平均被引用次数和专利平均许可/转让次数的离散度,进一步将企业画像中的技术竞争者因素融入竞争度的计算中,计算高校与特定企业最大技术竞争者专利相似度,为特定企业在头部竞争中赢得优势提供决策支持,凸显个性化匹配原则。高校技术竞争度的计算公式见下:
其中,W 1、W 2、W 3是采用熵权法计算得到的各个指标的权重,以区分指标在评价中的不同重要程度;U grant_radio表示在某个技术主题下,高校W的专利授权量占全部高校专利授权量的比例;Uavg_cited表示W的专利平均被引用次数;Uavg_transfer表示W的专利平均许可/转让次数;GCcited和GCtransfer表示W的专利被引用次数和许可/转让次数的离散度。被引用次数和许可/转让次数是正向指标,数值越大越好,而GC是反向指标,数值越小越好。为保证指标构建的一致性,基于GC取值范围在0~1之间,本文借鉴高英莲等[27]以及高丹等[28]的处理方法,使用(1-GC)反映两个指标的均衡性。Sim top_competitor表示W与特定企业最大技术竞争者的专利文本相似度,此处选择余弦相似度进行度量。
3 实验过程及分析
3.1 数据来源与处理
本文数据来源于Incopat专利数据库,选择分析的技术领域为“人工智能”。《2020年国务院政府工作报告》提出要重点支持“两新一重”(新型基础设施,新型城镇化,交通、水利等重大工程)建设,而“人工智能”作为新型基础设施建设(新基建)的重要领域之一,对实现产业数字转型、智能升级、融合创新具有重要意义。本文选择研究的企业为小米科技有限责任公司(以下简称“小米科技”),目前在人工智能领域申请专利47件。
在数据检索过程中,专利来源设置为中国发明授权/实用新型专利,检索式为标题/摘要=(“人工智能”or“智能系统”or“物联网”or“人机交互”or“智能技术”or“智能机器人”or“深度学习”or“语义网络”or“图像识别”or“图像检测”or“神经网络”or“机器视觉”or“专家系统”or“智能搜索”or“智能控制”or“智能问答”or“机器学习”),时间不限,对权利有效的专利进行筛选,共检索到59,311件专利,其中企业专利47,888件,高校专利11,423件,去除合作专利,剩余54,115件用于实验分析。
3.2 技术主题提取
根据技术主题的提取流程,当主题数目设置为12,alpha=0.01,beta=0.02时,基于LDAvis模型呈现的主题可视化结果,各个主题之间相互独立,互不交叉,表明主题数目最优。在确定最优模型的基础上,结合每个技术主题下的相关词对主题进行概括,通过文本聚类将每一件专利划归到一个技术主题下,并对“小米科技”在各个技术主题下的专利布局、专利授权量排名,统计最大技术竞争对手,结果见表1。
表1 小米科技专利授权量排名及竞争对手统计
3.3 “合作什么”——技术领域主题类型划分
依据给出的技术领域主题类型划分流程,通过技术主题创新度与授权量趋势估算对每个技术主题进行计算。在技术主题创新度计算过程中,利用人工智能领域专利平均被引用次数与技术主题平均被引用率计算Z分数来表征技术主题创新度;在趋势分析中,利用Sen’s斜率估算技术主题的专利授权量趋势,得到每个技术主题的γ值,结果统计见表2。
表2 技术主题创新度和授权趋势统计
分析表2发现,人工智能领域涵盖的12个主题,其γ值均大于0,表明人工智能领域各个技术主题的专利授权量均呈上升趋势,体现了学术界和产业界对人工智能领域的持续关注。将Z分数与γ值映射到二维空间进行可视化展示,并参考波士顿矩阵的命名方式对技术主题类型进行划分,结果见图2。分析图2发现,将γ值的阈值设置为80,Z分数的阈值设置为0,各个技术主题之间的划分界限明显。依据设置的阈值,主题类型的维度划分为:
图2 人工智能领域技术主题空间分布图
第一维度:明星类技术主题。Z分数>0,γ值>80,特指创新度和授权量趋势“双高”的主题群,需要企业加大研发投资,支持其迅速发展。
第二维度:金牛类技术主题。Z分数<0,γ值>80,特指授权趋势高但创新度较低的主题群,表明技术主题进入成熟期,企业无需增加研发投资。
第三维度:瘦狗类技术主题。Z分数<0,γ值<80,特指创新度和授权趋势“双低”的主题群,企业应采取撤退战略。
第四维度:问题类技术主题。Z分数>0,γ值<80,特指创新度高但授权趋势较低的主题群,表明技术发展前景好,但需要大量研发投入,企业可采取选择性研发投资战略。
通过技术主题类型划分,能够为小米科技清晰展现人工智能领域的技术主题发展趋势,结合小米科技在不同技术主题下的专利布局,为其规划企业战略提供重要的决策支持。技术领域中的明星类技术主题是企业能否占据市场竞争优势的重要赛车道,因此,在明星类技术主题上加大研发投资和技术创新,对提升企业竞争力具有重要意义。当前人工智能领域的明星类技术主题有“主题3→智能物联”“主题8→智能设备”,“小米科技”在主题3中有一定的专利布局;在主题8中专利授权较少;“小米科技”在这两个主题中均没有占据优势地位,可以作为“小米科技”在校企合作过程中的核心技术方向,借助高校已有科技成果和人才资源,降低企业的创新成本,快速提升在弱势领域的竞争力,也进一步解决企业在校企合作过程中“合作什么”的问题。
3.4 “与谁合作”——高校技术竞争度计算
依据技术领域主题类型划分,以及“小米科技”在不同类型主题中的专利布局,以明星类技术主题中的主题8为例,借助于公式(2)计算各个高校的技术竞争度。
首先,计算主题8下各个高校专利授权量在其专利总量的占比;进而计算每个高校融合离散度后的专利平均被引用次数以及专利平均许可/转让次数。
然后,对计算后的指标数据进行归一化处理,采取熵权法计算3个指标的权重,结果为W={0.01、0.24、0.75},可见专利平均许可/转让次数占的权重最大,专利平均被引用次数次之。
最后,计算每所高校与“小米科技”在主题8中最大技术竞争对手——“苏州路之遥科技股份有限公司”的专利文本相似度,并根据公式(2)计算每所高校的UTCI,并据此进行排名。需要说明的是,此处是采用归一化后的指标数据进行计算。
为了对不同指标的排名结果进行比较,将基于UTCI的高校排名与基于专利授权量、专利平均被引用次数、专利平均许可/转让次数的排名进行对比,结果见表3。为了抵消小数数值的缩减作用,对高校技术竞争度做扩大100倍处理。
针对表3的排名结果,首先对高校技术竞争度与其他3个指标进行Spearman相关性分析。在0.01水平(双侧)上,高校技术竞争度与高校专利授权量占比的相关系数为-0.532,呈负相关,这表明高校技术竞争度指标消除了“数量取胜”的影响因素。高校技术竞争度与平均许可/转让次数的相关系数为-0.365,呈负相关;与专利被引用次数的相关系数为0.928,呈显著相关性,这表明高校技术竞争度指标更强调高校在技术转移方面取得的成绩。2020年2月3日,教育部、国家知识产权局、科技部联合印发《关于提升高等学校专利质量促进转化运用的若干意见》,明确指出高校要以质量和转化绩效为导向,更加重视专利质量和转化运用等指标,坚决杜绝简单以专利申请量、授权量为考核内容,加大专利转化运用绩效的权重[29]。由此可见,高校技术竞争度的评价原则与此文件传达的精神具有高度一致性,能实现对高校科技创新能力进行公正合理的评价。
表3 “主题8”4种指标的高校科技创新能力排名对比
通过表3的排名结果可见,排名前三位的西南交通大学、西安工程大学、中国农业大学的专利授权数量为6件、6件、7件,授权量排名较为靠后;但西南交通大学、西安工程大学的专利平均许可/转让次数排名前两位;中国农业大学的专利平均被引用次数排名第一位。而华南理工大学专利授权量为11件,授权量排名第一。由于本文在高校技术竞争度计算中融入了被引用次数和许可/转让次数的离散度,并且采用熵权法赋予指标不同的权重,特别凸显了专利平均许可/转让次数的重要性,华南理工大学在这两个指标中的离散度较大,专利之间的被引用次数和许可/转让次数不均衡,且专利平均许可/转让次数排名靠后,拉低了其技术竞争度。技术竞争度的计算考虑了高校与企业最大技术竞争者的专利相似度,“小米科技”在主题8中的最大技术竞争者是“苏州路之遥科技股份有限公司”,华南理工大学与该公司的专利文本相似度低于排名前三位的高校,这也导致了其技术竞争度的下降。
综合以上分析,高校技术竞争度融合了多个指标数据,避免了依赖单个指标进行评价存在的不足,解决了使用单个指标进行评价过程中出现排名相同的情况,使得排名界限更加清晰。其次,高校技术竞争度考虑了指标的离散度问题,将专利技术价值和经济价值更为均衡的高校凸显出来,这有利于企业选择的高校内部科研团队具备普遍较高的专业能力。再者,借助于熵权法区分了指标在评价过程中的不同重要程度,更加凸显高校在技术转移方面取得的成绩。最后,高校技术竞争度也加入了企业的个性化特征,通过筛选技术主题下的竞争对手,融入专利文本相似度计算,以精准匹配符合其技术需求的高校开展合作。本文以“小米科技”在主题8中的最大技术竞争者为例,计算得出以西南交通大学为首的高校名单,解决了“小米科技”在校企合作过程中面临的“与谁合作”问题。
4 结语
本文从企业视角出发,提出了一种基于专利计量的校企合作伙伴选择方法,重点解决企业在选择高校开展产学研合作过程中面临的“合作什么”和“与谁合作”困境,为提升校企合作效率,实现校企联动发展提供了实践方法。需要说明的是,本文重点以专利数据作为判断校企合作方向和合作伙伴的数据来源,但在当前多源大数据分析的情境下,数据来源的丰富性尚待进一步扩充。此外,在主题解读的专业度上存在欠缺,需要探索更为有效的主题识别方法。这些都会对研究结论产生影响,后续的研究将加以改进。