基于专利技术关联度的中间人角色划分方法研究
2022-04-27王雅兰王成军孙笑明
王雅兰, 王成军,孙笑明, 向 锐, 冯 涛
(西安建筑科技大学 管理学院,陕西 西安 710055)
0 引言
在发明人创新合作网络中,占据结构洞的中间人具有较强的控制和整合优势,对创新具有显著促进作用[1-2]。近年来,学者对占据结构洞的中间人产生了浓厚的研究兴趣,中间人成为目前网络管理研究中最受关注的对象之一。作为中间人作用机制的一个关键视角,中间人角色分析始于20世纪80年代,相关研究涉及不同层次中间人角色对知识流动[3]、知识交换及技术融合的影响[4]、中间人角色与企业创业及创新绩效的关系[5]、中间人角色在组织动态协作网络中的作用[6]等诸多方面,由于数据获取方式受限,研究进程受到一定阻力。在数字经济时代和大数据时代,作为囊括全球90%以上最新技术情报和大量亟待挖掘的创新规律的宝库[7],专利大数据为中间人角色分析提供了前所未有的机遇。在微观层面,通过专利大数据分析可以追踪研发者流动轨迹,揭示发明人合作方式及其动态变化情况,还可以分析发明人知识整合特征和效率。中间人角色转换往往伴随着知识交换特征,华为从4G到5G预研阶段,研发者角色转换不仅影响团队创造力和研发效率,还影响预研阶段的最终成果和创新绩效[2]。
Howells[8]指出,中间人最早是作为技术知识的非正式传播者出现的;Burt[9]指出,中间人是向一个位置发送资源并从另一个位置获取资源的行动者,具有收集和交换资源以及联络不同行动者的功能;Gould & Fernandez[10]将中间人角色划分为协调人、顾问、守门人、代理人和联络人5种类型[10],如图1所示。然而,现有文献缺乏对基于专利大数据中间人角色类型划分方法的精准探讨。
图1 中间人角色类型Fig.1 Classification of brokerage roles
从上文界定看,中间人角色划分的主要依据是其在网络中所处的位置和连接方式。中间人所属群体关系包括3类:群体内部关系、群体内外部关系、群体外部关系[11]。其中,协调人从群体内某一行动者处获取资源并将其传递给群体内另一行动者,其与其他行动者同属一个群体,此类中间人可归属为群体内部关系。守门人从群体外部获取资源并将其传递给群体内部;代理人从群体内部获取资源并传递给外部群体;顾问作为群体外行动者,从群体内某一行动者处获取资源并将其传递给群体内另一行动者,此3类中间人可归属为群体内外部关系。联络人从群体外部获取资源并将其传递给其他外部群体,与另外两个行动者分属于3个不同群体,此类中间人可归属为群体外部关系。基于上述分析可知,中间人角色划分本质等同于无向,即不需要考虑关系方向的特定性[12]。因此,在对专利信息进行分析时,中间人角色划分需要解决的核心问题是如何精准地确定不同群体。
以往文献在进行群体划分时利用了较为明确的物理边界。Spencer[3]以国家为群体划分边界,研究了平板显示器公司全球守门人和代理人角色在全球及区域网络中的知识流动情况;刘凤朝等[13]以专利权人所属区域为依据对中间人角色进行了分析;李新和李柏洲[14]以城市群为群体划分边界,分析了哈长城市群协同创新网络特征。Hyojeong等[4]以产业为群体划分边界,设计了一种技术知识流算法,用于识别技术融合或知识交换过程中4类技术知识中间人角色。关于中间人角色对企业探索式创新的影响,刘凤朝等[15]以发明人所属企业作为群体划分依据;姜秀娟等[16]将中间人划分为内部联系者和外部联系者两种;Spiro等[12]以应急过程中的不同组织为群体划分边界,讨论了3类中间人角色在动态情景下的作用,并设计了相应测算公式;Glaser等[5]以组织单元为边界,分析了协调人和守门人等中间人角色对企业创业的影响;Tushman等[17]以研发项目组为群体边界,探讨了技术守门人的作用;李瑞茜等[18]按照IPC分类号和技术领域对照表,将专利划分到35个较大的技术知识领域中,并对中间人角色进行了分析;李长玲等[19]以学科为群体划分边界,识别了跨学科知识交流中的中间人角色。上述群体划分方法的优势在于操作简单、群体边界清晰,但也存在着诸多弊端,如群体边界过大导致群体内部成员关系松散。如以公司为边界,处于不同技术知识领域的发明人可能并不存在创新合作关系,即使存在工作交流也不一定必然进行知识交换。因此,当构建以知识流动为基础的发明人合作网络时,这种群体划分方法不一定合理。
基于此,本文提出一种基于专利大数据的企业发明家中间人角色划分方法,这种识别方法并非仅依靠网络结构,也不需要反复确定明显的群体边界。对于大多数企业研发团队而言,团队成员拥有相同或者相近的知识领域,团队之间进行发明创造需要深入开展知识交流,所以他们之间的合作关系比较稳定。对中间人进行分析的目的在于挖掘不同中间人角色类型在知识扩散和重组过程中的重要作用,以知识为边界划分发明人群体更加契合理论研究和人力资源管理的需要。因此,本文从理论基础、模型方法、应用实例3个方面阐释专利大数据所披露的中间人角色划分方法操作过程,兼具理论与实践双重意义。
1 理论基础
1.1 群体划分依据与边界
在发明人合作网络中确定网络边界并较为精准地找到互斥子群体,是从个体层面划分中间人角色方法的关键依据,主要体现在以下两个方面:
(1)凝聚子群分析法是最常用的发明人群体划分方法[20-21],其原理是对网络中的个体进行聚类,特指在不确定属性(部门、技术领域等)分类标准情况下,按照结构化数据或关系型数据进行自动分类[21]。这种分类依据主要包括4个维度:子群成员关系的互惠性、子群成员关系可达性或接近性、子群内部成员关系频次以及子群内部成员网络关系密度相对于内外部成员的关系密度。因此,应用凝聚子群分析法界定子群并非以发明人之间实质意义(技术领域、朋友关系)上的凝聚性为依据,而是以纯粹的结构特征来定义。实际上,基于专利数据进行中间人角色划分应建立在以技术领域为边界的群体结构基础之上(见表1)。
表1 凝聚子群分类依据Tab.1 Classification basis of cohesive subgroups
(2)提高发明人群体边界划分精准度。边界划分可根据具体研究层次设定,尤其是以知识领域为边界的群体划分,边界可以由大到小,可从行业、企业和团队层面延伸至个体层面。现有研究大多选择易于获取的数据设置较大的边界,往往忽略了边界划分精准度问题。此外,一些跨领域技术发明人有时会存在于两个或两个以上的群体网络中,常规做法是将群体边界模糊化,但这会导致群体规模扩大,或者将两个或两个以上群体合二为一,因而难以精准且完整地识别中间人角色类型。因此,需要在提高群体划分精准度的前提下,将发明人划入互斥子群(见图2)。
图2 群体边界模糊化Fig.2 Group boundary combination
1.2 技术领域等级
遵循上述群体划分依据,本文聚焦专利著录项中的技术分类号,其所展现的技术知识领域即为发明人的主要研发领域[22]。如表2所示,若某发明人的专利主分类号为G06F12/1027,则其对应的技术领域属于“在存储器系统或体系结构内存取、寻址或分配”。
表2 分类号示意Tab.2 Examples of the IPC
根据国际上通用的IPC分类标准,按照技术主题设立类目,将整个技术领域划分为5个等级:部、大类、小类、大组、小组。例如,部:B表示作业、运输;大类:B64表示飞行器、航空、宇宙飞船,大类类号用二位数标记;小类:B64C表示飞行,小类类号用大写字母标记;大组:B64C25/00表示起落装置,大组类号用1~3位数加/00标记;小组:B64C25/02标记是将大组/00中的00改为其它数字,如这里的02表示起落架。因此,可以根据该分类标准识别发明人所在技术领域。
群体边界划分精准度与技术领域等级密切相关,但具体到哪一等级要视企业而定。在一项专利中,主分类号与专利所包含的技术创新内容密切相关[23],因此本文将企业所有专利按照专利主分类号映射到IPC分类树状图上,进一步分析企业专利树状图拟合程度,如图3所示。若企业专利在上一技术等级内聚合而在下一级分散,意味着企业的主要技术领域汇聚于此。同时,当企业内部不同研发团队具有不同的研发方向时,会在下一技术等级呈分散分布状态。
图3 IPC分类结构Fig.3 Classification structure of the IPC
需要注意的是,最小技术等级(用于判断群体划分)一般可划分到大组,若过于细分则会大幅降低中间人角色团队划分与实际结构的契合度,并增加团队划分操作难度。这是因为,IPC分类标准中小组之间的技术差距较小,如G01L 5/16表示测量力分量仪表,而G01L5/18表示测量力比率仪表。除极少数高精尖团队可能需要在某一时期仅对某一类技术进行深度攻坚外,大部分企业研发团队并非只是沿着某一小组的方向进行研发活动。因此,当按照指定技术领域划分群体结构时,适度放松对技术领域等级的细分,有利于提高其与实际结构的契合度。
1.3 技术关联度
技术关联度是指在特定技术体系或技术领域内,某类技术与其它类技术相关联的数量和程度[24],对其进行判断的基本依据是两个技术分类号同时在一个专利中出现的组合情况。技术关联度越大,两类技术在同一专利中出现的次数就越多。在以往研究中,技术关联度有着广泛的应用[24],学者多采用技术距离对其进行测度,如企业之间拥有的差异化技术或专利技术关键词出现频次[25-26]。但实际上,技术关联度也是一种技术共类分析。王贤文等[27]指出,文献共被引标准化方法有两种:Salton余弦系数和杰卡德相似系数(Jaccard系数)。由于杰卡德相似系数更适合描述技术相似度,因此被大多数学者采用。参考李勇敢[28]的研究,本文采用相对技术关联度计算两种技术领域(类别)的相对关联度,如图4所示。
图4 技术领域关联关系Fig.4 Relationship of technical domain
在图4中,用A和B分别表示两个不同的技术领域,nA、nB表示A、B领域内的专利数量,nA∩B表示同时拥有两种分类号的数量,技术分类A相对于技术分类B的关联度或者相似度为:
(1)
同理可得,技术分类B相对于技术分类A的关联度为:
(2)
按照这种方法,可以测量任意两个技术领域的关联度,两者之间的相似度可表示为RA∩B=RA→B+RB→A,RA∩B的取值范围为[0, 2],该值越大表示两类技术知识领域关联度越高,取值为2时表示完全重叠,取值为0时意味着完全不存在共有分类号。
2 模型构建
2.1 聚焦企业技术领域等级确定
本文收集聚焦企业所有专利,将其技术领域等级确定为小类和大组,绘制两类等级下各技术领域的树状图,根据树状图技术领域分布情况确定聚焦企业的最终技术领域等级H。
2.2 技术关联度测量
同一发明人可能在不同但相近的技术领域申请专利,为将发明人映射到不同技术领域,需要计算技术领域之间的关联度,得到任意两个企业技术关联度RA∩B。
由于有些企业申请的专利数量有限,会导致基数不足而无法作出精准判断,即某些技术领域之间并非具有较低的关联度,只是由于样本数据较小而测出与实际不符的关联度。另外,考虑到单个企业所涉及的技术领域差别较小,因此本文认为只要在同一企业内技术相似度大于0即可判定两者之间存在一定的相似度,可将其整合为相似的技术领域集合。
Ti,i=1,2,...=f(RA,B∈P)
(3)
其中,RA、RB表示企业原有技术领域;Ti表示将相似技术领域合并后的新技术领域。
2.3 群体划分与合理性检验
在对相似技术领域进行整合后,将发明人一一对应到所有相似技术领域集合中,初步完成群体划分。
Vg=f'(I)
(4)
其中,I表示企业中的各个发明人;Vg表示将发明人进行技术领域归类后的群体向量。此时,仍有一些发明人可能处于两个集合的交叉位置,若发明人出现在两个集合频次中的差异较大(根据实验经验,差异应在5倍以上),则将该发明人划归到出现频次较高的集合中;若发明人出现在两个集合频次中的差异不大,且这种情况较多(占总体比例1/3以上),则需要进一步考察群体划分的合理性,可采用专家咨询法、技术引用法判定技术领域相似程度。本文以交叠率β作为衡量群体划分的合理性指标。
(5)
其中,t指发明人处于不同相似技术领域集合中的人数,T指全体发明人数。当交叠率较高时(超过5%),意味着相似技术集合规模小而数量多,内部结构过于紧密,与技术相似度、契合度不高,极有可能是由于样本数量太小而引致,故可以加入同类型企业专利样本重新计算技术相似度,并重新划定相似技术领域集合。另外,此时可能会产生部分相似技术领域空集。这是因为,当同一发明人在超过两个集合中出现的频次差异较大时,将其划归到出现频次最大的集合中有可能导致另外的集合出现空集。另外,跨技术领域研发人员偶尔也会进行专业领域之外的发明创造,但这不影响本文以技术领域作为群体划分边界进行分析。
由于本文数据样本量没有设限且具有动态性,因此无法参考张米尔等(2013)的研究给出一个确定的阈值。所以,本文借鉴Vedres & Stark[29]关于中小集团的实验划分法,在确定小集团中完全连通的网络节点数k的最大值时,以实验结果为准。如5倍频次差异较大,是因为一般一项专利发明人数多为5~6个,若一个发明人偶然出现在某一集合中,那么实验时选5倍结果比较合理,这是由实验经验给出的判断标准。对于交叠率,当把交叠率的值由高至低缩减至5%时,群体边界更加明显,因此根据实验结果,选择5%作为参考标准,这种参考值确定的优势在于研究者可根据具体样本量和实际实验结果进行灵活调整。同理,对于频次差异不大的样本,可根据具体实验情况以1/3作为判断标准。
2.4 中间人角色划分
本文以专利所包含的合作发明人关系构建发明人关系矩阵,如表3和表4所示。其中,任何一个专利内部两个发明人之间均存在一条连接关系。
表3 专利发明人信息Tab.3 Information of patent inventor
表4 发明人关系矩阵Tab.4 Matrix of inventor relationships
图5 发明人合作网络Fig.5 Collaborative network of inventors
根据修正后的发明人边界向量、发明人网络关系邻接矩阵及中间人角色分析算法[4],对聚焦企业发明人的中间人角色进行划分。
ri=f(Vg',MG)i∈I
(6)
其中,ri代表发明人的中间人角色;Vg′为调整后的群体向量;MG为发明人关系矩阵,此步骤可在软件UCINET中通过手动操作实现[13]。本文将各研发人员(I1、I2、I3......)分组信息构建成一个矩阵,群体划分信息为一个列向量或者行向量(1、2、3......),如表5所示。
表5 研发人员群体划分矩阵Tab.5 Matrix of inventors’ group division
表5数据包含6个发明人的分组信息,在软件中点击Network→Ego Networks→Brokerage roles程序出现对话框“partition vector”(分区向量),在对话框中输入“研发人员群体划分矩阵ROW”,程序会自动读取该矩阵的第二行,利用其中的分组信息,将拥有相同值的发明人置入同一个群体。经过分区后,在UCINET中沿着Network→Ego Networks→G&F Brokerages步骤,将之前根据发明人合作信息构建的邻接矩阵作为输入矩阵,测算中间人角色划分结果。模型测算共包含以下5个步骤:
(1)对聚焦企业的所有专利,利用著录项中的分类号信息确定技术领域等级H。
(2)利用典型企业或充足专利样本得到专利技术领域集合P,测算任意两个技术领域A和B的技术关联度RA,B∈P。
(3)根据技术关联度测算得到合并后的新技术领域Ti,i=1,2,...及发明人拥有的各类IPC分类号数量,进一步确定每个发明人的技术领域,将各个发明人Ij分配到对应技术领域∀Ij→Ti中并进行群体划分,得到群体向量Vg。
(4)对比指定重叠率μ,依据实际重叠率β对群体划分进行合理性检验和修正。当β>μ时,扩大公司样本量重新进行计算,否则将跨越多个技术领域的研发人员调整到不同的互斥群体Vg'中。
(5)利用发明人信息构建研发人员关系矩阵M,结合群体划分矩阵Vg',采用UCINET中的Network→Ego Networks→Brokerage roles算法(或在专利大数据分析平台Patlab)对每个发明人进行中间人角色划分,得到每个发明人的中间人角色rj∈I。
3 实例分析
本文以中科寒武纪科技股份有限公司(以下简称寒武纪)为例分析设计算法的具体操作过程。该公司专利所属技术领域较为聚焦,大多围绕芯片算法设计,能够清晰地展示模型应用效果。首先,对寒武纪专利数据进行清洗,得到125条有效专利著录项数据和34名发明人;其次,根据专利著录项数据中的发明人合作关系,构建研发人员关系邻接矩阵,合作网络如图6所示,这两步工作可在专利大数据分析平台Patlab中迅速完成。
图6 寒武纪发明人合作网络Fig.6 Inventor collaboration network of Cambrian
为确定寒武纪的技术领域等级,将寒武纪公司申请的专利映射到IPC分类树状图上,从中可以看出研究领域大类为G06,其在GO6F、G06N、G06Q、G06T和H04N几个小类中聚合并在下一等级大组中分散开来,从而确定技术领域等级为大组,如图7所示。
图7 寒武纪科技公司IPC分类树状图Fig.7 Dendrogram of Cambrian's IPC
进一步,确定大组级别,并对专利数据中的分类号信息进行处理,计算这些大组之间的关联度,将关联度大于0的大组进行合并,形成3个技术领域集合,如表6所示。与此同时,将所有发明人按照在不同小组中出现的次数划归到互斥子群中,结果发现并未出现较多发明人同时存在两个及以上群体的情况,交叠率为0,说明群体划分结果比较合理,如图8所示。
图8 基于技术领域的发明人群体划分结果Fig.8 Division results of groups based on technical domain
表6 相似技术领域集合Tab.6 Classification of similar technical domain
最后,将发明人合作矩阵和发明人按照技术知识领域划分的技术群体作为分组依据,对中间人角色进行分析,结果如表7所示。从中可见,节点(发明人)2主要充当团队协调人角色,同时还作为守门人和代理人存在,在这些专利研发工作中共扮演了110次中间人角色;节点1扮演了6次协调人角色。所有发明人被划分到3个群体中,其中一个群体不包含任何发明人。
为检验上述基于专利技术关联度的中间人角色划分方法的合理性,本文采用一般网络分析法对寒武纪中间人角色进行划分[14],如图9和表8所示。从中可见,节点(发明人)3只充当团队协调人角色,在专利研发工作中共出现过110次。表8中所有发明人虽然被划分为3个群体(在UCINET中实现),但每个群体均含有一定数量的发明人,与本文划分结果存在显著差异。结合表7和表8可知,在两种不同的中间人角色划分方法中,每个发明人所担任的中间人角色总数完全相同,表明基于专利技术关联度的中间人角色划分方法具有较高的准确性。同时,在传统网络分析中间人角色划分方法中,所有发明人均被划分为一种中间人角色,但实际上某些发明人还同时扮演着多种中间人角色,如发明人2、3、15,而基于专利技术关联度的中间人角色划分法可以全面识别每一个发明人所承担的所有中间人角色,表明其具有较高的有效性。
图9 基于数据结构特征的发明人群体划分结果Fig.9 Division results of groups based on data structure
表7 基于专利技术关联度的寒武纪发明人中间人角色划分结果Tab.7 Division results of brokerage roles based on the correlation of patent technology
4 结论与启示
4.1 研究结论
首先,本文以发明人知识领域为子群体划分标准,契合了中间人角色划分的基本假设,即发明人的实质连接关系为无向,划分时主要考虑发明人所属群体位置即可;其次,提高了对发明人知识领域精度的判断,减少了仅通过数据反映的群体结构与实际群体结构之间的差异;最后,完善了以专利数据为基础的中间人角色划分方法的应用范畴,从个体层面提供了完整的中间人角色划分思路和操作办法。本文提出的基于专利技术关联度的中间人角色划分方法具有较高的准确性和有效性,可以全面识别每一个发明人所担任的所有中间人角色,在挖掘专利大数据价值时给出了较为先进的处理手段。
节点协调人守门人代理人顾问联络人总计1600006211000001103110000011042000025176000017661400001478800008881000001094000041020000211600006120000001300000014600006151000001024000000340000001800000027000000280000002100000022000000232000023220000225000000260000003100000030000000160000002920000219200002200000003300000017600006
4.2 研究贡献
首先,本文设计中间人角色划分方法有助于学者分析研发者不同中间人角色对知识整合与转移的影响,并深入探讨中间人角色对企业创新绩效的影响,揭示研发者中间人多重角色的作用、中间人角色转换(局部中间人角色和全局中间人角色)机制,以及中间人角色对结构洞产生、演化与填充的影响等;其次,该算法有助于对跨层次中间人角色进行研究,如较低层次中间人角色如何影响较高层次中间人角色,包括影响方向、强度和结果等;再次,有助于丰富个体层面中介行为研究,如中间人地位对中间人角色的影响,从自我监控角度分析中间人意图与中间人角色能力之间的关系,探讨中间人从事中介活动的目的;最后,可以帮助学者考察组织环境和研发环境对上述关系的调节效应。
4.3 研究启示
根据上述研究结论,本文提出如下启示:
(1)在企业内部创新中,研发者(尤其是关键研发者)对外来知识的吸收、扩散及应用往往依赖于中间人角色,如技术守门人。因此,对此类角色的识别通常需要刻画研发者合作网络,而专利无疑是构建网络结构的重要途径。专利所包含的知识特征既可以帮助管理者识别研发者所扮演的中间人角色,还可以帮助管理者了解中间人角色在知识转移与共享过程中所发挥的作用,对于企业技术突破和新产品研发具有重要意义,因此国际上一些优秀企业应对此加以重视。
(2)随着我国企业多年的知识积累和技术追赶,目前有部分类似华为这样的企业已进入全球领跑序列。与传统研发情景不同,企业要在预研中获得成功,对中间人角色进行分析尤为重要,因为其可以帮助企业更好地确定预研阶段的合适人选,从网络结构角度对知识转移与整合载体进行科学设计和布局,而本文设计的算法为此类研究和创新实践提供了坚实的技术基础。此外,还可以指导企业日常管理,如外聘研发者参与公司内部重要研发项目,需要企业对研发者的中间人角色进行动态识别和监测,并及时进行情感、资源和权力等方面的调整。
4.4 不足与展望
本文存在如下不足:①以企业专利数据作为发明人个体知识领域的判断基础,难以全面反映发明人的真实情况;②在实际中,存在将领导、同事列为共同发明人的情况,而专利著录项中此类发明人的知识领域与实际有较大出入,未来应对其进行细化;③从企业组织内部拓展到整个行业(虚拟社区)时,随着样本量的增加,中间人角色划分效果可能会更好,尤其是在测量关键技术关联度指标时可能更加精确。因此,未来需要结合社区结构的一些算法,对其性能指标加以改进,同时也要考虑一些简化手段,进一步结合其它指标进行多方验证,以更为精确地对发明人群体进行界定。