产学合作网络的形成机理<br/>——基于中国人工智能技术的实证研究

产学合作网络的形成机理
——基于中国人工智能技术的实证研究

2022-12-13廉翔鹏

创新科技 2022年11期

廉翔鹏，苏竣，3

（1.清华大学公共管理学院，北京 100084；2.教育部科技委战略研究基地清华大学科教政策研究中心，北京 100084；3.清华珠三角研究院创新战略中心，广东广州 510799）

1 引言

产学合作研发被认为是推动科技活动和经济增长相结合的有效途径，是解决“技术与经济两张皮”问题的重要方法［1］。研究型大学是以科学研究为目标的非营利性公共科研机构，具有充足的科研人才和尖端的科研设备，在学科交叉、前沿研究、突破创新等方面具有天然优势，但在实现科技成果商业化和产业化方面却存在不足。企业则是以占有市场和引领产业为目标的营利性机构，能够准确把握市场的需求，并且拥有充足的资金。通过产学合作，公共研究部门和私人研究部门间可以实现资源共享和优势互补。

随着产学合作的优势不断展现，大量高校和企业加入到协同创新的阵列中，形成了主体多元、关系丰富、结构复杂的产学合作网络。随着网络科学的发展，产学合作网络由于蕴含丰富的知识流动、模式创新等信息已经成为众多学者的研究对象。刘凤朝等人以中国“985高校”为研究对象，分析了1985—2009年期间专利合作网络结构及空间分布的演化路径［2］。何郁冰和张迎春从关系嵌入和结构嵌入的角度研究网络嵌入性对产学协同创新模式的影响，划分出4类产学协同创新网络［3］。袁剑锋和许治利用专利大样本数据，刻画了我国产学合作网络的结构特性及演化路径［4］。高霞等人以中国ICT产业为例实证分析了产学合作创新网络中企业合作开放度对创新绩效的影响［5］。李明星等人以江浙沪A股上市公司为研究对象，实证检验了产学合作中企业网络位置与关系强度对企业技术创新绩效的影响［6］。

总体来看，现有关于产学合作网络的研究大致可分为两类。第一，借助复杂网络统计指标和分析方法，对产学合作网络的参与主体、协作关系、网络结构、合作模式等进行定量化描述性分析，以可视化的方式展现产学合作网络的动态演变［2-4］。第二，基于第一类研究中的网络结构定量化分析，将产学合作网络纳入到创新理论模型的建构中，探讨不同研究主体在产学合作网络中的位置和关系强度对其创新绩效、成果转化、商业行为等的影响［5-9］。

综合上述文献分析，现有文献更多聚焦于产学合作网络形成后的描述性统计分析和创新影响检验，鲜有研究针对产学合作网络自身的形成机理进行探讨，更缺少相关的实证研究。只有深刻理解产学合作网络的形成规律，才能通过政策引导实现公共研究资源和私有研究资源的流动和互补，推动形成健康良性的产学合作。鉴于以上研究不足和现实意义，本文从技术基础、社会网络和地理临近3个维度构建了产学合作网络形成因素的理论模型，并以中国人工智能专利技术的校企合作研发网络为例进行实证分析。

2 理论背景与假设

网络演化是复杂网络领域的重要研究方向，产学合作网络是一种典型的复杂网络。要想理解产学合作网络的形成机制，就要从网络系统性视角剖析网络形成的可能性因素。网络系统动力学将网络演化视为节点与节点产生连边的趋势和规律，从网络内部和网络外部两个方面将网络形成因素分为内生性因素和外生性因素［10］。内生性因素又称为网络结构嵌入，即网络中存在形成某一种局部网络的趋势，例如朋友社交网络中存在大量的三角闭环子网络，即“朋友的朋友是朋友”现象符合社交网络的形成规律。外生性因素主要包括节点属性和连边属性。节点属性特征使得某一节点有别于其他节点，使其更易或更难与其他节点产生连边，如在社交网络中个体的性格、外貌等特征。连边属性是节点与节点间的其他联系对节点间形成所关注关系的影响，例如社交网络中同学关系对好友关系的影响即是一种外生的连边属性［11］。

本研究也遵从网络演化的系统性视角，从节点属性、连边属性和结构嵌入3个维度来剖析产学合作网络的形成机制。首先，技术基础特征是最重要的节点属性［10］。在产学合作网络中，技术创新是合作的主要目标，因而大学和企业的技术基础特征是影响其获得合作机会的关键因素［9］。技术多样性关系到技术供给的丰富程度，技术价值关系到技术供给的应用潜力，技术相似性关系到技术供给的匹配程度，这3个特征会影响企业在选择合作大学时的技术判断［12］。因此，本文综合考虑以上3个特征对产学合作网络演化的影响。其次，在内生性因素方面，本文考虑合作主体的结构性嵌入带来的影响，从合作的社会性角度分析合作的内生演化趋势［13］。最后，合作主体所从属的环境使得主体存在合作以外的联系，其中地理上的联系是本文着重考虑的因素［14］。基于上述理论背景，本文将技术性、社会性和地理性因素纳入到同一分析框架中，形成如图1所示的理论框架。

2.1 技术性因素与产学合作

2.1.1 技术多样性。技术多样性是一个大学或企业涉足技术领域的宽广程度［12］。技术多样性已经被许多学者认为是影响科研活动的重要因素。Brennecke和Rank认为，多样化的技术知识能够为合作提供强有力的技术支撑［10］。Liu等人［15］和 Yu［16］沿袭过去研究将技术创新视为现有知识的再结合过程，而多样化技术能够为技术创新提供更多的结合创新机会。大学具有的技术多样程度决定了其满足业界技术创新需求的能力，因而具有多样化技术的大学在产学合作中能获得更多合作机会。对于企业而言，产学合作的目的在于通过协作的方式吸收利用大学的技术知识，而多样化的技术储备往往是顺利吸收新技术的基础［17］。因此，本文提出假设1a和假设1b。

假设1a：在产学合作网络中，技术多样性高的大学会与更多企业合作研发。

假设1b：在产学合作网络中，技术多样性高的企业会与更多大学合作研发。

2.1.2 技术价值。技术价值是指大学或企业技术的经济价值。技术的经济价值代表了其被商业化和产业化的潜力。Aldridge和Audretsch认为，当前大学科技成果转化效率较低的主要原因在于其研发技术的商业化潜力不足，即其实际能够产生的经济价值较小［18］。大学通过国家项目支持创造了大量的专利技术，然而很大比例的专利技术无论是创新性还是应用性都较低，以致很难成功被商业化。因此，大学的技术价值成为企业选择合作对象的重要指标之一。张根明和杨思涵发现，合作过程中双方的努力水平和合作收益随技术价值的增加而提高，随技术价值的减小而降低［19］。换言之，当企业认为大学的技术价值较高时，企业与其合作意愿也相对较高。因此，本文提出假设2a和2b。

假设2a：在产学合作网络中，技术价值高的大学会与更多企业合作研发。

假设2b：在产学合作网络中，技术价值高的企业会与更少大学合作研发。

2.1.3 技术相似性。技术相似性是指大学和企业间的技术领域储备的相似程度。许多研究已经指出，一定程度相似的技术背景对于协作创新的必要性。第一，技术可以被理解为合作的语言工具，跨领域合作等同于两个不同话语体系的交融，会增加合作双方的沟通成本［10］。第二，技术创新本身具有一定的失败概率，带有极强的偶然性特征。技术相似程度较低的大学和企业间合作会增加上述失败的概率，而逐利的企业对于创新失败的容忍度相对较低［20］。第三，相似的技术领域是企业顺利吸收、生产和商业化新技术的前提，因而在产学合作中企业会寻找有相似技术背景的大学合作［10］。因此，本文提出假设3。

假设3：在产学合作网络中，具有相似技术背景的大学和企业间更易合作。

2.2 社会性因素与产学合作

社会性因素主要指网络的结构嵌入性［14］。结构嵌入是指网络连边形成的某种特定模式，本质上反映了网络连边的自相关性，即每条连边不是孤立存在的，而是受到网络中其他连边的影响，即社会关系间会相互影响［11］。依据信息收益和资源限制间的权衡关系，合作网络呈现出“核心—边缘”和反“核心—边缘”结构嵌入趋势。

“核心—边缘”结构嵌入指网络中存在少数核心成员与其他多数成员间大量合作的趋势［8］。这种合作网络结构的形成主要是由于合作事项需要大量的信息和知识共享，而掌握核心信息和知识的机构或个体能够成为信息散播的枢纽，并且不断强化其在该网络中的信息获取能力和声誉地位，因而具有更多的合作机会［6］。由于核心信息和知识往往被掌握在少数核心团体中，网络中只有极少数的个体或机构能够成为核心节点，因而整体网络呈现出“核心—边缘”的结构趋势［3］。

反“核心—边缘”结构嵌入指网络中多数成员都只有有限的几个合作者，网络中不存在明显的中心和边缘位置［6］。这种合作网络需要多数网络成员具备与合作内容相关的基础知识和信息，合作不再局限于少数几个中心成员。此外，资源限制也使得单个成员不可能与众多合作者同时合作，尤其是需要投入大量人力、时间和资金的合作项目这种效应更加明显。很多机构会限于自身组织规模而无法维持数量过多的合作，因此会选择少量深入的合作［11］。在本研究中，人工智能技术的研发需要大量的资金、人力和时间的投入，与数量较少但联系紧密的几家企业合作会更有益于研发。因此，本文提出假设4。

假设4：产学合作网络会呈现反“核心—边缘”结构嵌入趋势。

2.3 地理性因素与产学合作

在创新合作研究中被强调最多的地理性因素是地理临近性。Santamaría等人认为，地理上的临近增加了互动的机会，企业能够通过直接接触或信息交互更深入地了解大学的技术基础和技术能力，增加大学和企业间的技术信任［13］。同时，地理上的临近意味着合作双方具有相似的文化背景和制度环境，能够降低由文化差异和制度规制带来的沟通、交易等合作成本。需要指出的是，虽然我国是中央领导的自上而下的行政体制，但是以省为行政单位的行政区划方式仍然造成了特色鲜明的区域差异。尤其是以“晋升锦标赛”为代表的激励模式会造成一定程度上的地方保护主义，对跨区域、远距离的产学合作造成阻碍［21］。因此，本文提出假设5。

假设5：在产学合作网络中，地理上临近的大学和企业更容易产生合作。

3 研究设计

3.1 研究方法

本文采用指数随机图模型（Exponential Random Graph Models，ERGM）作为分析工具。网络系统科学多以描述性统计分析为主，缺乏适用于网络因果统计推断工具，而传统回归分析模型很难解决网络的结构嵌入带来的内生性问题［14］。根据指数随机图理论，网络结构的背后动力机制可以被划分为内生性因素和外生性因素。内生性因素一般指结构嵌入，即网络连边之间并非独立的，会产生相互影响。例如，在社交网络中存在“朋友的朋友是朋友”的规律，即存在三角闭合结构。外生性因素又分为节点属性和连边属性，例如在合作网络中，节点的某些特征和节点之间的其他关系会影响节点间的合作。

ERGM刻画了从一个随机网络集合Y中观察到一个实际网络y的概率，这个概率取决于与内生性和外生性因素相关的网络构型（Configuration）。实际研究中根据理论设想选择适当的构型加入模型。ERGM的一般形式如式（1）所示［22］。

其中：y为待观测的实际网络，本文中为2020—2021年的人工智能专利合作申请网络；Y为与y节点数相同的随机网络集合；X是与构型或协变量相关的向量；θ是待拟合的参数向量，其取值代表了对应构型或协变量对网络生成的边际影响；k（θ，y）是模型的常数项，为了使数值上满足概率的数学定义。在实际操作中，θ的取值大小、正负和显著性代表了其对应构型和变量对网络生成的影响，是模型分析的关键点［11］。本文使用Wang Peng等人开发的MPnet软件进行ERGM的参数估计和拟合优度检验①。

3.2 数据来源与变量设计

3.2.1 数据来源。为探究产学合作研发网络的形成机理，本文以211工程大学在人工智能领域的产学合作为研究对象。自2010年以来，人工智能技术进入高速发展阶段，我国也积极加入到培育人工智能产业、促进人工智能技术研发的队列中。为促进人工智能技术创新，2017年发布的《国务院关于印发新一代人工智能发展规划的通知》中明确提出，要“倡导开源共享理念，促进产学研用各创新主体共创共享”。随着人工智能技术的不断发展，人工智能技术研发也进入新的瓶颈期，如何突破技术的软件和硬件难题成为产业界和学术界共同关注的问题，产学联合共享的人工智能技术创新模式不断出现。因此，结合当前人工智能技术发展的现实需要，以及人工智能技术研发在产学合作上的内在动力，本文将人工智能领域的产学合作作为研究对象。

本文以专利文本信息作为数据基础。专利文本数据包括专利申请人、国际专利分类号（International Patent Classification，IPC）、申请日等字段，为本研究中产学合作网络技术性因素、社会性因素和地理性因素的测度与表征提供了很好的数据支撑。专利数据来源于智慧芽全球专利数据库②，该数据平台与中国国家知识产权局合作，以周为单位定期更新数据，能够为本研究提供全面的数据支撑。本文收集了2000—2021年中国人工智能领域专利文本数据27.3万条，以2000—2019年专利数据作为技术性、社会性和地理性因素的衡量数据，以2020年和2021年专利数据表征产学合作网络，具体数据情况如图2所示。

图2 2000—2021年中国人工智能领域申请专利和产学合作申请专利趋势

3.2.2 变量设计。本文借助ERGM分析技术多样性、技术独立性、技术价值等节点属性，地理临近性、技术相似性等连边属性，以及2—Star、3—Star、K—Star等内生属性对产学合作网络形成机理的影响。ERGM模型统计量含义如表1所示。

①因变量。ERGM基于设定协变量和构型的参数估计生成观测网络的概率。本研究中观测网络为2020—2021年人工智能领域专利技术研发合作网络（y），因而本文的因变量为生成y的概率。本文的y是基于原始专利申请人信息生成的，如果211工程大学和企业间共同申请专利，则认为发生了产学合作研发。

②自变量。本文的自变量包括与技术性、社会性和地理性因素相关的6个变量。

技术性因素：技术多样性（Technological Diversity，TD）使用一个机构申请专利所属IPC类型总数进行测度［10］。技术价值（Technological Value，TV）为一个机构所有申请专利的估值总额③。技术相似性（Technological Proximity，TP）采用余弦相似度的测度方法进行测度［23］。基于专利IPC信息形成机构的IPC向量，计算211工程大学和企业间IPC向量的余弦值。取所有211工程大学和企业间技术相似性余弦值的3/4分位数作为阈值。TP大于等于该值则认为具有高技术相似性，值取1；否则取0。

社会性因素：为测度产学合作网络是否具有“核心—边缘”结构嵌入趋势，本文选择ERGM常用的3类构型，即2—Star、3—Star和K—Star。2—Star测度211工程大学（企业）是否倾向于与2个企业（211工程大学）合作；3—Star测度211工程大学（企业）是否倾向于与3个企业（211工程大学）合作；K—Star测度处于网络中心的211工程大学（企业）能够获得较多与企业（211工程大学）合作的机会［12］。

地理性因素：地理临近性是本文考虑的地理性因素。考虑到行政区划的影响，本文没有采用地理直线距离作为地理临近性测度指标，而是统计了211工程大学和企业间是否处于同一省份，是为1，否为0。

③控制变量。本文的控制变量包括边（Edge）、专利总量（Number of Patent，NP）、专利被引量（Number of Citation，NC）和合作历史（Collaborative History，CH）。具体测度方法见表1。

表1 ERGM模型统计量含义

4 实证分析

4.1 描述性分析

以211工程大学和企业为节点，以专利合作申请关系为连边，构建2020—2021年中国人工智能领域产学合作网络，如图3所示。网络包含79个211工程大学和790个人工智能领域企业。网络包含644个连边，5 201个大学—2—Star构型，619个企业—2—Star构型，43 412个大学—3—Star构型，2 449个企业—3—Star构型。在网络拓扑结构方面，大学的度中心性标准差为11.9，企业的度中心性标准差为1.544，大学的度中心性偏度为-0.577，企业的度中心性偏度为3.972，聚类系数为0.054。

图3 2020—2021年中国人工智能领域产学合作网络

4.2 分析结果

根据Wang等人的研究，包含在模型中的构型、协变量的t-ratio值均小于0.1，代表模型收敛较好［24］。根据表2中ERGM参数估计结果可知，本文ERGM收敛较好。进一步需要对模型的拟合优度（Goodness-Of-Fit，GOF）进行检验。GOF检验须将Wang等人的研究中要求的构型加入到模型中（见表3），GOF检验结果中大多数构型与协变量的t-ratio值小于2，说明模型拟合较好，即基于参数估计结果生成的网络与观测网络较为相似［24］。图4为GOF检验过程中模拟生成的最后一个网络。

表2 ERGM参数估计结果

图4 基于ERGM估计参数模拟的人工智能专利技术产学合作网络

表3 ERGM拟合优度结果

根据表2参数估计结果可知，技术性因素是影响产学合作研发网络生成的关键动力。协变量“大学—技术多样性”的系数显著为正（3.755），说明在产学合作网络中技术多样性越高的大学有更多企业与其合作；“企业—技术多样性”的系数也显著为正（11.039），说明技术多样性越高的企业加入产学合作的概率也越大。假设1a和假设1b成立。协变量“大学—技术价值”的系数显著为正（4.766），表明技术价值高的大学与企业合作的机会更多；而“企业—技术价值”的系数则不显著，表明企业的技术价值并不影响产学合作网络的形成。假设2a成立，假设2b不成立。二元协变量技术相似性的系数显著为正（0.925），表明在产学合作网络中具有相似技术的企业和大学更易合作。假设3成立。

社会性因素方面，构型“大学—2—Star”和“企业—2—Star”系数均显著为正，即在产学合作网络中，一所大学更倾向于与两个企业合作，一个企业也更倾向于与两所大学合作。构型“大学—3—Star”和“企业—3—Star”系数均显著为负，表明在产学合作网络中一所大学很少会选择与3个企业合作，一个企业也不倾向于与3所大学合作。用于衡量“核心—边缘”趋势的构型“大学—K—Star”系数不显著，而“企业—K—Star”构型显著为负（-2.698），说明在产学合作网络中不会出现少数大学与大量企业合作的局面，而企业更是不倾向于与多个大学合作。由此可以看出，在产学合作网络中存在显著的反“核心—边缘”趋势。假设4成立。

地理性因素方面，二元协变量地理临近性系数显著为正（2.703），即在产学合作网络中处于同一省份的211工程大学和企业更易合作。假设5成立。此外，构型Edge的系数显著为负（-5.911），说明在产学合作网络中企业和大学间关系较为疏离，现阶段人工智能领域的产学合作尚未形成较好的协同创新系统。协变量合作历史的系数显著为正（2.677），表明过去合作过的大学和企业在未来更易合作。

5 主要研究结论与启示

产学合作是实现创新驱动发展、技术推动经济增长的重要途径，研究产学合作网络的形成机理，厘清产学合作的动力因素具有重要意义。本文以2000—2021年我国人工智能领域的专利产学合作网络为例，从技术性、社会性和地理性3个维度对这一问题进行了理论构建和实证检验。实证结果表明：①技术性相关的技术多样性、技术价值和技术相似性与产学合作网络生成密切相关，提高大学的技术多样性与技术价值，同时提高大学和企业间的技术相似性能够促进产学合作；②产学合作网络呈现明显的反“核心—边缘”趋势，社会资本和资源控制理论强调的马太效应在人工智能领域产学合作中并不存在；③地理临近是促进产学合作的有利因素，能够为产学合作提供相似的文化背景和稳定的制度基础。

本文主要有以下两个理论贡献：第一，本文引入网络系统动力学的网络演化理论，结合内生和外生两个方面的因素提出了产学合作网络演化的动力框架。本文发现，产学合作网络需要考虑微观节点属性、中观连边属性以及宏观环境属性，这些因素综合作用于产学合作网络的生成和演化过程。第二，本文基于网络系统动力学提出的分析框架，从技术性、社会性和地理性3个维度探究了产学合作网络的演化规律并进行实证分析。本研究弥补了过去产学合作研究主要停留在描述性统计分析阶段的不足，对产学合作网络演化的内在机制做出了理论贡献。

结合以上理论分析与实证检验，本文提出以下政策建议。首先，为促进产学合作，大学应提高研究的多样性和价值，提高自身技术的适应能力和经济创造力，从而吸引更多的企业与其合作。并且，为提高合作的成功率，大学和企业应寻找与自身技术有一定相似性的合作对象，从而保障后续的技术吸收和利用。其次，产学合作对象并非越多越好，要尊重产学合作有效性规律，不要为了合作而合作。要将合作对象的数量控制在两个左右，寻求深入、密切的产学合作模式，让合作双方都能够从合作中获益。最后，政府应当推动省际合作。现阶段产学合作呈现出明显的省内优先趋势，这一方面是由于近距离合作有益于深入、高效的沟通，另一方面也有制度和文化层面的因素。因此，政府应当减少跨省合作中的制度性障碍，为不同地区、不同层次的跨省产学合作提供保障。

本文还存在以下研究不足：第一，本文仅选择人工智能这一新兴技术领域作为分析案例，实证结果和研究结论具有一定的局限性，未来可以选择传统技术领域进行稳健性检验。第二，本文使用专利合作研发信息作为产学合作网络构建的数据基础，忽略了论文合作、技术转移等合作方式，未来可以结合以上数据对产学合作网络进行更精准的刻画。

注释：

① Peng Wang，Garry Robins，Philippa Pattison，Johan Koskinen（2009）PNet：program for the simulation and estimation of exponential random graph models.Melbourne School of Psychological Sciences，The University of Melbourne.http：//www.melnet.org.au/pnet/.

② 数据来源：https：//www.zhihuiya.com/.

③单个专利的估值来源于“智慧芽专利价值评估体系”。它整合了专利价值相关的80多个指标，包括引用频次、专利国家规模、专利存活期、法律状态等，基于深度加工的专利大数据，运用市场法，结合机器学习模型进行价值估算。同时，基于历史上的专利成交案例等进行调整，最终得出专利价值的评估数值。