基于ERGM的科技主体间专利技术交易机会实证研究
2018-04-19何喜军董艳波武玉英蒋国瑞
何喜军,董艳波,武玉英,蒋国瑞
(北京工业大学 经济与管理学院,北京 100124)
一、引言
十九大报告提出创新是引领发展的第一动力,并强调要深化科技体制改革,促进科技成果转化。而加快建设创新型国家战略的进程中,创新能力不足已成为我国经济增长的主要掣肘[1],一方面关键核心技术依然未摆脱进口依赖,另一方面产业转型及产品提质增效的关键技术需求得不到有效满足。究其原因为科技创新供给不足,包括科技创新主体的有效技术供给不足,以及有效技术供给转化应用不足。目前我国科技成果转化率25%左右,与发达国家的50%-70%、美国的80%相比,科技进步对经济贡献率相对较低[2]。2017年,国务院印发《国家技术转移体系建设方案》提出,要推动形成紧密互动的技术转移网络,到2020年初步形成互联互通的技术市场。
专利技术是反映产业技术创新能力的重要指标[3]。2016年世界知识产权组织(WIPO)发布《世界知识产权指标》显示:2015年,中国发明专利申请数量超过美国(58.94万件)和日本(31.87万件)之和,高达110万件,专利大国的格局基本形成。但2015年全球提交的PCT专利申请21.72万件,其中中国PCT专利申请量仅为2.98万件,美日两国分别为5.69万件和4.41万件。同时,中技所《2015年中国专利申请及交易情况分析报告》显示:230万的专利申请中,交易总量仅16万,比例不足7%。众多研究得出影响专利技术转化的因素主要包括:质量不高[4]、缺乏专利估值机构[5]、专利技术供给与实际产业需求存在错配[6-7]、专利市场中供需信息不对称[8]等。为应对专利技术供需不对称、不匹配等问题,本文将大数据分析、文本挖掘与复杂网络方法相结合,采集专利交易数据,构建科技主体间专利技术交易网络,预测主体间技术交易机会,并以新能源领域为例开展实证研究,对提高领域技术供需对接,加速专利成果扩散与应用,具有重要的实践价值。
二、文献综述
(一)科技主体间专利技术交易的动因及预测研究
已有研究主要聚焦于科技主体间合作动因及预测,第一,研究个体属性如:企业吸收能力、企业规模、企业研发战略开放度[9],企业社会资本[10]对科技合作的影响;第二,研究关系属性如:合作伙伴知识共享、地理邻近性[11],企业间信任[12]等对研发协同的影响;第三,研究结构属性如:网络内生结构效应[13]对网络合作关系形成的影响。上述研究均从单一视角研究影响主体间合作的动因,预测精度较低[14],因此,融合节点属性与网络结构的链接预测快速发展[15-16],例如基于概率模型的链接预测,综合考虑了网络结构和节点属性信息,预测精度较高,但计算复杂度及非普适性的参数使其应用范围受到限制。
(二)基于ERGM的链接预测研究
由Pattison D P 等[17]提出的指数随机图模型(ERGM,exponential random graph model)可以综合考虑网络内生结构和网络中行动者关系等外生因素,不需要概率模型所必须的完整训练集,多用于研究网络形成与演化动因[18],同时综合考虑多因素建模的方法与基于决策树[19]、支持向量机[20]等相比,能够较好地预测未来链接的概率。目前国内应用ERGM进行网络关系预测的研究主要集中于:基于微博的关系推荐[21],基于情感相似度的社会化推荐[22]。国外应用ERGM开展链接预测的成果包括:Robbins[23]借助泊松回归及ERGM预测竞争合作网络中权利产生对网络结构与地域流动性的依赖。Relun等[24]利用ERGM,考虑地理及人口统计等外生变量及内生网络结构变量预测欧洲不同生产系统中的猪交易。Chrobot[25]基于ERGM预测公司与团队中重要的领导关系存在与否。
综上,本文构建新能源领域科技主体间专利技术交易网络,从网络内生结构、科技主体间关系属性、个体属性等多维度提出影响专利技术交易的假设变量,建立ERGM模型,预测科技主体间专利技术交易机会。其优势在于:第一,综合考虑交易网络中节点属性、关系属性及结构特征对交易形成的影响;第二,将传统链接预测指标融入ERGM;第三,将已有链接预测中难以融合的节点内容相似性引入ERGM。
三、ERGM链接预测模型
(一)ERGM构建及拟合
首先提出影响技术交易形成的假设变量并构建ERGM模型;然后运用蒙特卡洛-马尔可夫最大似然估计方法对ERGM进行拟合和变量参数估计,通过对比赤池信息准则(AIC)与贝叶斯信息准则(BIC)评估模型与真实网络的拟合度,选择最优模型,两值越小说明模型综合程度上越贴近观测网络[26]。采用最优拟合优度(goodness of fit,缩写Gof)对比基于最优模型生成的网络与观测网络的匹配性。采用R语言的Statnet[27]进行模型处理。ERGM的一般表达形式如下:
(1)
(二)基于ERGM拟合的链接概率预测
(2)
就推导出基于θA和构造变化统计量Δ(y)ij,yij发生变化时的条件概率。
(三)ERGM链接预测精度评价
采用ARC与AUC评估预测精度。针对稀疏网络,本文采取leave-one-out法进行模型训练[28]。即每次从观测网络中选取一条边作为测试集,设置为未链接,并预测其出现的可能性。用Ranking Score对其预测效果进行评价,公式为:
RankSkl=rkl/H
(3)
H表示观测网络中未链接边的总数(含测试边),rkl表示测试边对应的主体k与主体l之间产生链接的概率在H中所有边的概率的排名。RankSkl值越小表示测试边被成功预测的概率越大;对网络中的M条边重复上述操作,得到M个RankS的值;将M个RankS值按式(4)求其平均值作为预测精度,值越小,代表模型的预测精度越高。
ARC=(∑RankSkl)/M
(4)
AUC的值:从观测网络的测试集中随机选取一条边,预测其链接概率为Pkl,再从不存在链接的边中随机选取一条,预测其链接概率为Pij,若Pkl大于Pij,则加1分;若相等,则加0.5分,则:
(5)
其中n′为测试集中边的链接概率大于不存在边的链接概率的次数,n"为两者概率相等的次数,n为比较的总次数。
四、基于ERGM的科技主体间专利技术交易机会实证研究
(一)数据获取与网络构建
以新能源领域为例,通过查阅文献并阅读1500余篇领域专利构建检索表达式。从Incopat专利数据库检索2012-2016年专利技术交易信息,利用Python获取交易记录。剔除交易主体含个人及主体重复的记录,并针对同一交易中多主体进行拆分(见表1)。共得到6437个主体,交易频次9591;为缩小网络规模提高研究价值,论文筛选了5年中交易次数大于等于10次的243个主体构建交易网络,交易频次为2955。
表1 多主体间专利交易拆分规则
注:A、B、C分别为交易主体。
243个主体中企业183家,占比75%,高校和科研院所60家,占比25%;2955次交易中,企业间的交易频次约占总频次的62%,企业与高校和科研院所间的交易频次约占32%,说明企业间更易发生专利交易。此外243个主体共分布在中国24个省市,按照经济圈划分长三角、珠三角、环渤海、其他区域,各区域主体数占比依次为:珠三角:19.75%;长三角:31.69%;环渤海:32.10%;其他:16.46%,说明在新能源技术领域,环渤海和长三角区域的技术供需主体较多,技术优势和产业优势较明显。
用向量V=[vi](i=1,2,...n)表示网络中交易主体集合,用邻接矩阵E=[ai,j]表示主体间专利技术交易关系,如果主体vi和vj间发生交易行为,则ai,j=1,否则ai,j=0。用权重矩阵W=[wi,j]表示vi与vj之间2012-2016年进行专利交易的频次,从而由V,E,W共同组成科技主体间专利技术交易网络(无向加权网)。
(二)网络结构特征分析
1.集聚性:利用Gephi计算出网络平均聚类系数为0.755,平均路径长度2.308,说明网络具有集聚性和小世界性特征。
3.社团性:利用Gephi进行模块划分得出模块度为0.734,说明网络具有较强的社团性。
(三)ERGM假设变量选取
链接预测的基本假设即主体间相似度越高,越容易发生链接。本文在已有研究基础上将假设变量分为三部分:一是网络内生结构属性,包括网络的边和几何权重维度。二是网络节点属性,包括节点参与技术交易的开放度(用与该节点发生交易行为的主体数量度量)、节点区域性(节点所在省份)。三是节点关系协变量,包括节点间专利内容相似度(分别以各主体间IPC相似度与专利内容语义相似度度量)、基于结构的节点相似度(选取传统链接预测中的JC、RA、CN、AA4个指标)。部分指标测算及含义如表2所示。ERGM中各变量说明及表达式如表3所示。
表2 假设变量说明
表3 ERGM变量及表达式
(四)ERGM拟合
ERGM拟合是链接预测的前提,为得到最佳参数估计值,采用逐步添加变量的方式进行模型优化,分别探讨不同变量组合的ERGM拟合参数估计值及拟合效果(见表4)。
表4 技术交易网络ERGM拟合过程
通过表4发现Model5的AIC与BIC最小,拟合效果较好。再采用Gof检验对比生成网络与观测网络参数的具体拟合结果,选取edge-wise shared partners与degree的拟合分布进行匹配性检验,如图1所示。图1中实线为观测网络的统计值,小方形图为ERGM生成网络统计值,包含最大值、最小值及均值,实线若位于小方形均值附近,表明模型与观测网络的拟合效果良好。后续将基于Model5进行模型预测精度评价及未知边的概率预测。
图1 Model5中edge-wise shared partners 和degree的Gof拟合检验
(五)ERGM预测精度评价
根据3.2节公式及步骤,每次选取观测网络中已存在链接的404条边中的403条作为训练集,1条作为测试集,并与实际未链接的28999条边的链接概率进行比较,计算AUC与ARC。将所得结果与传统链接预测中CN、AA、RA、JC指标的预测结果对比,如表5所示。
表5 ERGM链接预测精度及对比
由表5可得:相比传统链接预测的4个模型,ERGM的ARC最小,AUC最大,反映出融合节点内容相似属性、结构相似属性、网络内生结构及节点属性后的ERGM之预测结果明显提高。
(六)科技主体间专利技术交易机会
依据Model5中各变量的最大参数估计值(见表4),根据公式(2)计算观测网络中28999条未知链接的链接概率,依据概率排名选取前30位的可能发生专利技术交易的主体对,并进一步对主体对间的关系进行分析(见表6)。
结合表6发现:在新能源领域专利技术交易网络中,可以挖掘出多对主体,其发生专利交易的可能性较高。其中1/3的主体对之间属于集团公司与子公司的紧密关系,但近5年此类主体间专利交易行为不活跃,其原因为:第一,双方专利交易出于公司战略需求,或者交易中涉及了兼并、收购等行为,不主动披露交易信息,导致现有交易数据无法全面反映集团公司与子公司间的专利交易行为,而给出较高的交易机会预测;第二,基于企业集团专利管理模式,企业集团内部可能存在不同法人之间的专利转让,但可能会存在法律风险,因此针对此类主体对,需要深入分析其专利交易现状及方式,完善专利技术交易原始数据,提高机会预测的准确性;另外2/3的主体对中65%的交易机会都是围绕国家电网公司及其直属科研单位中国电力科学研究院而形成,两个单位在专利交易网络中的节点强度排名前2位,说明其处于该领域专利技术的集聚中心;该结果将为技术供需主体间的交易及合作提供决策支持。
表6 未来链接预测结果(TOP30)
五、结论与管理启示
本文建立科技主体间专利技术交易网络,综合考虑网络内生结构、节点间内容相似度与结构相似度以及节点属性对交易形成的影响。构建ERGM模型,对科技主体间交易机会进行预测。通过新能源领域实证分析,并与传统链接预测结果对比,得出ERGM预测精度明显提高;预测结果为新能源领域专利技术交易推荐及主体对接提供决策支撑。
新能源领域专利技术交易网络是技术链、供需链、产业链、企业链融合的有效组织模式,以此为载体,开展供需主体间交易机会预测,对能源领域技术研发、供需对接具有引导作用。那么,如何在政策链上进行创新以推动技术交易机会实现,提出如下思考:
(1)整合技术交易大数据,推动互联互通的技术转移平台建设,规范供需信息发布标准,提高信息共享。目前在技术交易管理部门登记的线下技术交易合同信息数量达百万级,且基于互联网的线上技术交易快速发展,2016年,全国技术合同成交额首次突破1万亿元,其中“科易宝”线上技术成果交易量达2126万项,交易额达93084万元,同比增长377.84%。但技术交易线上线下信息未实现共享,分散建设的基于互联网的技术交易平台未进行有效对接,在一定程度上阻碍了技术供需信息共享和科技主体有效对接。因此,采用大数据分析方法,整合技术交易多源异构数据,规范技术供需信息发布标准,对实现技术供需信息共享、准确匹配,加速互联互通的技术市场平台建设具有重要推动作用。
(2)加快产业联盟建设,提高关键技术创新能力并促进技术成果辐射共享。技术创新与关键技术突破不仅需要金融资本支撑,还具有较大风险,单独一家企业很难拥有关键技术突破所必须的全部资源和能力,因此,加快产业联盟建设,对技术攻关与成果辐射共享具有重要作用,例如:国电和神华两大集团的重组,首先能够解决电力产业链上下游之间的供需矛盾;其次能够充分发挥二者之间的协同效应,实现优势互补、资源共享;第三,对产业链上关键核心技术的联合研发,以及双方现有核心技术的共享与交易许可等提供更多机会。目前中国新能源产业联盟的实践还处于起步阶段[29]。
(3)依托创新创业行动计划,鼓励高校、科研院所以及大型企业搭建开放性创新平台,促进技术转移。“十三五”规划提出要实施“双创”行动计划,依托此计划,一方面要加强各科研机构技术信息资源整合,向企业开放专利及技术资源和科研基地;另一方面鼓励大型企业建立技术转移服务平台,推动大中小企业跨界融合,服务中小微企业技术创新需求。目前,海尔集团就建立了全球资源和用户参与的创新生态系统,让技术供需双方零距离对接,为技术持有者寻找合适的客户、为技术需求者嫁接技术解决方案。第三,依托互联网拓宽技术市场资源、社会需求与创业创新对接通道。
(4)加快设立社会化技术转移机构,引导专业人员从事技术转移转化服务。一方面,鼓励高校和科研院所建设技术转移机构,加快技术成果转移转化;鼓励各类中介机构为技术转移提供专业服务,例如:技术资产评估、供需匹配评估、应用转化风险评估等。另一方面引导专业人员从事技术转移转化服务,尤其鼓励高校和科研院所的研究人员,要密切关注社会经济发展中的重大技术需求以及企业转型升级中的技术难题,避免技术成果束之高阁。
(5)深化产学研合作,加快PCT专利国际化战略布局,提升专利技术质量及产业化水平。要充分借鉴美国、日本的经验,深化产学研合作,如针对高校和科研院所,发展其衍生企业,寻找战略合作伙伴。例如:清华大学通过实施与企业尤其是鸿海精密工业股份有限公司的深度科研合作和共赢的专利战略,在美国进行布局并取得成效[30]。从而使得专利技术在研发的初期就具有产业化的基础。另一方面,要围绕优势产业和关键特色技术领域,加快PCT专利申请,提高知识产权领域的国际话语权。切实将高校、企业等科技主体的研发活动与市场的需求紧密结合,将科技主体的研发能力提升与国际竞争力拓展相结合。
(6)不断完善法律制度,充分调动中小企业参与技术转移的积极性。中国企业中90%以上是中小企业,是未来产业创新发展的重要主体,因此要不断完善并优化法律制度,逐步健全对中小企业技术创新的政策和制度保障。在此方面要充分借鉴国外经验,例如:美国《小型企业法案》规定:研发预算超过1亿美元的联邦机构必须参与小企业创新研究计划,并将不低于研发预算的3.2%(2017年最新数据)授予参与研发的小企业。此外联邦政府每年投入约10亿美元专门用于支持中小企业创新研究与技术转移[31],通过立法明确联邦政府有关部门和机构的技术转移职能,并提高中小企业参与技术创新和技术转移的积极性。
参考文献:
[1]赵志耘. 以科技创新引领供给侧结构性改革[J].中国软科学, 2016(9): 1-6.
[2]吴卫红, 董诚, 彭洁, 等. 美国促进科技成果转化的制度体系解析[J]. 科技管理研究, 2015(14): 16-20.
[3]余绍山, 贺正楚, 张蜜, 等. 再生有色金属产业技术专利状况及发展对策研究[J].中国软科学, 2015(3): 41-55.
[4]孙玉涛, 栾倩. 专利质量测度“三阶段-两维度”模型及实证研究—以C9联盟高校为例[J]. 科学学与科学技术管理, 2016, 37(6): 23-32.
[5]张宇青. 我国“专利沉睡”之困与治理研究[J]. 科学管理研究, 2013, 31(4): 50-53.
[6]薛伟贤, 田鹏, 孙姝羽. 战略性新兴产业技术供需协同研究: 以陕西为例[J]. 科研管理, 2016, 37(4): 507-516.
[7]王瑞敏, 腾青, 卢斐斐. 影响高校专利转化的因素分析和对策研究[J]. 科研管理, 2013, 34(3): 137-144.
[8]唐要家, 孙路. 专利转化中“专利沉睡”及其治理分析[J]. 中国软科学, 2006(8): 73-78.
[9]樊霞, 赵丹萍, 何悦. 企业产学研合作的创新效率及其影响因素研究[J]. 科研管理, 2012, 33(2): 33-39.
[10]熊捷, 孙道银. 企业社会资本、技术知识获取与产品创新绩效关系研究[J]. 管理评论, 2017, 29(5): 23-39.
[11]杨颖, 李宇啸. 研发协同的影响因素和绩效评价: 文献综述[J]. 科研管理, 2017, 38(S1): 543-549.
[12]陈晓峰. 关系资源对集群企业间合作绩效的影响研究[J]. 科研管理, 2017, 38(6): 59-66.
[13]叶春霞. 企业专利合作网络演化的形成影响因素研究[D]. 武汉: 华中科技大学, 2014.
[14]吴梦蝶, 唐雁. 基于主题模型的有向社交网络链接预测方法[J]. 西南大学学报, 2014, 36(1): 152-158.
[15]HE Yu Lin, LIU J N K, HU Yan Xing, et al. OWA operator based link prediction ensemble for social network [J].Expert Systems with Applications, 2015, 42(1): 21-50.
[16]BLISS C A, FRANK M R, DANFORTH C M, et al. An evolutionary algorithm approach to link prediction in dynamic social networks [J].Journal of Computational Science, 2014, 5(5): 750-764.
[17]PATTISON D P, WASSERMAN S. Logit models and logistic regressions for social networks: II. Multivariate relations [J].British Journal of Mathematical and Statistical Psychology, 1999, 61(2): 401-425.
[18]LUSHER D, KOSKINEN J, ROBINS G. Exponential random graph models for social networks: Theory, methods and applications [M]. Cambridge: Cambridge University Press, 2012.
[19]李玉华, 肖海岭, 李栋才, 等. 基于链接重要性的动态链接预测方法研究[J]. 计算机研究与发展, 2011, 48(S3): 40-46.
[20]SHIBATA N, KAJIKAWA Y, SAKATA I. Link prediction in citation networks [J]. Journal of the American Society for Information Science and Technology, 2012, 63(1): 78-85.
[21]ZHANG Chuang, ZHAI Bing Yu, WU Ming. Link prediction of community in Microblog based on exponential random graph model [C].//16th International Symposium on Wireless Personal Multimedia Communications (WPMC). Atlantic: IEEE PRESS, 2013, 6983(6): 1-6.
[22]杨东辉. 基于情感相似度的社会化推荐系统研究[D]. 哈尔滨: 哈尔滨工业大学,2014.
[23]ROBBINS B, WELSER H T, GRIGORYEVA M, et al. Power-use in cooperative competition: A power-dependence model and an empirical test of network structure and geographic mobility [J]. Social Science Research, 2014, 45: 131-151.
[24]RELUN A, GROSBOIS V, ALEXANDROV T, et al. Prediction of pig trade movements in different European production systems using exponential random graph models [J]. Frontiers in Veterinary Science, 2017, 4: 1-12.
[25]CHROBOT-MASON D, GERBASI A, CULLEN-LESTER K L. Predicting leadership relationships: The importance of collective identity [J]. Leadership Quarterly, 2016, 27(2): 298-311.
[26]SCOTT T A. Analyzing policy networks using valued exponential random graph models: Do government-sponsored collaborative groups enhance organizational networks? [J]. Policy Studies Journal, 2015, 44(2): 215-244.
[27]HUNTER D R, GOODREAU S M, HANDCOCK M S. ERGM.userterms:A template package for extending statnet [J]. Journal of Statistical Software, 2013, 52(2): 1-25.
[28]刘宏鲲, 吕琳媛, 周涛. 利用链路预测推断网络演化机制[J]. 中国科学: 物理学 力学 天文学, 2011, 41(7): 816-823.
[29]刘颖琦, 王静宇,ARI K. 产业联盟中知识转移、技术创新对中国新能源汽车产业发展的影响[J]. 中国软科学, 2016(5): 1-11.
[30]顾志恒. 清华大学美国专利分析与高校海外专利推进策略[J]. 科研管理, 2017, 38(1): 137-143.
[31]杨尚洪, 李斌, 王然, 等. 美国国防领域知识产权管理与技术转移的做法与启示[J]. 中国科技论坛, 2017(4): 186-192.