APP下载

基于内容与效率二维视角的创新主体识别研究

2021-11-15磊,方

创新科技 2021年10期
关键词:国防科技专利效率

周 磊,方 芳

(1.武汉纺织大学会计学院,湖北 武汉 430200;2.武汉大学信息管理学院,湖北 武汉 430072)

创新是经济长期发展的原动力,也是学术研究和国家政策规划的关注焦点。自熊彼特提出创新的概念以来,创新动力主题的经典研究相继提出了技术推动论、市场拉动论、技术与市场的耦合互动论、一体化模式、系统集成与网络模式等理论,逐步廓清了技术、需求等要素在推动创新中的重要作用。同时,党和国家历来高度重视创新在国家经济发展、产业安全中的战略性地位。党的十九大报告提出加快建设创新型国家,要引领原创成果重大突破,突出颠覆性技术创新。国家“十四五”规划进一步要求,强化国家战略科技力量,提升企业技术创新能力。目前,产业核心关键技术和重大科技创新的技术复杂性、学科交叉性、市场不确定性特征愈加显著,使得创新模式由传统的内部研发向合作开发、开放式创新、创新生态系统转变。因此,建立供需精准对接机制是实现创新要素按需配置的前提。鉴于此,本文以对接产业创新需求为目标,综合利用文本挖掘、文献计量、DEA模型等方法,建立三阶段的创新主体识别框架,以期为优化产业协同创新研究和实践提供帮助。

1 相关文献综述

跨组织创新是企业创新的重要模式,外部创新主体选择已成为企业管理研究的重要问题。相关学者根据企业竞争优势的来源,提出了基于资源基础观的资产指标、基于核心能力学说的动态能力指标、基于知识管理理论的专有性知识指标、基于战略管理视角的企业战略优势指标等。在此基础上,研究者针对上述指标设计了创新主体评价体系,并利用决策理论和方法对各指标进行合理赋权。早期评价方法以AHP模型、模糊综合评价等专家介入法为主。后续研究充分吸收决策理论量化方法,整合Theil不均衡指数和灰色关联度系数形成组合赋权灰色模糊评价法[1];使用Dematel-ANP法对开放式协同创新合作伙伴选择指标进行赋权[2];使用熵权Topsis法选择跨产业研发合作伙伴[3];组合AHP法与熵值法对创新合作伙伴选择评价指标体系进行赋权[4]。近年来,伴随着经济全球化和创新多元化趋势进一步凸显,跨组织创新合作的范围、强度、速度也随之变化。因此,创新主体识别研究应加大对其他学科先进分析方法和思路的吸收。

一是要吸收文本挖掘技术提升需求分析的自动化程度。不同于问卷调查、专家咨询法等传统方法,情报学领域利用信息采集、清洗、分析一体化工具,实现了针对互联网批量需求信息的自动获取和深度挖掘。相关研究始于高度专业化人才的招聘,分专业建立技能词典[5-6],利用文本挖掘技术分析专业、岗位、知识点的三层映射关系,总结出计算机专业人才的技能需求[7]。新兴研究引入Agent仿真模型,研究合作伙伴选择策略并评估创新成果[8];利用word2Vec模型分析专利相似性进而判断产品用途,从而识别潜在技术机会及合作企业[9];利用自监督表示学习识别企业偏好、技术融合机会,进而根据企业间相似性、企业和融合机会相似性做出合作决策[10]。因此,创新主体识别研究应引进情报学的文本挖掘技术对创新需求进行深度理解和自动聚类,从而为匹配创新供给主体奠定基础。

二是在文献数据及其计量方法的基础上,增强对多源信息的综合化分析。近年来,情报学领域积极采用异构数据开展技术创新主题的融合性研究。例如,利用论文和专利数据确定研究领域科研和创新演化的协同性[11-12],识别发明科学家或学界企业家[13],发现潜在的商业化机会[14];利用专利和商标网络建立主题模型,提高新颖性、创造性技术的商业化概率[15];综合论文、专利、新闻数据探索固体油脂纳米颗粒的技术转移路径和新兴研究方向[16];综合专利和交易许可数据,利用主题模型和生存分析对卫生健康类创新的商业可行性进行预测[17]。因此,创新主体识别研究应借鉴情报学的异构数据分析方法,通过多源信息的交互印证对潜在供给方法进行全面考察。

三是在深耕科研环节的基础上,加强对创新链各环节的关注。目前,情报学研究日益重视技术创新的经济效应,实证发现具有影响力的专利知识对企业财务绩效存在滞后一期且为期一年的正向影响[18]。国内情报学界亦积极开展金融情报学探索性研究,对我国上市公司年报信息质量进行了综合评价[19],对标美国提出我国上市企业年报产品的信息组织优化策略[20];应用文本挖掘技术抽取企业风险条目[21]和预测企业破产风险[22];建立了金融风险知识关联原型系统[23]及金融知识可视化模型[24]。因此,创新主体识别研究应借鉴金融情报研究视角,分析创新主体贯穿研究、技术化、商业化全流程的创新行为。

综上所述,创新主体识别的评价指标体系及评价方法成果丰富,但也存在亟待吸收、学习、优化的地方:一是产业创新需求被视作一个整体性的黑箱,未对其内部结构和特征进行定量化剖析;二是评价体系聚焦于科研环节,即重视供需双方的创新内容匹配,而对创新者效率的关注有限;三是单一数据源和传统评价方法难以完全适应未来研究对技术工具自动化、数据多源化、视角综合化的要求。因此,本文将从两个方面完善创新主体识别机制:一是从内容、效率二维视角丰富创新主体识别内涵。本文建立了“以需求识别为前提、内容匹配为基础、效率评价为进阶”的识别框架。二是增强研究方法的包容性和特色化。本文在经典的文献计量基础上,以网络数据为数据源,利用LDA主题建模技术从中挖掘需求主题;以企业年报数据为数据源,利用DEA方法评价企业创新效率。

2 研究框架

针对当前研究的不足,本文整合多源数据,综合应用文本挖掘、专利计量、DEA等方法,建立三阶段的创新供需识别框架:第一阶段利用文本挖掘技术识别产业创新需求;第二阶段针对潜在的创新供给主体,利用文献计量方法分析其创新专长,实现创新内容的匹配;第三阶段利用DEA方法评估供给方创新投入—产出情况,实现创新效率的筛选。具体分析流程如图1所示。

图1 本研究的分析思路

2.1 基于LDA分析的创新需求挖掘

情报学研究常用的文本挖掘方法有TF-IDF算法、SAO结构分析、LDA建模。TF-IDF算法克服了早期的词向量模型仅考虑绝对词频的缺陷,能够发现集合中真正重要的词汇。SAO结构分析区别于词袋模型,将词性和句法结构融入文本分析,是技术—功效矩阵自动化的重要工具。2003年,Blei等提出隐狄利克雷分配(Latent Se⁃mantic Analysis,LDA)主题模型,建立了连接文档、主题、词汇的多层次贝叶斯概率模型,实现高维度文档向低维度语义空间的完全随机映射[25]。LDA模型采用无监督学习机制,将文档集自动聚类为指定数量,并给出每一类文档集的特征词及其概率分布,分析过程如图2所示。

图2 LDA建模思路

图2中涉及的参数包括:主题数K、文档数M、文档—主题的多项式分布先验参数α、主题—特征词的多项式分布先验参数β;Nm是第m个文档的特征词数量,θm为第m个文档的主题分布,φk是第k个主题的特征词分布。LDA建模的工作机制可简单描述为五步:第一,从现有的M个文档中获得N个特征词,设置主题数K。第二,以先验参数α生成满足θ的文档—主题多项式分布。第三,针对选定主题Z,以先验参数β生成满足φ的主题—特征词的多项式分布。第四,根据特征词的分布,采样生成具体特征词W。重复以上过程,直到整个文档中的每一个词都被追踪到。第五,得到文档—主题的分类,以及各主题—特征词的分类。

产业创新需求挖掘的预期结果是以关键词组合形成若干主题,适合以LDA建模实现,具体执行过程分为三步:首先,对需求文本进行初步分词,人工分析后,修改分词词典、停用词词典,再进行二次分词。其次,对二次分词后的文本进行LDA建模,并根据困惑度(perplexity)或轮廓系数(silhouette)指标确定最优分类数N。最后,分析最优分类结果,综合行业背景、关键词和概率,为创新需求命名。

2.2 基于文献计量的供给方创新内容匹配

创新链是科学知识、技术知识经过技术创新转移转化实现商业化、产业化的过程[26],通常包括新思想产生、基础研究、技术研发、产品试制、大规模生产、市场营销等多个环节[27]。创新链各环节的发展动力各异,其需求的创新属性亦有所不同。科研环节位于创新链上游,对应的需求多与学科理论研究相关,创新供给方主要是高等院校。因此,本研究需要对高校的论文、科研项目、成果获奖的主题进行分析,判断其是否满足创新需求的内容要求。预研和开发环节是科学研究向应用开发转化的基础。例如,武器装备领域在武器装备具体型号开发前,通过预研环节来解决和落实各项关键性技术问题。该阶段的创新供给方主要为研发能力突出的大型企业、专业能力突出的研究所。例如,华为公司于1998年成立了预研部,专门负责前瞻性技术的开发。因此,本研究需要对企业、研究所的专利技术进行分析,判断其是否满足创新需求的内容要求。制造环节位于创新链的下游,需要调动各类物质资源组织生产。企业是这类创新的潜在供应方。因此,本研究需要对企业主要业务、产品系列、解决方案等进行分析,判断其是否满足创新需求的内容要求。

2.3 基于DEA分析的供给方创新效率筛选

创新内容匹配主要考查供给方产出与采购方需求的一致性。对于满足创新内容要求的潜在供给方,还要从投入、产出的因果关系出发,评估其创新效率,从而达到“优中选优”的目的。国内研究主要采用DEA、随机前沿分析法(SFA)等决策模型评价企业技术效率。考虑到DEA能够对多目标进行决策,且无需专家介入、对数据分布无特殊要求,本研究将使用该方法对供给方的创新效率进行综合评估,线性规划建模如下。

本文设有n个机构满足创新内容要求,每个机构投入m种资源,获得p种产出,xij(>0)表示第j个机构的第i种指标的投入量,yrj(>0)表示第j个企业的第r种指标的产出量,vi(≥0)表示第i种投入指标的权重,ur(≥0)表示第r种产出指标的权重。针对高校和研究所,本文主要将专职教师规模、重大实验设备、科研经费等作为创新投入;将论文、专利、获奖等指标作为创新产出。针对企业,本文将人力资本、资金、技术作为创新投入;考虑到企业承担了更大的市场风险、制造成本、资金垫付成本,因此,在衡量创新资源配置效率时应综合考虑创新产出、资金链稳健性。

本文采用C2R模型测试企业资源配置效率的相对有效性,最优化模型如式(1)所示:

若hj=1,表明主体j资源配置有效,满足创新效率要求;反之,说明主体资源配置的综合效率偏低,难以持续保障创新活动。

3 实证研究:以国防科技工业预研环节为例

国防科技工业涵盖航天、航空、船舶、电子等多个行业,具有典型的集中采购特征。创新供给方需要按照需求清单提供定制化产品或服务。本文以全军武器装备采购信息网为数据源,利用网络爬虫采集预研板块截至2019年的需求信息,共2 047条。

3.1 国防科技工业预研环节创新需求挖掘

按照上文步骤,本研究对预研需求文本进行清洗、分词和LDA主题建模。轮廓系数指标显示,N=9时,组内内聚性和组间差异度指标最佳。根据前10个关键词及分布概率,本文对9个需求类别分别命名,如表1所示。

表1 国防科技工业预研环节的创新需求主题建模(N=9)

根据需求主题的内在关联性,本文将上述9个主题进一步归为5个大类:一是材料类需求,由主题3、6构成,涉及储能相关材料、陶瓷复合材料、高性能涂层、纳米尺度材料等;二是飞行器与船舶类需求,由主题1、2构成,包括航天器抗干扰、卫星在轨探测、船线型优化与海洋目标辨识等;三是信息通信与智能分析类需求,由主题8、9构成,包括网络通信协议、信息管理方法、系统仿真与建模;四是电子元件类需求,由主题4、5构成,主要为高性能电子元器件需求,如各类芯片、传感器等;五是软科学类需求,对应主题7,主要为国防知识产权制度、数据库建设。

3.2 供给企业的创新内容匹配

前文指出预研环节对应的创新主体为企业和研究院。综合考虑国防科技工业创新主体的资质要求和信息可获得性,本节以我国十大军工集团的61家上市公司作为预研需求的潜在供给方。首先,以国泰安CSMAR数据库为起点,根据上市公司股票代码查询企业全称;其次,以inco⁃Pat专利数据库为数据源,采用基于企业全称的权利人扩展策略检索专利;最后,对各上市公司专利文本进行聚类,与创新需求进行匹配。匹配结果显示,软科学需求无针对性企业;共有33家上市企业能够满足其他4类需求。接下来,本文从创新需求、创新专长两个维度绘制热度图,如图3所示。子图中每一个方格中的数值表示特定企业满足特定需求的专利数量,随着数值的增大,方格的颜色按照黄、绿、蓝的顺序逐步加深。

图3 国防科技工业预研环节供需对接情况

由图3可知,共有33家企业的专利内容匹配创新需求。具体来看,7家企业的专利主题属于第1类(材料类)需求;8家企业的专利主题属于第2类(飞行器与船舶类)需求;17家企业的专利主题属于第3类(信息通信与智能分析类)需求;13家企业的专利主题属于第4类(电子元件类)需求。进一步观察方格颜色,本文发现各类需求的对接程度也存在较大差异。对接第3类需求的专利最多,申请量为12 217件,代表性企业有海康威视(002415)、杰赛科技(002544)、航天信息(600271)。对接第4类需求的专利次之,申请量为4 899件,代表性企业有中航光电(002179)、航天信息(600271)、四创电子(600990)。对接第2类需求的专利名列第三,申请量为1 677件,代表性企业有洪都航空(600316)、航发动力(600893)、中直股份(600038)。对接第1类需求的专利偏少,申请量为854件,代表性企业有杰赛科技(002544)、中国动力(600482)、乐凯胶片(600135)。需要注意的是,上述企业的专利均与软科学类需求无关。

3.3 供给企业的创新效率筛选

本节将上述33家企业的投入产出效率进行比较,以达到“优中选优”的筛选目的。根据前文的理论分析,下文将从人员、技术、资金三个方面衡量企业投入,从创新成果产出、资金链保障两个方面衡量企业产出,具体指标如表2所示。

表2 企业创新效率评估指标

为了与需求分析的时间窗口保持一致,本节对2019年企业创新效率进行评价。变量y1的取值来自incoPat,其余变量的取值来自CSMAR。预处理时发现有两种情况不满足DEA建模前提:一是y1j=0,表明该企业在2019年未申请专利,无技术发明产出;二是y2j<0,表明该企业在2019年经营活动未产生积极的经济后果,进一步削弱其资金垫付能力。删除初始数据不满足的9家企业,纳入DEA建模的企业共有24家,符合的最佳要求。DEA分析结果如表3所示。

表3 基于DEA的企业创新效率评估

由表3可知,创新资源配置达到有效水平(生产率=1)的企业共6家,分别为华锦股份(000059)、海康威视(002415)、光电股份(600184)、洪都航空(600316)、航发科技(600391)、华东电脑(600850)。这6家企业即为通过内容、效率双重筛选的创新供给方。

接下来,借鉴Choi Y 等(2021)[28]提出的创新生态系统框架图描绘创新供给方的技术图景,用以揭示上述企业利用专利技术对接国防科技工业预研需求的路径。该文提出了特定技术领域中由技术主题和关键机构共同组成的企业、专利、技术类三层网络,网络各层内部关系均由专利CPC分类号共类关系决定。由于本文涉及6家企业,大量专利难以在有限空间进行全面展示,故而对该研究框架进行了优化,将专利类、技术类两层合并为技术层,目的在于展示创新供给方的技术特征;同时,增加产业创新需求层以展示行业需求的主题分类;最后,考虑到上述企业间的交叉权属关系,还增加了企业权属关系层以展示由社会资源嵌入带来的企业间合作渠道。根据以上设想,本文绘制了国防科技工业预研环节的创新供需对接路径,如图4所示。

图4 国防科技工业预研环节的创新供需对接路径

由图4可知,最终筛选出的6家企业的创新供给模式主要分为聚焦化、多元化两类。聚集化模式指企业利用现有创新专长重点对接一类需求。采用该模式的企业包括华锦股份(000059)、海康威视(002415)、华东电脑(600850)。华锦股份拥有的锂电池隔膜专利技术可以对接储能材料需求;海康威视(002415)拥有的图像融合、分布存储、智能分析专利能够对接图像数据采集、分析一体化需求;华东电脑(600850)拥有的数据中心专利技术可以对接通信系统类需求。多元化模式指企业利用现有创新专长同时对接多类需求。采用该模式的企业包括光电股份(600184)、洪都航空(600316)、航发科技(600391)。光电股份(600184)拥有的电子经纬仪和图像仪专利技术、黑色阳极氧化专利技术分别对接高端光电仪器设备、材料类需求;洪都航空(600316)拥有的arinc429、航电系统专利技术分别对接航空元件、飞行器、信息通信需求;航发科技(600391)镍涂层、航空发动机专利技术分别对接材料类、飞行器类需求。

此外,鉴于隶属于同一控制人的上市企业间更容易达成战略联盟或合作“默契”,图4底层还从社会资源嵌入视角揭示出6个创新主体间的潜在合作渠道。具体来看,华锦股份(000059)和光电股份(600184)同属于中国兵器工业集团,海康威视(002415)和华东电脑(600850)同属于中国电子科技集团,洪都航空(600316)隶属的中国航空工业集团持有航发科技(600391)母公司中国航空发动机工业集团6%的股权;同时,上述4个集团的实际控制人均为国务院国资委。因此,鉴于国防科技工业创新复杂性和规模性、国有企业间交易成本优势,上述6家企业还可充分利用社会资源嵌入条件,形成具有规模效应和范围经济的创新供给合作渠道。

4 结语

本文基于内容、效率二维视角,融合文本、文献、财务数据等多源信息,建立包括创新需求识别、创新内容匹配、创新效率筛选三阶段的创新主体识别机制。基于该研究框架,本文对国防科技工业预研环节进行实证研究,发现该环节的创新需求集中于材料、飞行器与船舶、信息通信与智能分析、电子元器件、软科学5类;进而以61家相关上市企业为潜在创新供给方进行匹配,发现有33家企业的专利满足前4类创新内容需求,但其中仅有6家企业通过创新效率筛选;最后,为最终选出的6家企业建立创新生态系统,发现其创新供给模式分为聚焦化、多元化两类,且这6家企业相互间存在广泛的社会资源嵌入关系,可以形成合作性的创新供给渠道。

综合来看,本文的理论贡献集中体现为两点:一是从内容、效率二维视角完善创新主体识别思路,并将其分解为“需求识别、内容匹配、效率筛选”环环相扣的三个阶段;二是根据创新主体识别流程的特性,在传统文献数据的基础上引入网络文本、财务年报数据,建立了融合LDA、文献计量、DEA的综合分析方法体系。同时,鉴于本文的实证研究集中于预研环节需求且仅考虑了企业的创新成果形式和创新效率特征,建议未来研究覆盖创新链的更多环节,并根据对应环节创新供给方的成果特征和评价导向开展创新主体识别实证研究。

最后,本文的实证研究亦能为十大军工集团旗下上市公司的科技创新工作提供建议启示。首先,企业创新专长与国防科技工业创新需求间的关联性仍有待增强。上述企业脱胎于军工集团,但改制后近一半企业的技术专利集中于部件、配件加工或民品制造,无法满足创新内容要求;另一半企业拥有的专利集中于信息通信与智能分析、电子元件领域,对国防科技工业的飞行器与船舶、材料类、软科学需求支撑有限。因此,未来我国应继续引导和鼓励企业走内涵式发展道路,根据国防科技工业创新需求,调整军品和民品比例、优化技术结构和专利管理流程。其次,企业创新效率仍有待提升。满足创新内容要求的上述企业中,27%的企业在2019年未申请专利或经营业务无法带来资金净流入;还有55%的企业在2019年的创新投入与产出间未达到有效水平。因此,未来企业应将技术发明、技术商品化纳入企业年度绩效评价目标,激励企业提高创新活动的投入—产出效率。最后,创新主体服务国防科技工业创新的路径应当多样化。一方面,企业可以根据自身创新专长独立对接部分创新需求;另一方面,国防科技工业具有资源投入大、技术集成领域广、技术竞争激烈等显著特征,武器装备总体和关键分系统的研发制造需要多个创新主体合作参与。因此,企业应充分利用股权性质带来的社会接近性,建立竞争力强、稳定性高的有效合作机制。

猜你喜欢

国防科技专利效率
美国国防科技集成创新初探
国防科技工业自然环境试验研究中心
“慢”过程 “高”效率
注意实验拓展,提高复习效率
聚焦立体几何命题 提高高考备考效率
跟踪导练(一)2
2007年上半年专利授权状况统计