基于文献综述法的硬科技创新研究现状与识别方法研究
2021-04-04张楠,赵辉
张 楠,赵 辉
(中国科学技术信息研究所,北京 100083)
21世纪以来科技创新日益决定着世界各国发展的格局,但是过去几年我国GDP增速逐渐放缓,究其原因主要有三点:一是我国过去经济发展模式主要依靠人口红利、要素驱动和投资驱动,未来人口红利逐渐消亡,需转向创新驱动[1];二是我国金融投资比例倾斜问题严重,限制实体经济发展。据统计过去5年我国金融投资在信息技术等非实体经济领域的投资案例占到了总件数的56.7%左右[2]。许多企业更愿意涉足信息科技领域,或将发展重点放在营销和盈利模式创新而非研发,创业虚化问题严重[3];三是我国科技成果转化率不足,相较于发达国家80%的转化率,我国只有45%[4]。因此学界提出硬科技创新概念,希望帮助我国形成核心竞争能力,占领技术和经济制高点。
现有研究中,学者们主要围绕政策和经济两个领域,在政策方面,从硬科技创新扶持政策制定、企业成长模式探讨、硬科技创新人才培养等角度进行研究;在经济方面,对硬科技创新的投资价值进行研究。在图情领域还未有硬科技创新技术的识别方法探索。系统的文献综述法是针对某一研究领域进行全面系统性研究的最佳手段,本文将借鉴这种方法梳理硬科技创新相关研究,从中探索识别硬科技创新的方法,以期为后续研究提供参考。
1 系统文献综述法简介
系统文献综述法是一种定位、评估和综合文献证据观点看法的系统化文献分析方法,它能够利用不同的数据库资源制定检索策略和分析方法,针对某一特定问题进行研究,对其进行系统性了解,并得出一些研究结论。从研究内容来看有两种,一种是针对文献所描述的内容进行综合评价汇总,另一种在描述汇总的基础上有针对性地对文献进行总结整理[5];从研究方法来看有未经统计学合并的定性系统性综述和应用统计学方法对研究结果进行统计合并的定量系统综述两种。
系统文献综述法有5个步骤:提出问题、制定检索策略、确定文献、提取数据、研究结果展示。提出问题要求问题明确,有研究意义;制定检索策略要根据问题要求,在文献类型、时间年限等方面对所检索的文献进行限制,全面精确检索;确定文献要通过标题、摘要等对文献内容进行筛查,剔除非相关文献或者相关度不高的文献,避免不必要的误差;提取数据要求进行数据提取,保证所检索到的结果是客观可靠的;最后利用定性或定量方法来分析得出研究结论。
2 分析过程
2.1 硬科技概念辨析
硬科技为我国自创词汇,学界和媒体的讨论起源于中科院西安光学精密机械研究所(下文简称“西光所”)米磊博士[1]2016年发文。
徐豪[6]认为科技创新体系自下到上分别为科技、高科技、硬科技、黑科技,其中硬科技指高精尖原创技术;孙桂田[7]认为硬科技创新的重点在科技成果转化基地的建设,打造从人才培养到研发、中试、孵化、产业化的全链条产业发展模式;杨忠泰[8]认为硬科技创新概念的产生基于两个背景,一是当前新一轮产业革命正在兴起,二是互联网行业发展带来高市值企业,其他产业诸如芯片、新材料领域、智能制造发展进程缓慢;张建国[9]认为其发展不仅是经济发展必需,国防领域也受到深远影响,军用硬科技创新转民用也是一种发展路径。2018年西安市政府联合中国科学院发布了《中国硬科技产业投资发展白皮书》,提出硬科技创新的基础是原创科学发现和技术发明,具有较高技术门槛和技术壁垒,难以被复制和模仿,需要长期研发投入持续积累形成的高精尖技术,主要分布于人工智能、航空航天、生物技术、光电芯片、信息技术、新材料、新能源、智能制造八大领域[10]。
国外与之有渊源或概念相近的是“深科技”(Deep Technology)。美国波斯顿咨询公司(BCG)对深科技研究较为深入,该公司把深科技限定在先进材料、人工智能、生物工程、区块链、无人机和机器人、光电子、量子计算7个领域,认为深科技是比当前技术有着更为显著技术进步的技术,商业潜力巨大,但研发投入资金多、投资时间长[11]。
综合国内外的研究,可以将硬科技界定为原创性高精尖科技,而硬科技创新则是以促进实体经济创新发展为目标而进行长期的、持续性的研发投入,预期在未来获得巨大的经济效益。
2.2 确定研究问题
本文的研究目的是辨析硬科技创新的概念,分析其主要特征,并分析其与其他创新形式的异同点。
硬科技创新的概念自提出以来受到了社会各界的广泛关注,但学术界还未对硬科技创新有明确的定义,国内与国外相关研究文献也较少,加之由于样本选取的限制,通过单纯的文献计量方法如引文分析、共词分析等方法只能够展现一部分研究,并不能对硬科技创新领域内的相关研究做出比较全面的分析,为了能够更加全面地了解相关研究,本文将筛选文献精读,并参考其他文献,多角度多维度进行研究分析。
2.3 文献选择
2.3.1 检索文献
在本文中,国外数据库使用了Web of Science(WOS)核心合集数据库,国内数据库使用中国知网(CNKI)与万方。根据研究问题制定的检索策略、时间、结果等如表1所示。
检索结果初步显示,WOS核心数据集关于硬科技创新的研究热点为信息(2篇,5.4%)、创新(2篇,5.4%)、MapReduce(一种适用于大规模数据集并行运算的编程模型,2篇,5.4%)、云计算(2篇,5.4%);在知网检索结果显示,分散在前5名的研究热点为硬科技(14篇,12.07%)、人工智能(10篇,8.62%)、中关村(8篇,6.90%)、创新创业(7篇,6.03%)、西咸新区(6篇、5.17%);万方检索结果显示分散在前5名的研究热点为硬科技(10篇,7.25%)、西安(8篇,5.80%)、科技创新(7篇,5.07%)、创新驱动(7篇,5.07%)、科技创业(5篇、3.62%)。
2.3.2 确定文献
去除重复文献后,知网+万方+WOS总共收集到211篇文献,其中中文文献核心期刊(包含SCI来源期刊、EI来源期刊、核心期刊、CSSCI、CSCD、北大核心期刊)有31篇,占比14.83%。文献要根据本文的研究目的和问题进行选取,通过阅读摘要、题名等途径确定相关性高的研究文献并进行精读,去除刊头引言、会议报道性文章、评论性文章、创业者和团队介绍等文章,得到高度相关论文38篇,其中英文文献0篇,硕士学位论文1篇。
表1 检索策略与结果展示
2.4 结果解读
硬科技创新研究起源于米磊博士在2017年《中国高新区》一刊中发表的《“硬科技”创业的黄金时代》,该文对硬科技创新概念产生的背景和西光所科技成果转化孵化模式做了简要介绍。
这6篇高度相关文献可划分为政策、金融、企业调查、评述性文章4个大类,政策类文章有9篇,对成果转化模式、人才培养、地域产业发展等进行介绍;金融类文章有5篇,从产业投资角度对硬科技创新领域进行描述;企业调查文献有5篇,对创业公司创业趋势、成果孵化模式等进行研究;评述性文章有17篇,这些评述性文章对硬科技创新发展的战略意义背景、科创板设立目的现状等进行评述。
2.4.1 硬科技特点
第一,硬科技创新注重基础研究,它要求硬科技本身可以在多个产业应用,并在产业技术发展中起基础支撑的作用,能够带动一个产业发展,提高生产效率[12],这类技术通常由几个公司或者国家率先研究并做出突破,其他国家和地区难以在短时间内进行复制和模仿,所以这类技术往往是一个国家形成核心竞争能力的关键技术。中国科学院已于2018年立项“硬科技发展研究战略”,以期打造出硬科技创新品牌效应,通过扶持其发展找到新的经济增长点[13]。基于此,高校及国立科研机构根据国家战略目标制定研究任务,并实现研究结果的成果化,这一直是硬科技创新研究成果转化的一个主流方式。
第二,技术本身要够硬。硬科技是原创的实体性技术,要求技术在行业内领先,难以被复制,有较高的技术壁垒,是产业链内的关键技术,其发展需要长期的资金和时间投入,相关技术专家往往需要十年以上的研究才能够使技术有所突破。如新型晶体的研发和产成就需要长时间研究,所以投资风险高;为了保证研究有序进行,1988年福建物质结构研究所独资创建了福建晶体技术开发公司,对所内实验室成果进行转化,如今它已成为国内领先的光电子晶体企业[14]。
第三,科技转化过程中科学家的深度参与是另一个特征。硬科技创新型企业要求创始人有很强的学术背景,需要科学家领袖支撑,如西光所旗下西科控股把硬科技创新企业的被投资者定为创业者,他们在本领域要有一定的学术地位,必须是科研工作者甚至是科学家[15];美国康奈尔大学也有类似的硬科技创新成果孵化模式,投资对象定位于校内博士,并提供长期教育和投资计划[16]。一些学者也通过调查证明领域内核心作者、博士的成果更易商业化[17],因此对领域内核心作者及其成果转化为现实生产力的研究是必要的[18]。未来的硬科技创新发展将是由高校和科研院所引导的创新创业主力军,有学者建议,科创板应该组建一个国内外科学院和工程院院士、知名科学家以及产业顶级专家联络办公室来对上市公司质量进行考量[19]。
可从技术、市场、人才三个角度归纳硬科技创新特点,如表2所示。
表2 硬科技特点
2.4.2 硬科技与其他创新区别
硬科技创新与突破性创新、颠覆性创新等概念既有区别又有联系。
1978年Abernathy等[20]首次提出了利用技术创新提升企业地位、重构市场格局的突破性创新(Breakthrough Innovation),这概念既对后期的突破性创新理论产生了深远影响,也奠定了管理学科在突破性创新研究中的重要地位。1984年Ettlie等[21]对该概念进行完善,认为技术创新按照创新强度分为渐进性技术创新和突破性技术创新。突破性创新是指在现有技术发展路径上另谋出路从而能够逐步取代原有技术,最终改变行业内技术的发展进程、竞争形势的一种技术创新,它可能不是按照公司主流用户的需求在性能改进轨道上进行改进的创新,而是暂时还不能满足公司主流用户需求的创新,包括跃迁型突破性创新、跨界型突破性创新、原始型突破性创新三种,来源主题通常为小公司和市场中的新准入者。未来可以从市场风险、跨国合作战略、大数据赋能、绿色导向等方面进行研发[22]。
颠覆性技术(Disruptive Innovation)是与延续性技术(Sustainable Technologies)相对的概念,它的概念最早在1995年由美国哈佛大学教授Christensen提出[23]。颠覆性创新与突破性创新同属非连续性创新,颠覆性创新指以意想不到的方式取代现有主流技术的创新,低端或边缘市场是其切入点,简单、方便、便宜是初始阶段特征,之后性能与功能能够不断改进与完善,最终取代已有技术,开辟出新市场,形成新的价值体系,强调市场价值与破坏。颠覆性创新通常有颠覆性(对某项技术形成颠覆)、破坏性、跨界性(通常易在跨界研究中产生)、对象性(有明确颠覆对象)、前沿性、对抗性(能够对抗现有技术)等特性。对其评价主要考虑技术的颠覆能力,要评估它是否有明确的取代对象,成熟度如何、是否迎合社会发展趋势、发展潜力是否足够等。
本文根据相关文献[24-28]对这三种创新进行区分,如表3所示。
从考察视角来看,突破性创新更关注技术本身,而颠覆性创新和硬科技创新注重技术未来可能造成的对于环境和市场的改变;虽然三种创新最终目标皆为主流市场,但颠覆性创新可能从低端或边缘市场兴起,硬科技创新的设立目标首先便是为主流市场而服务;就技术复杂度而言,颠覆性创新依赖于灵敏的市场嗅觉,技术复杂度可能不高,此外,颠覆性创新还包含从低轨道技术上进行技术改进,从而使得原有技术得到大幅改进的特性,而硬科技创新技术复杂度较高,更接近原始性突破性创新。因此可以从技术和市场两个维度建立坐标,大致如图1所示。
三种创新还有一个区分是发起者角色不同,颠覆性创新发起者为新兴进入者和小公司,突破性创新由大型企业所主导,硬科技创新由高校和国家科研院所和科学家领导企业主导。
表3 硬科技与其他创新区别
图1 三种创新在市场-技术维度的区别
3 硬科技创新识别方法探索
关于硬科技创新识别方法,有学者从金融角度作出探索,如把硬科技创新定位于科创板申报企业,将企业过去一年净利润、过去三年平均净资产收益率、过去一年的研发费用率三个指标作为筛选突出企业标准[29]。叶金福[30]认为研发费用是科创板上市财务的重要指标基础,认为硬科技创新企业更加注重研发费用的真实性和高占比,这在一定程度上能够反映企业参与硬科技创新研发的力度。然而这两种方法对技术本身没有做出评价,评价方法较为局限,图情领域还未有硬科技创新识别研究。本研究根据硬科技创新特点做出一些探索。
3.1 关注学术型发明人研究
学术型发明人研究应被重点关注。研究学者可分为象牙塔型、需求导向型、企业家型、辅助型研究人员[31]。象牙塔型研究人员一般不与他人进行合作研究,他们能不依赖其他资源独立开辟新的理论体系、方法、甚至学科;需求导向型学者的研究是通过实现学者所处环境(例如为研究提供资金的公司或资助机构)设定的特定研究目标来完成的,他们自主性较低,往往需要依赖同事一起研究共享资源[32];企业家型研究人员对他们的科学产品产生了需求,他们迫切需要从环境中获取资源,这类学者往往是学术产出与专利产出并重的学者;而辅助研究学者虽然不是研究中的主要学者,但是他们在网络中起到了衔接不同研究团体的作用。
本文认为对于硬科技创新的识别要重点关注企业家型研究人员,以需求导向型研究人员作为辅助,这类学者有个共同的特征是同时拥有论文和专利产出,Margherita等[33]称这类学者为学术型发明人(Academic Inventors),并通过实验证明该类学者在领域网络中更具中心性,并扮演着非常重要的角色,因为他们的研究主题兼顾科技成果的先进性和技术上的创新性,有统一的知识基础,能够反映出领域内技术的发展阶段、发展趋势、不同技术流派的关注度、研究参与度。比如Winnink等[34]以艾滋病药物治疗领域内的整合酶抑制剂研究作为样本,并通过领域内学术型发明人的专利构建论文与专利之间的引用知识网络,证明他们对于领域内的知识流通起到了重要作用。
学术型发明人即同时拥有论文和专利产出的学者,由于论文专利命名方式不同,所以需要进行唯一性识别。Boyack等[35]曾经使用机构帮助进行唯一性识别;Trajtenberg[36]利用Soundex设计算法“姓名游戏(Name Game)”,以USPTO内的金融领域专利数据为例,通过作者机构对专利作者做出唯一性识别,取得了较好的同名作者识别效果;王刚波等[37]也曾沿用这种方法,以纳米领域为例,把研究对象限定在了累计专利家族数达到一定规模的高校,寻找其中的学术型发明人,通过论文与专利之间的数量关系变化分析高校的论文专利活动状况,发现学术型发明人和非学术发明人之间的绩效差异,证明学术型发明人确实有着更好的研究绩效。
3.2 关注战略性研究
虽然技术探索的初期无法从经济收益的角度对技术价值本身做出评估,但是投资资本密集度也可反映出一定的技术价值。米磊博士认为中国目前的科技力量主要掌握在科研院所手中,因为科研院所主导研究强聚焦国家战略重点任务,多为实验室研究成果,并不追求短期经济效益,所以我国长期的经济投资也集中于此。我国科研院所基础研究主要由政府资助,据统计在2018年基础研究科研经费占所有科研经费约5.5%,在GDP中的比重为0.11%左右,而在美国这两项指标分别达到17%左右和稳定在0.4%-0.5%[38],与发达国家还存在一定差距,而高校和科研院所约占到基础研究支出的93.8%[39]。虽然承担技术创新的往往是小微初创企业,但是硬科技创新资金投入大时间长,现在80%的社会资本都投入了互联网行业。提出硬科技创新概念的西光所提出了一条孵化硬科技创新引导投资的有效方法:科研院所承担基础研究主体部分,中试阶段由企业完成,转化为产品阶段科研院所和企业全程参与[40],孵化出硬科技创新企业250余家,打造出了围绕西光所的光电子产业集群。
因此可将硬科技创新研究识别主体范围放在高校和科研院所以及以科学家为主导的企业,尤其是研究周期长、资本密集度高、高校及科研院所参与强度高的技术主题应该被重点关注。
3.3 关注成果创新性研究
自熊彼特提出技术创新理论以来,科技创新对于社会经济和政治的影响已经被学者们广泛深入讨论,创新对于社会发展的作用不言而喻。论文和专利是某项研究内容的创新体现,论文代表了知识基础,专利代表了对科学知识的具象化,尤其是硬科技创新的研究不仅是对基础研究的深入,更要求对技术的成果化,所以针对其研究,对论文和专利进行选取是非常有必要的。
针对论文或专利研究主题挖掘有着共性方法。定性分析有德尔菲法、内容分析法、专家咨询法等,定量分析通常对研究样本字段进行计量分析,具体可分为基于文献、基于作者、基于词汇、基于引文等。科学知识图谱方法诸如Citespace、Pajak等能将上述计量分析进行汇总挖掘;近年来也有学者将计算机领域的主题模型算法引入情报学研究中,为主题挖掘提供更多便利,如LDA模型、Word2vec模型、LSA模型等。相较于传统计量方法,主题模型算法能结合上下文从语义层面理解文本内容,有着更好的主题挖掘效果。
论文与专利存在紧密关联,现在常用的关联方法可分为基于内部关系和外部关系。内部关系测量又可分为不同种类数据源之间的主题相似度测量和融合不同数据源文献进行的统一主题分析。主题相似度测量是利用相似度算法来计算不同类型的数据之间的主题相似度,发现其知识关联,比如Wang等[40]以微生物燃料为例,对论文和专利进行主题词聚类并进行相似度分析,从而能够对领域内的潜在技术机会进行发现识别;融合不同数据源进行分析是指对不同数据源主题进行混合分析,随着科学研究和技术研究的边界逐渐模糊,联系也越来越密切,这种方法也越来越具有可行性[41],比如说裘惠麟[42]就利用LDA主题模型对论文和专利数据进行融合分析,证明了相较于单一数据源,多数据源最终提取特征词更多,且不同类目之间的界线更加明晰,对于科研热点识别更具有参照性。外部关系测量指论文与专利相互引用关系测量,帮助探讨基础研究与应用研究之间的知识转移状况,比如Small[43]通过测度不同论文和专利之间的共被引强度测度其相关性。
通过上述分析可构建如图2所示的硬科技创新识别方法。
图2 硬科技创新识别方法
4 总结
本文通过系统文献综述法梳理硬科技创新相关研究,认为其具有在科技成果转化过程中科学家深度参与、以科研院所为主导、技术复杂度较高、需要长期资金和时间投入等特点;并与突破性创新、颠覆性创新等在考察视角、初始目标市场、技术复杂度、发起者角色方面有所区别,发现相较于其他两种创新,硬科技创新更关注技术本身,技术复杂度较高,且发起者角色有本质不同。因此硬科技创新的识别应关注学术型发明人研究,重视研究周期长、资本密集度高的基础研究成果,融合论文专利数据进行主题提取分析。