基于技术研发与基础研究关联的中国重点技术领域前沿主题预测*
2022-01-28吴菲菲李一苇
吴菲菲 李一苇 苗 红
(北京工业大学经济与管理学院 北京 100124)
0 引 言
基础研究成果转化是产业技术创新活动的重要环节,能够促进科技资源合理配置和有效利用,对于企业和国家的竞争实力提升具有重要作用。但是由于研发周期长、投资风险大等原因导致基础研究成果转化存在障碍。为此世界各国采取措施强化技术研发与基础研究的关联,促进基础研究向技术研发的转化,例如美国的先进技术计划(ATP)中政府根据企业技术需求,资助具有市场潜力的科研项目,促进研究机构与企业合作,促进基础研究成果转化[1];欧盟的“欧洲地平线”计划,包括将基础研究与创新和社会重大问题结合,服务基础研究,解决社会与提升工业竞争力的相关问题[2]。中国发布《国家中长期科学与技术发展规划纲要(2006-2020年)》,规划部署面向国家重大战略需求的基础研究。面向技术研发需求开展的基础研究,使基础研究成果处于易转化状态,也使利用基础研究成果预测技术研发前沿主题成为可能。专利作为技术研发成果的载体,专利的科学文献等非专利引文使技术研发与基础研究构成有效关联[3-9],利用关联的时滞特征和技术循环周期特征,可以确定预测前沿主题的非专利引文数据筛选准则。
基于技术研发与基础研究关联的技术领域前沿主题预测不同于传统的技术前沿预测。传统技术前沿预测以技术本身的发展和演化为基础,除专家预测外[4,5,10,11],通常采用专利引用专利[4,5,12-13]或专利文本挖掘[4,5,12-15]的方法实现。虽然在引文计算[16-18]和文本挖掘[19-21]的算法上不断进步,机器学习[22-23]的方法也用于技术前沿的预测,但因为没有将技术与基础研究进行有机关联,因此难以跟踪基础研究的新成果,不能服务于基础研究成果的转化。单纯的研究前沿又以论文为预测依据,分析的是基础研究发展趋势,由于缺少与技术研发的关联,造成前沿主题范围虽广但可直接用于技术研发的基础研究成果不明确,指导企业确定研发方向的作用有限。
技术前沿主题不同于技术热点主题,技术热点主题反映当下研究关注的焦点,短时间大量聚集或长时间持续累计都会增加热度,技术热点主题常用主题词频测度及词与词之间亲疏或语义关系识别分析[24-28],但热点主题强调的是受关注程度,并非技术主题的新颖性[4,29],不能反映技术未来的发展方向。技术前沿主题也不同于技术新兴主题,新兴主题关注词频增长率而不是累计频次,对主题的新颖性要求高,但忽视了技术主题的时效性[4,29-30]。相对新兴主题和热点主题技术领域的前沿主题更贴近未来,更注重未来的研究价值与前景[4]。技术前沿主题的预测既要考虑新颖性,也要考虑时效性。通过专利的非专利引文能够建立技术研发与基础研究之间的关联关系[7,9]。本文将以此建立技术研发与基础研究的关联关系,在关联基础上,通过技术研发成果引用基础研究成果时滞、技术研发成果科学循环周期实现对基础研究成果的时效性、新颖性的判断,利用基础研究成果预测技术领域前沿主题。
1 基于技术研发与基础研究关联的技术领域前沿主题预测框架
基于技术研发与基础研究关联的技术领域前沿主题预测,首先,本文通过筛选专利的非专利引文建立技术研发与基础研究的关联关系,测度基础研究成果转化层面的关联特征。其次,根据关联特征筛选用于预测技术领域前沿主题的基础研究成果数据。最后,根据筛选出的基础研究成果主题预测技术领域前沿主题。论文结构如图1所示。
图1 基于技术研发与基础研究关联的技术领域前沿主题预测框架
2 技术研发与基础研究关联预测技术领域前沿主题的方法
2.1技术研发与基础研究关联的建立本文将专利作为技术研发成果,在下载得到的专利数据中剔除没有引用信息,以及只引用了专利的数据,然后对存在非专利引文的数据进行进一步分类,具体的分类方法借鉴Sung等人[6]的非专利引文分类及筛选方法,从专利的非专利引文中筛选期刊论文、会议论文与书籍作为基础研究成果,手册、报告、网页信息不算作基础研究成果。根据专利对期刊论文、会议论文与书籍的引用建立技术研发与基础研究关联。
2.2用于预测技术领域前沿主题的基础研究成果筛选在建立了技术研发与基础研究关联后,并非所有存在关联的基础研究成果都可用于前沿主题预测。根据上文对前沿主题特征的描述可知,满足新颖性与时效性的基础研究成果才可用于预测技术领域前沿主题。
2.2.1 基础研究成果转化的时效性指标 基础研究成果转化的时效性指基础研究成果的转化速度,即从出版到被引用经历的时间长度。时间长度越短,时效性越好,反之越差。时效性可用技术研发成果引用基础研究成果的时滞PTg指标测度[31-32],见公式(1):
PTgi=(Ypi-Yci)/s
(1)
式(1)中i=1,2,3…n,j=1,2,3,…s;Ypi表示专利i的公开年份;Ycj表示专利i引用的第j项基础研究成果的出版年份;s表示专利i引用的基础研究成果总数。PTgi越小,代表技术研发成果引用基础研究成果时滞越短,基础研究成果向技术研发转化速度越快。
2.2.2 基础研究成果的新颖性指标 基础研究成果的新颖性指专利引用的基础研究成果的出版年龄,即专利所引用的基础研究成果的出版时间长度。时间长度越短,新颖性越强,反之越差。新颖性可用技术研发成果科学循环周期SCTt[31-32]测度,见公式(2):
SCTt=∑Sti/Pt
(2)
式(2)中=1,2,3…n,Sti表示专利i引用的基础研究成果出版年龄中位数,Pt表示施引专利总数。SCTt越小,代表技术研发成果科学循环周期越短,被引用的基础研究成果新颖性越强。
3 中国重点技术领域前沿主题预测
为了更好地了解我国技术研发引用基础研究成果的特征,本文对中国、美国、日本相同的技术领域情况进行了比较研究,然后,根据中国的技术研发与基础研究的关联特征进行技术领域前沿主题的预测。
3.1数据获取与清洗根据《国务院关于全面加强基础科学研究的若干意见》与《国家中长期科学与技术发展规划纲要》选取农业、材料、能源、网络信息、制造与工程作为中国重点技术领域,并筛选技术领域相关重点关键词进行全时间段的数据检索与分类处理,检索中国、美国、日本相同技术领域下有效的专利数据进行对比分析。中国数据收集时间2020年7月20日,美国、日本数据收集时间2020年9月19日,数据检索结果如表1。面向本文测度技术研发成果引用基础研究成果的时滞、技术研发成果科学循环周期的需求,对检索获得的专利数据按照参考文献[6]进行分类统计。结果如表2。
表1 中美日三国重点技术领域数据集
表2 有引用非专利参考文献的重点技术领域专利数据集
3.2基础研究成果的时效性衡量面向不同技术领域以专利为单位测度技术研发成果引用基础研究成果时滞,一方面测度时滞长度,在中美日三国之间对比,分析中国重点技术领域基础研究向技术研发转化的速度,另一方面测度时滞分布区间,分析中国重点技术领域技术研发成果相对集中引用基础研究成果的区间,视为基础研究相对密集向技术研发转化的区间,确定用于预测技术领域前沿主题的依据。
根据公式(1),得到中日美不同技术领域研发成果引用基础研究成果的时滞测度,截取各国时滞频次分布相对密集的区间,结果如表3-表5。
表3 中国重点技术领域技术研发成果引用
表4 日本重点技术领域技术研发成果引用
表5 美国重点技术领域技术研发成果引用
续表5 美国重点技术领域技术研发成果引用
对比表3-表5可知,中国的时滞分布在2-8年之间,其中3-4年最为集中,即中国重点技术领域专利倾向于引用专利公开年之前2-8年之间发表的基础研究成果,最为集中的是引用专利公开年之前3-4年发表的基础研究成果。美国农业和材料领域的时滞跨度较大,在2-25年之间,能源、网络信息和制造与工程领域的时滞分布在2-30年之间,综合来看时滞9-12年之间最为集中。日本由于专利数量相对较少,有引用基础研究成果的专利更少,因此时滞分布较为分散,其中能源领域的时滞分布在3-15年之间,6年最为集中;制造与工程领域的时滞分布在3-20年之间,13年最为集中。对比发现,中国重点技术领域基础研究成果时效性最好,基础研究向技术研发转化的速度最快。一方面说明,中国的基础研究成果在持续更新,可供技术研发成果引用;另一方面说明相对美国与日本,中国的基础研究起步较晚,仍处于追赶发展阶段,持续不断的基础研究成果转化为技术研发成果,既促进了企业创新发展,又引导了基础研究的方向选择。
3.3基础研究成果的新颖性衡量根据新颖性的概念定义及测度公式(2),对获取的中美日数据进行测算,结果如表6。
表6 中美日重点技术领域技术研发成果科学循环周期对比(年)
根据表6,对比各国重点技术领域技术研发成果科学循环周期,发现中国重点技术领域技术研发成果科学循环周期普遍短于美国与日本,显示中国重点技术领域专利倾向于引用更新颖的基础研究成果。
综合时滞指标的计算结果,中国存在持续更新的基础研究成果,并且技术研发仍存在需要解决的基础科学问题,需要引用新颖的基础研究成果作为支撑。因此需要强化基础研究与技术研发的关联程度,增加技术研发对基础研究的反馈,根据技术研发的需求进行基础研究,从而更精准支持技术研发。
3.4中国重点技术领域前沿主题预测基于3.2节与3.3节共同呈现的中国重点技术领域基础研究成果转化特征,选定中国各个重点技术领域技术研发成果集中引用基础研究成果的时滞区间。从本文检索所得的数据集中筛选有引用基础研究成果的专利与对应时滞区间内被引用的基础研究成果作为预测数据集,筛选其中包含超过两个技术研发主题的专利公开年,按照最新专利公开年、最早专利公开年及二者中间总共三个时间点,分别人工阅读归纳总结技术研发主题内容和基础研究主题内容,结果如表7。
表7 基于技术研发成果引用基础研究成果的时滞的中国重点技术领域技术研发主题与基础研究主题的匹配
由于制造与工程领域专利较少,且专利主题内容集中于极端制造技术和数字化与智能化设计制造两个主题,因此该技术领域可直接集中这两个主题进行研发投入。
在表7的匹配结果基础上,根据中国各个重点技术领域技术研发成果集中引用基础研究成果的时滞区间,通过本文检索所得数据集中的基础研究成果预测2022年的技术研发主题内容。为了验证表7结果的可信性,选择具有影响力的中国科学院科技战略咨询研究院、中国科学院文献情报中心与科睿唯安发布的最新《2020研究前沿》报告中的新兴前沿主题作为参照。该报告的预测依据是ESI数据库中根据被引频次和出版年筛选的核心论文,兼顾了本文所关注的基础研究成果的时效性和新颖性,论文也涵盖了大部分本文分析涉及的基础研究成果。如果本文得到的前沿主题与该报告一致,则可以认为本文的研究方法具有可信性,能够用于基于技术研发与基础研究关联的技术领域前沿主题预测。由于该报告采用学科视角归纳前沿主题,呈现出的主题粒度与本文存在差异,因此,采用两种方式判断两者的一致性,一是报告给出的研究前沿与本文得到的前沿主题词具有相似性,则可认为一致;二是尽管主题不相似,但根据主题粒度判断存在包含关系或目的手段关系,则也可视为一致。例如,农业科学、植物学和动物学领域可应用于环保型肥料创制、农作物肥料资源化技术的可降解废弃物资源化利用生物学调控技术及机制;生物科学领域可应用于分子评价、发掘、构建技术和基因识别技术的基因编辑技术,可应用于免疫防治技术的免疫相关研究;物理学领域可应用于发电部件和光电部件研究的二维范德瓦尔斯异质结的摩尔超晶格研究;化学与材料科学领域信息科学领域可应用于pH敏性聚合物的可生物降解的传感器材料,可应用于生物质能源开发、工业节能评价的三元共沸物萃取精馏工艺、等离子体用于废水处理;信息科学领域可用于5G发展,提升实时数据处理速度、识别网络信息、支持云计算的无线移动边缘计算,可用于机器学习技术研究的AlphaGo Zero的强化学习算法等等;地球科学领域可应用于现代服务业数据处理算法的模型预测研究;经济学、心理学及其他社会科学领域可应用于云平台服务技术的人工智能、区块链技术等。除了定性判断本文与研究前沿报告具有一致性外,也通过匹配度计算定量的刻画两者的一致性程度,匹配度采用本文预测得到的技术领域前沿主题占报告给出的新兴前沿主题的比例计算,结果如表8。
表8 2022年中国重点技术领域前沿主题预测
表8中加粗的字体表示与学科新兴前沿主题存在一致性的技术领域前沿主题。从表8的对比可以认为学科新兴前沿主题与预测得到的技术领域前沿主题具有较好的对应关系,从定量计算的结果来看,达到100%重合的有农业科学、植物学和动物学领域、生态与环境科学领域、信息科学领域、地球科学领域,重合度最低的领域是经济学、心理学及其他社会科学领域以及化学与材料科学领域。达到100%重合一方面是由于这些学科领域与技术领域的划分范围相近,因此在研究主题和研究目的手段方面重合可能性更高,另一方面是学科新兴前沿主题更容易转化成实际应用,例如可降解废弃物资源化、生物柴油成分与添加剂、析氢反应的催化剂成分等,而且研究目的手段适用面更广,例如基因编辑技术、机器学习算法、模型预测研究等,可支持技术研发的发展。反之,其余学科的分类范围与技术领域交集较小,例如生物科学领域的新兴前沿主题,涉及大量认知功能障碍相关疾病的学术研究;经济学、心理学及其他社会科学领域以社会发展理论研究为主,如区域可再生能源与经济发展、养育方式与短期/长期社会化结果等,既导致学科领域的新兴前沿主题与技术领域前沿主题交集较小,也导致学科新兴前沿主题难以转化并支持技术研发,因此重合度较低。如此也说明了建立基础研究与技术研发的关联对促进基础研究成果转化,支持技术研发的重要性。
4 结 论
本文从基础研究与技术研发关联视角,通过专利对基础研究成果的引用建立技术研发与基础研究的关联。通过测度技术研发成果引用基础研究成果的时滞,以及技术研发成果科学循环周期,从基础研究转化的时效性和技术研发成果引用基础研究成果的新颖度两方面衡量基础研究向技术研发的转化状况。选定技术研发成果相对集中引用基础研究成果的时滞区间,利用基础研究成果主题预测中国重点技术领域前沿主题,预测得到如下结论:
a.农业技术领域的前沿主题包括种质资源发掘保存与创新、畜禽健康养殖与疫病防护、农林生物质开发利用、环保型肥料创制、农业信息化技术。
b.材料技术领域的前沿主题包括智能材料与结构制备技术、高温超导材料与制备技术。
c.能源技术领域的前沿主题包括大规模输配电和电网安全保障、可再生能源低成本规模化开发利用、氢能及燃料电池技术、工业节能评价、煤液化与多联产技术。
d.网络信息技术领域的前沿主题包括传感器网络与智能信息处理、智能感知技术、信息安全保障技术、现代服务业数据处理算法、虚拟现实技术。
e.制造与工程技术领域的前沿主题包括极端制造技术、数字化与智能化设计制造。