基于表示学习的引证网络关键路径识别研究
2022-08-25孙晓玲杨颂颂
孙晓玲,杨颂颂
(大连理工大学 科学学与科技管理研究所,辽宁 大连 116024)
0 引言
2020年,国务院印发《新时期促进集成电路产业和软件产业高质量发展的若干政策》(以下简称《若干政策》),强调集成电路产业和软件产业是引领新一轮科技革命和产业变革的关键力量。一系列促进集成电路产业和软件产业高质量发展的相关政策以及全面优化完善高质量发展芯片和集成电路产业的有关环境政策的发布,表明了我国政府高度重视芯片产业、集成电路产业的高质量发展,并在各行各业对该领域发展进行大力扶持。2016年由国际知名专利检索公司QUESTEL发布的《芯片行业专利分析及专利组合质量评估》中指出,在数量上中国已经成为目前世界上芯片专利申请的第一大国。虽然我国芯片专利申请数量排名连年居高,但《若干政策》中指出,我国目前的芯片产量仍未有效满足各行各业对芯片的需求,在高端芯片方面严重依赖于进口。姜迪等指出中国芯片制造工艺水平低下是芯片产业链中最为薄弱的环节,芯片自给率低,芯片制造设备严重依赖进口。高端芯片制造的核心设备是极紫外(Extreme Ultraviolet,简称为EUV)光刻机,全球能够生产EUV光刻机的只有荷兰的阿斯麦以及日本的尼康、佳能。现阶段我国只能生产中低端光刻机,难以满足高端芯片制造的需求。光刻机(也称光刻系统)是光刻技术的关键装备,光刻技术的发展大大提高了芯片的计算速度及存储量,可以说光刻技术是促进芯片产业和集成电路及相关产业发展的关键核心技术。
技术和知识资产优势在发达国家与发展中国家博弈中占有压倒一切的核心地位与关键作用。为了维持与发展中国家的技术差距,发达国家将以前的“技术封锁”战略转变为“技术锁定”战略,使发展中国家形成了长期的技术依赖。随着中美贸易摩擦的加剧,美国进一步对我国关键产业核心技术进行全方位封锁,因此,寻求产业核心技术的破解已经成为我国各界亟待解决的战略性课题。要想破解我国光刻产业技术锁定难题,应当从光刻技术领域知识发展脉络入手,研究光刻技术领域发展历程。随着科学技术的迅猛发展和经济社会的持续进步,科技文献信息正以惊人的速度不断增长。由于科学技术的更新换代和知识的新陈代谢,大量现有科技文献信息的利用价值也正以不同的速度逐步减少。如何快速准确地发现领域内具有重要影响的知识演化脉络,以支撑未来的科技创新与科技决策,成为目前研究者关注的焦点。
我国光刻技术领域正处于被技术封锁的困局中,识别知识流动脉络以及探索光刻产业核心技术发展规律是值得深入研究的方向。在识别知识流动脉络的过程中不仅可以建立起整个领域的发展骨架,观察到整个领域的发展全貌,而且可以帮助研究者识别出该领域的重要根源文献,并且得到重要根源文献在时序上的知识流动关系。本文应用社会网络分析方法建立起技术引证网络,在此基础上,将主路径方法以及文本挖掘方法应用于关键主路径方法中,通过对核心文献和非核心文献相似度的大小归类文献,不仅可以避免丢失非核心文献的知识演化过程,而且可以提高整个引证网络的链接强度,得到更为聚集的文献群落。在此引证网络的基础上可以快速得到各自方向的关键主路径,进而得到每一条知识流动路径。探索光刻产业核心技术发展规律可以帮助研究者快速掌握光刻产业领域技术演化轨迹,为更早发现创新型技术方向提供可能,为我国实现技术突破提供方法参考。
1 相关研究
最早提出引文网络主路径方法的是Hummon和Doreian,他们从引文的关系出发而非节点之间的相似性来挖掘主要事件、主要理论和主要任务,提出了NPPC、SPLC和SPNP三种遍历算法以生成主路径。
1.1 基于遍历权重算法的主路径分析
在NPPC、SPLC和SPNP算法以及社会网络分析理论基础上,V.Batagelj进一步深化了主路径分析方法,并提出了此后在多数领域应用中最为主流且与NPPC、SPLC和SPNP等价的SPC算法。SPC算法通过遍历某条边所有从源节点到尾结点的次数计算出这条边的权重值。相比于NPPC、SPLC和SPNP,SPC可以更快地计算出每条边的权重,提高了运算效率。Wang等使用SPC算法从知识来源多样性和技术领域多样性角度出发进一步研究了知识演变,取得了很好的效果。
除了早期的NPPC、SPLC和SPNP算法外,后续出现了基于SPNP和SPLC的最优主路径演化网络的NETP算法,该算法是一种局部最优主路径算法,局部最优有可能出现遗漏掉全局最优解的情况。在最新的研究中,王婷等将社区发现算法与SPNP算法结合起来,对中药产业领域进行衍生路径识别。Li等则在引文网络的基础上结合引文分析与文本挖掘方法来监控纳米发电机技术领域的发展路径并预测其发展趋势。马瑞敏等从有机电激光显示技术入手证实了从节点重要性出发来探索一个领域的主路径是很有必要且可行的。这些方法被学者们陆续应用到概念系谱、学科划分等研究领域以及燃料电池、电线交换等技术领域。
总体来说,已有研究都只是基于引证网络做出网络中路径的相关搜索算法,需要在后续的研究中对算法进行优化。早期文献计量学工作者大多基于学术文献间的相似性聚类结果探究引文网络中的知识演化结构,从而缺少了从引文内容角度探究知识的生产、传播、吸收和创新等方面的相关研究。而以主路径分析为基础的引文网络知识流动研究,恰好利用了引文网络的拓扑结构、学术文献间的应用关系、处于引文网络核心地位且对知识流通具有枢纽作用的学术文献,展现了引文网络中的知识继承与改写关系。
1.2 基于引文内容权重的主路径分析
在SPC算法的基础上,随着自然语言处理技术的发展,后续学者们陆续考虑科学文献中的其它要素,主要是以引文内容为主。学者们尝试着将自然语言处理技术用于这些文章内容中,试图挖掘文本中潜在的语义信息联系,计算出更为真实可靠的主路径。学者们对于引文内容的研究关注于节点所包含的信息,主要使用方法包括主题模型、神经网络语言模型等。
程洁琼等受PageRank算法思想的启发,在路径搜索中,通过PageRank算法计算节点的影响力,之后基于边链接影响力流进行主路径的搜索,利用海水淡化领域内专利数据进行相关的实验。Liu等提出了关键路径搜索得到的主路径既有全局最优主路径还有局部最优主路径。Liu等在后续的研究中利用网络节点间的引证关系对原始的连边遍历数进行加权调节,然后根据加权后的连边遍历数来确定主路径。
已有的主路径分析算法利用路径权重指标所得到的高权重路径、局部最优主路径等一方面可能因为路径上节点数量较多以及局部最优所产生的累加效应导致该高权重路径会遗漏掉全局最优主路径,未能反映出路径的重要性,另一方面现有的主路径分析方法所得出的结论大多数将所有的引文关系一视同仁,但是在真实的引用关系中,仅有研究主题较为相似的引文对该关键路径中的主题演化起到关键作用。因此本文在引文网络中充分考虑了引文内容在整体引文网络中所起的作用,本文将深度学习中的表示学习方法应用到主路径分析方法中,挖掘网络中的关键路径。
2 研究方法
本文从科技文献引证以及文本挖掘的角度研究知识流动与技术轨迹,从而破解我国光刻产业核心技术被发达国家锁定的困局。首先阐述我国光刻产业核心技术被锁定的现状,其次从引文网络以及引证网络的角度出发,建立起光刻产业核心技术轨迹骨架,最后通过将机器学习方法中的Doc2Vec应用到该技术轨迹骨架中,进一步聚合文献群落,对骨架中的知识流动进行分析,从而获取其核心技术发展规律。运用实证分析,对我国光刻技术产业发展现状与国际发展现状进行研究。在此基础上,从不同的角度对我国破解光刻产业技术锁定困局提出科学的策略,为我国光刻技术产业蓬勃发展提供科学的理论依据。
本文具体的研究技术路线图,如图1所示:
图1 技术路线
2.1 SPC引文分析方法
利用SPC方法在网络中提取主路径,网络是指专利的引证关系网络以及科技文献的引文网络,这里以科技文献的引文网络为例进行介绍。Batagelj提出的SPC算法中,通过遍历得到整个网络图中从源点到汇点的所有路径,所有路径经过某条边的计数次是该边的权重值。
如图2所示,该网络一共有6条路径,经过(A,B)的有3条,故(A,B)的权重值就是3,同理求出所有直接边的权重值,进行累计求和,得出总值为12的路径A→B→D→E→G、A→B→D→E→F、A→C→D→E→G、A→C→D→E→F是全局主路径。
图2 SPC遍历算法
2.2 单路径SPC权重值
根据Batagelj提出的SPC算法,路径起点是网络中的源点之一,路径终点是网络中的汇点之一。定义边(A,B)为由节点A指向节点B的边,也称为单路径。该单路径的权重值SPC :
其中,C()为遍历网络中所有的全局路径,其中对包含(,)边的全局路径进行计数,计数值为(,)的权重值。
对于SPC算法来讲,某一条全局路径的值计算如下:
其中这条全局路径包含个节点,表示为(,,…,A )。将每一个子路径权重值累计求和即为该全局路径SPC值。
2.3 单路径SIM权重值
本研究所使用的文本向量模型为Gensim库的Doc2Vec模型。本研究使用的是PV-DM实现方式。使用Doc2Vec模型训练之后,就可以将每条专利数据表示成向量。使用文本相似度方法计算每篇专利之间的相似度以衡量每条引证关系的重要性。比较常用的向量相似度计算方法是余弦相似度。定义节点与节点之间的相似度S im :
2.4 关键路径权重值
对于某一条全局主路径,这条路径包含个节点,表示为(,,…,A)。传统的SPC算法将所有的引证关系视为一致,未充分考虑引用的具体含义、研究主题是否相似等一致性问题,因此本研究从文本内容入手,充分考虑节点之间的主题与文本相似问题,对此算法提出改进。最终的路径值为结合权重值和引文内容相似度权重值的乘积:
3 结果与分析
3.1 数据获取与预处理
本文研究专利数据来自于Derwent Innovations Index。构建专利检索式为:((((((((lithograph OR lithography)OR microlithography)OR photolithograph) OR photolithography) OR stepper) OR scanner)OR step-and-repeat)OR step-and-scan),选择数据库中的主题词检索方式,检索日期均为2021年11月29日,检索日期范围不做限制,研究范围为该数据库的全部光刻产业专利数据。对获取到的数据进行过滤清洗等操作之后,最终得到相关有效专利256 762条。
3.2 光刻产业专利演化脉络研究
在引证网络的基础之上得到了五条专利关键路径。根据各个专利的研究内容,将主路径上的专利进行排序分组,这五条专利关键路径研究主题分别为:光刻掩膜制备技术演化(PKP-a)、相移掩膜胚料研究演化(PKP-b)、光刻曝光方法研究演化(PKP-c)、光刻成像方法研究演化(PKP-d)、可编程光刻技术演化(PKP-e)。
3.2.1 光刻掩膜制备技术演化(PKP-a)
从专利研究内容角度出发,在专利关键路径PKP-a中,光刻掩膜制备技术的起源节点专利主要是对掩膜技术的研究,在后续的发展中,从该专利研究内容中知识演化大致可以分为三个方向:光刻工艺防护膜(PKP-a1、PKP-a2、PKP-a3、PKPa4)、光刻系统元件制造(PKP-a5)、反射式光刻系统研究(PKP-a6)。如图3所示:
图3 专利关键路径PKP-a
在光刻掩膜、半导体器件制造、集成电路制造演化分支中,核心专利均来自于美国、日本、韩国等,美日韩在一定程度上掌握着该行业核心技术,技术贡献也较为突出。而我国在半导体行业突出的则是台积电公司,其核心技术分布于芯片制造、半导体器件制造等行业。值得一提的是,自我国开始进入半导体行业起,日本尼康公司的芯片光刻机就开始走下坡路。目前半导体制造业龙头因特尔、三星、台积电等都是从荷兰阿斯麦(ASML)公司进口光刻机,可见阿斯麦公司处于全球光刻机尤其是EUV光刻机的绝对霸主地位。而我国光刻产业的发展受限绝大多数原因是由于西方《瓦森纳条约》中ASML的EUV和NX 1980D的对华禁售令,我国的芯片制造业目前仍未实现国产化,极大限制了半导体产业及高端装备制造业的产业发展。
3.2.2 相移掩膜胚料研究演化(PKP-b)
从专利研究内容角度出发,在专利关键路径PKP-b中,相移掩膜胚料研究的起源节点专利主要是对相移掩膜技术的研究,在该关键路径的知识演化过程中,可以分为三个阶段,如图4所示。
在相移掩膜、掩膜胚料、极紫外光刻掩膜胚料分支下,核心专利均来自于日本、美国、欧洲。主要的企业为日本三菱集团的旭硝子公司与东芝公司、美国格罗方德半导体股份有限公司、德国蔡司公司等。公司主营业务涉及半导体制造技术、光学消费品、晶圆代工生产等领域,在这些技术领域中,仅有晶圆代工技术是我国台湾的台积电公司的主营业务,但在关键路径中台积电公司的专利权重也暂未体现在高权重路径中,足以证明在相移掩膜、掩膜胚料及其制造方法与应用等技术领域一直被美日等发达国家垄断锁定。
图4 专利关键路径PKP-b
3.2.3 光刻曝光方法研究演化(PKP-c)
此关键路径也包含着SPC算法的主路径。从专利研究内容角度出发,在专利关键路径PKP-c中,光刻曝光方法研究的起源节点专利主要是对半导体器件光刻曝光方法的研究。在后续的技术轨迹中知识演化主要分为两个方面:光刻图案方法研究(PKP-c1)、光刻图案技术应用研究(PKP-c2)。此关键路径在基础的SPC算法中为权重最高的主路径,如图5所示。
图5 专利关键路径PKP-c
在两个演化分支下,核心专利都为美国的专利,这也证实了在光刻曝光方法研究及应用领域中,技术仍旧是处于美国的封锁中。在光刻图案方法研究分支中不得不提的是专利US8671368-B1的标准化当前权利人——铿腾电子(Cadence),该公司是美国三大电子设计自动化公司之一,其他两家公司分别为新思科技(Synopsys)和明导国际(Mentor Graphics)。半导体的软件产品电子设计自动化由这三家美国公司所垄断,合计市场份额达到70%以上。我国的电子设计自动化企业仍然处于起步阶段,值得一提的企业有北京华大九天科技股份有限公司和杭州广立微电子股份有限公司,前者成立于2009年,一直致力于电子设计自动化工具的开发、销售以及相关业务;后者是领先的集成电路EDA软件与晶圆级电性测试设备供应商,潜力无限。荷兰阿斯麦EUV光刻机在华禁售禁令之后,如若软件方面被限制,势必会导致我国光刻技术产业乃至芯片制造业面临硬件与软件双方面的封锁,从而大大地延缓我国在光刻技术产业、芯片制造业以及集成电路制造业的发展。挑战重重,但是往往机遇伴随着挑战一起存在。随着我国相关政策的出台,国内企业越发注重自身知识产权,越发重视自主科技研发,我国的半导体行业正慢慢崛起,打破发达国家对我国光刻技术封锁的时刻就在不久的将来。
3.2.4 光刻成像方法研究演化(PKP-d)
从专利研究内容角度出发,在专利关键路径PKP-d中,早期研究集中在光刻成像系统方法及其优化方面,在后续的技术轨迹中知识演化主要分为两个方面:光刻投影成像工艺方法及其优化(PKP-d1)和数字光刻系统方法分支(PKP-d2),如图6所示。
在光刻投影成像工艺方法及其优化(PKP-d1)演化分支中,分为两个阶段。第一个阶段为光刻设备的照明方法及其优化研究,第二阶段为光学建模、光刻工艺模型及其优化方法研究。在2010年以前,对于光刻成像方法的研究核心专利都为美国新思科技(Synopsys)所有,新思科技是全球集成电路设计提供电子设计自动化软件工具的龙头企业,该领域早期核心专利几乎都来自于新思科技,这也说明了此领域的技术封锁存在已久。一直到2012年我国的上海华力微电子有限公司才开始在光刻工艺技术方面有所起步,之后,广东工业大学在半隐式光源掩膜协同优化方法的研究取得进一步进展,并将其应用于光刻系统成像,得到了很好的效果,这也说明虽然我国在光刻成像工艺技术方面面临着早期的技术封锁,但相关研究布局已经有所起色,不过想要完全突破封锁,使我国光刻相关企业成为全球首屈一指的研发企业仍需努力。
3.2.5 可编程光刻技术演化(PKP-e)
从专利研究内容角度出发,在专利关键路径PKP-e中,早期研究集中在可编程光刻技术,在后续的技术轨迹中知识演化主要分为两个方面:应用于成像系统及成像设备制备(PKP-e1)和光刻照明装置制备研究(PKP-e2),如图7所示。
图6 专利关键路径PKP-d
图7 专利关键路径PKP-e
在可编程光刻技术的演化分支中,虽说在成像系统及成像设备制备方面的核心技术被美日所垄断,但在另外的演化分支——光刻照明装置制备研究中,我国中科院上海光机所、北京国望光学科技有限公司、中国科学院光电技术研究所等都在曝光光学系统、光刻投影装置制备等核心技术研发方面进展顺利。在可以预见的未来,我国的光刻机核心技术研发水平拥有从基础研究到关键技术创新到应用示范的创新价值链的无限潜力,有朝一日定能成为世界级光刻技术科技研究中心。
3.3 对比分析
结合前沿研究内容,对基于专利内容的分析、主路径分析算法、局部最优主路径算法、基于引证网络的重要节点算法等方法进行了在同一数据上的实验。当前对光刻领域的技术轨迹发展研究得出的结论着重在于光刻胶技术、光刻图案研究、曝光技术、掩膜技术等,对于光刻机的研究显示出我国的优势在于设备的整合、组装,短板在于光刻机组件、系统和整机设计等方面。当涉及到一些激光光刻技术研究以及激光光刻设备技术研究时,我国的研究相对较少,这些核心设备也仍依赖于进口。本研究获取到的光刻产业的技术发展脉络中的关键路径在于关注光刻胶、光刻材料的基础之上,发掘出一些更为关键的技术,比如光刻成像方法、可编程光刻技术下的光刻成像设备制造以及应用于影像学等关键核心技术领域。当前国内外主要研究方法所得出的领域分布情况见表1。
新的技术创新会带来很好的发展前景,影像学研究的一大应用场景就是高端医疗器械制造。在高端医疗器械千亿级别的市场下,发达国家早已布局,而当前我国在医疗器械制造核心技术方面的科学布局与技术布局尚不活跃,这也是我国值得关注的研究方向之一。这在《中国制造2025》中提出的“重点发展影像设备等高性能诊疗设备”也有所体现。
4 结论与展望
本文通过对技术演化脉络进行深入研究,基于专利文本内容的语义信息,探索技术演化关联规律。以光刻技术产业为例,通过实验对每条演化脉络进行溯源,得到如下结论:
(1)光刻产业技术演化脉络未来的主要研究方向为:光刻掩膜及其制备方法研究、相移掩膜胚料研究、光刻曝光方法研究、光刻成像方法研究与可编程光刻技术研究。
(2)从光刻产业的技术研究演化脉络入手,可以帮助科研人员识别光刻产业领域中知识流动与技术演化的方向以及发掘出众多技术研究中的核心关键技术。依据光刻产业领域下技术研究演化脉络的关键信息,我国在技术应用相关研究层面较为活跃,而在高端装备器械及其零部件的制造方面涉及到的核心关键技术层面研究相对较少,说明我国需要提高创新意识,强化自主知识产权意识,鼓励企业加大研发投入占比。与此同时,还需要在光刻产业领域中加强核心技术瓶颈攻关,尤其是光刻成像方法等核心关键技术。
表1 当前前沿研究内容领域分布
(3)近年来在政策加持下,国内很多企业已经有所突破,在整个核心零部件产业链中我国的弱势在于原料生产、核心零部件生产等,要实现整个领域的国产化仍有一定距离,可以通过在设备的组装、整合方面的优势面向产业链下游中的装备出口提高我国在整个领域中的认可度,从而促进基础研究的进一步发展。尤其是在数字时代的今天,AI医疗的发展热度不断提升,不仅仅是高端医疗器械领域,我国光刻产业研发机构、科研院所与企业如若能把握住光刻产业未来几年的核心发展方向,定能实现高端光刻机制造国产化,从而突破我国芯片产业被发达国家所封锁的现状,促进我国芯片产业及高端装备制造业的蓬勃发展,这也是我国迈向科技强国的潜在机遇。