APP下载

美国出口管制科学仪器技术分类研究*

2022-07-14王学昭刘细文王燕鹏

世界科技研究与发展 2022年3期
关键词:科学仪器管制仪器

陈 芳 王学昭**,,2 刘细文,2 王燕鹏 吴 鸣***,,2

(1.中国科学院文献情报中心,北京 100190;2.中国科学院大学经济与管理学院图书情报与档案管理系,北京 100190)

科学仪器是指科学技术上用于检查、测量、控制、分析、计算和显示被测对象的物理量、化学量、工程量和生物量等性质的器具或装置[1]。科学仪器是认识世界的工具,是提高人类自身和改造世界能力的基础与前提。据不完全统计,诺贝尔自然科学奖项中,68.4%的物理学奖、74.6%的化学奖和90%的生物医学奖的研究成果,是借助各种先进的科学仪器完成的,或直接与新仪器方法或功能发展相关的[2]。科学仪器产业属于高端制造业,其发展离不开光学、机械、真空、电子、精密加工、材料科学、化学以及软件等众多行业的支撑。科学仪器的应用领域涉及国民经济各个环节,几乎无所不在。科学仪器作为采集信息的源头,对其他产业的发展具有巨大的“指导”和“带动”作用。因此,科学仪器的创新及制造和应用水平反映了一个国家的科学技术和工业发展的实力。

尽管我国仪器仪表行业发展迅速,但是在高性能、高精度、高灵敏、高稳定、高可靠的科学仪器研发与生产领域,与国际先进水平还存在较大差距,尤其是受到来自美国等国家的限制[3,4]。中美贸易争端以来,更加剧了这一过程。有报道指出截至2018年,中国约有1800台核磁共振波谱仪,其中1400多台是一家国外供应商的产品,国内的仅有50台[5]。

美国将科学仪器产业定位为高端制造业、高保密行业和战略性产业,对华科学仪器整机、原料、元器件等出口执行严格的审批制度甚至禁止出口,对我国科学仪器的购置与发展产生了不少负面影响。近年来,美国一方面在“军民两用”的技术清单——美国商业管制清单(The Commerce Control List,CCL)中更新、添加相关的仪器设备[6],另一方面通过添加中国实体机构到实体清单[7],加大了针对中国“终端用户”禁售的力度。

美国CCL是针对“军民两用”的货物和技术清单,也是针对“高新技术”进行限制的主要工具。目前国内已有一些针对清单的研究,但多数从政策的角度开展,较少深入到具体的领域。在研究方法方面也较少采用计量和聚类等方法。其中,葛晓峰[8]对美国两用物项出口管制法律制度的结构和内容进行了定性介绍。陈峰[9]解析了国外实施技术出口管制的竞争情报含义,从宏观角度分析了应对国外对华技术出口限制的竞争情报需求和现实意义。南京大学陆天驰等[10]采用计量方法研究了人工智能技术领域的美国CCL,解析了CCL条目共2966条,并为我国人工智能领域的发展提出了一些建议。李广建等[11]通过实体识别的技术研究了CCL清单、管制实体清单(Entities List,EL)等对象,以光刻机为实证研究进行了方法评估,但没有对全部CCL清单进行解析和物项识别。目前国内的研究中,一方面,针对CCL量化的研究方法不成体系,在清单的结构化、语义化、本体化的分析方面,还需要进一步的深度挖掘;另一方面,科学仪器是清单包含的非常重要的模块,国内没有专门针对科学仪器管制的专门研究。

本文以美国CCL为分析对象,以中国国内的科学仪器分类体系为标准,将CCL中的内容与国内科学仪器的分类进行对比。采用文本挖掘和自然语言处理方法,对出口管制清单的技术进行了聚类分析,分析了每个科学仪器技术类型中,美国管制的核心技术或技术指标的情况,提供中美技术差距的对比点。对比了美国在科学仪器出口管制的管制力度分布,揭示不同技术类型的科学仪器可能面对的不同的管制现状,为我国科学仪器的自主研发、突破“卡脖子技术”提供参考。

1 研究方法

本文使用python语言进行数据的分析和处理,应用了多种自然语言领域的算法,包括N叉树解析方法、正则匹配方法、关键词检索方法、NLTK自然语言处理包(SnowballStemmer工具、ngram模型等),Word2vec聚类分析等。完整流程见图1。

图1 技术路线Fig.1 Roadmap for the Analysis of CCL

1.1 数据获取与结构化处理

应用基于python平台的技术开发工具,来获取美国官方的清单文本内容。根据正则匹配等方法识别ECCN条目,并采用N叉树方法构建树状结构,逐层识别其商品条目和技术条目,解析并存储清单数据。

1.2 科学仪器条款筛选与计量

科学仪器的中文表述往往带有通用性符号,因此在筛选科学仪器条款上,采用先翻译成中文,再构建检索关键词筛选(正则表达式为:’装置’|’设备’|’仪器’|’仪’|’器’|’机’|’计’|’室’|’风洞’|’构件’|’组件’),同时在筛选的时候去除明显与军事相关的条款内容。检索筛选后再请专家进行核对,最后得出与科学仪器相关的条款。这些条款包括整机类的仪器,也包括与科学仪器相关的组件或技术。

在上述处理的基础上,根据CCL的框架结构,即十大行业类和五个商品类,对科学仪器的相关技术条款进行计量分析,并绘制统计图表。

1.3 文本处理与分词

通过NLTK自然语言处理工具包,完成分词、停词等加工。在停词方面,专门建立了一个停词词表,以去除无实际意义的、无科学仪器指向的相关词。具体包括如下三步:

首先,构建科学仪器的分词词典。该分词词典采用了科技部大型科学仪器设备开放共享目录中的科学仪器的名称,在获取目录后提取了科学仪器的名称文本,并且进行了机器翻译。

其次,采用了词干化再还原的方法,即先用NLTK中的Snowball Stemmer工具将所有词进行stem处理,同时记录原词在原文本全部语料中的词频,取词干后再将其还原为词频最高的原词形式。该方法不仅获得词干处理的清洗效果,而且其还原后的原始形态保留了很好的可读性。

第三,将还原后的语料,先进行词典分词,再进行n-gram词组分词,同时使用了停词表,然后合并成最终的分词结果。

1.4 基于word2vec的词聚类

在进行词聚类之前先对词进行向量化,常见的词向量化采用TFIDF模型。然而,CCL的条款是一种非常短的文本,在使用TFIDF进行词向量构建时,维度高且非常稀疏,本文采用了Word2Vec的模型,构建词向量。

Word2Vec模型是Google公司在2013年开放出来的词深度表示模型[12],是一个三层的浅层神经网络,能够有效表征同义词、近义词等语义相近的词之间的相似关系,并且其通过神经网络的训练后可以赋予词向量一个合理的维度[13]。Word2vec模型来源于gensim工具包。

获取词向量之后,进一步采用K-means++进行聚类。K-means++算法是在传统K-means算法基础上,以最远距离原则优化初始聚类中心的改进方法。K-means++算法来自于Sklearn工具包。

2 国内科学仪器技术分类体系

由于科学仪器有属性的多样性,有着不同的分类体系,相互之间存在差异和侧重点[14-17]。例如,根据仪器测试对象的物理性质,可以划分出计量仪器、力学仪器、光学仪器、成份分析仪器、电磁量测仪表、时间和频率测量仪等;根据不同学科或专业用途,可以划分出天文仪器、地球科学仪器、生物科学仪器、农林科学仪器、工业自动化仪器、材料试验机和试验仪器等;根据物理量的测量方法分,可以划分出长度计量仪器、角度计量仪器、面积计量仪器等等。

本文主要参考的技术分类体系主要包括:1)国家标准GB/T 32847-2016《科技平台 大型科学仪器设备分类与代码》(后称国家标准分类体系)[14],2)科技部大型科学仪器设备的技术分类标准(后称科技部分类体系)[16]。

1)国家标准分类体系将科学仪器分为了A类-通用大型科学仪器设备和B类-专用大型科学仪器设备。A类通用科学仪器设备中又包括了质谱仪、色谱仪、激光器等至少18类科学仪器。B类专用科学仪器中主要以空间与天文科学仪器、大气探测科学仪器、地球科学仪器等13个学科领域为对象的科学仪器。

2)科技部自2008年起,在全国科研院所和高校开展了大型科学仪器设备的资源调查研究,并在2013年发布了调研报告。其中,在大型科学仪器设备开放共享目录中对50万元及以上的科学仪器进行了分类,共分为了十四大类,包括:分析仪器、物理性能测试仪器、计量仪器、电子测量仪器、海洋仪器、地球探测仪器、大气探测仪器、天文仪器、医学诊断仪器、核仪器、特种检测仪器、工艺实验设备、激光器、其他仪器。本文将该目录中的仪器名称提取后,形成科学仪器的文本词典,该词典用于对管制清单的文本加工。

上述的分类体系与CCL中的十大类型(行业类)、五个小类型(商品类)分类的标准都有所不同。在分析对比中对该分类体系进行了细微的调整。

调整的内容如下:一方面科技部分类体系中特种检测仪器数量较少,并且其光电检测仪器、超声检测仪器、电磁检测仪器等在其他类别中已经出现,因此取消了特种检测仪器类别,将里面涉及的种类划分到其他类中;另一方面,将国家标准分类体系中的空间类仪器,合并到天文仪器大类中,这类仪器管制清单中有较多涉及。最终,本文主要涉及的科学仪器的技术类型包括:分析仪器、物理性能测试仪器、计量仪器、电子测量仪器、海洋仪器、地球探测仪器、大气探测仪器、空间与天文仪器、医学诊断仪器、核仪器、工艺实验设备、激光器等12个种类,并作为本文对比分析和映射的分类体系。

3 美国CCL结构

美国的技术管制清单主要由三个部分组成:1)CCL;2)军用品清单(United States Munitions List,USML);3)核管理委员会管制目录(Nuclear Regulatory Commission Controls,NRCC)。

其中,CCL是针对“军民两用”的货物和技术进行管制的清单。相对而言,CCL具有最大的体量,涉及军用和民用的各个行业领域,也是针对“高新技术”进行限制形成技术壁垒的阵地。科学仪器属于民用产品,因此针对科学仪器的出口管制主要存在于CCL清单中。

3.1 行业分类(大类)

该清单总共分为10个行业类型(0~9 Category),每个行业类下面分为5个商品类型(A~E)。10个行业分类见表1。

表1 行业分类及中文翻译Tab.1 Categories Classification of CCL

3.2 商品分类(小类)

根据商品的类型,分为五个种类A~E,每个行业分类原则上分别包含这五个方面的商品,见表2。

表2 商品分类及中文翻译Tab.2 Commodities Classification of CCL

3.3 ECCN代码体系

ECCN代码是CCL用来组织和管理清单的一整套编码体系,例如“3A001”,其主体是五位数字和字母的组合。具体每一位的含义如下。

第一位:数字,代表十个行业类,分别从0~9,见表1;

第二位:为字母,代表五个商品类,分别为A~E,见表2;

第三位:数字,代表控制理由,0为国家安全,1为导弹技术,2为核不扩散,3为生化武器,5为商务部确定的需要国家安全或者外交政策控制的项目,6为“600系列”特殊管制物品,9为反恐、犯罪控制、地区安全、短缺、联合国制裁等。

第四位与第五位:序号编码。

3.4 科学仪器的条款计量

通过前文的数据方法,共抓取和识别最新版本CCL(2020年12月份),全部条款4510条;筛选出科学仪器相关的条款1898条,占总数的42.08%。

用清单的十个行业大类和五个商品小类交叉分析,以观察在不同的子区域中科学仪器条款的分布情况(图2)。条款分布最多的是6A区域,该区域主要是传感器和激光器的“最终产品、设备或零部件”;其次是2B区域,该区域是材料加工中的“试验、检验和生产设备”;第3位的区域是3B区域,该区域是电子产品的“试验、检验和生产设备”。总体而言,商品A类的分布遍及所有的十个行业,主要涉及科学仪器相关的部件、元器件等;商品B类的分布也较为广泛,其中较多的是检测、检验和生产的设备。

图2 科学仪器清单的交叉分布情况Fig.2 Cross-field Distribution of Scientific Instrument of CCL

4 管制科学仪器的技术分布

将管制的科学仪器清单的条款文本进行聚类分析,选取其中出现频次最高的Top200的代表性科学仪器设备绘制成复杂网络图,以观察其分布效果(图3)。该聚类结果与CCL本身的十大类型有所不同,其结果更为客观地展示了科学仪器本身科学特征的分布。该聚类结果共聚出了十一个类,其对应关系与上文筛选的科学仪器技术分类体系具有较好的对应关系。

图3 管制科学仪器的聚类分布Fig.3 Cluster Distribution of Control Scientific Instruments from CCL

从图中可以看出,分布最多的三个类分别是代表分析仪器的Ⅰ类,代表工艺实验设备的Ⅺ类,和代表电子测量仪器的Ⅳ类。从关联性来看,这三类都与整个科学仪器的中心区域有高度的关联性。此外,代表激光器的Ⅺ类,虽然节点种类不多,但其节点的数量较大,而且也处于整个科学仪器的中心位置,与其他的科学仪器有较密切的关联。代表物理性能测试仪器的II类,也处于这个网络靠近中心的位置。计量仪器的Ⅲ类、海洋仪器的Ⅴ类、地球勘探仪器的Ⅵ类、空间与天文仪器Ⅷ类、核仪器Ⅹ类,数量较少,处于网络的边缘。另外,大气勘探仪器由于太少,没有入选Top200的仪器种类;医学诊断仪器基本没有明显受管制的种类。

表3展示了国内科学仪器分类和管制仪器聚类结果的对应结果,其中的类别为12类科学仪器分类(见前文),后面列举了各种类的典型仪器和在管制中的对应关系。其中,Ⅰ类分析仪器又分为两个模块,Ⅰ-a为生物类检测仪器、Ⅰ-b为其他检测仪器。Ⅱ类为物理性能测试仪器,包括声振动试验设备、惯性测量设备等;Ⅲ类为计量仪器,包括典型的磁强计、重力计、尺寸计量系统等;Ⅳ类为电子测量仪器,包括电子传感器、电路、网络、通讯等的检测分析仪器;Ⅴ类为海洋仪器,数量和种类都较少,典型的如水下声纳等;Ⅵ类为地球探测仪器,典型的如勘探设备、地震仪器等;Ⅶ类为大气探测仪器,只有少量的遥测设备受管制,没有入选Top200;Ⅷ类为空间与天文仪器,这是较大的一类,包括较多与空间技术相关的设备,如陀螺仪、天文罗盘、火箭发动机检测设备等;Ⅸ类为医学诊断仪器,清单中未见明确的、整机呈现的该类型仪器,如果不涉及零部件的话,该类型仪器是不受管制的;Ⅹ类为核仪器,民用的核仪器较少,是一个小类,更多的条款存在于核管制清单中;Ⅺ类为工艺实验设备,是一个大类,典型的包括各种机床、光刻机、气相沉积、离子注入等设备;Ⅻ类为激光器,聚集效果明显,节点少但技术指标多的一个类型。

表3 管制科学仪器的聚类解析Tab.3 Deep Interpretation of Controlled Scientific Instruments

4.1 分析仪器

根据本文所述分类体系,主要包括生化分离分析仪器、质谱仪、光谱仪、色谱仪、显微镜、图像分析仪、X射线仪、热分析仪、电化学仪、样品前处理和制备仪以及其他设备。在美国出口管制清单中,分析仪器也是种类最多的一类仪器,与国内的分类体系相吻合。在CCL中,每个大类中都包括了五个小类别,其中一个类别(B类)就是检测设备,多数的分析仪器处于该类型中。最典型的包括微生物检测仪器、化学分析仪器、质谱仪、图像分析仪、X射线仪等等。然而,显微镜、热分析仪、电化学仪等未见管制的情况。该类型仪器中主要来自国外进口,其中较多来自美国,美国具有明显的技术优势;但其中的质谱仪、化学分析仪器等国产仪器已经开始占据中低端市场,具有较好的发展势头。

4.2 物理性能测试仪器

在本文所述分类体系中,主要包括力学性能测试仪器、光电测量仪器、颗粒度测量仪器、声学振动仪器、大地测量仪器、探伤仪器等。在美国CCL中,这类仪器设备都受到管制。

4.3 计量仪器

在本文所述分类体系中,主要包括长度计量仪器、电磁学计量仪器、力学计量仪器、热血计量仪器、光学计量仪器、声学计量仪器、电离辐射计量仪器、时间频率计量仪器。在管制清单中并没有明确标记为用于“计量”的仪器或设备。但是也有较多关于“测量”或者用于物理量测量的仪器。如:尺寸检查或测量系统、重力仪、磁强计、水洞、声纳等。

4.4 电子测量仪器

在本文所述分类体系中,主要包括通用电子测量仪器、射频和微波测试仪器、网络分析仪器、通讯测量仪器、大规模集成电路测量仪器。在美国的管制清单中,电子测量仪器是重要的一大块。其中通用电子测量仪器、集成电路测量仪器主要分布在3B区域中。由于大规模集成电路和芯片制造是美国出口管制中的重要内容,该区域的检测设备的管制条款也较为详细,其对应于相应的集成电路产品的技术指标。

4.5 海洋仪器

在本文所述分类体系中,主要包括海洋水文测量仪器、海洋生物调查仪器、海洋采用设备、水文气象测量系统、海洋遥感/遥测仪器、海水物理测量仪器。在管制清单中,海洋探测属于第8大类,该类的管制条款数量较少。其中的海洋仪器主要针对的是水面军舰、潜水艇、水下无人机等,对于一般的科学研究,限制较少。除了水文测量中受管制的水洞外,其他海洋生物调查仪器、海洋采样设备、水文气象测量系统、海水物理测量仪器都未见管制。

4.6 地球探测仪器

在本文所述分类体系中,主要包括电磁法仪器、地震仪器、重力仪器、地球物理测井仪器、岩石矿物测试仪器。在管制清单中,地球探测类仪器不是受管制的重点区域,整体涉及的条款较少。其中,地震探测设备、重力仪器、油气勘探设备、测井仪器是明确被管制的仪器。此外,电磁法仪器、岩石矿物测试仪器未见受到管制。

4.7 大气探测仪器

在本文所述分类体系中,主要包括特殊大气探测仪器、气象台站观测仪器、主动大气遥感仪器、被动大气遥感仪器、对地观测仪器、高层大气/电离层探测器、高空气象探测仪器。在管制清单中,地球探测类仪器不是受管制的重点区域,没有专门针对“大气”的相关仪器和设备。在遥感部分,用于遥感的单光谱成像传感器和多光谱成像传感器受到管制(6A002.b.);在气象观测用的“激光雷达”受到管制(6A998.b.)。

4.8 空间与天文仪器

在本文所述分类体系中,主要包括地面天文望远镜、天体测量仪;而在国标GB/T 32847-2016中天文仪器还包括空间飞行器、空间分析器测试/实验设备、卫星与地面运营仪器等空间探索的仪器。在管制清单中,空间飞行器、空间分析器测试/实验设备、卫星与地面运营仪器等空间探索的仪器是重点管制的领域;地面用于科学研究的天文望远镜、天体测量仪不受管制。

4.9 医学诊断仪器

在本文所述分类体系中,主要包括影像诊断仪器、电子诊察仪器、临床检验分析仪器等。在管制清单中,医学诊断类仪器基本不受到管制。通过分析认为这个领域由于国内差距过大,没有威胁到美国的地位,暂时没有必要进行管制。但随着未来中国整体实力的提升,特别是2020年新冠疫情之后,关于生化检测、病毒疫苗等领域的仪器设备有可能成为新增管制的领域。

4.10 核仪器

在本文所述分类体系中,主要包括核辐射探测仪器、离子束分析仪器、核效应分析仪器、中子散射及衍射仪器等。核管制是美国出口管制的重要内容,除了在CCL中管制外,还有专门的NRCC。两个清单的主要区别在于,NRCC主要负责核制造、生产、使用等直接的技术、产品、材料和设备等,关于核相关的一般性检测则由CCL负责。

4.11 工艺实验设备

在本文所述分类体系中,主要包括电子工艺实验设备、加工工艺实验设备、化工制药工艺实验设备、汽车工艺实验设备、食品工艺实验设备、纺织工艺实验设备等。在美国CCL中,工艺实验设备是非常大量的一类管制对象,分布在多个类别中。其中,电子工艺实验设备是分布在第3大类中,以光刻机、掩模制作系统、芯片封装设备等为代表的仪器与设备被严格管制,有大量和详细的技术指标对光刻机的各种性能进行限定,也是近年来中美冲突中的热点领域。典型的如:光源波长小于193nm或能够产生“最小可分辨特征尺寸”小于等于45 nm的图案;电磁光谱波长大于5 nm小于124 nm极端紫外线(Extreme Ultraviolet,EUV)的光刻设备等。由于在EUV光刻领域,中国的技术差距明显,是被“卡脖子”的方向。汽车工艺实验设备、纺织工艺实验设备方面一般的家用设备不在管制范围,食品工艺实验设备不在管制范围。

4.12 激光器

在本文所述分类体系中,有较多来自美国的进口产品,也有不少国产产品。由于激光在军事上用途广泛,如除用于通信、夜视、预警、测距等方面外,多种激光武器和激光制导武器也已经投入使用,在美国出口管制中是重要的一大模块,也是很早就受到管制的领域。管制清单对于固体激光器、气体激光器、液体激光器、自由电子激光器等激光器的种类进行了全面的限定,并对激光器的波长和输出功率进行了详细的限定。该领域的管制是非常严厉的,但是中国自主研发的能力也比较强,属于比较容易突围的领域。

5 讨论与建议

美国出口管制政策对我国科学仪器的影响深远,不仅影响着我国科学仪器的贸易、采购、运行、研发和使用,还进而制约着我国在科学研究、工业制造、军事发展等方面的深度和水平。2018年,美国出台了《出口管制改革法案》,试图将“新兴和基础技术(Emerging and Foundational Technologies)”列入出口管制中[6],进一步加剧该影响。面对严峻的国际形势和实际情况,本文提出分类应对,制定短期、中期、长期规划,坚定走自主研发的道路。

针对不同的科学仪器类型分类应对,制定短期、中期、长期规划,坚定走自主道路[18]。1)针对长期以来管制比较严的“军民”两用类科学仪器,比如激光器、核仪器、航天器、雷达等领域,长期以来就受到比较严格的管制[19],虽然在某些核心技术指标方面还有差距,但我国已经建立了一定的研发基础,尤其是在军事应用方面,已经走出了独立自主的道路,在这个方向,应该继续坚持自主研发战略,紧追国际上最新的技术指标,逐渐缩短技术差距。2)贸易冲突以来逐渐加强管制的领域,比如光刻机、晶圆检测设备、芯片检测设备等是贸易冲突前较为宽松,而冲突以来重点加强管制的领域,需要制定短期应对的策略,寻找国际上的多边合作和突破的可能,制定贸易进口的可替代方案,例如从俄罗斯、法国、德国等国家寻求突破点,同时要制定中长期规划,摒弃“拿来主义”“买来技术”的幻想,走自主研发的道路。3)针对暂时管制较轻的领域,例如医学诊断仪器、新一代基因测序仪、大气探测仪器、地球探测、化学分析仪器等理论研究相关的科学仪器,虽然当前管制并不严格,但并不代表着我国在技术上没有差距,相反正因为差距太大,对美国暂时不构成威胁,美国才没有严格管制,随着我国的逐渐进步,很有可能这些领域会成为新的管制对象。针对该方向的科学仪器要从长远着眼,未雨绸缪,定制“备胎”计划,由国家主导,国立科研机构和大型科研型企业主力承担,形成足够的科学仪器技术储备,逐步提高科学仪器的水平[20]。

猜你喜欢

科学仪器管制仪器
注意!携带这些当玩具,可能会被拘留
《现代仪器与医疗》2022年征订回执
《现代仪器与医疗》约稿函
《现代仪器与医疗》2022年征订回执
在危机中寻找“机会”
——第十八届中国国际科学仪器及实验室装备展览会线上展览开幕
环境管制对中国产业结构调整的影响
环境管制对中国产业结构调整的影响
我国古代的天文仪器
跨太平洋伙伴关系协定——放松美国金融管制的密径?
资本运作、成果转化、网络营销……一个也不能少!