以稀土产品为例中国海关及全球各国外贸数据大数据算法研究
2021-09-19崔建高
● 崔建高/文
本文通过分析现行国际贸易《商品名称及编码协调制度》(HS 编码)在不同国家存在的编码及其解释的异构问题,提出了跨国HS 编码转换的方法,并通过稀土及稀土制品对相关方法的适应性进行验证。同时,列明了全球商品参数加工标准及大数据SQL 脚本,为进一步提升GTA 全球贸易数据应用效能,准确掌握某类商品全球各国的贸易情况、市场前景、行业发展形势提供了大数据算法支撑。
目前,世界海关组织(WCO)制定的《商品名称及编码协调制度》(The Harmonization System Code,简称HS 编码)仅对商品编码的前6 位做出了统一规定,后2~4 位作为子目由各国单独设定,使得同样商品的后2~4 位各国HS 编码不同,导致准确测算某一商品的全球贸易情况较难实现。因此,充分发挥GTA 全球贸易数据可以精确到各国8位HS编码的优势,准确测算各类商品全球贸易情况,需要首先克服后2~4 位HS 编码异构问题。
一、HS 编码及我国后2~4 位编码设置情况
HS 编码是国际贸易编码协调制度的简称,广义上涵盖了《海关合作理事会税则商品分类目录》和联合国《国际贸易标准分类》两类编码体系,是国际通用的海关编码。狭义上,HS 编码是《商品名称及编码协调制度》(TheHarmonizationSystem Code)的简称,由海关合作理事会(世界海关组织(WCO)的前身)于1987年制定,并于1988年1月1 日正式生效,目前已覆盖全球200 多个国家和地区,占全球贸易总量的98%以上。我国已批准《商品名称及编码协调制度公约》,于1992年正式加入《商品名称及编码协调制度》,1993年正式生效,所以本文是指狭义上的HS 编码。
1.HS 编码设置情况
HS 编码由商品名称及其对应编码两部分组成,共21 大类97 章,部分国家将“特殊交易品及未分类商品”作为第 22 类第98 章。目前,国际通行的HS 编码由6 位数字组成,其中:前2 位码对应“章(Chapter)”,共97 个;3~4 位对应“目(Heading)”,共1242 个;5~6 位对应“子目(Subheading)”,共 5019 个。7~8 位或9~10 位编码是各国子目,由各国根据国情自行设定。例如:我国使用10 位HS 编码,新加坡则采用8 位HS 编码。
为提高HS 编码的商品覆盖面,在每一个HS 编码对应一条相应的商品描述的同时,设置了“兜底”编码,将每一“子目”的最后一行定义为“其他(编码常用数字9)”,用以涵盖在本“目”中难以分类的物品。例如:国务院税则委员会发布的《中华人民共和国进出口税则(2021)》,编码01012900、01022900 通过第6 位9 涵盖了其他马、其他牛;编码01013090 则通过第7 位9 涵盖了其他驴;
2.我国后2~4 位编码设置情况
在我国,前6 位HS 编码是申报的最基本税号。例如:2020年海关总署全面推行的两步申报制度,概要申报要求商品编号申报6 位HS 编码即可。
一是7~8 位情况。按照《中华人民共和国进出口关税条例》(以下简称《关税条例》),在前6 位HS 编码基础上,由国务院税则委员会编制7~8位作为《中华人民共和国进出口税则》(以下简称《税则》)中的税则号列,对应的是《中华人民共和国海关统计商品目录》。
二是9~10 位情况。根据《中华人民共和国海关进出口货物报关单填制规范》(2019年18 号公告)第34 条“填报由10 位数字组成的商品编号”要求,9~10 位作为执行进口商品暂定税率、关税配额商品进口关税税率、出口关税税率、进口环节税税率、相关贸易管制措施的依据,由中国海关编制,是监管附加编号,主要为执行贸易管制措施。
3.综合利用中国海关数据与全球贸易数据的原则
在6 位HS 编码基础上,我国增加了7~8 位作为税则号列,增加9~10 位作为商品编号,但是各国情况又不完全与我国一致。因此,有效解决HS编码各国异构问题,必须立足GTA 全球贸易数据大多到8 位商品编码的情况,一是将全球各国7~8位商品翻译对应,准确锁定所要掌握的某类商品全球贸易情况;二是将9~10 位商品编码进行细化,全面掌握我国某类商品的贸易细节。
二、解决7~8 位HS 编码全球异构的方法
目前,6 位HS 编码较难满足很多商品的全球贸易精准测算问题。例如:准确测算稀土及制品的全球贸易情况,需要精准测算稀土(2503902、28053、2846)和稀土制品(3606901、7202991、72029991、8505111)的全球贸易情况,就必须解决7~8 位HS 编码全球异构问题。
1.明确商品属性,制作商品参数表
稀土及制品包括稀土、稀土制品两类,稀土又包括稀土金属矿、稀土化合物、稀土金属3 类商品,稀土化合物、稀土金属又可以进一步细分为镧、铈、镨、钕、钷、钐、铕、钆、铽、镝、钬、铒、铥、镱、镥、钪、钇等17 种稀土元素情况。稀土制品进一步细分为稀土永磁材料、铈铁合金,稀土永磁材料又可以进一步细分为钕铁硼磁片、钕铁硼磁粉、铈铁硼磁片、铈铁硼磁粉、其他稀土永磁材料等。因此,考虑到全球各国8 位稀土及制品商品编码情况,将商品属性进一步细分为非稀土及制品、稀土金属矿、稀土化合物、稀土金属、稀土永磁材料、稀土合金等6 类,进而翻译8 位全球商品编码,制作稀土及制品的参数表(具体见表1)。其中,需要梳理各国法定计量单位情况以准确计算各类商品的进出口单价。例如:美国8505110050(烧结钐钴永磁体以及磁化后可能成为永磁体的物体)、8505110070(烧结钕铁硼永磁体以及磁化后可能成为永磁体的物体)法定计量单位为“个”。计算全球稀土永磁单价时要对美国进行单独处理。
表1-1 全球各国稀土及制品参数表样例
表1-2 全球各国稀土及制品参数表样例
经过对全球稀土及制品进行8 位HS 编码梳理,2010~2020年,累计102 个国家(及地区)有稀土及制品进出口贸易,并进行了进一步的细致分类。一是需重点关注的国家12 个,主要为美国、日本、欧盟、印度、马来西亚、越南、俄罗斯、澳大利亚、巴西、德国、加拿大、韩国等;二是编码划分较为详细的国家27 个,主要为爱尔兰、爱沙尼亚、奥地利、白俄罗斯、比利时、波兰、丹麦、法国、芬兰、哈萨克斯坦、荷兰,捷克、克罗地亚、拉脱维亚、立陶宛、罗马尼亚、葡萄牙,瑞典、塞尔维亚、斯洛伐克、土耳其、乌克兰、西班牙、匈牙利、意大利、希腊、英国等;三是需要采用映射法反推的国家1 个:缅甸。因为缅甸已经成为全球重要的中重稀土金属矿出口国,但缅甸没有上报相关的国际贸易数据,需要用其他国家的进出口贸易数据映射得出缅甸的稀土及制品进出口情况。
2.商品参数表的主要加工原则
美国、日本、德国、马来西亚、越南等作为全球稀土及制品重要的贸易国,需要对其商品编码进行重点核实与关注。例如:因为最初将德国85051100(永磁体,金属制,及拟在磁化后成为永磁体的物品(不包括卡盘、夹子和类似的夹持装置))列入了非稀土永磁材料,致使德国稀土制品贸易额未进入全球前10 位国家,与实际情况不符。
一是结合国情,合理判定同类税号的商品属性。例如:日本钕铁硼类稀土永磁材料产量居全球第二,德国又是传统的稀土制品进出口大国,虽然850511没有进一步细分永磁材料的属性,也将日本、德国的850511000 判定为稀土永磁材料。而美国850511系列划分详细且是否为钕铁硼进行明确判定,因此将“其他”判定为“非稀土永磁材料”,排除在稀土及制品之外。(日本、德国、美国850571 具体商品编码情况见表2)
表2 日本、德国、美国850511 具体商品编码情况表
二是整体判定各国的商品关注重点。通过各国HS 编码异构设计情况,可以较为准确的判定该国对稀土及制品的关注领域和关注重点,并籍此对全球稀土及制品贸易格局进行初步判定,为后续大数据模型的运算数据提供经验验证。例如:商品编码7202991、72029991 只有中国含有并明确为稀土铁合金。再比如:通过参数梳理发现,GTA 数据中的全球各国稀土编码17 种稀土元素普遍以轻、重稀土划分,部分国家将铈、钪单独分列或者阿根廷将钪、钇分列,但也难以掌握每一种稀土元素的贸易情况。也因此,准确测算全球稀土及制品贸易情况,必须结合中国海关数据库的10 位商品编码。(全球各国稀土及制品HS 编码异构情况见表3)
表3 全球各国稀土及制品HS 编码异构情况表
3.具体建模方法及模型脚本。
将2010~2020年全球各国稀土及制品贸易数据进行清洗加工(累计涉及630 万条数据),通过inner join 函数与全球稀土参数表进行拼表,将实际稀土及制品记录提取出来,分别测算我国占比、发达经济体对我国稀土依存度、主要稀土产品进出形势等情况(具体全球稀土贸易脚本略)。
三、细化9~10 位中国海关商品编码的方法
通过GTA 数据可以细化到稀土化合物、稀土永磁材料、稀土金属等商品属性,但是如何准确测算17 种商品元素的进出口情况就成为难题,必须通过中国海关数据库对数据颗粒度进行进一步细分。
1.制作10 位商品编码参数表
通过商品编码梳理,除钬、铥、镥、钷4 种元素外,其余13 种商品均有相关独立的商品编码,但以镧、铈、镨、钕、铽、镝、钇编码较为丰富和详细。即使如此,依然有2846909100(镧的其他化合物)、2846109090(铈的其他化合物)、2846909500(镨的其他化合物)、2846909200(钕的其他化合物)等兜底税号,而钐、铕、铒、镱、钆则只有氧化物一个税号,分别为2846901940、2846901400、2846901920、2846901970、2846901930,因此准确测算每一个稀土元素的化合物、金属的进出口情况,必须在10 位商品编码之外,通过商品名称、规格型号字段进行进一步细分,把2805301900(其他稀土金属)、2805302100(其他电池级的稀土金属、钪和钇)、2805302900(其他稀土金属、钪和钇)、2846901991(灯用红粉)、2846901992(按重量计中重稀土总含量≥30%的其他氧化稀土)、2846901999(其他氧化稀土)、284690280(混合氯化稀土)、2846902900(其他未混合氯化稀土)、2846903900(其他氟化稀土)、2846904810(按重量计中重稀土总含量≥30%的混合碳酸稀土)等中未列明的稀土化合物和金属提取出来。(10 位商品编码稀土元素属性梳理见表4)
表4-1 10 位商品编码稀土元素属性梳理表
表4-2 10 位商品编码稀土元素属性梳理表
2.明确REO、MEO 换算标准及方法
按照《中华人民共和国海关总署公告2011年第37 号》“为加强和规范稀土以及稀土相关产品的出口管理,在稀土及相关产品出口时,除按《中华人民共和国海关进出口商品规范申报目录》(2011年版)要求的要素填报外,还应在报关单‘规格型号’栏,填报本公告涉及的商品总的稀土元素重量百分比含量,以‘[A]’表示,具体为:‘[A]:%’”。而公告中稀土元素重量百分比则分别为稀土化合物重量(REO)和稀土金属重量(MEO),需要通过instr、substr 函数将上述数据提取出来,并乘以报关时的法定第一数量,才能将法定报关数量与稀土行业的专业重量实现一致。
3.具体模型脚本及模型效果
通过上述方法,不仅可以把钬、铥、镥等没有明确商品编码的稀土化合物、稀土金属进出口情况准确提取出来(钷因为只存在核反应堆中,没有相关进出口记录),改变传统通过增加商品编码的方式进行单一稀土元素监控的方法,同时可以将进出口重量与行业REO、MEO 重量实现一致,以更加准确的评估我国稀土产业整体发展、我国稀土产业在全球中的地位作用、全球稀土元素整体供求形势(具体稀土元素加工脚本略)。
四、结论
通过上述方法,可以综合发挥中国海关数据和GTA 全球贸易数据优势,有效解决HS 编码后2~4位在不同国家存在的编码及其解释的异构问题,最大限度的发挥海关政务大数据的生产要素价值,真正实现大数据辅助科学决策。笔者通过上述方法,将加工后的大数据结果与中国海关发布的稀土及制品数据进行了对应,大部分数据完全一致,其他数据误差也不超过1%,大数据模型的科学性、适应性较高,能够较好的帮助相关党政部门、行业组织、上下游企业准确掌握某类商品全球各国的贸易情况、市场前景、行业发展形势,并籍此提出科学的产业政策和企业发展决策。