浅议“厚数据”思维下的我国海关“智慧风险管理”
2017-10-19娄泽黎沈斌
娄泽黎++沈斌
[摘要]大数据目前在海关风险管理中的运用已相对普遍,但其带来的管理效益却见仁见智。这需将“厚数据”思维引入海关风险管理进行深度数据挖掘,让大数据开口说话。文章从我国海关风险管理的研究现状谈起,分析其存在的不足,在对“厚数据”与“大数据”进行比较的基础上,分析了其在海关风险管理运用中的优势,提出了未来以“厚数据”为核心的我国海关人工智能风险管理新思路。
[关键词]海关风险管理;“厚数据”;智慧风险管理
[DOI]1013939/jcnkizgsc201730154
随着AlphaGo对世界围棋高手的围剿,人工智能成为当前最热门的话题,这就是“大数据”时代。但是,人工智能也存在着“大数据”思维下注重数据相关性而弱化因果关系等局限性。因此,人们很快意识到在现代管理学中应尽可能地把“人”的因素融入到数据分析中去,这就是本文所要讨论的“厚数据”思维。希望“厚数据”思维下的中国海关AlphaGo诞生,其目的是为中国海关风险管理提供一条更具前瞻性的新思路。
1我国海关风险管理现状与国内研究概述
我国海关系统的风险管理起步于1999年海关总署综合统计司的海关执法评估系统,成型于2004年。迄今为止,风险管理在我国海关管理中的运用已超十年,逐渐形成了以海量数据为基础,设定参数下达指令为方法的风险管理模式。但在技术不断更新的今天,信息数据来源将更加分散、格式将更加多样,这就对我国海关的风险管理提出了新的挑战。特别是与欧美国家相比,我国的海关风险管理模式仍停留在“初代防火墙”水平,即根据“已知”去管理“未知”,根据已发生的违法情况来防范未来可能发生的相同违法情况。这样的模式在监管环境日益复杂的今天显然是既缺乏动态性、立体性,更缺乏灵活性的。
国内学界对我国海关风险管理的探讨,从最初借鉴欧美等国风险管理定义对我国“海关风险”“海关风险管理”等概念进行界定,到后来以天津、青岛等地为例,从直属海关层面分析海关风险管理模式,再于近年大数据兴起后,将双因子分析法与风险管理结合提出新方法。目前我国海关风险管理的各种平台与手段也是基于该理念而设计开发的。
2目前我国海关风险管理存在的不足
十几年来,我国海关的风险管理从无到有,取得了一系列令人瞩目的成就。但从风险管理理论本身的价值看,其效能远未在我国海关管理实践中充分发挥。
21数据规模效应初现,但数据研究缺乏深入
随着海关信息化建设的加速发展,近年来全国海关积累了海量的数据。由此我们初步形成了通过对海量报关单申报价格进行统计、分析,然后计算出海关的可信价格置信区间。
但这种方法也存在明显缺陷。当大量样本数据不符合实际时,基于错误数据的分析就会与贸易实际情况发生偏差。例如某些企业为了逃避海关正常估价,集体性对申报价格进行加工,导致申报价格失真;又如由于一些欠发达国家对外汇进行严厉管制,逐渐形成了官方和黑市两种汇率。导致相关企业在向中国海关申报时价格存在较大的风险。于是这种仅停留在“数据分析”层面的风险分析,只能让数据展示出“是什么”,却揭示不了其背后的 “为什么”。
22管理理念相对保守,技术支持升级缓慢
一直以来,海关风险管理的理念是以“稳”为主,设置固定的参数与硬性考核指标。这样的做法在风险管理实施之初,不失为一种从易而难、避免犯错的方法。但是十多年过去了,这种考核模式仍未发生改变值得我们反思。
目前我们的风险管理主要是两种思路。一是在发现某些违规、违法行为后总结其特点,然后在海量的进出口数据中去比对较为类似的记录。例如发现某个商品归类错误后对其他同品名的商品进行归类复核;二是在未知風险的情况下,某些进出口数据违背了正常逻辑或者游离于置信区间时,判定为存在风险的记录。例如在打击虚假贸易时,新成立的企业一旦有较高的出口值,就容易被判定为存在风险。
上述风险管理的基础是管理对象向海关申报的数据,因此提炼出的各类风险参数有滞后性,海关无法主动在第一时间发现风险。
与此同时,海关对风险的处理技术也相对保守。一是内部风险信息平台功能少、升级慢。二是外部风险信息平台建设推进慢、阻力大。三是风险管理手段少,缺乏专业第三方科技支撑。
23数据来源口径单一,数据评估缺乏途径
我国海关系统的数据主要来源于H2010,对进出口货物的统计由接受申报的海关负责。这样确实可以保证从总署到隶属海关所拥有的数据是一致的,不存在外界的干扰。但这就导致海关系统的数据来源过于单一,与“多口径”统计的地方政府数据相比,海关数据缺乏评估验证。例如出口贸易中的虚假贸易,因特殊关系而低报的价格、涉及退税而高报的价格,虽然均在海关统计的数据库中,但是由于缺乏相关的法律法规,目前海关几乎无法对进出口货物的数据进行全面审核,也没有技术支持来剔除无效数据样本,这就使得海关数据的科学性大打折扣。
大数据目前在海关风险管理中的运用已相对普遍,但其带来的管理效益却越来越值得商榷。显然,这就为将“厚数据思维”引入到海关的风险管理中提供了机会。
3“厚数据”概念新解与大数据之比较
简言之,厚数据是指针对被研究对象显著特征的,体现其更深层次的、对其内涵更精确定位的数据。它是由已故人类学者Clifford Geertz最早提出的。它强调用定性研究的方法来阐释数据,旨在揭示数据背后的感情、故事及意义。大数据是以宏大的量为支撑,不具有深刻性,所以又称其为“薄数据”。而“厚数据”则是在揭示大数据背后的更深刻的场景与故事。二者的关系是大数据是面,范围广;厚数据是点,范围相对较窄;厚数据包含在大数据内,只是层次与角度不同罢了。二者的区别如下表所示。
4“厚数据”思维在海关风险管理中的优势分析
“厚数据”是一个全新的数据挖掘理念,未来在我国海关管理中其优势不可小觑。endprint
41“厚数据”思维已在欧美国家的风险管理中成功运用
KeyCrime是一家意大利软件预测公司,它们主要服务于米兰警方。利用“厚数据”算法,针对商店的抢劫和偷窃做预测。这套系统用了几年后,有了大量的数据和神经网络学习算法,在不同罪案中建立联系也变得更加方便,目前在意大利很多家警局推广使用。PredPol是一家加州圣克鲁兹的警力软件公司,运用“厚数据”思维编程,供部分警局进行风险预测。芝加哥警局表示,用了PredPol程序几个月后,枪击案件发生概率下降了 13%,谋杀案件数量降低了49%。洛杉矶警局也表示,使用这套提高效率的模型,一年光一个分局就能省下 200 万美元。“厚数据”在发达国家执法机关的成功运用,表现出了低成本、高效率等优势,这样的尝试为我国海关引入厚数据思维,提供了良好的参考与借鉴。
42“厚数据”思维契合了我国海关风险管理的需求
421契合风控中心建立要求
全国通关一体化改革下,海关系统将建立以海关总署风险防控中心为一级风控中心,直属海关风险防控中心为二级风控中心的风险管理框架。这样的框架类似于“专家集中制”。然后利用“厚数据”良好的融入环境,为海关风控中心服务。其基本思路是:假设原有风险管理1000人,其中10人为专家,990人为一般管理者,那么1000位水平不一、领域不同的风险管理者各自为政,效率较低。现将10位专家集中到一起,并根据领域划分配备合理数量的助手,结合厚数据思维对数据进行质化研究,将契合风险防控中心管理要求。
422契合嵌入式管理诉求
日益复杂的贸易环境使海关风险管理不得不将视角放眼于整个贸易链,将个性化贸易行为嵌入到数据分析中去,而非单纯通过简易标准化方差计算得到的数据去评判企业行为。以贸易国为非洲的进口贸易为例,存在官方、黑市两种汇率,企业若以黑市汇率成交付汇,在进口申报时以实际成交价格申报,则会引起现有风险管理的预警。如果不将非洲的实际贸易环境嵌入到风险批判中,那可能造成企业如实申报却仍被布控、审价,这对企业来说是有失公允的。未来的海关管理更需兼顾服务与把关,在最大限度上促进贸易公平,这便需要厚数据思维来满足嵌入式管理的诉求。
423契合倒查式挖掘需求
未来的风险行为将更具隐蔽性,海关风险管理对数据的挖掘要在线索少、数据少的情况下开展。例如市场上的“神户牛肉”,海关数据中并未出现过日本神户牛肉的进口记录,那么在排除虚假广告的前提下,这些神户牛肉必定是通过走私进境的。对于这类风险,需从终端销售者倒查,挖掘数据后再建立模型。对于这类高挖掘需求的小数据样本,厚数据思维是理想的选择。
43“厚数据”思维是实现我国海关人工智能管理的优选之路
未来我国海关风险管理发展的趋势一定是向人工智能方向发展的。实现智慧风险管理也需要像AlphaGo一样经历数据思维的更替。第一代AlphaGo的思路是大数据思维,输入大量棋谱,根据已知招数与棋手下棋。第二代AlphaGo的思路是厚数据思维,在已有棋谱基础上进行重组深挖,计算出多种人类从未使用过的招数以取得完胜。海关的风险管理亦是如此,第一代智慧风险管理建立在大数据技术之上,第二代突破的优选之路便是“厚数据”思维的广泛应用。
5对我国海关“智慧风险管理”的思考
51业务再造,建立海关风险管理工作回路
海关(Customs)根据企业的行为(Behavior),利用组织行为学等相关理论,进行分析(Analysis)组成行为分析小组(Unit),简称CBAU,以环形的工作机制来支持厚数据理论在风险管理中的落地。建立工作回路,实现事前、事中、事后分析,动态防范风险,变滞后为超前,将风险管理的重心安排在企业风险行为发生之前。其工作回路图1为:
图1工作回路
其中PLAN代表精准收集数据,分析典型样本,编写程序算法,预测行为发生;DO表示根据厚数据算法得到的结论,警告重点企业,提示现场关员,下达布控指令;CHECK表示检测命中情况,反馈执行结果;ACTION为修正模型,调整算法。
52分层共享,打造立体海关风险情报信息系统
打造“分层共享+多元融合+公众参与”的智能化风险信息共享平台,打破层级、部门、关区、领域的壁垒,实现内外部风险资源的互通,为厚数据模型的个性化分析提供数据支持。借助云平台,建立海量、动态、多元的“风险信息池”,丰富非结构化信息的种类,建立文本图像分析机制,构建多样化信息框架。使风险信息的外延不断延伸,视角向整个物流链条拓展。情报信息系统分为海关、其他政府部门、社会、专家智囊团四个层面,将外部信息资源作为内部信息资源的有益补充。开展自动采集、定向采集及个性化采集,提高信息采集智能化水平。如图2所示。
图2立体海关风险情报信息系统
53“由企及企”,释放海关风险管理新活力
在海关风险管理的思维中,是以绝大部分企业都是守法的,仅有小部分企业容易发生违法行为为基础的,而海关的职责就是找出已经违法的企业和有潜在风险的企业。所以我们需要把目光聚焦在企业上,而不是物品上,将传统的“由企及物”思想转变为“由企及企”,建立企业行为模型。首先,通过“厚数据”模型筛选出高风险企业。其次,根据企业基本情况再建企业风险模型。最后,根据企业后续的申报行为及违法行为完善模型。在这个方面,美国的COMPAS人工智能值得我们借鉴。在美国,如果犯罪进了监狱,COMPAS就会接管罪犯的个人数据。入狱者填写一份个人情况调查问卷,综合犯罪的严重程度,COMPAS会计算出一套“未来罪犯”的评分机制,预测其未来再次发生违法行为的概率、地点及形式。
54建立“海关风险管理厚数据模型”
海关还可与专业的人工智能公司签署合作备忘录,聘请技术顾问与海关风控中心专家合作,筛选出第一批高风险企业,建立起第一代风险企业行为模型。日后的完善调整,均以第一代模型做基础,所以第一代样本对象的确定十分关键。各现场海关可将各自数据发送到风险防控中心进行专业评估,再结合各现场实际情况进行数据完善,做合理的参数调整,建立模型后在不断的互动中预测风险,实现“以企管企”的风险管理模式。算法运行初期可以重点预测企业高风险行为发生的“概率”,中期重点预测高风险行为发生的“地点”,后期达成企业高风险行为发生的精准预测。如此,建立在厚数据思维模式下的我国风险管理水平必将很快实现从“粗线条预测”到“精确化查处”,再到“定制化提醒”的飞跃,为我国海关风险管理水平再上台阶而做出其应有贡献。
参考文献:
[1]钱锦我国海关风险管理发展趋势研究[C].海关风险管理论文汇编集,2016
[2]段景辉海关风险管理分析与评价方法[J].上海海关学院学报,2012(3)
[作者简介]娄泽黎,杭州海關下辖嘉兴海关在职关员;沈斌,杭州海关下辖嘉兴海关在职关员,副科长。endprint