大数据时代背景下边检信息工作创新研究
2016-03-17何令举
何令举
(北京出入境边防检查总站,北京 100621)
大数据时代背景下边检信息工作创新研究
何令举
(北京出入境边防检查总站,北京100621)
当前边检工作急需引入大数据技术,以创新边检信息工作模式。边检信息工作的数据资源符合大数据的4V特征,具备引入大数据技术的数据条件。创新边检信息工作的路径包括:树立边检信息大数据发展理念;培育金字塔型边检数据分析人才队伍;创建动态评估出入境人员风险的边检大数据信息平台,与地方公安机关开展数据共享和技术合作。
大数据;边检;情报工作;创新
随着公安信息化的推进和信息主导警务战略的实施,公安信息工作突飞猛进,“智慧公安”“警务云”“公安大情报体系”等公安信息工作都需要引入大数据技术。目前,公安大数据信息技术的应用及理论研究主要集中于治安、刑侦和交通等警务领域,鲜有专门针对边检警务的大数据信息应用和研究。本文将从边检信息工作引入大数据技术的必要性、可行性以及实现路径三个方面对大数据时代下边检信息工作创新问题进行探讨。
一、新形势和新任务要求创新边检信息工作
随着对外开放的不断深入和国内经济的高速增长,中国出入境形势发生了深刻变化,边检工作面临着新的形势和新的任务,要求边检机关创新信息工作,以满足边检业务的需求。
(一)边检工作面临的新挑战
1.外国人入境由“形式审核”转为“实质审查”
2013年《出境入境管理法》第二十四条①“外国人入境,应当……履行规定的手续,经查验准许,方可入境。”与二十五条②“可能危害中国国家安全和利益、破坏社会公共秩序或者从事其他违法犯罪活动的”“在申请签证过程中弄虚作假或者不能保障在境内期间所需费用的”“入境后可能从事与签证种类不符活动的”不准入境。的相关规定赋予了边检机关拒绝持有有效中国签证的外国人(符合入境形式要件的外国人)入境的自由裁量权,即边检机关具有了对外国人入境实施“实质审查”的权力。同时,边检机关需要承担深入核查入境申请人真实身份和入境目的的义务,以保证科学、准确地行使“实质审查”权。因此,边检机关需要获取客观全面的信息,以支持对出入境人员身份及入境目的的判断。
2.免签过境外国人的管控难度增大
为促进我国旅游市场发展,以带动口岸城市经济增长,在24小时过境免签的基础上,于2013年开始在部分城市实施72小时过境免签政策,并于2016年进一步试点144小时过境免签政策[1]。边检机关在配合过境免签政策实施的过程中,面临诸如个别外国人超过规定期限和区域在华停留、利用该项便利措施实施相关偷渡活动、或利用过境免签政策在指定区域停留却未真正过境[2]等管控难题。如何对免签入境人员开展有效的入境审查并动态管控其出入境活动需要大量实时的信息支持。
3.非法出入境案件查处难度增加
随着经济的快速增长,中国由传统的“非法移民来源国”转变为“非法移民目的地国”和“非法出入境中转站”。边检机关查处非法出入境案件的重点由“中国公民出境”转向“外国人入境”。非法出入境案件的种类、手段和目的也越来越多样,并呈现出跳跃性、集团化、职业化和国际化的特点。证件本身“合法”却“不真实”的“隐蔽性”非法出入境案件越来越普遍,非法出入境案件的查处难度增大,亟需高效的边检信息支持。
4.日益严峻的“反恐”任务
近年来,恐怖主义组织在非洲、俄罗斯、欧洲、美国、西亚和澳大利亚等地频频发动恐怖活动,中国国内也发生多起暴力恐怖活动。在中国境内发生的恐怖袭击的背后,都有境外恐怖势力的影子,目前中国认定的四个恐怖组织都在国外活动[3]。恐怖分子的跨境交流和相互呼应的情形越来越普遍。以近两年来欧洲频发的恐怖袭击为例,相关情报分析表明:该现状的根本原因之一是在2012-2015年间,数千名欧洲公民被招募到叙利亚和伊拉克加入恐怖组织IS接受培训,致使欧洲人口与IS发生了直接的联系。2016年3月22日,比利时布鲁塞尔发生的三起爆炸案后,IS公开表示对恐怖袭击负责并呼吁全欧洲包括亚洲的圣战者发起圣战,而早在2015年5月,已有新闻报道做出相关预言[4]。可见,阻止国内人口与恐怖组织的直接联系对于反恐维稳至关重要。边检机关身处国门一线,肩负阻断境内重点人员与境外国际恐怖组织间的人员流动的重任,信息支持至关重要。
5.管控人员范围扩大
自2014年9月全国检察机关职务犯罪国际追逃追赃专项行动部署会议以来,截至2015年3月31日,全国检察机关共劝返或抓获犯罪嫌疑人61人,其中,边检机关抓获9人[5]。边检机关在配合国家跨国执法行动中,发挥了重要的作用。随着国家法制化建设的推进,跨国执法将成为新常态,同时意味着边检机关的管控人员范围越来越广,人员组成越来越复杂,对相关信息的需求也越来越多。
6.“快速通关”的巨大压力
近年来,我国出入境人员数量持续高速增长,以2014年第四季度为例,全国出入境人数达到1.29亿人次,较2013年同比增加10.97%。根据汇丰银行2014年10月份公布的《外派人员调查报告(2014)》显示,“中国成为世界上最受欢迎的移民目的地国家之一”[6]。与此同时,国家也在积极推行各种宽松的出入境政策,例如公安部推出的支持北京创新发展的20项出入境政策措施将于2016年3月1日起正式实施。可以预见,在今后一段时间,中国的入出境人员数量,特别是入境外国人数量将持续增加。在国家严格控制公务人员编制的背景下,边检机关面临“快速通关”的巨大压力,需要针对每一名出入境人员的信息支持,以提高边检勤务效能和通关效率。
(二)边检传统信息模式的局限
传统的边检信息工作是以边防检查信息收集、信息研判为主要内容,通过“边防检查人员有目的地收集、传递信息,并对各种信息进行加工、整理、分析、评价,得出结果”[7]的人力信息模式。传统边检信息模式效率较低,信息产品以事后“总结、归纳”式的定性分析为主,已经不能为边检业务新需求提供足够的支撑。因此,为适应上述边检工作任务的变化,引入大数据技术创新边检信息工作迫在眉睫。
一是需要以量化和科学的信息,支持边检机关行使“实质审查”的自由裁量权;二是需要以预测性的信息,提高对非法出入境嫌疑人和涉恐涉案人员的查获效率;三是情报的范围要尽量覆盖全体出入境人员;四是以智能化的方式提高边检信息工作效率;五是提高情报反应速度,以支持业务部门应对复杂的出入境形势。
二、应用大数据技术创新边检信息工作的可行性
(一)大数据技术是天然的信息工具
大数据的价值在于通过对整合分析海量数据,发现其中隐藏的“关联”,预测未来发展的“趋势”,这是天然的信息分析工具。大数据技术通过机器学习、人工神经算法可以实现智能化数据分析,可大大提高信息分析的效率。强大的计算能力可以即时对获取的数据进行分析处理,反馈结果。将大数据技术融入边检信息工作,才能满足上述边检工作新任务的需求。
(二)边检信息工作具备应用大数据技术的数据基础
海量的数据是大数据应用的基础,边检信息工作是否具备应用大数据技术的数据基础?边检机关信息工作中可以应用的数据主要包括两部分,即数据源在边检机关的边检业务数据和数据源在其他部门的边检业务相关数据。
1.边检业务数据
边检业务数据是边检机关数据资源最重要的组成部分。指的是边检机关为维护国家主权、领土安全和社会秩序,促进对外交往和对外开放,在履行对出入境人员及其行李物品、交通运输工具及其载运货物的出入境边防检查、出入境交通运输工具监护、口岸限定区域管理等业务职能的过程中,采集、记录的能够由计算机处理的数字、字母和符号等原始数据。自2006年梅沙系统在全国启用以来,边检机关存储有几十亿人次的边检业务数据,其中绝大多数都没有得到应用。
2.机关信息工作中可以应用的数据
一是核心边检业务数据。核心边检业务数据是通过边检信息系统(梅沙系统)采集的边检业务数据。要梳理核心边检业务数据,就不得不回顾边防检查信息系统的发展历程。自1983年第一代边防检查系统问世到2006年第四代出入境边防检查信息系统(梅沙系统)在全国范围内全面启用,二十多年来,边检信息系统由查控到查验再到综合管理,功能日益强大。从2008年护照资料页整版扫描阅读机大范围部署,自助通关逐渐铺开,到2010年,上海边检总站在执勤一线安装面像采集仪,梅沙系统的数据采集项基本确定。以梅沙系统为数据采集平台,边检机关在执勤执法过程中采集了大量的核心业务数据。其中,不仅包含上述出入境记录,还包括证件样本数据、法律法规文件数据、自助通关、面相采集仪采集的出入境人员照片、指纹等生物信息数据,3M阅读机采集的护照资料页图片信息数据,办案机关产生的案事件数据等。这些数据格式多样,容量巨大,是最具边检信息挖掘价值的基础数据,且考虑到2007年全国边检机关就已经实现了网络互联,数据范围应该设定为全国各边检机关采集的数据之和。
二是其他边检业务数据。其他边检业务数据是核心边检业务数据以外的边检业务数据。其他边检业务数据包括边检机关通过其他信息系统或网络收集的大量图片数据、视频数据、文本数据、网络数据等。具体包括:旅客满意度电子评价系统、国际中转免办边检手续旅客信息采集系统、外籍旅客出入境卡片自助打印系统等边检机关使用的应用系统,在运行过程中生成海量的数据;全国证研网、边检机关电子政务网站等每天发布的大量证研信息、非法出入境案件信息、出入境动态信息等文本、图片及网络数据;视频监控系统、执法记录仪等录制、存储的大量音频、视频数据等。这些数据以非结构化数据为主,受边检机关处理、利用非结构化数据的能力限制,其他边检业务数据长期缺席边检信息工作。
三是边检业务相关数据。边检机关在履行业务职能的过程中,共享到大量来自其他部门和组织的数据,即边检业务相关数据。边检业务相关数据的数据源不在边检机关,不属于边检业务数据的范畴,但是,这类数据中蕴含出入境人员在境内外活动的大量信息,对于边检信息工作意义重大,是创新边检信息工作的重要数据基础。边检业务相关数据根据获取的渠道不同,大致分为:公安数据、社会数据和互联网web数据等。其中公安数据包括在逃人员数据、全国人口户籍信息数据、护照签证签发数据和驾驶证数据等。社会数据包括SLTD系统①SLTD系统即国际被盗遗失旅行证件数据库系统。数据、API数据、铁路订票数据、口岸非限定区域监控视频数据等。互联网数据包括各组织在互联网上公开的与边检业务工作相关的各类非结构化数据。
上述三类数据的数据规模(Volume)较大、数据多样性(Variety)丰富、产生速度(Velocity)快、数据价值(Value)高等,符合大数据的“4V”特征,即边检情报工作可利用的数据资源完全可以支撑大数据技术的应用。因此,边检机关具备以大数据思维创新边检情报工作的基础,能够充分利用大数据技术高效挖掘边检机关所掌握的数据核心价值,提高边检勤务效能。
三、基于大数据应用的边检信息工作创新路径
(一)树立边检信息大数据发展理念
大数据技术是目前数据应用技术的集大成者,其智能与高效的特点,强大的知识发现和预测功能都将从根本上变革边检信息工作的模式,提高边检工作效能。大数据不仅是一场技术变革,也是一场思想观念的变革。尽管目前边检信息工作现状与大数据的要求和标准有很大的差距,但是,大数据技术在信息分析领域的天然优势要求边检机关应该着眼未来,树立边检信息工作大数据发展理念。边检信息工作的大数据发展理念就是以数据为中心,用数据说话,将数据采集和应用工作置于边检工作的重要位置,以量化的、科学的数据分析挖掘结果为基础开展边检信息工作。大数据的应用不能一蹴而就,边检机关应以业务需求为出发点,根据自身数据资源和数据应用水平的现状,逐步推进大数据技术在边检信息工作中的应用。
(二)培育金字塔型数据分析人才队伍
边检业务数据的涉密性决定了边检机关业务数据应用中部分具体数据的分析挖掘不能完全委托相关专业企业完成,培养边检机关自己的数据分析专业人才是基于大数据应用的边检信息工作创新的首要任务。边检数据分析人才需要具备数据科学的基本知识和技能,同时对边检业务工作有实际操作经验和正确的认识,能够正确地理解和分析边检业务需求及业务数据,正确解读数据分析挖掘的结果。边检数据分析人才的培养管理机制以金字塔型为宜,通过细化分工和科学划分等级。例如,可以根据边检数据分析员对数据分析挖掘技术的掌握程度及对业务的理解水平,分为三个等级,三个等级的划分不仅可以作为定岗定责标准,也可以作为边检业务数据分析员的培养和进阶标准。具体如下:
一是初级边检数据分析员。主要从事日常例行的边检业务数据排查和分析,要求能很好地理解边检业务,掌握概率论和统计理论基础,能够熟练运用Excel、SPSS、SAS等专业分析软件,能够根据边检业务问题利用常用数据分析方法进行边检业务数据指标的选择和数据的处理与分析。
二是中级边检数据分析员。专门负责在边检业务数据分析与挖掘基础上建立预测预警模型,定期提交对边检业务有指导意义的数据分析或口岸形势预警信息。应该在初级边检数据分析员的基础上掌握更多的多元统计、时间序列等数据挖掘数据算法,熟练运用SPSS、SAS、Matlab等专门分析软件,能够应用SQL、R语言访问边检业务数据库,能够根据边检业务需求进行合理的建模分析,或者掌握JAVA语言和linux操作系统知识,能够掌握运用Hadoop、Spark、Storm等专业大数据分析软件,能够从海量数据中提取有用的信息。
三是高级边检数据分析员。可以担任边检和数据分析工作的具体领导职务,带领初级、中级边检数据分析员完成不同主题的边检信息分析。要求掌握中级分析员具备的所有技能,同时对边检业务和数据分析挖掘技术都有敏感的洞察力和判断力,能够为边检情报工作提供全面的数据支持。
(三)建立边检大数据信息平台
提高边检工作效率和管控能力,根本在于提高对出入境人员危险程度的信息研判能力和效率。出入境人员风险的信息研判过程是一个将出入境人员由未知状态转化为已知状态的过程,即大量积累、关联、分析和挖掘与出入境人员相关数据的过程。根据这一边检业务需求特点,边检机关可以在全国范围内建设以每一名具体出入境人员为信息研判目标的边检大数据信息平台。该平台应该以历年全国边检业务数据为基础,以每一名出入境人员为分析挖掘对象,整合与出入境人员相关的所有数据资源,为出入境人员动态风险评估提供数据、模型、软硬件基础和大数据技术的支持。
在边检大数据信息平台上,边检数据分析人员针对不同类型的出入境人员分别设计评估模型,对新入库(预检预录入库或验放入库)出入境人员按照既定设计自动进行信息分析,实时给出的风险等级评分,供前台检查人员或案件审理人员参照使用。对于低风险出入境人员可以简化对其的出入境查验,并允许其使用自助通关等自助化查验通道,提高其通关效率。对于风险评分较高的人员根据评分情况进行有针对性的进一步查验。
笔者认为,出入境人员动态风险评估模型设计的逻辑思路可以这样设定:首先,对于每一位出入境旅客在全国范围内进行出入境记录的出入境匹配,作为出入境人员分析的基础。对于中国公民,可以在匹配其历次出入境记录的基础上,分析其出入境轨迹,据此进行风险分类。对于短期出境游或商务旅行的出入境中国公民归为低风险类别;对于在境外停留时间较长的人员进行进一步分析,其中在国外定居或者有固定职业的驻外人员也可以归为低风险类;对于长期停留或者经常出入涉恐等敏感地区的人员设为风险等级高的类别。对于高风险中国公民,在其出入境时或之前予以针对性的重点关注,必要的情况下可以通知相关单位协助核查。这样的分析挖掘对于预防监控国际恐怖势力的渗透有积极的意义。其次,对于外国人,可以在匹配其历次出入境记录的基础上,入境时根据其API、PNR等数据的完整性、是否有可靠的个人申报信息、签证信息、以往的出入境记录等项目进行加权计算,计算其风险指数。对于中国永久居民、入境记录良好、有可靠的申报信息、有稳定雇佣单位或经教育部门备案的学生等可设为低风险外国人;对于搭乘不合理航班或重点航线、初次入境且身份证明或不充分或有过不良出入境记录的外国人设为高风险类别,对其实施重点检查。
更为可行的设计思路应该综合以往入境人员规律反复推敲,使逻辑更为严密、分类更为精细。相信随着数据量和计算经验的积累,包括人工智能在内的大数据技术的引入应用,边检机关的出入境人员动态风险评估的智能程度和准确度必将持续提高。
(四)与地方公安机关开展数据共享和技术合作
随着金盾二期工程的完成,地市级公安机关建成了城市公安综合信息系统和各级大情报系统,实现了信息的综合采集、管理和利用。公安机关基于信息化的信息技术已经可以针对新型犯罪、传统犯罪、关注人群犯罪和日常行政管理等建立信息研判分析模型[8]。在后金盾时代,多地公安机关都在以“加强大数据、云计算和物联网等新技术的研发与应用,提升公安信息化的层次和水平”[9]的思路开展大数据建设工作。与边检机关相比,地方公安机关在信息工作方面具有数据种类和技术水平的优势,在大数据应用方面具有规模优势和先发优势。在业务上,边检机关与地方公安机关在涉外管理领域有天然的合作机制基础,各自掌握的信息互补性强,具备开展合作的条件。双方通过开展大数据共享和技术合作,边检机关更能够借此发挥后发优势,快速提高大数据信息工作的效能。
[1]公安部:上海、江苏、浙江三省(市)实施部分国家人员144小时过境免签政策[EB/OL].(2016-01-26)[2016-04-06]. http://www.gov.cn/xinwen/2016-01/26/content_5036251.htm.
[2]姜涛.外国人72小时过境免签边检问题探析[J].武警学院学报2015,31(1)20-23.
[3]刘慧.中国国家安全研究报告(2014)[R].北京:社会科学文献出版社,2014:99.
[4]数百比利时人赴叙加入极端组织或回本土发动恐袭[EB/OL].(2015-05-15)[2016-04-06].http://www.chinanews. com/gj/2015/05-15/7279830.shtml.
[5]最高检反贪总局:61名在逃贪官归案47人被劝返[EB/OL].(2015-04-27)[2016-04-06].http://news.cnr.cn/native/ gd/20150427/t20150427_518406294.shtml.
[6]王辉耀.中国移民报告(2015)[R].北京:社会科学文献出版社,2015:32.
[7]王国良.出入境边防检查学[M].北京:中国人民公安大学出版社,2011:262.
[8]王电.公安信息化概论[M].北京:清华大学出版社,2011:203.
[9]公安部.杨焕宁在公安部金盾二期工程竣工验收会上要求:进一步巩固扩大成果,在新起点上提升公安信息化建设水平[N].人民公安报,2015-01-16(1).
责任编辑:蒋玉莲
Research on Innovation of Immigration Inspection under the Background of Big Data Era
HE Ling-ju
(BeijingImmigration Inspection Station,Beijing100621,China)
The present immigration inspection calls for introduction of big data technology so as to innovate the immigration information work mode.The big data resources for immigration information work conforms with 4V features of big data,providing preconditions for introduction of big data technology.The approaches for innovating the immigration information work include establishment of the immigration information data development idea,cultivation of the pyramid-shaped immigration data analysis talent team,creation of big data information platform for dynamic assessment ofentry-exit personnel risk,bigData sharingand cooperation with local public securityorgans.
bigdata era;immigration inspection;intelligence service;innovation
D631.46
A
1008-9438(2016)04-0097-05
2015-05-03
http://www.cnki.net/kcms/detail/45.1333.D.20160729.1503.036.html
何令举(1986-),女,山东临沂人,北京出入境边防检查总站一级警司,中国人民武装警察部队学院研究生部,主要从事边防学研究。