APP下载

经济犯罪数据化侦查研究

2021-12-26

辽宁警察学院学报 2021年6期
关键词:研判算法

李 丽

(山西警察学院 侦查系,山西 太原 030401)

科技改变生活。随着互联网、云计算、大数据、人工智能、区块链和5G 等科技的飞速发展,全球已步入信息化时代,即将引发继蒸汽机革命、电气革命、生物科技与产业革命之后的第四次工业革命的“数据”,已成为社会第一生产力,是国家和社会的命脉。如何借助和应用以数据为核心的现代科技,挖掘数据价值、释放数据动能,创新技战法,提高核心战斗力,成为经侦领域的迫切需求。

一、新形势下经侦工作面临的挑战

社会信息化是一把“双刃剑”,在颠覆人们生活方式的同时,也为不法分子提供了经济犯罪便利,突破了时间和空间的限制,日趋升级化、产业化、智能化、网络化,社会危害极大,成为社会治理的难点。

(一)犯罪线索发现难

经济犯罪本质上属于经济业务,与正常经济业务行为存在很多共同点,与合法经济行为的边界难以划分,极具迷惑性。在当前国家经济飞速发展、经济形态不断创新的背景下,尤其在金融领域,近年来乱象频发,创新“走样”而脱离了经济金融的本质,滋生了许多以创新发展名义出现的违法犯罪活动,极具衍变性。这些新型经济犯罪一旦搭上了“互联网”的快车,发展速度极快,再加上专业化作案手段的掩护,隐蔽性更强。网络“黑灰产业链”为各种上游犯罪提供了职业化的中间服务,打通了犯罪渠道,作案更加便捷性。为逃避国内监管和法律打击,犯罪团伙跨区域作案甚至将犯罪链条延伸至境外。以上多种原因导致经济犯罪案件线索难以发现,经侦部门应急处置多,主动发现少。

(二)犯罪过程还原难

在魔道争高的较量中,嫌疑人为了逃避监管打击,不断发展反侦查措施。有的在境外注册,嫌疑人取得外国公民身份来隐蔽身份;有的刻意拉长犯罪链条,增加中间环节致使犯罪意图识别难;有的利用虚拟货币切断资金脉络造成资金流向、违法所得还原难,如在虚拟货币传销案中,虚拟货币不存在交易账号和交易流水,参与人员是谁、在其中起什么作用、涉案资金流向何处,传统的侦查方式根本无从查证;有的设计复杂的电子交易平台程序[1],致使电子交易平台规则、交易模式还原难;有的跨地域广、受害群体分散,团伙内部组织相对独立,分散在国内多个省市地区,调查取证成本过高;有的案情复杂、办案周期长,多有证据灭失现象。再加上很多重要资料都存放于服务器上甚至是境外的服务器上,电子证据虚拟性、不稳定性和技术性导致电子证据获取难等问题,使案漏人、人漏罪等现象时有发生。

(三)嫌疑人口供突破难

经济犯罪的实施以经济行为作掩护,较易混同于正常经济业务,与一般经济纠纷难以区分,嫌疑人常常否认犯罪故意,狡辩其行为是经济纠纷。随着国家经济金融的不断推陈出新,经济金融创新元素和创新形态成为新型经济犯罪觊觎的重点对象,如证券期货市场相关犯罪,涉及的产品从股票、期货发展到私募债券、期权,作案领域也由主板、创业板、中小板向新三板市场和跨境、跨市场犯罪蔓延,嫌疑人有的试图从技术角度狡辩其行为是经济金融创新形态,有的仗着“行家里手”的专业知识通谋串供,如内幕交易、利用未公开信息交易等案件中,信息传递方、接收方极易形成攻守同盟,“零口供”对抗。在国家鼓励“大众创业、万众创新”的背景下,经济犯罪主观故意的认定更是难上加难,嫌疑人多数侥幸心理严重,致使罪名认定难,如某海关缉私局2018 年办理的涉税涉私案件中,不能认定为走私犯罪的首因即为行为人主观故意认定难,只能以行政处罚方式结案。[2]

(四)犯罪网络摧毁难

数字技术和通信技术为经济犯罪的蔓延提供了现实基础,从显性的侵害式犯罪到隐匿的服务式犯罪,从一对一的单点犯罪到一对多的撒网式犯罪,经济犯罪迅速从个体作案发展为涵盖上下游犯罪、提供“一条龙”服务的全链条式作案,再发展为多种犯罪相交织、盘根错节的犯罪网络,借着信息传导极速的网络通道,作案手段愈发专业化,反侦查行为愈发效率化。如新型涉网经济犯罪利用区块链技术的匿名性去中心化,利用数字货币为交易媒介,来躲避监管和打击。职业犯罪团伙有的雇用并包装他人甚至外籍人员为“傀儡创始人”,有的利用虚拟平台、虚拟账号阻断身份识别,有的利用虚拟IP 地址、虚拟电话号码隐蔽犯罪窝点和藏身之处[3],团伙主犯隐藏在幕后遥控指挥,一有风吹草动,即刻逃往他地,“招兵买马”重操旧业,很难彻底摧毁,造成经济犯罪打不尽、打不绝的态势。例如2020年3 月盐城破获的“Plus Token”传销案,平台创始人之一王某虎就是常州警方2017 年7 月打掉的“珺腾国际”特大网络传销案的漏网之鱼,在其主要传销头目获刑次月,便伙同他人组建“Plus Token”传销组织。[4]

(五)追赃挽损难,涉稳风险加剧

近年来,非法集资等涉众风险型经济案件日渐趋于网络化,涉及的地域更广、金额更大、受害人更多。然而此类犯罪案值虽高,能追回的赃款却寥寥无几。究其原因,首先是嫌疑人为吸引投资人,重金召开发布会、高额奖励员工、组织大客户免费旅游,开销巨大。以“Plus Token”传销案为例,最高等级账户奖励一年150 万美金以上,收取的数字货币大部分用于发放了“拉人头”奖励。[5]其次是这些不义之财来的太过容易,嫌疑人挥霍无度,如日照破获的“11·26”特大虚开增值税专用发票案,主犯曾一夜打赏网络女主播9700 万元。[6]再次是犯罪团伙计划周密,在非法获取资金的同时,就隐匿和转移资金,一旦平台暴雷立即潜逃甚至藏身于境外。最后是侦查的滞后性,公安部门介入案件时,可能已经平台关闭、服务器损毁、人去楼空,即便抓获或从境外遣返主要嫌疑人,能追回的赃款所剩无几。案件参与者中闲散人员居多,如老年人、大学生、下岗工人、家庭妇女等,他们为了减轻家庭负担,希望以此赚钱却面临整个家庭垮掉的风险,其不满情绪就会直接指向公安等党政部门,极易发生上访闹访甚至聚众闹事等过激行为。在网络空间,由于网络谣言、网络舆论的放大和加剧,极易发生网络集群事件,可能引发社会风险甚至上升为政治风险。

二、数据化背景提供经侦转型契机

在我国数字经济飞速发展的同时,电子政务也从信息化、网络化阶段迈向数字化阶段,数字化程度空前发展。2021 年3 月11 日国家“十四五规划”和“2035 年远景目标”,更是专篇论述了“加快数字化发展,建设数字中国”,数字经济、数字社会和数字政府建设等方面将高速发展,并带来生产、生活和治理方式的根本性转变。

(一)经济主体信息数据化

自1987 年1 月24 日国家经济信息中心成立开始,到“三金工程”“两网四库十二金”等标志性工程的建成;从2017 年2 月,首个省级大数据局在贵州成立,到2018 年底,超过23 省、200 地市相继成立大数据管理部门,再到 2019年11 月,全国政务服务一体化平台上线,电子政务工作全面数据化。至此,公司企业的法人信息留存于市场监管部门;财务、税务、社保数据留存于税务、审计等部门;自然人身份信息、行为轨迹信息、车辆信息留存于公安、公共交通、旅店饭店等部门;资金、证券、期货信息留存于银行、证券公司等金融机构;经济主体的行政违法行为信息也留于相应的行政管理机构中,为发现犯罪线索、查找犯罪源头提供了数据渠道。

(二)经济犯罪过程数据化

随着网络和电子设备的普及和广泛应用,人类所有的社会活动几乎都延伸到互联网,互联网虚拟空间犹如现实的镜像和延续,根据物质交换原理,现实空间“社会人”的行为、思想转换在虚拟空间,呈现为“数字人”的一系列数据。经济犯罪活动从预谋到实施,嫌疑人通联时间、内容、频次都以数据的形式存在于网络社交平台中;涉案资金的获取、流转、挥霍、转移数据留痕于银行、证券公司等金融机构或者网络结算平台中;涉案物品的流动数据留痕于快递、物流等媒介中。数据之间的关联架起了虚拟空间与现实空间的桥梁,为重建犯罪现场、还原犯罪过程提供了数据途径。

(三)嫌疑人社会关联数据化

社会属性是人的本质属性,当今网络化时代也并未改变这一属性,因此,不论嫌疑人有多强的反侦查意识,还是与社会有着千丝万缕的联系。这些联系在以往是难以被捕捉到的,然而在当今“万物互联”的大数据时代,“世界是普遍联系的”这一唯物辩证主义哲学原理,能够由数据牵线得以快速印证。利用知识图谱技术可层层挖掘人员关系网,发掘关系属性,融合关键特征构建人员信息一张网;收集嫌疑人及其公司特征,构建人员或公司多维度数据画像,还原其社会活动的样貌,为案件突破指引方向;只要嫌疑人在装有监控设施的场所出现或使用通讯工具,人脸识别数据或通讯数据将代替人工盯控模式高效精准锁定其位置,为抓捕或采取下一步侦查措施提供奠定坚实的基础。

三、经济犯罪数据化侦查的应用

在这场没有硝烟的斗争中,谁掌握的数据更多、更快、更准,谁的战斗力和主动性就越强。于是,公安部经侦局于2016 年提出“信息化建设、数据化实战”的战略部署,借助大数据等现代科学技术,开启了经济犯罪数据化侦查的全新征程,经侦工作从作战理念思维到打击手段措施、从战术战法到警务机制实现了“智”的飞跃。

(一)搭建信息平台汇聚数据资源

数据是指记录和区分客观事件的符号。[7]在经侦工作中,数据具有多种表现形式和内容,既包括狭义的数字,也包括有意义的单词、字母、图形、图像、视频和音频。想要让这些数据发挥作用,就需要体系化的数据运作模式。公安部经侦局现已建成常州、烟台两个数据导侦战略中心,上海、辽宁、青岛、深圳、重庆等10 个证券、骗税犯罪办案基地,开发运用了“云端行动系统”“经侦云应用”“违法资金查控平台”等数据系统,更多数据平台正在加快建设中。各省、市广建地方平台,如湖南“神鹰”实战平台、石家庄“昆仑镜”“玲珑塔”“玄天伞”实战平台等。各平台通联公安内部信息资源库、社会行业信息资源库,互联网信息资源库,运用各类前沿感知技术,如人像、车牌、Wi-Fi 等前端多维感知设备,实现各类数据的智能化采集、存储,广泛获取数据资源,构建了鲜活的数据超市。如潍坊地区目前整合各类系统平台140 余个,实现20 个维度、20 亿条标准化数据的融合接入,构建了数据高地。[8]

(二)开发数据模型挖掘数据价值

数据就像是原材料,它只是描述发生了什么事情,数据本身不会自动发挥作用而构成决策或行动的基础,需要经过分析、处理找出其中的关系,赋予其意义和关联,数据才能转化成有价值的信息,[9]服务于经侦工作。类罪模型是给数据增值的有效武器。类罪模型也称为“算法”型侦查,即提炼并数据化描述类案的行为特点和类罪特征,结合实战中行之有效的侦查技战法,设计为计算机“算法”,进行数据的比对、碰撞、关联和数据挖掘工作,从而拓展案件线索,锁定侦查目标。公安部经侦局已建成类罪模型数十个,各地市根据地方特色和实战经验,自主研发类罪模型和通用数据工具,大幅度地提升了数据研判的深度及风险预判预警的精度。以虚开案件的研判为例,可综合运用“企业基因测序模型”“反洗钱模型”“中间人开票模型”“虚开骗税识别模型”,对可疑票据流、资金流、通讯流、货物流、信息流数据进行深度挖掘和关联,找出可疑开票人、售票人、中间人,以及溯源至开票或者制售假票的源头。

(三)创新作战机制释放数据效能

“云端打击”机制一改变过去下达简单行政命令为在数据挖掘基础上发起的集群战役,集数据支撑和模型工具于一体,决策体系正在由领导者决策转向由数据引领决策。经侦作战体系经过几年实践,纵向上逐步形成省级监测、地市级研判、区县级落地打击的三级作战新格局,各级警力和资源的使用向科学配置迈进;横向上内联刑侦、技侦、网侦、情报等部门,纵向上外联税务、海关、银行等机构合成作战,数据协同的作战格局正在构建。数据化侦查培训改过去的课堂讲授为以战带训,以公安部经侦局自2017 年起每年举行的“论剑”情报导侦大比武为契机,多省市举办各类数据赋能的实战练兵竞赛等战训结合的数据应用培训,用数据说话的经侦技战法不断创新,经侦部门数据应用能力大幅提升。

四、经济犯罪数据化侦查的思考

以数据研判为核心的数据化侦查模式取得了辉煌的战果,然而作为新生代战法,经济犯罪数据化侦查现阶段存在着一些障碍,亟待克服。

(一)经济犯罪数据化侦查的障碍

1.数据资源尚不完全

一是部门间存在数据壁垒。由于体制机制的束缚,银行、证券、税务、海关等行业数据等不能完全共享,公安机关内部警种间数据资源不能互相开放,各地经侦部门的地方数据平台各自独立,不能相互访问。二是数据的前端采集不全面。以目前可获取的资金数据为例,第四方支付和部分第三方支付平台的数据采集缺失,银行、金融机构的资金信息不全面,缺失银行保险柜等非现金资产数据。三是数据采集录入缺乏统一标准、数据质量不高。[10]如各银行资金数据格式不一,有的银行对手信息等字段项缺失。

2.数据工具使用效率不高

数据平台方面,各平台、系统相对独立,所使用的开发工具,数据结构,操作系统都不尽相同,造成数据之间口径不一,格式不同,难以有效对接,再加上业务定位和网络安全等原因,形成数据壁垒,迫使研判人员在各系统间来回查询,加高了研判的门槛、工作量、工作难度和出错率,不利于各地、各级经侦部门之间的协查和协作。实践证明,只有实现全量公安数据和业务系统的整合,才能释放公安大数据的全部潜能,发挥综合效益。

数据模型方面,在种类上尚未覆盖经侦全领域,战术性研判多、战略性研判少;[11]在设计上分领域研判多,不能智能互联进行全领域综合研判;在统筹规划上,各地数据模型不能互通互用,存在重复开发,资源浪费,使用效率低等问题;在开发上业务与技术“两张皮”,经侦部门与软件公司之间,侦查要求与技术研发的精准融合度存在偏差;[12]在应用上,存在建用脱节现象。部局模型由于一些县级经侦部门使用权限、民警数据能力的限制,存在用不上、不会用等问题。

3.算法偏差与黑箱效应

算法在开发、使用、执行中的机械性可能产生信息偏差,误导侦查方向与结论。首先,算法承载着制定者的价值判断,[13]目前其开发依赖于数据研发公司,数据技术人员并不具备侦查、法律专业知识,设计算法时易带入个人偏见[10],出现系统性偏差风险,可能导致算法结果不正确。其次,算法在应用中,由于数据清洗、数据分析方法选择不同,相同数据源由不同的人员操作会出现结果差异,甚至同一人再次操作结果也可能不尽相同,算法结果不具有唯一性。再次,算法中机器学习时自动调整运算参数的设置,数据输入与输出之间存在人们无法洞悉的黑箱问题,[14]计算出的结论连设计者可能也难以解释。最后,算法是在总结过去犯罪规律的基础上提炼出来的,对于特殊情况可能出现算法结果失真,对于新出现的作案手段则不具备识别功能。

4.民警数据应用能力不足

数据化实战的推广和应用,经侦民警的数据意识得到有效提升,然而数据应用能力却跟不上数据化经侦的需求。一是就全国各地经侦数据建设情况看,存在上热下冷、[11]重建设轻应用等问题,基层经侦民警接触、使用数据工具、模型的机会并不多,数据实操能力难以得到锻炼。二是从目前经侦民警的专业结构和录用机制看,专业型数据分析民警严重短缺,数据深度挖掘较为依赖数据公司。三是以网络为依托的经济案件多以电子数据形式存在,其易篡改性、易灭失性对证据的现场收集、提取、网络在线提取、网络远程勘验[15]等提出更高的要求,经侦民警电子取证能力尚待提高。

5.数据分析结论未能证据化

实战中,借助数据模型与机器学习等方法对海量数据进行研判、形成分析报告、用作办案支撑[16]的情形越来越多,然而目前数据分析结果只能作为侦查线索使用,不能直接作为证据使用,取证还得走繁锁的人工调证流程,将数据材料转化为传统证据。如通过资金查控平台调取的电子数据,没有加盖银行电子签章,要想作为证据使用,还得到各相关银行手工调证。目前,一些经济案件证据动辄达数千卷,这种以转化性证据办案的模式,不仅费时费力,侦查效率低下,并且可能出现时过境迁导致证据灭失等情况。

(二)经济犯罪数据化侦查的发展建议

1.开拓数据渠道,提高数据质量

数据源的完全程度、准确程度是算法准确性的重要决定因素。因此,要在优化已有数据通道的基础上,不断开拓新的数据通道,同时拓展数据的可用维度,提高数据质量和反馈速度。[11]首先,打通数据壁垒,通联信息孤岛。在外部,加强与市场监管、税务、金融、证券、保险、外汇、海关等行政部门的合作,破除行政屏障,打通数据通道。在内部,开放各警种的数据资源,共享各地方经侦数据资源。其次,拓展前端采集渠道和采集维度。随着智慧城市建设,延伸前端感知网络触角,不断向新领域、新业态、新要素拓宽数据采集广度深度,如拓宽资金的采集范围至理财产品、银行保险箱、有价证券、股权期权等资产。积极与大数据公司合作,广泛获取反映社会行为等互联网开源数据。如山西省公安厅侦办善某金融非法集资案时,在北京金信网银金融信息服务有限公司的技术支持下,采集到了善某金融的业务模式、组织架构、历史情况等重要数据。[17]三是统一数据采集录入标准、提高数据质量。“数同标”是信息标准化录入的前提,正如车同轨、书同文,通过给信息贴上标准化的标签,一方面解决了数据录入不全、重复采集等问题,提高了数据质量;另一方面,为将来数据自动关联、同步交互式更新奠定基础。[18]

2.创新、优化、释放数据工具动能

在数据系统方面,形成纵向贯通、横向集成、互通共享的信息大厦。由公安部经侦局牵头,架构“全国数据经侦大厦”,纵向上四级建库。第一级为部级系统,嵌入部级数据系统和类罪模型,按权限共享给各地、各级经侦部门。第二级到第四级依次为省级、地市级和县级平台,分别配置“数据房间”“数据区间”和“数据格”,对应采集各级公共基础信息数据,按各级标准数据平台模板运行,可嵌入地方特色的数据包、自行研发的类罪模型和数据工具,运营良好则上升到上一级平台。“全国数据经侦大厦”涵盖公安所有的人、车、电、网、像等业务系统数据,自动关联研判对象的所有社会数据,统一数据口径、标准、入口及出口,一键秒级查询,覆盖全国经侦业务,实现线索倍增和数据价值的倍增。

数据模型方面,一是推进数据模型工具谱系建设,[11]提升数据流引领业务流的效能。首先,加快空白领域的数据模型开发,在数据模型的种类上不留死角地覆盖经侦全领域。其次,优化现有模型的设计操作,由战术性研判转向战略性研判。最后,探索各领域数据模型智能互联、综合研判之技术,由分领域研判转向全领域研判。二是开放部局数据模型的基层使用权限,实现各地数据模型互通互用,提高其使用效率。

3.提高算法的准确性、通用性

算法偏见是其固有特征,[19]不可能完全消失,但是可以通过程序设置和操作流程规范化,减少其运算结果的信息偏差。首先,在算法开发时,设定标准化数据清洗程序,统一算法的数据接入口径;增设机器学习时自动调整参数的运算过程显示及解释程序,[10]以利于发挥算法应用人员的主观性,减少黑箱效应。其次,在算法应用中,秉持批判性思维审视算法的运行,通过电子数据侦查实验[20]等方式,效验检测算法偏见并及时修正,提高算法的精准性。再次,标准化算法操作流程,力争消除算法因操作人员不同而异的情形,提高算法的通用性。最后,加强对新型经济形态和经济风险的研究,在对有关部门进行漏洞堵塞建议的基础上,设计算法时预留特殊情况、异常情况识别摘出通道,转入专用研判程序或者人工研判,减少特殊情况算法结果偏差,预防新型作案手段得逞。

4.提升民警数据应用能力

一是在数据平台和数据模型建设上,秉承用户思维,优化平台设计,改善操作界面,开放数据权限,普及数据应用,让基层民警的数据运用在用中学、学中用,解决不敢用、不会用、用不好等问题,提高民警的数据敏感性、数据实操能力以及数据学习和应用的主动性,真正将数据引领作用发挥到每一个办案环节中。二是选拔数据人才。选调专业数据人才充实经侦队伍,并培养经侦职业能力,选拔基层经侦业务骨干到部局、省厅情报研判机构跟班学习。三是加强数据能力培训。一方面,以“论剑”大比武为契机开展多层面的以战代训,开展数据研判精品案例讲评,开展数据研判人员数据开发和维护、基层民警数据基本应用等培训。另一方面,加强电子数据取证培训。规范民警对原始电子证据的现场收集提取、网络在线提取、调取等操作,训练减少电子证据的真实性瑕疵,提高民警数据完整性保护技术和网络远程勘验等技能。

5.加速数据分析结论证据转化进程

基于海量数据的分析报告,通过可视化技术能够快速直观地展现犯罪团伙架构、资金流转过程等核心要素,依靠海量数据分析来证明案件事实已经成为形势所需。因此,加速数据分析结论的证据转化,对于提高侦查效益、化解司法证明难题将大有裨益。首先,赋予数据分析结论以独立证据的法律地位。数据分析结论属于何种法定证据理论界观点各异,“证人证言说”“鉴定意见说”“专家辅助人意见说”[16]都不足以体现其优势和作用,数据分析结论作为单独的证据种类更为适宜。其次,制定出台数据分析结论证据转化的系列规则,包括数据来源真实性、数据传输保真性、机器算法可信性、数据程序操作人员公正性等规则。最后,提高数据分析技术,加强数据治理。引入区块链等技术,提高数据来源的真实性、数据传输的保真性、机器算法的可信性。构建科学的数据治理体系,对数据质量的管理、数据血缘关系、数据运维管理等方面进行智能化管理,[21]提高数据的全面性、完整性、准确性、可用性和安全性。

五、结语

经侦1.0 时代已经过去。“互联网+”开启了经侦2.0 时代,数据库查询、检索、运算,取代了时效差、效率低的手工检索比对模式。以数据挖掘技术为核心的经侦 3.0 时代,数据平台建设、模型算法研发开启了经侦“信息化建设、数据化实战”模式,平台实时监控、机器自主学习、数据自动关联运算,数据的无穷魅力开始展现。随着科技的进步和经侦作战模式的不断优化,经侦4.0 时代将全面迎来数据警务和智慧经侦。

猜你喜欢

研判算法
南京市2017年至2019年道路交通死亡事故分析与研判
市场研判 不确定因素困扰市场
哪种算法简便
国外软件定义卫星发展态势与影响研判
全球低轨卫星网络最新态势研判
抑制OFDM系统峰均比的DHT-SCF联合算法
基于Lévy飞行的一种改进鲸鱼算法
研判当前货币政策走势的“量”与“价”
研判当前货币政策的“变”与“不变”
Travellng thg World Full—time for Rree