APP下载

融合网络数据的侦查画像技术相关问题研究

2022-12-09张蕾华张惠绒

关键词:犯罪人刻画画像

张蕾华, 张惠绒

(山西警察学院侦查系,山西太原 030401)

0 引言

侦查画像是公安机关推进侦查工作的重要技术手段。公安机关在侦查破案过程中根据已获得情报和线索对犯罪嫌疑人进行描述和刻画,以此作为寻找和确认犯罪人的依据。它包括人脸模拟画像、犯罪地理画像和犯罪心理画像3个阶段。人脸模拟画像技术最早运用在案件侦破过程中,它是依据现场目击者的语言描述,对犯罪嫌疑人的面部特征进行描绘从而识别锁定犯罪嫌疑人的一种手段。随着技术发展出现了计算机智能人脸模拟画像,其原理是基于事先储存的大量人脸各部位模板,通过计算机图像处理功能进行不断调整和组合,形成与犯罪嫌疑人高度契合的人脸图像[1]。其次是犯罪地理画像技术。犯罪地理画像是对犯罪人地缘关系的一种刻画,通常适用于系列杀人、强奸案件,将系列案件的发生地标注在地图上进行分析,进而推断犯罪人的居住地点、经常出行地点和可能再次作案的地点[2]。有学者提出犯罪地理画像不仅可以分析系列案件犯罪嫌疑人的地缘关系,也可以运用于杀人分尸抛尸案件,警方可以通过多个抛尸地点在空间位置关系来查找第一杀人现场[3]。犯罪心理画像技术是根据已掌握情况对犯罪嫌疑人进行相关行为、心理过程、动机的综合分析,形成对犯罪嫌疑人形象和心理特征群的描述[4]。这是唯一持续至今仍然广为使用的一种侦查技术手段。在西方,犯罪心理画像有多种称谓:犯罪人画像、行为画像、地理画像、犯罪人格画像等[5]。犯罪心理画像技术是基于犯罪嫌疑人的作案手段和现场痕迹推断其犯罪心理、行为习惯乃至其他社会特征。这也是侦查画像技术的重大发展。

1 研究背景

社会环境层面。进入网络信息社会,尤其2020年疫情以来,大数据技术渗透进人们的日常生活和工作也因此储备了海量的数据。对于公安机关来讲,数据也已经成为公安情报工作的研究对象[6]。海量的数据中包含大量有关生活轨迹、兴趣爱好、日常习惯的信息,电商可以通过这些数据信息进行人员刻画进而制定精准营销策略。同理,公安机关可以利用这些信息对业务对象进行多维的刻画,分析其个人属性、性格爱好、经济基础、消费水平等特征。

技术发展层面。信息科技的发展已经使人类具备存储并分析挖掘海量数据潜在价值的技术,“元宇宙”被称为是互联网的下一个发展阶段,人们普遍认为终极的“元宇宙”将联通物理世界和数字世界,是未来的生活方式。支撑“元宇宙”的技术基础已经具备[7]。它不仅产生和存储数据,而且能够对数据进行有效的分析挖掘,是进行数据画像依托的技术基础。

2 融合网络数据侦查画像的技术原理

2.1 网络空间的物质性原理——上网留痕

(1)网络数据广泛存在。人们在搜索资料、浏览网页、网络社交、网上购物的时候会留下相应的数据痕迹,这些几乎覆盖线上线下的数据可以反映个人出行、消费、社交等特征,公安机关通过分析这些数据就可以挖掘有关其性别、社交性格、行为状态,构建初步的特征画像,将这些数据整合分析就可以刻画出行为轨迹,进而分析是否和犯罪有关联[8]。

(2)网络数据形态多样。从数据来源看,有来自不同部门和领域的数据,如交通数据、气象数据、传感器感知数据;从数据形态来看,有文本数据、影像数据、语音数据;从数据结构来看,有结构化数据、非结构化数据,还有半结构化数据;从数据种类来看,有网约车、共享单车的出行数据,有外卖的地理空间数据,有银行网贷的金融数据,有移动支付的消费数据,等等。这些多源、异构、海量的数据为进行业务对象画像、数据建模、行为预测提供了广泛和多维度的资源。

(3)网络数据即时动态。现实社会人们的交往行为具有“在场性”特点,但同时呈现出“去场化”和虚拟性的特点,人们可以随时随地与身在全球各地的其他个体进行沟通交流,而且所获得的数据都是实时动态的[9]。侦查工作中,时间和空间是非常重要的两个要素,而这些即时动态的数据能够为侦查画像技术提供时间和空间维度的标准。

2.2 网络和现实的一一对应——镜像原理

现实行为和网络活动之间存在紧密的一一映射关系,所以现实社会与网络空间是一种镜像关系,每一个现实社会当中的人都可以在网络空间中找到与自己相对应的“数据人”[10]。侦查人员能够根据现实空间的人和事物去搜寻与其对应的数据形式,还可以通过该数据形式分析出行为轨迹与心理特征等信息,再折回现实空间形成目标人的数据画像。

(1)能够实现从静态特征到动态轨迹的刻画。传统的犯罪人画像常常是一个人个人属性描述,性别、年龄、相貌、文化程度……这些信息是相对静态和稳定的。在融合网络数据的侦查画像技术中,更多的过程数据开始被利用对人员进行动态描摹,这就突破了仅依据个人特征数据静态构建模型的限制。借助网络动态大数据分析,可以发现犯罪人的行为特点及行为轨迹,进而构建类案犯罪行为的数据画像,就能够实现对犯罪特异行为的快速识别和情报预警。

(2)能够实现从简单特征到多维影像的刻画。传统案件侦查中,囿于犯罪现场和侦查员所掌握的信息,对犯罪人的描绘常常是性别、年龄、身高等简单的个人属性特征,而融合网络数据的侦查画像技术还可以拓展侦查对象的心理特征、爱好习惯、个性情感进行多维的描述。

(3)能够实现从模糊描述到精确刻画。海量数据的挖掘技术能够实现更精准的人员刻画,画像可描述的特征越来越丰富,并可以将目标人的所有特征、行为都进行数据化的表示。

2.3 数据科学的引入——数据精算思想

在大数据的时代背景下,侦查画像应具有传统犯罪画像和数据精算分析技术的双重特点。精算思想以概率统计为基础,一直应用于保险领域,如今正逐步向其他行业领域拓展。对风险的量化分析是其核心,对于不确定性的分析是精算研究的主要内容[11]。数据精算理论在侦查工作中深入应用可以有效解决海量数据带给人们数据爆炸的困惑。

(1)能够实现从被动分析到主动预测。精算思想的核心是“预”,引入精算思想的侦查画像技术不仅仅停留在案件发生之后的案情“解读”,还应该有罪案发生前期的“预测”。融合网络数据的侦查画像除了具备传统画像的功效之外,还能够预测和预防犯罪。因为网络数据中存储和记录着犯罪人在案件预备阶段的行为特性与心理痕迹,以大数据技术为支撑的类案犯罪人画像,侦查机关可以依据数据画像提前预测犯罪,实现情报预警和主动侦查。

(2)能够实现快速精准画像。连锁超市塔吉特拥有专业的顾客数据分析模型,可对购买行为进行精确分析,然后实施精准营销策略,这是通过购物数据对社会个体特征的精准画像。可以借鉴这种商业“数据画像模式”用于对犯罪嫌疑人的画像描绘,刻画嫌疑人或相关人的身份、兴趣、爱好、人际交往关系等特征,为侦查活动提供线索和情报[12]。

2.4 网络侦查思维的体现——异动数据识别

(1)犯罪行为的异动性。侦查异动思维理论认为,具有社会危害性的犯罪行为是一种异于正常的特殊行为,犯罪行为人是异于常人的特殊人群[13]。异动性表现有异动动作、异动表情、异动服饰、异动物品,比如涉恐犯罪人员可能具有着装与季节不符、携带可疑物品、频繁出入大型活动场所、神情恐慌等表现。中国工程院院士邬贺铨表示:恐怖分子在行动之前,肯定会有蛛丝马迹表露出来,公安机关可以不断地收集积累数据,提炼关键特征标签画像,从而对恐怖犯罪进行排查和预警[14]。

(2)异动行为的网络化。在通过监控分析恐怖分子日常各种数据,如出行、购物、聊天记录等网络行为进行恐怖犯罪预警和排查,已经成为国际反恐的常用手段。融合网络数据的侦查画像技术的客体已经由现实行为转变为网络数据,与传统的侦查画像技术不同,公安机关通过挖掘分析带有个人特征的网络数据,对具有网络映射的行为进行特征标签进而刻画侦查对象的身份、兴趣爱好、行为特征、犯罪嫌疑等情况。

3 融合网络数据的侦查画像技术实施框架

大数据时代,所有的网络活动都可以成为碎片化的数据痕迹,反映出个人的性格、习惯、态度等。融合网络数据的画像就是基于数据的现实代表,大数据环境为画像信息标签化提供了蓝本[15],公安机关可以通过这些数据信息进行犯罪人画像,为犯罪情报预警提供支持,见图1。

图1 融合网络数据的侦查画像技术实施框架

3.1 数据收集

进行数据画像必须要有相应的数据条件,全面、多维的数据是进行画像的基础,采集的数据应确保内容可靠、完整、多样。技术人员可以通过数据爬虫、采集程序获取包括用户基本信息、行为数据、统计数据等信息。其中,基本信息包括姓名、性别、职业、邮箱等;行为数据包括网页浏览、网络购物、外卖预定、出行地址等等,能够反映行为人的兴趣偏好,通常是动态变化的;用户统计数据如热门检索主题、地域分布、受访页面等,能够体现一段时间内用户的整体需求与访问情况[16]。数据收集过程应注意两点:

(1)数据收集技巧,要善于由一点向多点发散。

(2)多点关联搜索与挖掘数据。

3.2 数据处理

对于采集到的数据需要经过一系列规范化、标准化的处理才能用于画像构建,即数据清洗、标引、解析和关联等。对原始信息数据缺失或填写不规范的数据,通过人工或机器的方式对其规范化处理,以便进行后续分析、挖掘工作;对于非结构化数据必须要通过标引、解析将其转化为结构化的数据,为下一步构建画像标签体系服务;对于其他某类数据要从不同的文件中提取出来并进行合并,解析后再以统一的格式存放到指定文件或数据库当中。总之,对于采集来的原始数据必须采用相关技术对其进行加工和处理,使其规范化、标准化以提高数据的可用性。

3.3 标签设计

在当前数据画像应用中,客体标签的建立是一个主要环节[17]。画像技术的核心是构建标签体系。标签是描述客观事物的方法,或者说是对业务对象逻辑的抽象表达。有学者指出,建立用户画像的关键就是生成描述画像的标签。由于标签具有规范性,标签亦可以被计算机方便地进行提取、聚类等处理[18]。画像过程中每一个数据标签的背后是大量的数据分析和挖掘,因此大大提高了数据可用性意义识别,可以说,犯罪人的画像就是特征标签的集合,特征标签越丰富,人员的画像就越形象,越能支撑情报人员做出准确的决策。利用大数据统计分析和基础属性标注技术,对公安业务对象实体形成特定的标签体系,还能够结合不同的业务场景,利用标签挖掘与实体相似行为的模型,可以快速定位具有犯罪异常的行为的对象,提高打击犯罪和防范突发事件的能力。

3.4 行为建模

经过以上阶段的数据处理,我们通过机器学习技术,对目标人的行为、偏好进行算法评估,就如同一个y=kx+b的算法,x代表已经掌握的数据信息,y是对目标的行为偏好特征的刻画,我们要通过不断的调整k和b来得出精确的y。这个过程涉及到各类计算机算法,通过各类算法要把目标人的基本属性(性别、年龄、户籍地域)、心理特征、行为特征、兴趣爱好、社交网络等特征完成标签化。

3.5 画像应用

案件侦查过程中,公安机关想方设法要解决的两个关键问题就是:他是谁?他在哪里?这正是侦查画像要解决的。一方面,通过网络数据的集合映射进行犯罪人画像,分析现实生活中的犯罪行为人特征,进而发现追踪犯罪人。另一方面,对犯罪人的特征进行深度凝练并全面刻画,为其贴上特征数据标签,实现犯罪人与犯罪行为快速、精准的映射和匹配,也就是对犯罪个体信息的标签化,通过收集特定犯罪对象群体的数据信息,刻画类案犯罪对象的特性全貌,这样公安机关就可以全方位、多视角掌握犯罪嫌疑人行为特征并进行情报预警。

4 融合网络数据的侦查画像应用场景

4.1 刻画犯罪人的个体特征

融合网络数据的侦查画像技术是以公安大数据为基础,通过网络数据资源多维度的刻画犯罪嫌疑对象,即根据目标对象的人口学特征、网络社交活动、网络浏览内容和消费行为等信息,刻画推测出犯罪人的个体特征,如表1。融合网络数据的侦查画像技术能够按照相应的规则将这些数据进行自动识别,从数以千万计的用户数据中找出目标犯罪人。

表1 依托网络数据的个体特征刻画

4.2 刻画犯罪人的行为轨迹

目前最常见的是利用行为轨迹特征来构建画像。行为轨迹特征主要是目标人的日常活动信息,如上网动态、交通出行、旅游等相关活动,通过这些行为以及行为背后的数据进行统计分析,从而获取其网络行为偏好。罗格斯大学的学者熊辉等研究发现,有相当数量的扒手是在地铁和公交车上被抓的。于是,他们对北京智能公交一卡通数据进行分析研究,根据交通轨迹来区分正常人和小偷,并且成功地识别出了92.7%的小偷。通过对不同人的行为轨迹进行可视化研究之后发现:正常的出行者轨迹通常总在居住地和工作地两点之间;旅游者会频繁地访问景点区域;购物者主要访问商业区域;正常的人出行会选择最短的距离、最快的时间,而扒手的行为轨迹是一种流浪的模式,他们没有清晰的目的地,经常会随机地停留、频繁地换乘,还会经常出现短途出行,比如访问人流量高的购物区或是景点[19],如图2,这是通过网络数据对人的行为轨迹的刻画,以此进行不同的人的身份识别和行为特征的认定。

图2 基于公交卡数据的不同群体行为轨迹刻画

4.3 犯罪行为预警

融合网络数据的侦查画像技术改变了传统警务的执法模式,提升了犯罪预测的效率与精确度。在画像过程中,公安机关可以识别目标对象的个人信用、犯罪风险和犯罪可能等特征数据,深入分析挖掘后获得潜在罪犯的情报信息,通过网络数据建模构建画像,就能够对其海量的行为数据进行监控和提炼,一旦有异于常规的动作就会迅速被发现。京东集团风控平台曾经通过人员画像成功发现一起盗刷银行卡案件,并且先于被害人报案第一时间发出预警。风控平台根据受案人的网络购物数据对其进行的画像:男性、20岁左右、有女朋友,经常购买电子产品的小礼物;消费水平偏低,价格通常几百元左右;支付方式固定用微信零钱。犯罪人的作案手段是通过一个虚假考试成绩查询短信在被害人手机埋入木马程序,然后盗刷其绑定的银行卡。风控平台发现犯罪人此次的购买方式和以前平台的画像出现极大偏差:首先,购买的物品是一个充气玩偶,试想一位男性有女朋友为什么要买充气玩偶呢?第二,购买物品的价格是全网的最高价格(49 966元),而且毫不犹豫,支付速度极快,选择最贵的直接支付,不同于以前还要花时间浏览货比三家;第三,改变了先前的微信付款方式而直接刷银行卡支付。作案人购买的物品、消费价格水平、浏览时间还有支付方式这些要素都发生变化,所以触发了预警(见图3)。本案当中,盗刷银行卡犯罪是一种违反常态的特异行为,京东风控平台能够先于被害人报警发现案情并发出预警,得益于平台系统对客户的精准画像。

图3 基于网络数据的犯罪行为识别预警

5 结语

数据已经成为公安情报的重要资源,大数据也为人类理解复杂系统关系提供了新的思维方式[20]。融合网络数据的侦查画像对当今大数据时代公安机关打击预防犯罪具有重要意义,能够帮助情报人员从海量数据中挖掘公安业务对象的群体或个人特征,全面掌控并动态追踪犯罪行为,有针对性地开展重点人员管控及犯罪预防打击等工作。融合网络数据的侦查画像技术能够对犯罪嫌疑人的个体特征、行为轨迹、时空信息等进行有深度、有准度、有力度的分析刻画,打破了传统侦查画像技术的功能局限,推动数据画像技术在侦查场域中的应用,提高公安机关侦查工作技术化和智能化。

猜你喜欢

犯罪人刻画画像
威猛的画像
“00后”画像
画像
和谐人际关系的构建与犯罪人的再社会化
刻画细节,展现关爱
未成年犯罪人的刑罚制度分析
潜行与画像
ℬ(ℋ)上在某点处左可导映射的刻画
Potent环的刻画
老年犯罪人社区矫正论*