视频图像侦查中的视频挖掘阶梯模型分析
2014-07-10王海增赵阳
王海增 赵阳
1. 国际智慧影像产业专家联盟 2. 河北省邢台市公安局
一、视频图像侦查与数据挖掘理论的相通性
随着科技强警在全国大中小城市的深入开展,各地建成了规模不等的各类“天网”工程、“平安城市”视频监控联网系统,图像侦查也已经成为继刑侦、技侦、网侦之后的第四大类侦查手段。据不同地方的公安案件侦破过程显示:部分地区的案件侦破70%甚至90%以上都离不开对视频图像侦查数据的应用。“天眼”、“电子警察”等概念已经越来越深入人心,有案件找摄像头查录像也成为公安破案最常用的手段之一。一些地方如湖北、广东等很多省份已经建成了各种规模的图像侦查专业队伍,从组织到人员方面来加强图像侦查这一新兴技术手段的有效应用。不过关于视频图像侦查究竟能做什么、不能做什么,甚至到底什么叫视频图像侦查,目前都还处于探索阶段。本文作者之一长期从事公安科技产品的实战应用和产品技术分析,另一位长期从事视频监控和智能分析产品的设计研发,针对视频图像侦查在公安领域的应用率先研究出一种实用化的阶梯模型,供公安视频图像侦查分析工作的理论和实战参考。
从原理上讲,视频图像侦查就是从视频图像数据中挖掘出公安案件所需要的各种情报线索和犯罪证据。虽然视频图像的挖掘最近几年才开始流行并受到越来越多的关注,但数据挖掘这种技术在各类商业智能应用中已经有大量案例。例如各类通信运营商都有专门的数据挖掘部门,对用户的通信记录进行挖掘分析,进而把客户按照商业价值贡献进行不同的区别对待,甚至很多新业务都要靠数据挖掘的结果来进行价格、营销目标、营销渠道的决策参考。数据挖掘不仅作为理论,更是作为技术工具已经得到大量的成熟商业应用。从权威的定义来看,通用意义的数据挖掘是指从大量不完全、有噪声、模糊、随机的实际应用数据中,提取隐含在其中人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘通常包括几个要素:第一,数据源是真实有效的、大量的、含噪声的;第二,发现的是用户感兴趣的知识;第三,发现的知识要被用户可接受、可理解、可运用;第四,发现的知识并不要求道理或者真理,有时候往往是用户关心的特定问题,比如电信运营商要从通信记录信息中查找有商业价值的客户一样。目前随着互联网的应用,现实与虚拟世界越来越联系到一起,越来多的数据产生已经使信息社会进入到大数据阶段,云计算、物联网等多种将来可能对信息社会起到决定性的重大新兴技术理论正在潜移默化地改变着信息使用的方式。视频图像侦查在公安领域的应用方兴未艾,如果能够充分应用到数据挖掘、信息化的大格局体系中,则能发挥更大的效用。视频图像侦查本来就是视频数据挖掘的一种具体应用领域,视频数据挖掘又是在通用数据挖掘的理论范畴之内,所以更应该借助通用数据挖掘领域成熟的理论和工具体系来提升视频图像挖掘的各种应用形式。
通用的数据挖掘有一个很基础的理论:DIKW模型。DIKW模型指数据(DATA)、信息(Information)、知识(Know ledge)、智慧(Wisdom)(见图1)。这个模型的要点是:数据是指能够直接获得的内容,比如公交车7点钟进站,这算个数据;知识是指对多个有关联的数据进行加工后可以得到的进一步内容,比如连续统计了一周公交车的数据,发现公交车进站在6点50分到7点15分之间,这样得出一个信息:公交车到站时间可能不稳定,会有25分钟左右的偏差,正常的到站时间约在7点左右;知识是指对信息进一步提炼而形成的可以重复应用到其它领域的内容;智慧是指利用信息所作出的各种决策,比如可以根据公交车时间表决定是选择公交车还是选择其它方式等等。
数据挖掘知识管理的DIKW模型,完全适用于也非常有必要应用于对视频图像数据的挖掘处理中。借助这个模型,可能会对视频图像侦查理论起到重要的参考作用。
二、视频图像侦查的阶梯模型
在公安视频图像侦查系统中,既需要通用的数据挖掘理论做参考,更要结合公安业务实战将抽象的通用理论在公安的实战业务中找到更确切的应用。经过对多种案件侦破过程的实战分析和提炼,本文创新地提出了一种专门应用于公安实战的视频图像侦查阶梯模型。借助这个模型,可以为视频图像侦查工作提供一个系统化的实战操作导航图,指导图侦人员按照理论模型的要求一步一步收集线索、分析案情、还原真相甚至积累提炼案件侦破和犯罪预防的经验教训。
视频图像侦查的阶梯模型分为两个层面:第一,要侦查的目标对象,第二,侦查对象的意义分级。结合案件侦查的需要,要侦查的目标对象一般分为三个关联的因素:对象、工具、行为。对象一般是涉及案件要追查的目标,通常是各类犯罪嫌疑或关联的人或者车;工具是指犯罪嫌疑人在案件发生时所使用的各类器件,如通讯工具、交通工具、作案工具甚至包括着装、现场环境等器物设备;行为是指要侦查的目标对象所进行的一系列活动,比如拿走物品、伤害别人、现场逗留等多种对案件侦破有意义的活动。目前各类视频图像侦查的理论或实践都会涉及对对象、工具、行为等不同形式的描述,但鲜见将这三个要素进行系统的关联,应用于视频图像侦查理论之中。阶梯模型是以这三要素为基础进行后续视频内容的挖掘,认为任何一个案件侦破的过程中,针对每一个要分析的视频都要首先关注对象、工具、行为这三要素,以三要素为基础进行后续更深度的视频挖掘。
在明确了三要素以后,阶梯模型最重要的思想就是将案件线索三要素的挖掘层次由浅到深分为四个层级。这四个层级不可跳跃,只能从第一级分析逐次深入,通常情况下挖掘到第三级就能够还原整个案件发生过程甚至对案件进行回溯分析,如果能进一步深入到第四级,将意味着案件的侦破甚至对犯罪的预防还可以起到推广普及的作用。四个级别分别代表如下意义:
第一级——原始视频级:针对一个报案号,把直接涉案的相关视频数据收集到位并进行分析,属于图像侦查的第一级。
所谓原始视频级调查分析,是指完整有效地收集与案件相关的直接视频和间接视频,对视频进行分析后得到第一手与案件有关的对象、工具、行为的最原始信息;这是整个视频图像侦查最基础的工作,视频收集是否完整有效,有可能关系到整个视频图像侦查是否能够挖掘到真正有效的内容。因为从实践来看,大量图像侦查案件之所以无法锁定目标嫌疑人或者无法提供有效的证据,通常因为关键位置的直接视频或间接视频角度不对,不能确定犯罪嫌疑人,或者因为视频不清晰无法确认,甚至关键视频丢失导致侦查无法进行。
原始视频一般包括以下几个方面:
a.直接涉案的视频:对与案发地点和时间最直接相关的视频进行调用;调阅方面,如果时间明确,调阅案发时之前24小时乃至3~7天的视频;
b.间接涉案的视频:以案发地点和时间为中心,将可能受案件影响的距离和时间范围内相关的视频称为间接涉案视频。以某路口晚8点发生盗抢案件为例,距离该路口在步行时间60分钟以内、行车时间在30分钟以内的其它摄像机的视频均应看作是间接涉案视频,应对间接涉案视频和直接涉案视频一起进行采集取证供调查分析。具体的间接关联摄像机的地点和时间可结合案件酌情调整。
第二级——抽象信息级:针对获得的原始视频,从原始视频出发寻找出图像侦查三要素的抽象信息或社会信息。它通常涉及:
对象抽象:原始视频看到的是某个具体的对象,抽象信息级要通过对象的身体特征、着装特点、行动姿势、行为内容来判断对象的性别、年龄、职业、户籍、身高、体重等信息,以判定出目标对象的社会身份认证信息(如姓名、籍贯等)。比如通过原始视频看到目标对象走路齐整,判定可能参军入伍受过训练;若步伐散乱随意,可能是社会无业人员等,进一步结合其它信息进行佐证。
工具抽象:通过对象所携带、使用、接触的工具来协助判定目标对象的身份、职业、户籍、身高、体重等关键特征,不仅协助判断目标对象的身份,还可通过工具来判断目标对象在案件中所进行的活动;比如在涉案视频中发现目标对象拨打移动电话,可据此调查特定范围的电话呼叫记录来锁定犯罪嫌疑人的身份信息,以及通过拨号方式来大致判断手机类型等。
行为抽象:通过对视频中目标对象的原始视频行为进行分析,来判定目标对象正在进行的活动,通过逻辑分析判断活动的逻辑意义;比如当看到目标对象经过某一路口,但走路的速度和旁边行人对比有明显延迟,再结合对象的姿态,可初步判断目标对象是否在该区域进行踩点。
将多个行为信息综合起来,逐步梳理出案件涉及的对象是谁、用什么工具、在做什么等有意义的信息,这就是视频图像侦查的抽象信息级主要研判的目的。抽象信息级要结合多段原始视频进行反复分析比对,直到能够将多段可能看不出逻辑关系的原始视频提炼出背后的逻辑含义,从而判断哪些视频是有价值的、哪些视频是干扰信息。当然,如果原始视频获取不充分,无法形成有意义的逻辑分析,甚至形成了错误的逻辑分析,那就可能会导致无法进入下一级的视频侦查分析。
第三级——案件知识级:针对原始视频、抽象信息提炼的结果,结合案件报案情况,复原案件发生的整个过程,并提炼出可以作为法庭证据的视频图像,这一级称为案件知识级。
案件知识级是前两级工作的总结,相当于通过视频甚至多种侦查手段确定了案件嫌疑人身份信息、案件发生过程信息后,可以通过涉案视频进行案件的回溯推演,并收录存档,将对应关键原始视频作为案件犯罪确认的视频证据。
案件知识级通常涉及两项重要工作:
a.案件过程视频复原:可以按照案件发生的过程,组织各类视频信息进行回溯推演,从而以视频证据的方式验证案件发生过程,对犯罪嫌疑人的犯罪行为以视频方式进行认定;视频复原的另一个重要功能是确认或者否定各种可疑线索,确保案件认定的准确性。
b.视频证据存档:对能作为法庭证据的相关原始视频进行存档收录,以备诉讼审理使用。
第四级——经验智慧级:结合前三个层级所发现的规律、经验甚至问题进行总结提炼,并进行推广应用,这也是模型在视频挖掘方面比较注重的一个方面。经验智慧级别一般关注以下几个方面:
a.对案件侦破能起到推广作用的图像侦查技巧:如发现球机视频模糊不清或角度不合适,而停车场视频通常效果清晰,后续侦查时应将各停车场作为视频收集重点。
b.对监控设备部署能起到改进作用的设备型号或部署要点:如发现交通路口因设置球机导致角度不好而难录像,那么在后续监控项目建设中,要设立规范,在交通路口应减少球机设置,尽量采用多角度枪机乃至360度全角度摄像机,进行全方位无死角录像;可将这些设备部署要求逐步纳入到地方录像设置规范中。
c.对犯罪预防能起到警示作用的公告通知:如发现某些人流集中场所在特定时段容易发生某类盗抢案件,就可以通过张贴通知、提前部署警力等方式进行有针对性的打击。
视频图像侦查的阶梯模型可以用图2进行阐述:
三、阶梯模型的模板工具化
目前视频图像侦查在各地还处于探索阶段,各地公安民警通过实战总结出很多方法技巧,但阶梯模型不仅是视频图像侦查的理论参考,更重要的是提供了模板方法,可以应用在案件侦破过程之中,对案件侦破起到提纲挈领的作用。利用阶梯模型理论研制的警用视频图像侦查工具,可以有效地实现海量视频数据的搜索整理,对案件侦破能起到事半功倍的效果。阶梯模型是一个实战化的图侦模型,通过案件三要素、四层级分析来系统贯穿图像侦查的整个过程。通过公安科技民警与设备厂商联合研发出的能够系统化应用阶梯模型的警用视频图像侦查工具,可以在实战中一步一步指导办案民警进行原始视频收集、案件信息抽象提取、案件过程复原甚至多案件信息经验共享等。
[1]李瑾.深化视频监控应用,加快图侦技术发展——专访公安部科技信息化局总工程师朱抚刚.警察技术,2012.(03).
[2]韩汩鸿.VCS视频图像采集摘要比对器.警察技术,2012.(03).