基于跨镜追踪(Re-ID)技术在警务实战中的应用与思考
2019-06-10李诗晴
□ 文/李诗晴
引言
平安城市是一个覆盖整座城市的大型综合系统,包括治安、交通管理、消防、刑侦等多个领域,以及社会治安监控系统、交通智能卡口系统、电子警察系统、社会重点防范单位监控系统等多个子系统,各系统之间既相互独立又相互协作,与安防紧密相连。随着公共安全信息化建设的深入开展,在将这些海量视频数据运用到业务实践中时,一些困难和问题开始凸显。
存储传输难
已有的海量视频数据直接占用大量存储空间,从而造成数据管理上的高成本,随之而来的备份难度加大也带来数据管理的高风险。同时,大量高清视频的频繁传输,向传输带宽提出更高要求,也给传输线路带来巨大压力。而如果简单地对视频数据进行压缩,又可能造成图像模糊、数据失真等问题。
处理效率低
目前的视频数据处理多依赖于人工浏览和人工值守方式,受制于人的生理特点,长时间观看视频容易产生视觉疲劳,甚至遗漏重要线索,效率低下。面对视频数据的高速增长,人工处理方式根本无法应对,急需自动化、无人值守式的视频处理手段。
类型差异大
现有的视频数据来源广泛、类型多样、标准不一,其结果是在业务实践中无法采用信息化手段对视频数据进行标准化处理和存储,进而造成各个部门、各个行业之间信息共享困难,不同领域的信息数据彼此成为孤岛,造成信息的极大浪费和系统的重复建设。
应用范围窄
在安防领域,利用传统的视频数据所能解决的问题相当有限,缺乏深层次的应用,无法满足现代安防数字化、信息化、智能化的要求。
针对存储传输难、处理效率低、类型差异大、应用范围窄等诸多难点,如何在大数据、人工智能时代让视频系统更好地为平安城市建设服务,需要新型的视频数据处理技术。
Re-ID技术方案设计
随着AI技术的兴起,越来越多的开发者将精力投入到计算机视觉技术的研究,基于“以图搜图”技术的目标检索这一热点主题被再次重点研究,解决了以往一部分视频侦查中由于类别差异、视点变化、复杂背景等造成的搜图难题。
从视频侦查的角度来说,能产生战果的应用主要基于以下三种计算机视觉技术:视频结构化技术、人脸识别技术、车辆识别技术。
Re-ID跨镜追踪是基于视频结构化进行的深度应用,通过把不同视频内的物体关联起来,通过有效的方法把物体找出,保证整个监控操作的完整性,掌握大局观。
Re-ID技术难点现
目前,人脸卡口在整个基础监控资源中占比不足10%,80%以上的摄像头均由普通监控探头组成,拥有光线暗、角度偏、遮挡率大、夜间清晰低和区分度不高等普遍缺陷,因此拍到的人脸都不够清晰,甚至连人脸都无法抓拍到。
与此同时,Re-ID在进行数据采集时难度很大:1、需要跨摄像头采集;2、公开数据集的数据规模非常小;3、数据一般都是视频的连续截图;4、同一个人需要有不同角度的全身照片;5、监控大规模搜集涉及用户隐私。数据采集难度大,将会对算法提出更高要求。
核心技术优势显
考虑到行人非刚体的局面,目前有两种基本算法:一是把人的身体划分成不同部分,以不同的方法把这些部分检测出来,并进行局部特征提取。可是,无论怎样划分,某些部分依然会有一定程度上的非刚体特性,会对算法造成干扰;二是考虑对齐,也就是把两张要比对的图片,以某种方法先对齐好,例如相同头部位置和脚步位置,并在匹配时只考虑有用的部分。当然,做到这部分并不容易,因为这部分一般会内嵌到神经网络。除此之外,业界一般会附加一些网络设计技巧再提高特征提取的准确度。
行人Re-ID基于注意力架构模型的深度神经网络方案来实现,与传统的全局表征或设定好的局部分割不同,主躯干网络不要求躯干位置的标注,能够从浅层视觉到高层语义的不同空间内自动捕捉关键区域,挖掘多尺度的注意力特征,自动实现行人肢体(如面部,上身及下身)的特征融合,对于姿态改变以及空间变化有着很好的鲁棒性,可有效完成行人搜索工作。
▲图1 Re-ID原理图
实际测试时,发现即使不使用re-ranking,对于Market-1501数据库,top-1准确度也能达到90%,而不使用re-ranking也能达到这个水平,代表速度会快上很多,也同时减少计算资源的使用。原因是reranking(例如现今常用的k-recipical方法)即使再简单,也需要消耗内存把某范围内的数据暂存,并进行分析和对比。而现有不少算法是非常依赖reranking来达到高准确度,去除该依赖性,使得算法在实际产品内产生优势。
Re-ID技术精准搜
在实战运用中,对涉案视频进行分析排查,通过“即看-即辨”、“即辨-即追”、“即追-即控”的作战模式,锻炼一支专业化的实战队伍、形成一套科学化的业务机制、固化一系列的综合技战法,实现案件的迅速侦破。
“即看-即辨”,指的是通过视频分析,在观看视频的同时便可直接对视频目标进行截图标注、搜索、比对,迅速辨别嫌疑目标。
“即辨-即追”,指的是在发现嫌疑目标之后,结合图上作战、以图搜图,以跨镜追踪的方式,对嫌疑目标在范围区域内进行追查,迅速发现其活动轨迹及落脚点相关信息。
“即追-即控”,指的是在确认嫌疑人落脚地信息之后,再基于视频结构化、人脸识别、车辆识别等技术,对重点区域重点场所进行重点实时布控。当布控目标出现时触发报警,并及时对嫌疑目标进行控制。
▲图2 以图搜人
▲图3 360°结构化目标跨境追踪
实时图踪基于Re-ID技术,通过即时检索和快速响应,对后台海量监控点进行不间断的实时结构化分析,将产生的快照进行存储,一旦案件发生,能够在已生成的视图库中快速定位目标的时空信息,形成轨迹。
▲图4 实时图踪
Re-ID+人脸技术新助力
人脸识别技术在安防领域已经有较为成熟的应用,但在很多实际场景中,人脸识别技术作用并不突出,很多摄像头根本无法准确抓拍到行人清晰的正面照。Re-ID作为人脸识别的补充,可以有效解决实际应用中跨设备、跨场景的问题。
受限于视频监控探头的安装高度及密度,实际情况中拍到更多的是行人的头顶、后脑勺或者侧脸。其次,即便拍到人脸,也可能模糊不清。于是,基于公安机关的实战要求以及多年的实战经验,提出一种卡视联动技战法,结合人脸识别和跨镜追踪(Re-ID)各自的特点及优势,以少量的人脸卡口加大量的普通监控探头的部署,既可锁定嫌疑人身份,又能重现嫌疑人轨迹,这种创新的综合型技战法可以较大概率对监控范围进行覆盖,实战价值极强,对安防行业具有颠覆性意义。
图5 卡视联动结构图
实战案例及成果
案件一:盗窃车内财物案
▲图5 案件一视频截图
辖区内发生多起车内财物被盗事件,经侦查,都是两个骑电动车的男子所为,且卡口抓拍到一张嫌疑人较为清晰的图片,但依然看不清人脸。
案发后,民警使用人脸系统排查嫌疑人身份,可能由于前面的人戴了鸭舌帽遮挡脸部又或者光线不够等原因,在此案件中,人脸系统并未发挥作用。考虑到人脸系统无法有效寻找到犯罪嫌疑人,办案民警使用跨境追踪技术开始疑犯追逃工作。
▲图6 案件一视频截图
▲图7 案件一视频截图
▲图8 案件一视频截图
▲图9 案件一视频截图
▲图10 案件一视频截图
通过录像结构化,查找嫌疑人踪迹:因为案发地点四通八达,在GIS地图上框选通往各个方向的周边36个点位,分析在案发时间半小时左右的录像,使用Re-ID技术进行以图搜图,仅用20多分钟,就找到了一张疑似嫌疑人图片,然后,再在新出现的位置附近查找,又接连找到第2张、第3张……通过视频接力追踪的方式,追踪目标轨迹,共找到6张嫌疑目标图片,随后在地图自动刻画其轨迹,进一步锁定了嫌疑人的疑似活动方向。
案件二:盗窃三轮车案
2017年8月25日,受害人王某某报警称:自己家门口的一辆电动三轮车被盗。经了解,被盗三轮车为灰色“金彭”牌电动三轮车,现在价值2000余元钱,被盗时间为当日14时-17时许。虽然受害者家地处四通八达的居民区,但民警、辅警仍通过大量视频侦查工作,发现一名可疑男子。
▲图11 案件二视频截图
视频侦查
中心民警通过大量视频侦查工作,发现一名可疑男子。该嫌疑人作案前骑自行车到达该区域,并且作案后驾驶盗窃到的电动三轮车向北逃离。视频在线结构化,寻找嫌疑人踪迹
通过现场周边大量监控查找,发现嫌疑人16:40-16:57的轨迹。通过视频结构化,将嫌疑人骑自行车图片在库中自动搜索,描绘出嫌疑人15:06-16:30(作案前)在县城三处的活动轨迹。
关联信息,未发现踪迹
通过视频结构化系统提取监控画面,倒查嫌疑人活动轨迹,掌握嫌疑人前一天晚上已到网吧。通过网监部门研判嫌疑人为虚拟身份,并未获取有效信息。
▲图12 案件二视频截图
案件反复研判,终现马脚
将嫌疑人头像在本地人脸识别库中检索,也未获取有效信息。但是,在通过对之前有线索的案件进行重复研判时,再次将嫌疑人头像在本地动态人脸库中检索,发现嫌疑人正面头像,在省人像比对库中比对,锁定嫌疑人为卧龙区候某。
▲图13 案件二视频截图
结束语
随着公安业务的迅速增长,公安部门迫切需要实战效果显著的视频监控技术,以此适应复杂多变且精细具体的公安环境。跨镜追踪(Re-ID)技术满足这一实战需求,让AI系统即使不看脸,也能通过衣物、发型、体态等信息,跨摄像头、跨场景下实现目标的识别与检索,在人脸被遮挡、距离过远时依旧可以从不同摄像机镜头中追踪行人,通过将技术转化为产品,落地为应用,取得一些很好的实战效果。随着视频监控技术的快速发展以及不断革新,其必将在公安工作中取得更加广泛的应用,发挥更加显著的效果。