视频人脸识别技术在铁路人员管控中的应用
2019-07-04刘金明朱成波周长义
刘金明,朱成波,周长义
(1.哈尔滨铁路科研所科技有限公司,黑龙江哈尔滨150006;2.中国铁路哈尔滨局集团有限公司电务部,黑龙江哈尔滨150006)
0 引言
保障铁路系统安全可靠运行,保证国民经济生产、人民出行活动正常运转,是铁路部门持续面临的挑战性课题。鉴于铁路运输系统,尤其是大型枢纽客运站具有全年无休、环境复杂、人员密集度高等特殊的行业特点,因此存在安保工作量繁多、治安管控难度大、人员核查效率低等突出问题[1-2]。传统视频监控手段已滞后于当前的实际业务场景需求与发展,尝试借助新型人工智能、人脸识别的计算机视觉等技术手段正逐步提上日程。
2013年,中国铁路总公司颁布的《铁路综合视频监控系统技术规范(V1.0)》,首次将高清视频纳入技术标准。2016年,中国铁路总公司发布《设计时速200km及以上铁路区间线路视频监控设置有关补充标准的通知》(铁总建设函〔2016〕18号),进一步明确提出对高铁区间线路全部采用高清摄像机进行设置或增补,且分辨率不低于1080P[3-4]。结合原铁道部颁发的《关于加强铁路客站安检区域视频监控系统建设的通知》(铁计函〔2011〕59号)和《关于印发<客运站安检区域视频监控系统建设指导意见>的通知》(铁公安〔2011〕115号)[5],对客运站安检区域视频监控系统的建设,不仅要注重高清视频的加强,更要运用图像识别比对、智能分析等技术,以提高铁路系统人员管控、打击违法犯罪的能力。
当前人工智能技术飞速发展,数字神经网络的深度学习技术不断成熟,以人脸识别为主的计算机视觉技术得到长足发展,人脸识别技术已能支持海量视频图像和人像数据的并行处理及深度分析,极大地丰富了泛安防领域的适用场景。2012年,深度学习理论的突破使人脸识别性能指标大幅提升,能够极好地应对复杂光照并支持多种人脸姿态和表情。随着H.265视频编码压缩标准的诞生和普及,前端摄像机作为视频监控图像基本的采集工具,得以从算法、技术和应用角度开始被规范化、规模化建设,从而在控制建设成本的同时,使人像采集全覆盖网络可以形成。同时,深度学习加速卡的运用解决了以往视频解码、进行多帧比对而消耗大量计算资源的问题,使海量视频图像的并行处理、城市级的全面监控成为可能。算法的突破、视频编码技术的改良以及高性能计算资源的普及推进了人脸识别技术的广泛应用。
1 现状分析
我国铁路运输系统,尤其是大型枢纽客运站、高铁站,近年来通过不断的信息化建设,已在综合视频监控方面取得了长足进步。伴随着高清摄像机的普遍应用,以往落后的模拟监控系统逐步被网络高清系统所替换。据调研,当前铁路客运站大部分点位已达到标清、高清水平,而且点位数量也在逐步增加,基本满足了日常监控管理需要,但仍存在若干迫切待解的问题。
(1)点位覆盖不全面,无法掌控关键细节。目前综合视频监控系统较多使用小毫米数镜头。如果要追求大场景、无死角的覆盖,难免会出现细节清晰度和全局掌控度无法平衡的问题。通过大场景监控摄像机只能观察到大致情况和人体的动作,而关键区域的监控细节、人脸细节特征却无法看清,给事后研判、视频分析、证据采集、违法犯罪人员抓捕带来诸多不便。
(2)信息量庞大,但检索效率低下。随着高铁网格密度的不断增大以及人民生活水平的提高,越来越多的人选择乘坐高铁出行,同时铁路也是逃犯出行流窜的主要方式之一,因此公安机关已将铁路运输系统作为追逃查逃的主要卡口。但已建视频监控系统不具备人脸提取功能,大量的人脸数据散乱地存在于铁路综合视频监控系统中,却无法有效地进行整合利用,单纯依靠人工盘查、核对,既耗费了大量人力物力,也无法达到准确辨识。
(3)资源分散,带宽有限。我国幅员辽阔,铁路站点分散,铁路视频监控系统建设虽然都有覆盖,但联网率低、预览回放卡顿、丢包现象比较普遍。一般情况下,基层站点回传到上一级主管单位的带宽资源不足百兆,即便是铁路局集团公司级的带宽资源往往也才勉强达到千兆。随着监控点位数量的不断扩容增补,业务管理部门的工作难度越来越大,而带宽资源也越来越不能满足使用需求。
同时,传统视频监控系统往往采用事后分析查询的方式。面对海量的视频文件,凭肉眼查看如海底捞针,更难以做到事件及时预警和人员及时到位。
(4)出警容易,但抓捕难。一般情况下,后台指挥中心接到案事件的预警信息后,犯罪嫌疑人已逃之夭夭。铁路站台值班民警往往采用事后侦查的方式,通过查看海量的视频文件,调取监控进行研判分析,容易错过最佳抓捕时间,无法做到人员提前布控、事件及时报警及快速抓捕。
2 需求分析
(1)建点补位,关注细节。在车站出入口、安检区、购票区、候车室等重点区域建设大毫米数镜头的高清前端设备,对车站形成包围式点位部署,以有效采集进出车站人员的人脸信息。
(2)智能抓拍,人脸提取。前端点位建设需要采用内置智能人脸抓拍技术的摄像机,将场景内的人员脸部进行自动检测、自动跟踪、自动抓拍,从海量视频信息中将人脸价值信息进行提取,为后端人像识别系统提供高质量的人脸图像数据,为后续研判应用提供前提。
(3)优化编码,图片传输,节约带宽。前端采用的智能人脸抓拍摄像机需支持H.265编码压缩标准,在调用视频回放和预览时,可以降低一半带宽。各站点的人脸抓拍机以图片流的方式将人脸图片传输至上一级主管单位的识别后台服务器,以节省带宽占用率。
(4)建设人像识别系统,实时预警布控。在后台建立一套人像识别平台,配合前端采集的人像数据进行实时动态布控,不仅能有效应对人员协同布控,通过与公安部门的深度合作,还可对全国在逃人员、涉恐人员及各类危险人员进行分析布控。利用人像识别系统扩大布控范围,实现从单体打击向规模打击、从事后研判向事前预防的转变。
3 前端摄像机
3.1 规格选择
人脸识别摄像机的选择主要从3方面考虑:(1)摄像机类型;(2)摄像机分辨率;(3)镜头。
目前国内外主流的后端人脸识别系统均支持普通高清摄像机接入和人脸抓拍卡口摄像机2种接入方式:既可接入视频流,也可接入图片流进行分析。但接入视频流分析方式有较多劣势,如后端服务器资源消耗大、中心接入带宽高、建设成本高。因此目前主流建设均为人脸抓拍卡口摄像机接入方案。
根据所需覆盖的场景宽度选择摄像机的分辨率。根据理论计算,200万像素的摄像机可以覆盖2.88m的宽度[6]。计算原理如下:
一般成年男性的瞳距为60~73mm,女性的瞳距为53~68mm。取60mm进行计算,在1080P分辨率下,即水平方向为1920像素的摄像机成像图片中,保证人脸瞳距不低于40像素的情况下,覆盖宽度不能超过3m(1920 像素 ×0.06m÷40 像素 =2.88m)[6]。
一般成年男性的肩宽为38~45cm,女性的肩宽为33~38cm,平均肩宽为40cm。若成“一”字排开站立,考虑到衣服厚度及人与人之间的间隙,横向最多可站立6个人。若在出站口场景,前后人员比较密集,空间距离上最多可能容下15~20个人。考虑到人员低头抬头、遮挡、走动,可能出现重复抓拍,因此前端抓拍机的抓拍性能应支持单画面25张人脸的检测和抓拍,方可充分满足实际需求[6]。
镜头的选择主要与摄像机靶面、摄像机分辨率及需要覆盖的宽度相关。一般而言,在同样覆盖宽度需求条件下,摄像机靶面越小所需要的镜头焦距越短。摄像机分辨率越高,单位面积上获得的人脸像素越多。镜头选择的原则为:保证在设计监控距离上,人脸两眼间的像素不低于40×40像素。
3.2 编码压缩标准
传统视频监控的数据量非常大,一台200万像素的摄像机,按照以往H.264技术,可以将200万像素摄像机1d的原始数据最小压缩到42G。对于后端录像存储而言,一般录像存储至少要求30d,则1块4T硬盘只能存储3个摄像机的录像,导致后端建设成本畸高。同时,由于H.264算法的设计限制,在监控系统中,通常需要4Mb/s的码率才能实现高清数字图像传送,对传输带宽的压力也很大。
H.265编码压缩标准是ITU-TVCEG继H.264之后制定的新的视频编码标准[7],在原有技术的基础上,使用新技术对H.264的某些劣势加以改良和优化。例如,在码率、编码质量、延时等方面,在保证画面画质不降低的同时,提高压缩效率、增强鲁棒性和错误恢复能力、减少实时的时延、降低复杂度等[8]。采用H.265编码压缩标准,200万像素的摄像机每路仅占用2Mb/s的带宽,1d的录像文件大小仅为21G,综合建设成本相比H.264至少可降低一半(见图1)。
图1 H.265与H.264的码率对比
综合视频监控系统的整体发展趋势是高清化,摄像机像素越来越高,因此铁路人脸识别系统也应采用H.265编码技术,以适应后续300万、500万、800万等超高清摄像机。
3.3 安装部署
为保证人脸识别的准确率,除考虑摄像机的成像效果外,现场摄像机的安装部署也非常重要。一般室外场景下,为了保证人和车的正常同行,摄像机架设高度不低于5m。此时,识别位置距离摄像机位置的水平距离为(20±5)m,人体平均身高设为1.7m,摄像机俯仰角在15°以内(见图2),能够满足人脸识别算法要求。若取最佳俯仰角10°进行计算,摄像机安装高度与识别距离示意见图3。
图2 人脸识别摄像机安装示意图
图3 人脸识别摄像机安装高度与识别距离示意图
结合铁路应用场景,人脸识别点位一般需要架设在安检通道、候车室入口、站台、上下扶梯等位置,同时应结合现场施工难度综合评估并计算摄像机架设的高度、镜头焦距大小等。焦距的计算公式为:相高∶物高=焦距∶物距。
3.4 场景选择
摄像机的场景选择以车站出入口、安检区、购票区、候车室等重点区域为主,这些场景具有人流量大、人群复杂的特点,是采用和检验视频人脸识别技术的最佳场所。
同时,摄像机安装位置应尽量考虑通道式场景,因为此时人员在行走过程中,会具有典型的方向性,不容易出现大侧脸和后脑勺。现场光线尽量避免出现强逆光、强曝光等情况。若现场实在无法避免逆光环境,建议调节摄像机的宽动态参数,以提高摄像机抓拍人脸的效果,进而提升系统的识别效果。
4 后端人脸识别平台
4.1 人脸识别系统工作流程
人脸识别包括人脸检测定位、人脸质量判断、人脸特征点提取和人脸识别等关键过程[9]。前端抓拍机自身完成人脸检测定位、质量诊断的工作;中心机房部署人脸识别、比对服务器和抓拍图片的存储服务器。前端人脸抓拍摄像机完成人脸抓拍,包括人脸抠图抓拍和人身场景图片抓拍,传输给后台的计算服务器。计算服务器除完成人脸的特征提取和比对外,还需将图片转发给图片存储服务器保存记录,并为用户提供人脸实时报警、比对、大数据查询分析等服务。
4.2 人脸识别软件平台
人脸识别软件平台的功能主要包括:实时报警、人像检索、综合研判、资源管理、统计分析、系统管理等。
(1)实时报警:系统对前端发送来的人脸图片进行实时建模分析,并与动态布控底库进行比对,实时呈现人脸比对结果。若当前画面中的人脸特征与所布控的人脸比对超过设置的阈值[10],则在实时报警页面立即弹出报警提示并伴有声音提醒,同时可进一步查询报警详情,如:抓拍人脸图、全身图、全景图、比中人员信息、比对阈值等。该功能是人脸识别软件平台最重要的功能之一,是从事后研判转为事前预防的重要手段。
(2)人像检索:既可对历史报警信息进行查询,也可通过路人检索对所有抓拍机画面中出现的人脸进行检索查询、以脸搜脸,同时可根据人像属性,如年龄、性别、民族等信息进行检索。对于静态底库和动态底库,可以上传1张或多张照片与底库进行对比,系统将相似度高的人员筛选出来,从而实现利用人脸识别技术对铁路进出站的旅客信息进行大数据检索。
(3)综合研判:随着点位密度的增加和人脸数据的积累,可通过计算同一人的出现频率、时间、地点,研判该人可能的落脚点及活动轨迹。
(4)资源管理:可对相机、底库、布控进行灵活调整,便于有针对性地布控。例如,某些点位重点布控涉恐人员,某些点位重点布控扒窃人员。
(5)统计分析:可以对抓拍的人流量、报警的数量、底库的人员数量等进行统计和分析,便于用户掌控站点内的当前和历史状况,分析车站内的态势。
(6)系统管理:由于铁路系统部门众多,分工明确,因此系统应支持详细的权限控制。例如,底库的增加、删除、修改权限,相机查看、添加、修改权限,报警信息接收人的范围等,都应支持灵活的配置和管理,防止权限滥用导致的信息安全事件发生。
4.3 人脸识别系统应具有自主知识产权
铁路系统的信息安全是国家安全和战略安全的重要组成部分,尤其2017年突然爆发的一场勒索病毒危机更是席卷全球,铁路系统也有波及。而人脸识别作为高度敏感及秘密的公民个人隐私信息,在做好应用的同时,更要严加防范,绝不能为国内外非法组织或个人所窃取。因此,在人脸识别系统及其包含的人脸识别算法、人脸结构化算法、人脸比对算法、以图搜图算法等应用方面,建议采用我国自主知识产权的安全可靠的成熟产品。
5 结束语
结合铁路系统的应用场景及业务需求,探索在铁路运输、客运站场的综合视频监控系统建设中引入人脸识别系统,做到事前预警提醒、事中实时监控、事后智能化检索分析,实现对铁路运输全流程进行人员管控,在提升综合管控运维效力、保证铁路站场人员安全方面发挥事半功倍的作用。