智能视频监控系统关键技术研究
2023-12-21郑孜祎
郑孜祎
中国人民公安大学,北京,100038
0 引言
如今,大量监控系统已出现在人们的生活中,其组成部分包括电视墙与相关监控器。虽然工厂、公共场所等机构均对视频监控系统予以了运用,但也只是单纯的录像操作而已,只是为了让后续的取证管理更加方便,进而也就降低了图像价值。而就算事后取证是必然,但如果能事前预警无疑是最好的,对此便需要计算机系统对监控视频的实际内容展开快速分析。目前,随着科学技术的发展速度不断加快,计算机的相关性能也越来越完善,也使得图像处理技术、计算机视觉等在智能监控系统中得到了充分应用[1]。
1 智能视频监控系统的概念
智能视频监控系统以图像处理、计算机视觉技术和模式识别为主要手段,将智能视频分析模块加入系统中,并通过计算机在数据处理方面拥有的强大能力,过滤画面中用不到或是对正常画面产生干扰的信息,监控系统主要是发挥监控技术的优势将视频中有价值的信息抽取出来,当发生异常情况时立即报警,该监控技术能够对突发事件进行处理,为警察处理相关问题提供有效帮助[2]。作为人工智能研究领域的一个分支,计算机视觉技术可让映射关系在图像和图像描述间形成,基于此可通过数字图像处理以及分析等方式,理解视频画面中包含的相关内容[3]。
2 视频监控系统的发展应用及研究现状
2.1 视频监控系统的发展
智能视频监控在具体发展过程中,需要将传统视频监控作为基础。对于传统视频监控系统的发展而言,涉及以下阶段。第一,模拟时代。20世纪末,模拟闭路视频监控系统等设备的依赖性极强,诸如监视器、录像机等。图像在进行传输时,通常运用同轴电缆,涉及无法远程访问等相关缺点。并且,臃肿的存储方式也加大了信息查询与检索的难度。第二,数字时代。20世纪中期,随着数字视频压缩编码技术的持续进步,形成了将数字硬盘录像机等作为基础的半数字系统。在存储数字化的推动下,提高了用户对视频信息进行处理的能力。第三,网络时代。进入新世纪后,在计算机与网络技术更新迭代速度逐渐加快的背景下,人们逐渐加强了对IP视频监控系统的关注,其还被称为网络数字视频录像机系统[4-5]。对于此系统而言,是将标准TCP/IP协议作为基础,通过互联网实现传播工作,并在流媒体技术的作用下于网络上多路复用传输所采集的信息,同时借助中央控制服务器、转发视频流等,促使整个监控系统的存储、调度、指挥以及授权控制等功能顺利实现。
2.2 智能视频监控系统的应用
2.2.1 安全相关类应用
(1)高级视频运动检测。系统能够在恶劣天气环境中准确检测单个、多个物体的实际运动状况,诸如运动方向、速度等。
(2)运动跟踪。顺利检测到运动物体后,立足于物体运动状况,结合摄像机,对控制指令进行自动发送,保证计算机能够自动对物体予以全面跟踪,若物体经过运动之后脱离了监控区域,那么会立即向物体所处区域的摄像机进行通告,使之对物体进行继续跟踪[6]。
(3)人物面部识别。对人物的脸部特征进行自动识别,同时借助对比数据库档案对身份进行识别与验证,诸如机场、火车站等。
(4)车辆识别。准确识别车辆形状、颜色以及车牌号码等信息,然后第一时间反馈给监控人员。在跟踪被盗车辆等场景中,这一类应用发挥了重要作用。
(5)智能监护。通过对正常人动作行为的学习与锻炼,当家里老人等存在异常状况时,可迅速检测然后发出警报。
2.2.2 非安全相关类应用
(1)人数统计与人群控制。系统能够对指定区域中的人流量进行全面统计,并对人群表现出来的整体运动特点予以识别,诸如方向、速度等,预防产生拥堵的状况,或是迅速发现人群表现出来的反常状况,主要应用于超市、火车站等场景。
(2)交通流量控制。用于监视高速公路或是环线公路上的交通,完成对车流量、平均车速、违章行车行为、交通事故的统计。
3 智能视频监控系统关键技术
3.1 图像增强
图像增强指的是根据特定需求突出图像内的某些关键信息,在此基础上消除无用信息,有效增强图像对比度,优化其视觉效果,更好地进行之后的图像分析。对该技术而言,现阶段已经涉及诸多算法,各类算法针对特殊场景与对象能够发挥出较好的增强作用,但依旧存在自身的缺陷。
图像增强算法通常来说涉及空域增强以及频域增强两种类型。前者一般有灰度变换、直方图均衡、平滑增强以及模板滤波增强等。直方图均衡算法属于相对简单、运用广泛的一种算法,然而针对高照度图像进行处理的过程中会存在过饱和现象,同时容易增加噪声,导致图像整体视觉效果降低。匹配的改进算法主要有自适应直方图均衡、对比度限制的自适应直方图均衡等,按照图像的局部统计数据对其灰度动态范围进行调整,能够得到更加丰富的细节,最终实现图像增强的目标。而从频域角度来说,相关算法主要有低通滤波、高通滤波、带通以及带阻滤波等。图像变换一般有傅里叶变换、小波变换以及离散余弦变换等。同时,近年来基于小波变换而逐渐衍生出的Curvelet与Contourlet变换,表现出更高的精度,所以也常常将其运用到图像边缘以及轮廓信息的表达过程中,在很大程度上促进了图像增强效果的提升。在实践中针对纹理细节较多的图像,仅仅进行尺度表达无法有效符合处理要求,小波变换算法属于多角度分析算法的典型代表。图像通过小波变换细化为各种尺度的子带图像,借助调整子带小波系数来达到图像增强的目标。同时,由小波变换理论逐渐衍生出新的图像多尺度分析理论:曲波变换,这一算法表现出更加精确的辨识度,有效提高了图像内直线以及曲线的几何特点表达能力,可以更为准确地识别其中的边缘细节以及噪声,但是该算法在实际应用中存在复杂性较高的缺点,因此并未得到普及应用。
3.2 运动目标检测
运动目标检测属于视觉系统以及智能视频分析系统的重要工作,是现阶段的主要研究方向,为后续的目标追踪、行为分析以及事件检测的相关研究提供了更加丰富的理论和技术支持。借助运动目标检测可以将运动前景和背景予以分离,将运动目标直接从视频序列中进行提取,最终结果的优劣在很大程度上关系到后续算法能否发挥出实际作用。同时针对智能视频监控来说,很多事件检测也能够通过运动目标检测算法予以实现,包括入侵检测、人数统计以及车流量统计等。现阶段主要包含如下几种。
首先是光流法。该方法是借助于光流方程对各个像素点的实际运动状态进行计算,对图像实施动态分析,通过这样的方式获取目标的位置、数量等信息,在此基础上实现对目标的追踪。另外,这一算法对噪声相对敏感,实际精准度不是很高,难以有效掌握目标的精确边界,同时该方法需要庞大算量支持,无法大范围推广应用。
其次是帧差法。这一方法是针对相邻两帧或是多帧图像差分,随后通过阈值分割的手段,超过阈值像素将其当作前景目标,不超过的则当作背景。帧差法一般来说对动态环境表现出更高的适应性,然而提取目标存在空洞问题,也可能出现漏检的问题。
最后是背景差分法。该方法属于现阶段普遍使用的一种,其基本原理是针对背景实施建模之后和视频帧予以对比,从而获取差分图像,其中像素值变化更大的可以判定为前景目标。相对上述两种方法来说,该方法能够有效实现实时监控,同时检测准确性更高,优势更大,但实际检测结果往往受到背景建模环节精准度的影响。在实施背景建模的过程中必须充分考虑到具体场景中一些不能预测的因素出现,比如动态背景、光照变化以及相机自身抖动,更加精准地建模对于前景目标检测来说提出了很大的技术难题,高斯混合模型便属于非常经典的建模策略,可以有效处理光线变化以及背景混乱等问题,但这一方法的应用必须定期予以更新,还涉及不同参数的设置,需要消耗较大算量,难以保证实时性的要求。目前普遍使用的建模算法还包括SACON201、ViBe、GMG3P等算法。
3.3 局部特征匹配
图像匹配技术属于诸多领域都会采用的一项基础又非常重要的技术,如电子稳像、图像配准、图像融合、目标识别和跟踪以及三维重建等,也是智能视频监控系统重要研究内容之一。一般来说,图像匹配方法主要分为两种,分别是基于灰度相关匹配与基于特征匹配。前者具有复杂的算法,对于图像间的多个方面均有较高的敏感度,包括尺度缩放、亮度变化等,缺乏良好的抗噪声能力。而后者的算法又由两部分构成,即全局特征匹配算法、局部特征匹配,其中全局特征抽取于整个图像中,而局部特征则抽取于某个局部区域。在检索领域中,全局特征多用于对整个图像内容进行描述,比如颜色直方图的检索性能就非常好。但图像混叠以及存在遮挡时不适合采用全局特征,而需采用局部特征描述。
局部特征具有诸多不变性,体现在旋转、尺度、仿射变换等方面。提取图像局部特征,主要是提取角点、区域特征以及斑状等。提取结束后,需借助一种有效方法描述相应图形的局部特征。为保证局部特征相似性的度量成功实现,需要采用一种紧凑且完整的局部特征的描述。而其中最具代表性的描述子就是SIFT特征描述子,其性能得到了大家一致的认可,在局部特征研究领域该项工作具有里程碑意义。基于SIFT理论研究,还提出了如GLOH、SURF以及PCA-SIFT等其他描述子,但都对SIFT特征描述子的生成方法予以了借鉴,但在很多方面,如局部特征提取速度、稳定性等,也相应地改进了SIFT特征描述子,获得的效果较为理想。
4 结语
综上所述,相较于传统意义上的视频监控技术,智能视频监控技术与之存在很大的不同。传统的视频监控系统一般只负责录制、存储,而智能视频监控系统则可利用计算机视觉和模式识别的方案,自动分析研究监控设备采集的图像,同时定位场景中的目标物体,对其展开精确识别,无需人为干预,所以在很多方面均拥有良好的应用空间。