面向人眼探测识别的视频优化方法研究
2014-12-02易运池
易运池,李 翔
北京农业职业学院机电工程学院,北京 102208
0 引言
在探测识别的应用中通过图像获得的信息越多,探测分析的正确性和准确性就越高,因此观察者为了提高探测识别的正确率,必须要从图像中获取尽量多的信息。基于这一需求,国内外进行了大量的相关研究,并提出了很多基于不同算法的图像增强方法,其中比较有名的是直方图均衡和Retinex 算法。近些年来,也出现了一些基于人眼视觉系统的图像增强的方法,目的是使人眼尽可能感知较多的图像信息,并根据实际应用情况进行了一定改进。但是,这些方法在用于视频图像处理时由于对连续图像的处理不足,往往会出现闪烁的现象。由于在监测系统在实际应用中大都具有较高的实时性要求,因此,这种闪烁会带探测识别的准确性产生较大的影响。因此要想增强视频优化质量、提高视频优化方法的实用性,就需要在这些面向人眼探测识别的图像优化方法进行深入了解的基础上,分析闪烁产生的原因,然后探求在不影响人眼能够获得尽量多图像信息前提下的抑制这种闪烁的方法。这一研究不仅视频优化理论的发展具有重要意义,同时也有巨大的实用价值。
1 面向人眼探测识别的视频图像优化研究成果与分析
图像的进行拍摄时,其周围环境往往十分复杂,因此拍摄过程经常会受到干扰,从而影响到拍摄的视频质量,从而给人眼难识别图像中的信息带来困难,这就需要对视频图像进行优化与图像增强。在目前常用的图像增强方法中,最基本和常用的包括直方图均衡化方法、线性拉伸方法和Retinex 算法,直方图均衡化图像处理方法以图像的灰度分布相对均匀为目标,在处理过程中将图像的灰度进行变换以达到图像增强的目的,但是容易发生相邻像素的灰度合并造成图像信息的丢失,从而影响识别的准确性,线性拉伸的方法由于这种处理方法对于图像对比度的提高十分有限,因此实用价值并不大;Retinex 算法的主要是针对低对比度图像的处理方法,但是在处理过程中易产生“光晕现象”,影响到处理效果。
图像优化的一个重要应用就是目标探测识别。这种情况下,为了保持识别的准确性,在图像优化的过程中不改变原始图像的信息是最基本的要求之一,只有这样才可以避免因破坏原始图像信息而降低探测识别的成功率。因此符合这一要求的处理方法必须满足以下两个条件:首先处理过程要做到图像原始信息的保持,尽可能少丢失或不丢失;其次是对图像进行优化的方式必须要符合人眼视觉特性,因为我们的最终目的是增加人眼获得的信息量以提高识别的准确度。
我们知道人眼获取图像信息的方式是通过灰度关系来进行的。视频图像上相邻像素的灰度关系有相等和不等两种。因此图像灰度处理的原理是处理后图像灰度相等的相邻像素间应继续保持相等关系,同时灰度不等的像素间的灰度差异被放大到能够被人眼分辨的程度。这样就既可以保持图像原有信息,又能够使人眼尽可能多地识别图像中的信息。具体优化流程是,将拍摄的图像按照相邻像素的灰度值分割成若干区域,那么这些区域就蕴含图像的所有人眼可识别或不可识别的信息。根据人眼视觉系统的可见偏差特性可知,灰度差值小的相邻区域在人眼识别时就会被视为同一区域,如果视频图像中灰度差值较小的区域数量越多,则图像中包含的信息就越难被识别,因此这些相邻区域要能够被人眼区分开来,它们之间的灰度差值就需要达到一定值。人眼的JND 特性曲线如图1 所示。
图1 人眼的 JND 特性曲线
基于以上分析,我们可以将图像进行分割后,按照区域相邻、灰度级从低到高及灰度级差值最小的原则建立图像中灰度级之间最小相邻关系表。然后将在图像中不相邻而关系表中相邻的各灰度进行合并,这样处理之后可以得到表示图像所需的最少灰度级个数,但是不会改变图像原始信息。然后依据这一原理经过数据处理就可以得到灰度级映射关系表,依据灰度级映射关系表我们就能够将图像的各像素通过灰度映射得到符合人眼观察要求的图像。但是,人眼能够分辨的灰度级的个数并不是无限多的,这一结论可以从人眼的临界可见偏差特性得到验证(如图 2)。这一理论也提醒我们,当最小灰度级个数仍然高于人眼可分辨的灰度级个数的情况下,上述方式转换的结果就会造成一些信息仍不能被人眼所识别。因此为了是视频图像在人眼识别中发挥更大的作用,就需要在图像处理时以尽量压缩不已识别的图像信息为原则,并以此腾挪出较多的映射空间,并用于易被人眼识别的图像信息。具体方法是当最小灰度级个数仍然高于人眼能够识别的灰度级个数时,可以采用以下两种不易识别的信息的压缩方式,一种是以最小相邻的灰度级中区域邻接的次数,另一种是以最小相邻区域中邻接区域的邻接长度。通过以上方法,就可以将所需的灰度级数进行有效压缩,并达到人眼能够识别的临界个数以下,然后再根据前面的方法进行灰度级映射,得到输出图像。
图2 人眼视觉心理学曲线
2 视频闪烁原因分析及抑制方法
2.1 视频闪烁原因
事实证明上面图像处理方法在单幅图像时能够获得比较理想的效果,但是将其用于视频图像的优化时经常出现闪烁现象。原始视频拍摄时现场光线环境,尤其是灯光较暗是造成闪烁固然的客观原因,但并不是根本原因。从上述优化方法的原理不难看出,其根本原因在于视频优化处理时,上述方法只能对视频图像的各帧分别进行处理,但是不能照顾到帧与帧之间相互影响的问题。这是出现闪烁的主要原因,而这种闪烁在不同的视频场景中,会反映在灰度映射曲线某个范围内在前后几帧中变化很大。
2.2 视频闪烁抑制的原理
在视频图像处理时既不能丢失原始数据,也不能向图像引入新的其他的信息,也就是必须要在保留原图像信息的不变的情况下,达到让人眼感知更多的图像信息的目标,从上一节的分析中我们事实上得到了以下结果,视频图像产生闪烁的原因是两帧图像的灰度映射曲线存在差异,并且这种差异越大,视频闪烁的现象就愈发严重,否则,闪烁的情况就相对较轻。所以,要想成功抑制闪烁,我们在视频优化时,相邻各帧之间的灰度映射关系差别尽量小一些。
2.3 视频闪烁抑制的方法
根据前面的分析,在进行视频优化时我们可以采用如下方法进行视频闪烁抑制。首先运用前面所述的方法得到的当前帧的灰度映射关系,记为 curr_map,上一帧的灰度映射关系记为 prev_map,并将两帧的灰度差值记为 diff,则可以得到视频闪烁抑制的计算公式:curr_map=k×diff+prev_map
上述公式中的k 为调节系数,特别地,当k 的数值为0 时,意味着相邻两帧间的灰度映射关系完全相同,当k的值为1时,这一公式就可以演变为第二节所述方法计算得到的映射关系。因此,在抑制闪烁处理时为了既照顾视频闪烁又保证人眼的信息感知,因此可以在数值上做一个折中,将k 值取为0.5 即可。
2.4 视频闪烁抑制的效果
图3 和图4 分别是根据抑制图像闪烁的方法以及普通方法对400 帧图像的视频进行优化处理后每帧图像的灰度均值,由于图像的灰度均值能够反映图像的总体亮度情况。从两幅图的对比可以看出,图 3 中视频各帧的均值变化显然比图4 中的视频各帧均值变化的平缓,可见闪烁抑制处理后的视频的总体亮度变化幅度要小得多,因此,视频剧烈闪烁的现象得到了明显的改善。
图3 视频闪烁抑制处理后的每帧灰度均值
图4 未经闪烁抑制处理的帧灰度均值
3 结论
面向人眼探测识别的视频优化不仅具有理论意义更具有实用价值,国内外学者在这方面做了大量的研究工作,并取得了一些重要成果。本文对于人眼识别的相关原理,以及相对应的图像优化方法进行了简要分析,并针对优化过程中的一些问题给出了相应的解决方法。
[1]黄凯奇,王桥.基于人眼视觉特性的多尺度彩色图象增强算法[J].中国图像图形学报,2003(11).
[2]刘勋,吴锦,郝颖明.面向人眼视觉的图像增强方法[J].计算机工程,2012(38).
[3]吴颖谦,方涛,李聪亮.一种基于小波分析和人眼视觉特性的图像增强方法[J].数据采集与处理,2003(1).