基于图像处理的自动调焦技术
2022-02-12翟彬
翟彬
中国航空工业集团公司洛阳电光设备研究所 河南 洛阳 471023
引言
基于图像处理的自动调焦技术,是指通过图像传感器实时处理到的图像信号来获取对摄像图像评价值,并通过评价值来给予图片的清晰程度一个评价,然后将这个“评价”作为一个反馈信号发送给微型电机,微型电机接收到信号时就会控制摄像镜头的转动方向,直到摄像镜头聚焦达到最佳状态[1]。基于图像处理的自动调焦技术中,清晰度评价值的获取和搜索方式这两种技术最为关键。
1 自动对焦技术的有关概述
1.1 传统模式下的自动对焦方法
1.1.1 距离测量法。距离测量法又称测距法,是通过对要摄像的物体发射一束光波或辐射波,然后利用接收到反射波的时间差来得到目标的距离,从而通过计算机的有关计算来实现自动对焦,这种广播以及辐射波有很多种,以此延伸出来的测距方法有超声波测距法、红外线测距法以及激光测距法等[2]。这种利用“波”的测距方法对焦结构简单,且可靠性较高,当一些被拍摄物是细状、条状时能够实现自动的对焦,对于一些处在运动中的物体、处在暗处或者处在玻璃后面的物体都能够进行自动的对焦;但是由于不同物体的材料不同,其对“波”的吸收和反射能力也有较大区别,就容易造成测距法在对焦时产生一些随机性的误差,对于一些距离较远或者本身很小的物体的摄像能力、摄像精确度较差。
1.1.2 像偏移法。像偏移法实际上是利用到了“三角形测量距离”的原理,不同于测距法发射“波”,像偏移法是摄像机通过左和右两组接收器来接收到摄像物体反射出来的光线,并在接受光线的原件上把摄像物体成像出来,然后通过对比左右两组接收器得到的信号,来求出最合适的对焦位置。被摄像物体的距离信息能够通过电荷耦合元件上成像位置的差异反映出来,并且能够直接由电荷耦合元件进行有关的检测和分辨。像偏移法的结构也相对的较为简单并且有着极强的可靠性,但是电荷耦合元件本身对于技术的要求较高,再加上光电转换电路系统、相关的成像距离运算电路系统等复杂技术,导致这种方式所需要的成本也较高。
1.2 基于焦点检测的自动对焦方法
当前,大多数单反相机应用的都是焦点检测法,将能够实现自动对焦的微型器件直接的设置在摄像设备的焦点附近,探测的对象就是镜头的焦点,这种焦点检测的方法在各种变焦摄像中都有着很好的适应性,且能够摄像的距离足够远。
1.2.1 对比度法。对比度法又被称为反差检测法,对比度法实质上是一种通过检测被摄物体边缘、轮廓而实现自动对焦的方法。被摄物体的轮廓越清晰,其与背景环境对比时所产生的值也就越大,在摄像设备中所产生的亮度也就越高,此时被摄像的主体就会最清晰,得到的就是合焦图像。与之相反的是,当摄像主体的边缘轮廓模糊、不清晰时,被摄像的物体与其周围背景间的差别就越小,亮度梯度、对比度都会有着明显的下降,摄像机焦点就不能够正确的对到拍摄物体上,就会导致照片模糊不清[3]。利用对比法设计出来的摄像设备,会将两个光电检测器放置在摄像设备底片前后相等的位置,被摄物体反射出来的光就会被光电检测器检测到,并分别输出其检测到的对比度或者是亮度梯度指数,然后经过电路系统的运算指示对焦的方向或者进行自动的对焦,当这两个光电检测器所输出的值相同时,就代表被摄像物体正好位于两个光电检测器的中间,这时对焦位置与底片位置完成的进行重合,此时对焦就已经完成。
1.2.2 相位差检测法。相位检测基于基准与参考光线实现,当被摄像物体处于不同位置时,基准光线以及参考光线就会因为物体位置改变而产生不同的位置差,有关的电路运算系统通过这个位置差就可以得出具体的相位差,再根据对焦运算就可以通过相位差得出摄像设备镜头需要移动的方向以及移动的距离,然后控制系统通过电机根据方向和大小对镜头进行调整,从而使得相位差“归零”,这时相机就会完成自动对焦。
由于焦点检测法不需要发射“波”,因此其能耗相对于传统对焦方法较少,在一般的情况下能够实现较好的对焦,特别是远距离对焦。但是其对于一些处在运动中、细状、条状的物体或者与背景反差不大、偏向于光性的物体进行对焦时,就会产生较大的困难。
1.3 基于数字图像处理的自动对焦方法
在数字成像系统中,一般会应用到数字图像处理技术来达到自动对焦的目的。
1.3.1 离焦深度法。离焦深度法(DFD),是一种通过未完全准确对焦图像来获取信息,并以这些信息来实现自动对焦目的的方法。离焦深度法通常需要建立描述成像系统的数学模型,然后通过两幅到三幅不同成像状态下的图像来获取深度的信息,并根据这些深度信息利用数学模型计算出对焦最准确的位置。由于所需的图像信息较少,因此离焦深度法能够大大地减少传统机械结构获取图像的次数,因此对焦的速度较快,但是由于其信息量少,致使其精确度也较低。
离焦深度法有两种:其一是基于图像恢复的方法,系统通过分析图像中一些具有代表意义的信息,来对成像系统中的点扩散函数进行有关的计算,然后再利用到相关的图像退化模型,通过原有的模糊图像计算、恢复成为清晰图像[4];另外一种是基于离焦量估算的方法,通过对所获取到的在不同成像参数下两幅到三幅图像的局部区域进行适当的分析和处理,确定图像模糊程度的大小,然后利用几何光学原理来将摄像模糊程度和成像参数“联系”起来,从而将最佳的合焦位置计算出来,使得摄像设备拍摄更加清晰。值得注意的是,离焦深度法需要依靠精确地数学模型来完成有关的计算,但是当前的技术只能够对焦点进行近似的估计,因此存在着较大的误差。
1.3.2 对焦深度法。对焦深度法(DFF)是一种通过反复的搜索来实现准确对焦的方法,首先要对“评价函数”进行确定,通过“评价函数”来对尚未准确对焦情况下获取到的图像的清晰度进行评价,当获取到的图像越清晰评价的值就会越大,其所对焦的位置也就越接近焦点的位置,此种方法需要通过一系列的对焦操作来逐渐的确定摄像机到物体的距离,一般需要搜索10–12幅图像才能够精确地定位到这个位置,并且所参考的图像越多,对焦的精确度也就越高。
2 基于图像处理的自动对焦系统的关键技术
2.1 对图像的清晰度进行评价
想要实现自动的对焦,就要判断所获取到的图像是否是足够清晰的合焦图像,因此基于图像处理的自动对焦首要关键就是对图像的清晰度进行合理的评价判断,而进行评价判断就要用到评价函数。对图像清晰度进行评价的函数应该具备三点特点,首先,评价函数所形成的曲线只具备一个“峰”,即在对同一个物体进行摄像时,摄像最为清晰的焦点应该只有一个并且对应评价函数的最大值;第二评价函数在峰值的两侧分别是“单调的”,即单调的上升或者是单调的下降;第三,评价函数在最高峰两侧下降程度应该较大,即整个函数曲线“更陡”。
2.1.1 频域函数。因为合焦图像是物体正好在焦点上拍摄下来的图像,所以合焦图像相对于离焦图像来说有着更多的图像细节以及清晰的图像轮廓,而在图像傅里叶中,这些丰富的信息和细节表现为高频成分的递增,与之相反的是离焦图像在频域函数上体现出高频成分的衰弱。这种对焦评价函数是建立在频域变换的基础上的,将像素图像的变换转化成为频域分布的变化,然后将中高频成分的大小作为图像清晰程度的判断依据。常用的频域函数有离散余弦(DCT)、小波变换等。
2.1.2 灰度函数。灰度函数对图像清晰度的评价主要是利用到了图像的灰度,灰度一般是通过在图像处理过程中用到的梯度函数对图像的边缘轮廓进行信息提取出来的,一般来说,正确对焦的图像会产生更大的梯度函数值,也就意味着其灰度值越高。常用的有绝度方差算子灰度函数,其利用同一行相互邻近的两个像素,通过将这两个像素的灰度值作差取绝对值来评价图像的清晰程度,当摄像设备没有准确对焦时,图片就会模糊,使得相邻像素的灰度值相差不大,而当摄像设备准确对焦时,图像变得清晰,图片中每个相邻像素所产生的灰度值就会有较大的差异,像素点间的灰度变化率也会随之增加。
2.1.3 信息熵函数。信息熵是与图像的像素灰度有关的,摄像设备没有准确对焦时,产生的图像较为模糊、像素间灰度变化的程度不明显,所包含的有关信息较少,因此信息熵就少;反而言之,合焦时,图像变得更为清晰,图像每个像素间灰度值有着较大的差异,所包含的信息开始变多,信息熵也就变大。因此可以将信息熵作为函数来对图像的清晰度进行评价,熵最大时信息量最多,图像也就越清晰。
2.1.4 统计学函数。统计学函数实质上也是根据图像灰度值引导出来的。图像完全离焦时,整个图像是不具备任何有价值的信息,图像的灰度值也就较为的平均和单一,而完全合焦的图像由于包含了丰富的信息,其图像也就变得清晰,图像像素的灰度值开始变得多样,因此就可以通过统计学将图像中灰度值的大小、概率利用直方图来估算出来,其表示了所有的图像点出现在每一灰度值上的次数,图像对焦准确时会有多个带状分布出现,而当摄像设备没有准确对焦时,所产生的带状只有少数,因此可以利用直方图来对图像清晰度进行分析和评价。
2.2 搜索算法
2.2.1 函数逼近法。函数逼近法首先要通过采集处在不同位置时清晰度的和评价值的大小,来确定评价函数和评价曲线的大致形状,然后利用简单的、已知的函数来对评价曲线的大致形状进行拟合,从而逐渐地向实际的评价曲线“逼近”,由于评价曲线的“最高峰”就是摄像设备拍摄时的准确焦点,因此可以利用拟合出来的曲线的最高点来近似地替代实际评价曲线的极值点。值得注意的是,这种方法在取值集中在极值点附近时会有着非常好的对焦成效,但是这种方法受到取值的影响较大,个别的取值数据一旦有较大的误差就会整体的估算结果造成巨大的影响,在实际的对焦过程中不是很适用。
2.2.2 爬山搜索法。这种方法建立在评价曲线走势的基础上,在理想情况下,对焦评价曲线的形状与抛物线相近,摄像设备的准确焦点就是对焦评价曲线的“极值点”,而在峰点的两边,随着距离极值点的距离变大,对焦的准确度也会慢慢地降低,并且无限接近于零。实际的最佳聚焦点搜寻过程中,首先要确定搜寻的方向和每一次搜寻的大小,每搜寻一次就要计算一次清晰度的评价值,并通过这个评价值的相对大小来确定下一次搜寻的方向和大小。一般情况下,越是接近合焦点,值就会变得越高,当计算出来的评价值相对前一次较小时,就说明已经经过了最佳的焦点聚合位置,这时搜寻的方向就要发生改变,然后不断地重复上述步骤,直到获取到最高的评价值。
3 结束语
综上所述,以图像处理为基础的对焦技术有着多样的、灵活的焦点调节方式,能够节省摄像时摄像设备所消耗的能源,简化摄像设备焦点调节的结构,具有非常重要的现实影响和发展前景。