图像多分辨率表示方法概述
2018-05-14张卓
张卓
摘要:图像处理的核心任务是视觉信息的有效表示,图像多分辨率表示方法具有多尺度、多方向特性,能有效捕捉图像纹理、边缘等重要图像结构信息。本文对国内外研究状况进行了阐述,提出存在的问题,探讨了图像多分辨率表示的发展方向。
关键词:图像表示;多分辨率;图像处理
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2018)02-0207-01
1 引言
图像处理的核心任务是视觉信息的有效表示,好的图像表示能用较少的描述捕获重要的目标信息。M.N.Do给出了图像有效表示的目标为:多分辨率、局部性、临界采样、方向性和各向异性[1],而多分辨率是符合人眼视觉的重要要求。
图像多分辨率表示起源于图像金字塔分解,故在第2部分首先介绍图像金字塔的组织结构和特点,然后介绍基于金字塔结构发展而来的方向多分辨率图像表示方法。在第3部分先给出四叉树分解结构的变分辨率特征,然后介绍了复合多分辨率图像表示方法。
2 方向多分辨率图像表示
2.1 图像金字塔
图像金字塔是图像多分辨率表示理论的最早应用。对一幅图像进行金字塔分解,首先将其在两个方向上进行1:2的亚采样,然后经过滤波处理得到原始图像的缩略图。重复此过程,就可得到不同尺度的缩略图。
图像金字塔作为一种图像多分辨率表示方法,仅能产生较粗的频率分解,没有方向分解,所有在同一个倍频程的频率,都包含在金字塔同一层中,因而应用领域受限。
2.2 方向多分辨率图像表示的发展
图像金字塔表示的方向匮乏问题使其应用受限,如何将图像多分辨率表示与多方向性结合起来,是重要的发展方向。
Stephance G.Mallat于1989年将小波分析应用于图像领域,图像的小波分析不仅能对图像进行不同尺度分解,而且二维小波基具有多方向性,能一定程度的表达图像几何正则性。但在二维小波逼近奇异曲线过程中,出现的大量不可忽略的系数使其无法“稀疏”表达原函数。为解决图像等多维数据有效表达的问题,需寻找更优的方向多分辨率图像表示方法。
1998年E.J.Candes和D.L.Donoho提出Ridgelet变换。此变换是针对直线奇异的多变量函数的最优逼近,为非自适应高维函数表示。变换过程首先运用radon变换,把线状奇异性变换成点状奇异性,再用小波变换进行处理。因此,Ridgelet变换具备了一定的方向辨识能力,对具有方向性的直线特征可有效表达。
Ridgelet变换虽能最优逼近含直线奇异的多变量函数,但对图像中的曲线却无能为例。1999年E.J.Candes又提出单尺度Ridgelet变换,用直线逼近曲线,能较好处理图像曲线的奇异特征。较之小波变换,其针对含曲线奇异的多变量函数的逼近能力有所提升,但在计算复杂度上有所牺牲。
1999年E.J.Candes和D.L.Donoho提出第一代Curvelet变换。有别于单尺度Ridgelet变换只在某一尺度进行Ridgelet变换,Curvelet变换在所有尺度上完成Ridgelet变换。这种变换综合了Ridgelet变换擅长表示直线和小波适合表示点奇异性目标的优点,但存在加窗效应,又因使用的仍为Ridgelet变换,复杂度高。
2005年E.J.Candes和D.L.Donoho对算法进行改进,提出第二代Curvelet变换。该方法不再使用Ridgelet变换,而是通过在频域进行划分,直接给出了具体的变换形式。第二代Curvelet变换在方向性、时频域局部性和非线性逼近等方面有更好的表现,但仍没有解决冗余度和加窗效应的问题。
M.N.Do和M.Vetterli于2001年提出Contourlet变换。该变换在离散频域中直接定义,避免了复杂的离散化操作,比Curvelet变换的冗余度和计算复杂度低。但对于多数角度滤波器,该变换无法在频域迅速局域化,造成图像边缘线的伪振荡。另外,Contourlet变换缺乏完整、系统的逼近理论和算子理论,基础理论还有待完善。
2007年K.Guo和D.Labate等人在合成膨胀的仿射变换基础上提出Shearlet变换。该变换允许每个尺度上有不同数目的方向分解,其基支撑区间具有长宽比随尺度而变的“各向异性”特点,能实现对图像的稀疏表示。相比其它图像多分辨率表示,Shearlet变换理论性强,算法实现简单,计算复杂度低,在图像处理方面应用广泛。
3 复合多分辨率图像表示
3.1 四叉树
四叉树表达法利用金字塔式的数据结构对图像进行表达,树根对应整幅图像,树叶对应单个像素或相同特征像素组成的方阵。
复合多分辨率图像表示是一类结构较复杂的图像多分辨率表示,基于四叉树分裂结构的隐型模型。不同于金字塔多分辨率的分解形式,复合多分辨率表示是在四叉树分裂结构的基础上,根据预先已知的图像几何正则性,对图像进行自适应二进剖分。
3.2 复合多分辨率图像表示的发展
复合多分辨率图像表示采用四叉树分裂结构,对分块进行恰当的描述来逼近图像的几何结构和边缘信息。根据不同图像内容,分块大小随之调整,体现多分辨率特性。
1999年D.L.Donoho提出Wedgelet变换。Wedgelet基是定义域为正方形区域的分片二值函数,Wedgelet字典由不同尺寸、不同方向的一组Wedgelet基构成,用以描述图像边缘。Wedgelet变换为水平模型的物体提供了一种近似最优的表示,主要用于检测有噪图像的线性奇异性信息,但由于Wedgelet逼近自底向上,计算时间较长。
2000年D.L.Donoho和霍小明提出Beamlet变换。Beamlet字典由在不同位置、方向和尺度上进行二进结构剖分的线段组成,可对全部线段实现多尺度逼近,能有效分析线段奇异性。相较于小波分析对光滑函数进行了最优稀疏表示,Beamlet变换最优稀疏表示了图像中的光滑曲线。
Pennce和Mallat在2000年提出第一代Bandelet变换。这种变换能够自适应跟踪图像几何正则方向,为基于边缘的多分辨率表示。变换首先将图像的几何特征转换为矢量场,把灰度变化的局部正则方向用矢量来表示,然后在矢量线方向进行小波变换,用光滑的曲线描述不连续重要的小波系数。Pennce和Mallat给出了Bandelet变换的最优基快速寻找算法,在去噪和压缩方面体现出一定优势。
2005年Peyreg和Mallat改进算法,提出第二代Bandelet变换。该变换避免了重采样和弯曲等在第一代Bandelet变换中造成算法实现复杂的操作,通过二维小波变换实现多分辨率分析,通过正交方向的一维小波变换实现几何方向分析,二者共同实现了图像表示。第二代Bandelet变换具有简单、正交及没有边界效应等特点,在图像处理领域应用更为广泛。
4 结语
本文从两条主线粗略探讨了图像多分辨率表示的发展概况,阐明了它们产生的背景和发展历程,并指出其优缺点和发展方向。虽然图像多分辨率表示已發展多年,但其重要价值才崭露头角,如何能更加有效地研究和利用图像多分辨率表示方法,对未来图像智能信息处理至关重要。
参考文献
[1]M.N.Do, M.Vetterli. The contourlet transform: an efficient directional multiresolution image representation, IEEE Transactions Image on Processing.2005,14(12):2091-2106.