浅谈ICA多媒体信号特征分析技术
2010-09-17丁明
丁 明
[摘要]本文介绍了ICA的基本概念、算法及其应用情况,重点阐述了ICA在多媒体信号中的应用。然后,分析了基于采样和ICA的特征分析方法模型,并分别介绍了二层、高层分解模型和在离散小波变换中的概貌分量的能量统计,最后提出将采样与ICA相结合的信号处理方法。
[关键词]ICA多媒体信号特征DWT
一、ICA的概念引入
独立分量分析不同于其它多媒体信号处理方法。一些方法对信号的分解的分量只能保证是不相关的,并不能保证相互独立(除非提取出的分量是高斯过程的,因为高斯信号如果不相关就意味着独立)。因此就使得这样的分解能够多的具有实际(生理)意义,提高了所提取特征的典型性。因此,ICA被视为一种具有很好的应用前景的信号处理方法。
独立分量分析可以看作是主分量分析的一种扩展,它不同于主分量分析把目光投注于信号的二阶统计量,研究信号间的相关关系,而是基于信号的高阶,研究信号间的独立关系,它将数据变换到相互独立的方向上,使经过变换所得到的各个分量之间不仅正交,而且相互独立。
二、lCA在多媒体中的应用
独立分量分析算法由于具有处理后分量相互独立的特点,被作为一种信号处理的新方法,在通信信号处理、语音信号处理、生物医学信号处理、金融数据分析、阵列信号处理及通用信号分析等方面有着非常重要的应用。这种方法最初是被用于信号分离中,通常把一些信号视为相互的独立的信号相混叠得到的,经过ICA分解后可以得到这些相互独立的信号。ICA在多媒体信号的应用中离不开信号的特征提取。基于ICA的特征提取为各种多媒体信号处理提供了很好的支持。
1.多媒体信号基于ICA的特征提取。ICA在多媒体信号处理中的应用主要是基于ICA对多媒体信号的特征提取。特征提取的本质是将高维向量空间映射到一个低维子空间中,使得原来在高维空间中表示的复杂信号投影到低维空间后,其与分类有意义的主要特征得以显现。特征提取的主要目的是找到对观测信号的一组特征表示。设计对观测信号的统计生成模型是信号处理的基本方法,生成模型中的各个分量组成了对观测数据的一种表示,这种表示可以用于数据的压缩、去噪声和模式识别等任务中。
可以假设变换后的表示成分的数量与观测信号相同。这种线性叠加模型给出了一种信号在低阶的有效描述,这里舍弃了高阶的非线性部分。另一个方面,对于多媒体信号而言,其中大部分重要特征信息与信号的高阶统计特性有着密切的关系。2.基于分块的ICA特征提取。在当前实际应用,通常是将多媒体信号分块或是利用窗口将其分解。对于图像,通常是将图像分成8×8或是16×16像素块,并把这些块作为ICA模型中的观测信号,再通过ICA,得到源信号;对于语音信号,通常是将语音分成若干段,将这些段作为观测信号进行ICA处理。
通过上述方法得到的这些源信号是相互独立的,可以视为图像的特征,因此这一过程可以称作特征提取。而基于分块法(加窗口)的这种方法,可称之为基于分块(加窗口)ICA特征提取法。通常为了更能表现出特征,人们采用一些标准化手段。具体做法为:首先将图像进行线形标准化,使得像素具有零均值、单位方差;然后将图像分成块,再进行相关处理,最后得到ICA的向量基。
三、基于采样和ICA的特征分析方法模型
本文提出将下采样与ICA相结合的信号处理方法,该方法在将多媒体信号采样的基础上再进行ICA处理,且不同于传统的基于分块的ICA特征提取方法。传统的分块法破坏了原始信号的全局特性,提取的特征只具有原始信号的局部特性,表征的意义并不是很明显。而基于采用的ICA信号处理方法提取的特征具有原始信号的整体特性,且与小波多尺度分析十分相似。
1.二层、高层分解模型。在小波分析理论中,信号除了一层分解外还有二层、三层乃至高层的分析方法,在实际应用中也被广泛地应用,如图像、视频的压缩。超分辨率复原、数字水印等。因此,研究二层、高层的分解方法(ICAT)具有一定意义。
基于采样和ICA的特征分析方法二层分解模型有两种。其中,第一种与小波分析方法类似,把原始图像将经一层ICAT分解得到的各个分量继续进行一次ICAT处理。另一种方法是将图像经过采样因子为4的采样提取出16个子图,对这16个图像进行ICA处理,这个过程称为基于采样因子为4的下采样的ICAT。
2.离散小波变换(DWT)。离散小波变换(DiscreteWavelet transform)是当前研究和应用比较广泛的信号处理方法,经过十几年的探索研究,理论基础已经非常成熟。离散小波变换是时间和频率的局域化的变换,因而能有效地从信号中提取时频分布参数。通过伸缩和平移等运算可对函数或信号进行多尺度的细化分析,解决了傅立叶变换不能解决的许多问题,被认为是时间一尺度分析和多分辨率分析的一种新技术。目前,它已被广泛应用于分形、信号处理、图像处理、地震勘探、语音识别等应用领域。
3.概貌分量的能量统计。小波多尺度分析中,图像分解得到概貌分量表示的是原始图像的低频子带,是原始图像能量最集中部分,因而被用于基于小波的图像压缩理论中重要环节。为此,应把概貌部分的能量统计作为概貌分量的一个重要特性。统计的方法、步骤如下:
(1)将概貌分量进行二维离散余弦变换(ZD-DCT)。
(2)对得到的离散余弦系数进行zigzag扫描,将得到的DCT系数按从低频到高频依次排列。
(3)除第一个DCT系数(直流系数)外,再按照从低频到高频的顺序统计交流系数能量分别占整个交流系数总能量95%、90%的个数,即统计前多少个低频交流系数的能量可以占整个交流系数总能量的95%、90%。然后分别对一层、二层小波分析方法和ICAT分解方法进行上述DCT统计分析。
(4)ICAT和DWT比较。通过对ICAT和DWT进行比较,可发现由ICAT提取出来的特征与小波提取出来的特征具有相同的特性,分别具有原始图像概貌、细节信息。此外在图像处理方面,ICAT至少有三点优于DWT。首先,同一幅图像被不同的母小波分析。通常子带的大小是不同的。如本文实验中采用Db4小波的一阶子带大小为259×259,略大于原始图像的四分之一;而在ICAT中一阶分量大小是恒定的,为256×256,为原始图像的四分之一,因此ICAT的分析比较方便。其次,概貌分量能量统计的结果说明ICAT的概貌分量能量与DWT提取的概貌分量相比,能量更加集中。也就是说可以用相对较少的DCT系数恢复出同样质量的图像。ICAT提取的细节分量与小波相比,具有更多的方向性细节。综合上述两个优点可说明,ICAT方法的稀疏性要强于DWT,即可以用较少的数据恢复相同质量的图像。总所周知,DWT能去除数据的相关性以达到减少数据的冗余的目的而被应用于数据压缩,并已经作为JPEG2000压缩标准的理论基础。ICA获得分量不仅不相关而且是统计独立的,这能更在更大程度上减少数据的冗余。最后,ICAT也可以用于图像边缘提取方面,而且在图像边缘提取中不会引入误差。
通过上述对比。得到如下结论:这种基于下采样和ICA的图像图像分析方法(ICAT)将成为一种比较有前景的图像处理方法,它将广泛地应用于图像特征分析、图像压缩、边缘提取、数字水印等领域。