APP下载

基于峭度的独立分量算法的性能分析研究

2014-04-10钟丽莉熊兴中

关键词:峭度鲁棒性高斯

钟丽莉,熊兴中

(四川理工学院自动化与电子信息学院,四川自贡643000)

基于峭度的独立分量算法的性能分析研究

钟丽莉,熊兴中

(四川理工学院自动化与电子信息学院,四川自贡643000)

独立分量算法是一种应用非常广泛的盲信号处理算法。而峭度作为一种重要的信号分析工具,可以有效地进行优化分析。然而,对于各种不同类型的算法的对比分析目前还少有介绍,所以有必要对基于峭度的FastICA和RobustICA两种独立分量算法进行对比分析研究。理论分析及实验结果表明,鲁棒独立分量法RobustICA在鲁棒性、收敛性和复杂度方面整体优于快速定点独立分量法FastICA,从而为实际应用提供一定的参考价值。

峭度;快速定点独立分量法;鲁棒独立分量法;鲁棒性;收敛;复杂度

引言

盲源分离(BSS)[1]是指在不知晓源信号和理论模型的情况下,从混迭信号即观测信号中恢复出各源信号的过程。独立分量分析(ICA)[2-3]基于源信号间的统计独立性,目的是将观察到的随机向量分离成统计独立变量。在众多应用中,当假设源信号独立时,ICA是盲源分离瞬时线性混合信号最自然的工具。相对于经典分离技术,比如基于二阶统计量的主成分分析(PCA),基于高阶统计量的ICA可以处理即使不是由正交列组成的一般混合结构。

1997年,芬兰学者Aapo Hyvärìnen等人提出基于峭度的快速定点算法FastICA[4],由于其无须设置参数,算法简单,收敛速度快,分离效果好,是ICA最常用的方法。但FastICA也存在不少缺陷,比如不能有目的性地提取想要的信号、弱信号提取不理想、串行分离易传递误差、存在伪局部极值和鞍点。2004年,Zarzoso A和Comon P等人改进了FastICA的缺陷,提出了一种鲁棒性更好的依然基于峭度的RobustICA[5],理论分析及大量仿真实验表明,该算法在实值和复值源信号的情况下,综合性能表现都优于FastICA。

1 对比函数峭度简介

以往的文献提出了许多ICA的对比函数,大都基于信息理论的原则,可以分为基于最大似然、基于相互信息、基于边际熵、基于负熵以及基于相关非高斯等方面。这些对比函数中,峭度kurtosis反映信号分布特性的数值统计量,是归一化的四阶边际累积量,由于采用高阶累积量比采用二阶统计量能提取到更多的有用信息,因此峭度是ICA中最常用的对比函数之一。它通过计算有效迭代技术进行优化,这种技术在搜索方向每次迭代中计算代数步长(适应系数)和全局优化对比度。

将零均值随机变量y的峭度定义为:

Kurt(y)等于零时,随即变量y为高斯分布,小于零时为亚高斯分布,大于零时为超高斯分布,三种分布如图1所示。

由中心极限定理可知,N个不同分布信号的联合分布高斯化会加强,因此,信号的非高斯性正是盲源分离模型中估计分离矩阵的关键。将峭度作为对比函数,是衡量信号的非高斯性简单合理的指标[6]。

随机变量y经过标准化处理后,E{y2}=1,(1)式可简化为:

峭度还具有线性和比例两个简化特性。设有两个随机变量y1和y2,参数a,则峭度满足:

峭度的主要优点在于,当无噪声观测模型实现后,采样量无限大也不会出现伪局部极值。这个特点引出了全局收敛源提取算法。通过这种算法,即使在卷积多输入多输出(MIMO)情况下,使用某种形式的降阶步骤,也可以进行完整的源分离。虽然峭度作为对比函数在统计效率和对抗野值的鲁棒性这两点的基础上的缺点不能忽视,但由于它数学上易于处理、计算方便和有限采样时具有鲁棒性等优点,而得到了广泛的应用。

2 FastICA和RobustICA简介

2.1 基于峭度的FastICA算法

其中,E{·}表示数学期望。易看出,这个定义对尺度不敏感,即,k(λw)=k(w),∀λ≠0。由于这种尺度的不确定性通常并不重要,在不失一般性的前提下,可以令归一化,从而简化数值。这个基于对比度的峭度最大化(KM)定义使用普遍,因为它不要求对观测信号预白化,并且不做修改就能在实值和复值信号应用。

为了简化源提取,基于峭度的FastICA算法首先要进行预白化处理,利用单位化协方差矩阵变换观测信号[7],I。在实值的情况下,公式(1)中的对比函数就相当于四阶距定义:

其中λ是拉格朗日乘数。在实值情况下,(w)的Hessian矩阵近似为:

因此,基于峰度FastICA的迭代减少为[8]:

由▽M(w)=4E{x(wTx)3},式(7)基本是梯度下降的更新规定:

在基于峭度的FastICA算法复值情况扩展中,由式(1)中的y可得更新规定[9]:

2.2 基于峭度的RobustICA算法

近年来出现了一种比FastICA更简明自然的替代算法RobustICA,它不需要简化假设,进行绝对峭度对比函数式(1)的精确线性搜索[10]:

搜索方向g通常是梯度,由g=▽wK(w)得:

在每次迭代中,RobustICA执行最优步长(OS),包括步骤[11-12]:

(1)计算OS多项式系数。对于峭度对比函数,OS多项式为:

(3)沿搜索方向使对比函数绝对最大化的根:μopt=,式(8)。

(5)进行正交化。

对比函数式(1)的一般性保证了RobustICA能够分离没有经过处理的实值和复值信号。利用特定的峭度符号ε锁定信号,RobustICA就可以很容易被改动用于处理只需要提取小部分源信号的情况。计算步长多项式的根后,式(8)可以简化为:

步骤(4)后,更新的提取矢量被限制于之前发现的提取矢量正交子空间中。在降阶式(10)的线性回归方法中,搜索算法收敛后,估计信号^s与观测信号的误差可以通过线性回归问题x=^h^s的最小均方误差求得[13]。在搜索下一个源信号重新初始化算法前,由x=^h^s得到x,从而将观测信号降阶。

3 RobustICA的进步点

相对于基于峭度的FastICA和它的变形,RobustICA在实际应用中有很多显著优点[14]:

(1)实值和复值的信号由完全相同的算法处理。二者可以在给定的混合信号中同时出现。复值源信号不需要循环。无论什么类型的源信号,混合矩阵系数可以是实数也可以是复数。

(2)因为不需要预白化,所有能避免强加的性能限制。在实际中,由于跳过预白化这一步,从而提高了渐近性能。在这种情况下,可以通过线性回归进行顺序提取(降阶)。

(3)根据用户提供的峭度符号向量定义的顺序,RobustICA可以以亚高斯和超高斯源信号为分离目标。如果提前知晓想要得到的源信号的高斯特性,就能避免全部分离和随之增加的复杂度与估计误差。

(4)在对比函数中,当处理短数据量时,容易出现鞍点和伪局部极值,而最优步长技术可以增强RobustICA的鲁棒性。

(5)综合考虑源信号提取质量和运算操作数量,RobustICA显示出了非常高效的收敛速度。

4 仿真分析

仿真实验以Matlab为平台,随机产生四类循环和非循环源信号S,如图2所示,采样频率为1000,采样长度为100:

产生随即混合矩阵,将仿真出的源信号混合,得到观测信号X,如图3所示。

用FastICA对混合信号进行分离,得到的估计信号SF与源信号S进行对比,如图4所示。

用RobustICA对混合信号进行分离,得到的估计信号SR与源信号S进行对比,如图5所示。

图5可以直观看出,RobustICA分离得到的估计信号与源信号重叠较好,显现的蓝色较少。采用信号均方误差衡量两种算法的分离效果,SMSE越小,效果越好。本次实验采用两种算法提取每条信号所产生的SMSE,如图6所示。从6中可看出,8次提取中,蓝色的FastICA在2、3、4、6、7、8六次的提取中SMSE都小于红色的RobustICA。FastICA的平均SMSEF=-23.3582 dB,RobustICA的平均SMSER=-24.609 dB。由SMSEF>SMSER可知,RobustICA的整体分离效果比FastICA好。

计算复杂度由总的迭代次数和每次迭代的计算量决定。本次实验得到的两种算法的迭代次数数据见表1。

由表1知,虽然在每次迭代中,基于峭度的RobustICA每次迭代的计算复杂度要大于基于峭度的FastICA,如表2所示,其中L为源信号个数,T为采样长度。但由于RobustICA每次的迭代方案都更有效,在同样的提取精度要求下,迭代次数减小,最终整体收敛速度和计算复杂度都要优于FastICA。此外,在某些情况下,比如超高斯源信号或者采样点数较少时,FastICA还达不到RobustICA所能达到的精度[15]。

5 结束语

无论是源信号是实值还是复值、循环或者非循环、亚高斯或者超高斯,又或者是否已经预白化处理,峭度一直被认为是在瞬时和卷积线性混合信号中提取独立源的有效对比函数。该对比函数在整个搜索方向的全局最大化,可以用代数方法在每次提取滤波更新迭代时获得,这也提升本文所研究的RobustICA的性能。由于基于峭度函数,RobustICA可以不需要预白化,就能处理实值和复值源信号。其结果就是,在对待常在短数据量出现的这类残留源相关性,RobustICA比基于白化的算法容忍度更大。除此之外,最优步长法加强了RobustICA在初始化和鞍点方面的鲁棒性,特别是在小观测窗口时。达到给定源提取质量的计算复杂度是衡量BSS/ICA最自然最客观的手段。由于没有二阶预处理(白化)所带来的性能限制,与流行的、具有渐近立方全局收敛性的FastICA和它的一些最新变形比较后,RobustICA被证明计算速度更快,更效率。

[1]张发启,张斌,张喜斌.盲信号处理及应用[M].西安:电子科技大学出版社,2006.

[2]Hyvarinen A.Karhunen J.oja E.Independent Component Analysis[M].New York:John w iley&Sons,2001.

[3]Hyvärinen A,Karhunen J,Oja E.Independent Component Analysis[M].New York:John W iley&Sons,2001.

[4]Hyvärinen A,Oja E.A fast fixed-pointalgorithm for independent component analysis[J].Neural Computation, 1997,9(7):1483-1492.

[5]Zarzoso V,Comon P.Robust independent component analysis for blind source separation and extraction w ith application in electrocardiography[C].//In proc.EMBC-2008,20th Annual International Conference of the IEEE Engineering in Medicine ahd Biology Society,Vancouver, BC,Canada,2008:3344.

[6]王峻峰.基于主分量、独立分量分析的盲信号处理及应用研究[D].武汉:华中科技大学,2005.

[7]高巧玲,刘辉.一种FastICA的改进算法[J].计算机技术与发展,2010(11):20-11.

[8]Zarzoso V,Comon P.Comparative speed analysis of FastICA[C].//In Proc.ICA-2007,7th International Conference on Independent Component Analysis and Signal Separation,London,UK,2007:293-300.[C].//In Proc.EMBC-2008,30th Annual International Conference of the IEEE Engineering in Medicine and Biology Society,Vancouver,BC,Canada,2008:3344-3347.

[9]Hyvärinen A.Fast and robust fixed-point algorithms for independent component analysis[J].IEEE Transactions on Neural Networks,1999,10(3):626-634.

[10]Zarzoso V,Comon P.Robust independent component analysis[EB/OL].I3S Laboratory,University of Nice-Sophia Antipolis,CNRS,Tech.Rep.I3S/RR-2009-02-FR,Mar.2009.

[11]赵陶钰,邵鹏华.基于峭度的一种RobustICA算法[J].电脑开发与应用,2012(8):25-28.

[12]郑茂,张银涛,郑林华.一种稳健的基于峰度的独立分量分析算法[J].航天电子对抗,2010(5):26-30.

[13]Zarzoso V,Comon P.Robust Independent Component Analysis by Iterative Maximization of the Kurtosis Contrast w ith A lgebraic Optimal Step Size[J].IEEE Transactions on Neural Networks,2010,21(2):248-261.

[14]姚文坡.基于健壮独立分量分析及其改进方法的胎儿心电信号提取的研究[D].南京:南京邮电大学,2013.

[15]吴微,彭华.FastICA和RobustICA算法在盲源分离中的性能分析[J].计算机应用研究,2014(2):31-32.

Research on Performance Analysis of Independent Component Algorithm Based on Kurtosis

ZHONG Lili,XIONG Xingzhong
(School of Automation and Electronic Information,Sichuan University of Science&Engineering,Zigong 643000,China)

Independent component analysis algorithm is a widely used algorithm for blind signal processing.As an important signal analysis tool,kurtosis can be effective for optimization and analysis.However,there is little introduction to the comparison and analysis for various types of algorithms currently.Therefore,it is necessary to research and analyze the comparison between FastICA and RobustICA based on kurtosis.The theoretical analysis and the simulation results indicate that the robustness,convergence and complexity of RobustICA are better than that of FastICA on the whole.Thus it provides the reference for practical applications.

kurtosis;FastICA;RobustICA;robustness;convergence;complexity

TN911.72

A

1673-1549(2014)04-0043-05

10.11863/j.suse.2014.04.11

2014-02-11

四川省杰出青年基金项目(2011JQ0034);四川省省属高校科研创新团队建设计划基金项目(13TD0017);人工智能四川省重点实验室基金项目(2012RYJ05)

钟丽莉(1989-),女,四川自贡人,硕士生,主要从事信号盲分离方面的研究,(E-mail)381340169@qq.com

图1峭度与分布的关系

猜你喜欢

峭度鲁棒性高斯
基于MCKD和峭度的液压泵故障特征提取
联合快速峭度图与变带宽包络谱峭度图的轮对轴承复合故障检测研究
荒漠绿洲区潜在生态网络增边优化鲁棒性分析
数学王子高斯
基于确定性指标的弦支结构鲁棒性评价
天才数学家——高斯
谱峭度在轴承故障振动信号共振频带优选中的应用
基于非支配解集的多模式装备项目群调度鲁棒性优化
非接触移动供电系统不同补偿拓扑下的鲁棒性分析
基于鲁棒性小波包峭度图的滚动轴承故障诊断*