APP下载

基于信号时频域聚集性的欠定盲分离混合矩阵估计方法

2016-11-25温江涛赵倩云孙洁娣

北京理工大学学报 2016年7期
关键词:频域比值线性

温江涛,赵倩云,孙洁娣

(1.燕山大学 河北省测试计量技术及仪器重点实验室,河北,秦皇岛 066004;2.燕山大学 信息科学与工程学院,河北,秦皇岛 066004)



基于信号时频域聚集性的欠定盲分离混合矩阵估计方法

温江涛1,赵倩云1,孙洁娣2

(1.燕山大学 河北省测试计量技术及仪器重点实验室,河北,秦皇岛 066004;2.燕山大学 信息科学与工程学院,河北,秦皇岛 066004)

为解决欠定盲分离中混合矩阵估计问题,通过研究观测信号在时频域的线性聚集特性,提出一种基于时频域线性聚集程度差异的混合矩阵估计方法,并着重研究在信号线性聚集程度较弱情况下对混合矩阵的估计. 首先,利用观测信号或其时频域中相应变换系数的比值分布衡量信号线性聚集程度;其次,采用优化初始中心的K-均值聚类算法估计混合矩阵. 该算法降低了对信号稀疏性的要求,并且可以较高精度地估计出混合矩阵. 仿真实验结果表明该方法具有可行性和有效性.

欠定盲源分离;混合矩阵估计;线性聚集性;改进K-均值聚类

盲源分离(blind source separation,BSS)是指传输信道和源信号都未知时,仅从观测信号中分离源信号的过程. 在实际问题中,观测信号的个数一般少于源信号个数,即为欠定盲源分离(underdetermined blind source separation,UBSS). 其简化的数学模型为

(1)

式中X(t)=[x1(t)x2(t) …xm(t)]T为由M个传感器得到的观测信号;A∈Rm×n未知的混合矩阵;S(t)=[s1(t)s2(t) …sn(t)]T为N个未知的源信号,且M

Lee等[4]提出先估计混合矩阵,然后重构源信号的方法,即“两步法”,它是目前解决稀疏信号分离问题的常用方法. 实现源信号的精确重构,需准确估计混合矩阵A,因此高精度地估计A是两步法的核心. 近年来在SCA的基础上,提出了许多解决欠定盲源分离问题的新算法,如退化分离估计技术(DUET)[5]、时频混合比算法(TIFROM)[6]、超平面聚类算法[7]、非线性投影列掩蔽算法[8]等,这些算法均假设信号为稀疏或弱稀疏信号,但并未对信号的稀疏程度做进一步的研究. 估计A的前提条件是混合信号须在散点图中呈现较为明显的方向性,即信号须有一定的线性聚集性,而实际中很多情况并不满足此要求.

针对上述问题,本文提出一种基于信号时频域内聚集性估计混合矩阵的算法. 该算法通过统计观测信号在时频域内变换系数的比值分布情况衡量观测信号的线性聚集程度,并根据不同程度的线性聚集性研究最佳的混合矩阵估计方法. 该方法降低了对信号稀疏性的要求,仅需增强散点图中线性聚集程度即可较为精确地估计混合矩阵.

1 欠定盲源分离问题

式(1)展开可改写为如下形式:

(2)

式中:xi(t)是行矢量,表示第i路观测信号;si(t)也为行矢量,表示第i个源信号. 对式(2)进行短时傅里叶变换(STFT)得

(3)

式中xi(t,k)和si(t,k)分别为第i路观测信号xi(t)和第i个源信号si(t)的STFT系数.

解决欠定盲源分离问题的方法主要基于信号的稀疏性,假设源信号S为强稀疏信号或其变换系数具有强稀疏性,即非零值的个数是唯一的或只有少数信号具有较大值,大部分数值很小可视为零值. 研究表明多数信号在变换域中都具有稀疏性[9],本文主要以混合信号在时频域中变换系数的稀疏性为例进行理论推导.

若在时频点(tk,kk)仅有sj(tk,kk)为非零值,有

(4)

式中aj为混合矩阵A的第j列,式(4)可改写为

(5)

从几何意义来说,式(5)是一个直线方程,故sj(tk,kk)所有采样时刻将确定一条直线,并且直线的方向为混合矩阵A的第j列向量,此时信号在时频域中线性聚集性强,可直接采用聚集算法估计混合矩阵. 然而,在实际情况中信号的线性聚集程度是未知的,不确定是否能够直接采用聚类算法估计混合矩阵. 因此,有必要对信号的线性聚集程度进行衡量,并根据线性聚集程度进一步研究精度更高的混合矩阵估计算法.

2 基于信号时频域聚集性的混合矩阵估计方法

估计混合矩阵A的主要依据是信号的线性聚集性,信号的线性聚集性强,信号在散点图中呈现出清晰地方向性,可直接运用聚类算法估计混合矩阵;反之,不呈现方向性,直接运用聚类算法得不到混合矩阵的估计,需增强线性聚集性,再进行混合矩阵的估计. 因此,衡量信号线性聚集程度并增强其程度对精确估计A具有重要影响.

2.1 信号线性聚集程度的衡量

将信号X(t)进行STFT,为了更好地衡量信号线性聚集程度,利用式(6)去除能量值较小的变换系数:

(6)

式中ε为阈值. 由此时的变换系数得到其比值d(t,k)为

(7)

令a=min{d(t,k)},b=max{d(t,k)},将区间[a,b]分为相等的P个子空间,可表示为{a+(i-1)δ,a+iδ}i=1,2,…,P,其中δ=(b-a)/P,且P充分大,统计d(t,k)样本点落在各子区间的个数Di(i=1,2,…,P). 比值d(t,k)相差较小的变换系数近似汇聚于一条直线,且d(t,k)会落入同一子区间内;反之,落入不同的子区间. 线性聚集性强时,比值d(t,k)集中落入部分子区间内,对应的Di较大,P个子区间内Di呈现极大值和极小值的间隔分布;线性聚集性弱时,比值d(t,k)会散落在相对应的子区间内,P个子区间内Di不呈现极大值和极小值的间隔分布. 因此,统计Di分布能够衡量线性聚集程度.

2.2 增强信号线性聚集程度

通常混合信号在时域中甚至时频域中的比值并不会集中落在某些子区间,即Di在P个子区间中不呈现峰值点,因此,线性聚集性较弱. 针对此种情况,本文研究了基于时频域等比系数增强观测信号时频域内线性聚集程度的方法.

定义1 观测信号在时频域内变换系数的实部之比与虚部之比相等,且为常数,该常数是混合矩阵对应列向量的比值,称此类变换系数为等比系数.

以观测信号个数M=2为例,假设时频域中某时频点(tz,kz)上的比值与混合矩阵A第i列的比值相等. 则有

(8)

式(8)可改写为

(9)

最大概率满足式(9)的情况是在时频点(tz,kz)处仅有源信号si(tz,kz)作用,其他源信号对X(tz,kz)不起作用或作用相互抵消. 式(9)可改写为

(10)

由式(10)可知等比系数实部的比值与虚部的比值相等,且与混合矩阵对应列向量的比值相等. 因此,等比系数散点图呈现清晰的方向性,其线性聚集性强. 然而实际应用中,式(10)中Re[X2(t,k)]/Re[X1(t,k)]和lm[X2(t,k)]/lm[X1(t,k)]的值会存在一定的误差,并非完全相等,因此设定一个门限值ω,消除此种误差,判定等比系数的公式为

(11)

式中ω的取值范围为(0,0.1),ω是一个经验性取值,满足式(11)的变换系数可视为时频域中的等比系数. 因此,可以进一步对等比系数进行分析得到混合矩阵的估计值.

2.3 混合矩阵的估计方法

前文对时频域中等比系数进行了有效判定,将有效选取的等比系数采用式(12)进行单位化处理,得到集合U为

(12)

式中X(tz,kz)为时频域上选定的等比系数,Ωz为所有选定等比系数的集合. 由于该集合中的向量均为单位向量,进一步计算向量之间的比值,即

(13)

运用聚类的方法将集合H进行分类,若H中任意两个hm、hn相等或者近似相等,则将其归为一类.

(14)

式中:sum(Cn)为第n类中所有向量个数;∑hCn为第n类中所有元素之和,则可通过式(15)估计混合矩阵列向量为

(15)

3 实验结果及分析

针对欠定盲源分离问题,对本文提出的基于时频域信号聚集性估计混合矩阵的方法进行仿真及分析. 估计误差采用归一化均方误差(NMSE)进行评价,并与Bofill的势函数算法进行对比.

归一化均方误差为

(16)

3.1 观测信号在时频域内线性聚集性较强的情况

取M=2、N=6,即有6路源信号,2路观测信号. 6路源信号截取自6段长笛声音信号,取自Bofill[10]的仿真实验,6路源信号采样点数均为32 768点. 随机选取混合矩阵A,并对其列矢量归一化为

根据式(1)混合后得到两路观测信号,如图1所示.

首先衡量观测信号的线性聚集性,图2为P=40时观测信号在时域及时频域中比值分布情况.

分析图2中Di的分布可知:观测信号在时域中Di不具有明显的极值,因此线性聚集性差;而在时频域中Di的极值间隔分布,线性聚集性较强. 为验证上述分析的正确性,图3中给出观测信号的时域和时频域散点图.

由图3可知,观测信号在时域散点图中未呈现方向性,而在时频域具有明显的方向性,线性聚集性较强.

因此估计混合矩阵A时可以采用改进的K-均值聚类算法,得到的估计结果为

为评估本文算法估计矩阵的精确度,采用Bofill的势函数算法[10]估计混合矩阵为

由图4可知:本文提出的算法估计混合矩阵的归一化均方误差明显小于Bofill势函数算法,本文提出算法估计的混合矩阵更为精确.

3.2 观测信号在时频域内线性聚集性较弱的情况

取M=2、N=4,即4路源信号,2路观测信号. 采用的4个源信号均为实际语音信号,取自http://www.speech.cs.cmu.edu/cmu_arctic/,每组源信号的采样点数为35 920点,混合矩阵为

根据式(1)混合后得到两组观测信号如图5所示.

首先衡量观测信号的线性聚集性,图6是P=40时观测信号在时域及时频域中比值分布情况.

分析图6中Di的分布可知:两个分布图均不具有明显极值,因此,线性聚集性均较弱. 直接运用改进的K-均值聚类算法估计混合矩阵会有很大的误差甚至无法得到估计矩阵. 图7给出了观测信号在时域、频域、时频域的散点图用于验证上述分析的正确性.

由图7可知,观测信号在时域和频域散点图中未呈现方向性,在时频域散点图中呈现模糊的方向,线性聚集性依旧较弱. 下面利用本文提出的算法,在时频域中选取适当等比系数增强线性聚集性进而估计混合矩阵A. 利用式(11)选出时频域中的等比系数,其中选取ω=0.025,如图8为等比系数的比值分布情况:所示Di的分布具有明显的极值,线性聚集性得到了增强.

分析图8中Di的分布可知:等比系数在时频域中具有较强的线性聚集性. 图9为时频域等比系数的散点图.

实验2信号直接采用Bofill势函数算法,无法估计出混合矩阵;若先进行时频域选取等比系数的方法增强信号线性聚集性后,再采用Bofill势函数算法则可得到估计混合矩阵的估计值为

由图10可知:本文提出的算法估计混合矩阵的归一化均方误差在-62 dB左右,而Bofill势函数算法估计混合矩阵的归一化均方误差在-42 dB左右,本文提出的算法估计混合矩阵更为精确.

6 结 论

研究结果及仿真实验表明:对于稀疏程度未知的信号,本文算法可以有效鉴别时频域上的等比系数,增强信号的线性聚集性,并采用改进的聚类算法较为精确地估计出混合矩阵. 本文方法可用于语音信号、机械振动信号等领域的欠定盲源分离问题;该算法降低了对信号稀疏性的要求且能高精度的估计混合矩阵,为下一步精确重构信号奠定了基础.

[1] Li X,Zhang X. Sequential blind extraction adopting second-order statistics[J]. IEEE Signal Processing Letters,2007,14(1):58-61.

[2] Reju V G,Koh Soo Ngee,Soon Ing Yann. An algorithm for mixing matrix estimation in instantaneous blind source separation[J]. Signal Processing,2009,89:1762-1773.

[3] Xie S L,Yang L,Yang J M,et al. Time-frequency approach to underdetermined blind source separation[J]. IEEE Transactions on Neural Networks and Learning Systems,2012,23(2):306-316.

[4] Lee T W,Lewicki M S,Girolami M. Blind source separation of more sources than mixtures using overcomplete representations[J]. IEEE Signal Process,1999,6(4):87-90.

[5] Tengtrairat N,Woo W L. Extension of DUTE to single-channel mixing model and separability analysis[J]. Signal Processing,2014,96(3):261-265.

[6] Abrard F,Deville Y. A time-frequency blind signal separation method applicable to underdetermined mixtures of dependent sources[J]. Signal Process,2005,85(7):211-221.

[7] Jayaraman J,Thiagarajan. Mixing matrix estimation using discriminative clustering for blind source separation[J]. Digital Signal Processing, 2013,23(1):9-18.

[8] Zhou G X,Yang Z Y,Xie S L. Mixing matrix estimation from sparse mixtures with unknown number of source[J]. IEEE Trans on Neural Networks,2011,22(2):211-221.

[9] Bao G Z,Ye Z F,Xu X,et al. A compressed sensing approach to blind separation of speech mixture based on a two-layer sparsity model[J]. IEEE Audio Speech Language Processing,2013,21(5):899-906.

[10] Bofill P,Zibulevesky M. Undetermined blind source separation using sparse representations[J]. Signal Processing,2001,81(11):2353-2362.

(责任编辑:刘芳)

Mixing Matrix Estimation Based on Cluster Degree of Time-Frequency Signal for Underdetermined Blind Source Separation

WEN Jiang-tao1,ZHAO Qian-yun1,SUN Jie-di2

(1.Key Laboratory of Measurement Technology and Instrumentation of HeBei Province ,Yanshan University,Qinhuangdao,Hebei 066004,China; 2.School of Information Science and Engineering,Yanshan University,Qinhuangdao,Hebei 066004,China)

To solve the mixing matrix estimation problem of underdetermined blind separation,through the study of signal linear aggregation feature in time-frequency domain,an estimation method of mixing matrix based on different signal linear aggregation degree in time-frequency domain was proposed in this paper,and focus on the estimation of mixing matrix under the signal linear aggregation degree in weaker conditions. First,the observed signal or the ratio distribution of the corresponding transformation coefficient in time-frequency domain was used to measure the degree of the signal linear aggregation; second,the improved K-means clustering algorithm was applied to estimate the mixing matrix. The proposed method reduces the requirement for signal sparsity and can estimate the mixing matrix accurately. The simulation results show that the proposed method is feasible and effective.

underdetermined blind sources separation; mixture matrix estimation; linear aggregation; improved K-means clustering

2014-11-15

国家自然科学基金资助项目(51204145);河北省自然科学基金资助项目(E2013203300,E2016203223)

温江涛(1974—),男,博士,副教授,E-mail:wens2002@163.com.

TN 911.7

A

1001-0645(2016)07-0733-06

10.15918/j.tbit1001-0645.2016.07.014

猜你喜欢

频域比值线性
二阶整线性递归数列的性质及应用
基于频域的声信号计权改进算法
线性回归方程的求解与应用
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
非齐次线性微分方程的常数变易法
线性回归方程知识点剖析
也谈极值点偏移问题破解策略
网络控制系统有限频域故障检测和容错控制
物理中的比值定义法
基于频域分析和低通滤波的光伏并网逆变器谐振抑制研究