APP下载

基于改进稀疏度估计模型的压缩感知去噪算法

2023-06-26谢显中

关键词:上界二项分布正态分布

马 彬,梁 伟,谢显中

(1.重庆邮电大学 通信与信息工程学院,重庆 400065;2.重庆市信产部计算机网络与通信技术重点实验室,重庆 400065)

0 引 言

认知无线电(cognitive radio,CR)被广泛认为是解决频谱利用率低下的有效解决方案之一。当CR中次用户(second users,SU)发现授权频谱中的空闲频谱时,CR允许SU机会式接入授权频谱。为了避免对主用户(primary users,PU)造成干扰,CR首要任务是通过频谱检测技术快速准确地找到可利用的空闲频谱。

若采用传统的Nyquist采样定理对宽带信号进行频谱检测,由于采样率较高,因而需要高采样率的模数转换器。为了解决高采样率问题,本文提出了一种基于压缩感知的宽带频谱解决方案[1]。压缩感知(compressive sensing,CS)表明,若信号是稀疏信号,则可以用远小于奈奎斯特速率进行采样,然后通过特定的重构算法[2]准确重构出原始信号。虽然CS技术能够有效地降低采样率,但是也带来新的问题,即如何估计出信号稀疏度k,稀疏度的准确度决定着宽带信号的检测精度。

宽带信号的高动态性,使获取准确的稀疏度k非常困难,而采样数目和重构精度都与稀疏度k密切相关,大部分贪婪重构算法都需要稀疏度k作为其输入条件,如正交匹配追踪[3],压缩采样匹配追踪算法等贪婪重构算法,此外文献[4]提出的最优k-阈值算法中也是将稀疏度k作为已知信息。因此,如何准确估计出信号稀疏度k尤为重要。文献[5]利用二项分布精确置信区间,同时精确估计稀疏度上下界。文献[6]利用观测向量中的非零元素的数目估计出信号稀疏度上界。文献[7]通过蒙特卡罗实验仿真分别给出估计信号稀疏度和重构信号所需样本数目都与稀疏度k有关。

目前对于信号稀疏度估计的研究中,大都没有考虑信号噪声,或者仅仅考虑了测量噪声,但在实际应用中信号噪声不可忽略。本文主要考虑加性噪声对信号的影响[8]。在压缩感知中,信号噪声经过随机测量后,会被成倍放大,这种现象称为噪声折叠[9](noise folding,NF)现象。

由于NF的影响,信号稀疏度估计和信号重构过程都带来新的挑战。为了减小噪声NF对压缩感知的影响,目前的处理方法主要有优化感知矩阵和改进重构算法两类。为了能够在对信号进行采样时减少对信号噪声的采样,文献[10]假设噪声信息先验已知的情况下,根据这一先验信息设计感知矩阵,智能地过滤噪声分量。文献[11]在信号重构之后,采样基于数据自适应阈值去噪算法对估计出的信号做去噪处理。文献[12]对重构算法做了优化处理,引入数据预处理操作,缓解了NF对信号重构的影响。

为了解决带有信号噪声的宽带稀疏信号稀疏度估计问题,本文改进基于二项分布的稀疏度估计模型,实现了在已知噪声信号的方差、观测向量和感知矩阵的情况下,能够估出信号稀疏度上界,并且利用稀疏度上界改进了自适应阈值去噪算法。

本文的主要贡献和创新工作如下:①针对带有高斯白噪声的宽带信号,改进了基于二项分布的稀疏度估计模型,推导出观测向量中噪声的概率分布函数,在稀疏度估计时,滤除观测向量中的噪声分量,提升稀疏度估计性能;②根据估计出的信号稀疏度的上界计算采样数目,在保证能够准确重构出信号的前提下减少采样数目,同时利用稀疏度上界改进自适应阈值去噪,减少算法的迭代次数,从而可以更准确、更快地确定阈值。

1 压缩感知中的噪声折叠现象

假设长度为N的宽带频谱信号s=x+z,若信号是稀疏信号或者在稀疏基Ψ的变换下是稀疏信号,即

X=Ψs=Ψ(x+z)

(1)

(1)式中:z表示服从高斯分布的信号噪声;Ψ是N×N的矩阵。若变换后X中只有k个非零值,即‖X‖0=k,k≪N,则称X是信号s在稀疏基Ψ变换下的k阶稀疏信号。

在CS中,通过M×N(M≪N,M是观测值数目,M=O(k×log(N/k)))维的感知矩阵A=ΘΨ获得观测向量y,由于NF是由信号噪声引起的,所以本文主要考虑信号噪声对压缩感知的影响,即

y=ΘΨs=A(x+z)=Ax+e

(2)

(2)式中:Θ表示M×N(M≪N)维的测量矩阵;z表示信号噪声;e=Az表示有效噪声。

(3)

当AAT是由(N/M)个正交基组成时,有效噪声e的协方差变为

(4)

从(4)式可以看出,信号噪声经过压缩感知的随机测量协方差变为原来的N/M倍,这称为NF现象。

基于改进稀疏度估计模型的压缩感知去噪算法如图1所示。考虑信号噪声时,受到NF现象的影响,当利用估计样本对稀疏度进行估计时,由于估计样本中存在着离散程度较高的噪声部分,会使得估计出的信号稀疏度不准确。本文做法是先根据信号噪声分布和观测矩阵推导析出估计样本中噪声分量的概率统计特征,在估计样本中去除掉噪声分量然后再进行稀疏度估计,以提高稀疏度估计的准确性;根据稀疏度上界确定采样数目进行重新采样,以保证原始信号能够被准确重构;同时,根据稀疏度估计上界值改进自适应阈值去噪算法,减少算法在时间以及计算上的开销。

2 改进基于二项分布的稀疏度估计模型

(5)

2.1 基于二项分布稀疏度估计模型

利用稀疏随机矩阵作为测量矩阵,先计算估计样本Me中的非零元素数目ω,然后根据二项分布的精确置信区间估计出了信号稀疏度上界[5],即

(6)

(7)

(6)—(7)式中:「⎤表示向上取整;Fv1,v2,χ表示自由度为v1,v2的F分布的上100×(1-χ)分位数;χ为显著水平;ω=‖y‖0。

2.2 二项分布的正态近似

受到噪声折叠的影响,估计样本中不仅含有信号的信息,同时还包含噪声信息。因此利用估计样本进行信号稀疏度估计之前,需要先滤除其中的大部分噪声分量,以保证稀疏度估计的准确性。观测向量y可以看成是由信号噪声和测量矩阵的乘积,其中信号噪声服从高斯分布,而测量矩阵中的元素aij服从二项分布。为了得到y中噪声分量的概率统计特征,本文把测量矩阵中的元素aij近似为正态分布。

本文用稀疏随机矩阵作为测量矩阵,矩阵中的每一个元素aij都服从二项分布,即

aij~B(M,β)

(8)

定理设随机变量ηn(n=1,2,…)服从参数为n,p(0

(9)

棣莫弗—拉普拉斯定理表明,正态分布是二项分布的极限分布,若满足

①np≥5;②np(1-p)≥5;则二项分布可近似为正态分布,即

B(n,p)≈N(np,np(1-p))

(10)

本文测量矩阵中的参数d=6,np=Mβ=d,满足条件①。

np(1-p)=d(1-d/M),当采样数目M≥6d时,可以满足条件②,鉴于采样数目M=O(klog(N/k)),对于宽带信号而言很容易满足M≥6d的前提条件。

综上所述,本文中测量矩阵中的元素aij可以近似为正态分布。

2.3 改进的稀疏度估计模型

随机矩阵中的每一个元素aij~B(M,d/M)。根据(10)式,此二项分布则可以近似为正态分布,即

aij~B(M,d/M)≈N(d,d(1-d/M))

(11)

同时信号噪声也是一个服从N0~N(0,σ2)的正态分布。

两个正态分布相乘后仍然是被压缩或者是放大的正态分布,即均值分别为μf、μg,标准差分别为σf、σg的两个正态分布相乘后仍为正态分布,且乘积后的均值μfg和标准差σfg分别为

(12)

(13)

根据棣莫弗—拉普拉斯定理,测量矩阵中的元素aij可以近似成均值为d、方差为d(1-d/M)的高斯分布,那么与均值为0、方差为σ2的高斯噪声相乘后,根据(12)—(13)式,乘积后的均值和标准差分别为

(14)

(15)

至此,求得观测向量y中噪声分量是一个均值为μ标准差为σ的正态分布,令

(16)

此时ξ服从标准的正态分布,即

(17)

综上所述,本文把测量矩阵中的元素由二项分布近似为标准正态分布,为了能够滤除观测向量中的大部分噪声分量,根据正态分布的统计特征,给定一个概率p可以通过查标准正态分布表得到上界ξ1,将求得的ξ1值代入(16)式得到观测向量中噪声分量的区间上界γ。利用噪声分量的阈值γ先滤除观测向量中的大部分噪声分量,根据观测向量中大于γ的数目来估计带有信号噪声的宽带信号的稀疏度,即

h=sum(|y(:)|>γ)

(18)

(19)

(20)

3 基于稀疏度上界改进的自适应阈值去噪算法

由于信号稀疏度未知,以及噪声折叠现象对信号重构的影响,经压缩感知重构出来的信号会包含被放大过的信号噪声部分,提高了频谱检测的虚警概率,因此在信号重构之后加一个自适应阈值去噪算法去除重构信号的噪声部分。

本文信号重构算法主要讨论基追踪降噪(basis pursuit de-noising,BPDN),BPDN算法的主要目标是寻找欠定方程最优解的问题,即

min‖s‖1s.t.‖As-y‖2≤ε

(21)

(21)式中ε>‖c‖2,c表示为测量噪声。

本文的阈值去噪算法采用了文献[14]中的自适应阈值去噪算法,并基于估计出的稀疏度对自适应阈值去噪算法进行改进。该方法可以根据信号噪声的变化而自适应调整获得最优的阈值并且可以不用噪声信息先验已知,其阈值估计方法示意图如图2所示。

图2 阈值估计方法示意图Fig.2 Schematic diagram of threshold estimation method

图2中,重构信号按照幅值降序排列,实线代表正确的解向量,点画线代表重构信号中的噪声分量。选择重构信号最大的幅值w[1]和较小的幅值w[N1]来构造一条虚拟的线y=ax+b,其中a=(w[N1]-w[1])/(N1-1),利用点到直线的距离公式得

(22)

最优的阈值是距该虚拟直线最远的一个点的值,即

τ=w[i*],i*=argmaxd(i)

(23)

本文方法可以根据信号噪声的变化而自适应调整,获得最优的阈值并且可以不用噪声信息先验已知。为了保证在信号稀疏度未知的条件下,能够准确得到最优阈值,通常选取较大的N1。如果选择的N1小于信号的稀疏度k,此时估计的阈值会偏大,从而提高误警概率;而选择较大的N1时,虽然保证了估计出阈值的准确性,但是会增加自适应去噪算法的时间开销。为了既准确得到阈值τ又减少自适应阈值去噪算法的时间开销,本文根据估计出上界的信号稀疏度 对此方法进行改进。

改进后的自适应阈值去噪算法如算法1所示。

算法1改进后的自适应阈值去噪算法

输出:去噪后的稀疏信号x。

4.dis=[];

d_new=abs(a×i+b-x1(i))/sqrt(a2+1);

dis=[dis,d_new];

End

5.[a,g]=max(dis);

6.τ=x1(g);

7.Forj=1:N

xi=0;

else

4 实验仿真

本文主要从稀疏度估计、采样率、自适应阈值去噪算法的时间开销、重构精度以及检测精度5个方面进行。前两组实验说明本文所改进的稀疏度估计模型能够估计出带有信号噪声的稀疏信号稀疏度以及本文的采样率大小,其中采样率的大小与不考虑信号噪声的二项分布稀疏度估计模型[5]对比分析改进后的性能。第三组实验是与自适应阈值算法[14]对比分析改进后算法的迭代次数,第四组实验与仅采用BPDN算法对比分析改进的自适应阈值去噪算法的重构,最后一组实验与文献[5]、文献[14]所提算法对比分析检测概率。仿真实验重构信号的准确性用虚警概率Pf1和误警概率Pf2之和来表示。计算式为

(24)

Pf1表示原始信号是空闲状态的而重构信号是被占用状态,这种情况会使SU可以用的频谱资源变少;Pf2表示原始信号是占用状态而重构信号是空闲状态,这种情况下SU将会干扰PU通信,不符合认知无线电初衷。

表1 仿真参数Tab.1 Simulation parameters

4.1 稀疏度上界估计以及估计成功率

对带有高斯白噪声,信噪比分别为SNR=10、SNR=5、SNR=0和SNR=-5的稀疏信号进行稀疏度估计,并与文献[5]中不考虑信号噪声的稀疏度估计的成功率进行比较。稀疏度k在闭区间[10,30]以1为间隔等间距取值,估计样本在[60,120]以3为间隔等间距设置采样数目。

图3是稀疏度上界估计成功率随着估计样本Me变化的仿真结果图。图3中稀疏度k=10,估计样本Me在[10,80]以10为间隔等间距取值。由图3可知,随着样本数目的增加,本文改进的稀疏度估计模型和文献[5]中的稀疏度估计模型的估计成功率都不断在增加并且成功率都最终接近于1。本文模型在SNR=10时,在估计样本达到40时,稀疏度上界估计成功率就接近于1。而文献[5]中的稀疏度估计模型虽然稀疏度上界估计的成功率也随着估计样本的增加在不断增大,但其成功率仍然小于本文的模型。说明本文的稀疏度估计模型更加适用于带有信号噪声的稀疏信号。从图3中可以看出,在样本数达到70时,稀疏度上界估计的成功率较高。以下仿真实验中,稀疏度k=10时,估计样本数均为70。

图3 稀疏度上界估计成功率Fig.3 Upper bound estimation success rate of sparsity

图4是稀疏度上界估计的仿真结果。由图4可知,本文模型在SNR=10、SNR=5、SNR=0、SNR=-5时,都能够成功估计出信号的稀疏度上界,这表明本文改进的稀疏度估计模型适应于带有噪声的稀疏信号,且对于不同的SNR都能够准确地估计出稀疏度上界,对噪声具有鲁棒性。

图4 稀疏度估计Fig.4 Sparsity estimation

4.2 采样率大小对比

本文根据估计出的信号稀疏度上界计算信号采样率。采样率定义为M/N,N在闭区间[300,2 100]以300为间隔等间距取值。仿真结果如图5所示。

图5 本文与不考虑信号噪声模型的采样率对比Fig.5 This paper compares the sampling rate with the model without considering signal noise

由图5可知,在信号稀疏度一定时,随着信号长度的增加,采样率逐渐降低。在信号长度相同时,两种方法的采样率都大于实际稀疏度的采样率。两者都利用估计出上界的稀疏度来计算采样数目M,虽然增加了一定的采样成本,但是能够确保准确重构出原始信号。在信号长度较小时,本文的采样率基本与文献[5]相同;在信号长度较大时本文的采样率略高于文献[5]的采样率。这说明本文模型适用于带有噪声的宽带稀疏信号的稀疏度估计,能够和文献[5]没有考虑信号噪声的情况相比拟,极大地降低了带有噪声的宽带稀疏信号的采样率。

4.3 阈值去噪算法时间开销对比

图6展示了不同算法迭代次数变化情况。在稀疏度k=10时,估计样本Me在[60,80]以2等间隔增加。从图6可以看出,文献[14]中的自适应阈值去噪算法的迭代次数在60次左右,而利用稀疏度的上界改进的自适应算法的迭代次数得到显著降低,迭代次数仅仅略大于信号真实的稀疏度,极大地减少了自适应阈值去噪算法的时间开销,能够满足认知网络的高动态性要求。

图6 迭代次数比较Fig.6 Comparison of iterations

4.4 检测精度比较

图7是检测精度随着信号稀疏度k变化的仿真结果。估计样本Me=70,稀疏度k在[10,30]以2为间隔等间距取值,本文与文献[14]都在原始稀疏信号中加入了SNR=10的高斯白噪声,而文献[5]的原始信号中不含有信号噪声。检测概率Ptrue=1-Pf1-Pf2。

图7 不同算法之间检测精度对比Fig.7 Comparison of detection accuracy between different algorithms

从图7中可以看出,随着稀疏度k的增大,3种检测算法的检测精度都呈现下降的趋势这是因为估计样本数目不变时随着信号稀疏度k的增大,信号稀疏度k的估计成功率降低,最终影响了宽带信号的检测精度。图7中文献[5]的检测精度最高,原因是本文和文献[14]都在原始的稀疏信号中都加入了高斯白噪声,经过随机测量后,信号噪声被成倍放大,从而影响了信号的重构效果。本文模型检测精度优于文献[14],原因是本文对文献[14]的阈值去噪算法进行了改进,能够根据估计出的信号稀疏度自适应调整阈值去噪算法中的N1参数,从而使得检测精度增加。这说明本文算法对重构信号的去噪效果要优于文献[14]。

5 结束语

本文利用改进的稀疏度估计模型,较为准确地估计出了带有高斯白噪声的稀疏信号稀疏度上界,并利用稀疏度上界确定采样数目M,减少了不必要采样;利用稀疏度上界对自适应阈值去噪算法进行改进,在保证算法的有效性的同时也减少了自适应阈值去噪算法迭代次数。

猜你喜欢

上界二项分布正态分布
二项分布与超几何分布的区别与联系
深度剖析超几何分布和二项分布
概率与统计(1)——二项分布与超几何分布
一个三角形角平分线不等式的上界估计
一道经典不等式的再加强
二项分布参数的E-Bayes估计及其应用
基于对数正态分布的出行时长可靠性计算
正态分布及其应用
正态分布题型剖析
χ2分布、t 分布、F 分布与正态分布间的关系