基于中频域维纳滤波的非视域成像算法研究*

2023-01-30唐佳瑶罗一涵谢宗良夏诗烨刘雅卿徐少雄马浩统曹雷

物理学报 2023年1期

关键词：维纳滤波人偶纸板

唐佳瑶罗一涵谢宗良夏诗烨刘雅卿徐少雄马浩统曹雷

1) (中国科学院光束控制重点实验室,成都 610209)

2) (中国科学院光电技术研究所,成都 610209)

3) (中国科学院大学,北京 100049)

4) (中国科学院大学电子电气与通信工程学院,北京 100049)

非视域成像是对探测器视线外被遮挡的物体进行光学成像的新兴技术,基于光锥变换反演法的非视域成像可以看作是一个反卷积的过程,传统维纳滤波反卷积方法是使用经验值或者反复尝试得到瞬态图像的功率谱密度噪信比(power spectral density noise-to-signal ratio,PSDNSR)进行维纳滤波反卷积,但非视域成像每个隐藏场景的PSDNSR 都不同,先验估计难以适用.因此本文提出使用捕获瞬态图像的中频域信息来估计PSDNSR 进行维纳滤波从而实现非视域成像.实验表明,基于中频域维纳滤波的非视域成像算法估计的PSDNSR 能够落在一个重建效果较好的量级上.相比其他方法,本文算法能一步直接估计出PSDNSR,没有迭代运算,计算复杂度低,能够在保证重建效果的前提下提升重建效率.

1 引言

非视域(non-line-of-sight,NLOS)成像是对视线外的隐藏物体进行光学探测和可视化的新兴技术,类似于“视线拐弯”或“隔墙观物”[1−7].在机器视觉、制造业、医学成像、自动驾驶、军事反恐等领域具有广阔的应用前景.NLOS 基于飞行时间探测技术,主动向一个中介反射面发射激光,利用探测器捕获从隐藏物体上发生散射返回的光子的空间时间信息来重建隐藏物体的形状[8].

近年来,非视域成像技术成为研究热点之一.2012 年,Velten 等[9]使用条纹相机和超快激光器搭建非视域成像系统,并提出了一种椭圆反投影算法对隐藏物体进行三维重建.2016 年,Klein 等[10]提出了基于合成瞬态渲染的NLOS,该研究将NLOS 转化为了凸优化问题.2018 年,O’Toole 等[11]探索了一种适用于共焦NLOS 系统的光锥变换反演法(the light-cone transform,LCT),LCT 降低了重建复杂度.2019 年,Liu 等[5]提出了基于相量场虚拟波的NLOS,将NLOS 过程公式化为波成像问题,可以将经典光学中成熟的见解和技术应用在NLOS 领域,即将NLOS 成像系统模拟为一个虚拟的视线成像系统.在NLOS 定位和成像的研究中,为了提高重建质量和效率,除了对捕获的飞行时间信息进行滤波处理外[12],主要从三维重建算法、成像装置和中介反射面的选择等方面进一步改进,如对反投影算法改进从而实现了多目标NLOS、远距离NLOS 和快速反投影NLOS[2,13−15].也有研究引入深度学习来解决NLOS 问题[16−19].在之前的研究中,使用条纹相机、单光子雪崩二极管(single-photon avalanche diode,SPAD)、飞行时间(time of flight,TOF)相机等作为探测器做了大量研究[9,20,21].2021 年,中国科学技术大学研究团队基于短激光脉冲泵浦技术构建了一个工作在近红外波段的上转换单光子探测器(upconversion single-photon detector,UCSPD),有效提高了探测器的时间分辨率[7].

目前主流的NLOS 是基于瞬态光传输进行研究的,主要包括椭圆反投影方法、光锥变换反演法和凸优化法等.椭圆反投影法对于存储和处理的要求较高,并且接收到的回波信号弱[9,13,14,20],基于光锥变换的非视域成像通过使用共焦扫描系统解决了回波信号弱的问题.光锥变换反演法将探测器捕获到的瞬态图像表示为一个三维卷积,该卷积在变换域中模拟自由空间的光传输,光锥变换提供了快速且高效的方式计算反向光传输.可以将光锥变换反演法看作是反卷积的过程,维纳滤波是经典的反卷积方法,其中功率谱密度噪信比(power spectral density noise-to-signal ratio,PSDNSR)决定了重建成像的质量.在非视域成像中每种隐藏场景的PSDNSR 不同,每次都需要调节,PSDNSR 通常采用经验值或者反复尝试来获取.该方法进行反卷积很难一步就找到最佳的PSDNSR,需手动调节PSDNSR 进行多次实验.而快速地进行反卷积对非视域成像的实时应用至关重要,因此本文重点研究改进的维纳滤波算法使光锥变换反演法更高效.

2 基于光锥变换的非视域成像原理模型

本文同样使用光锥变换反演法进行非视域成像,因此本文使用共焦光路,实验设置如图1 所示.通过使用分束镜将激光发射光路与探测器接收光子的光路合成共焦非视域成像系统.激光器向中介反射面发射脉冲激光,经过三次散射后使用超导纳米线单光子探测系统(superconducting nanowire single-photon detector,SNSPD)作为探测器捕获返回的光子信息.时间相关单光子计数 (timecorrelated single-photon counting,TCSPC)模块对SNSPD 捕获到的每个像素的光子数进行直方图统计,得到瞬态图像.

图1 实验场景示意图,激光通过振镜对中介面扫描,探测器接收来自中介面反射的直接光和来自隐藏物体的间接光Fig.1.Experimental scene,the laser scans the intermediate surface through the galvanometer,and the detector receives direct light reflected from the intermediate surface and indirect light from a hidden object.

探测器捕获到的瞬态图像可以表示为[11]

式中,(x′,y′) 是激光照射在中介反射面上的点,(x,y,z) 是隐藏物体表面上的点,r表示这两个点之间的距离.ρ是满足z＞0 的三维半空间Ω中隐藏物体表面每个点的反照率,函数δ表示由x2+y2+z2=(tc/2)2给出的时空四维超圆锥的表面.

对瞬态成像模型做变量代换后可以写成一个3D 卷积:Rt{g}=h ∗Rz{ρ}.其中,h表示移位不变的卷积核,即Rt是对g沿t轴衰减及重采样,Rz是对ρ沿z轴衰减及重采样.接下来,对成像模型进行离散化,在空间域中经变量代换和离散后的瞬态图像可以表示为

维纳滤波是经典且有效的反卷积方法,文献[11]正是使用维纳滤波反卷积,最后得到隐藏物体的反照率为

一般来说,K值的选取决定着非视域成像的质量,通常采用经验值或反复尝试来手动调节,但该方法成像效率不高.并且常数项K值代替Π(u,v,w)进行维纳滤波时,没有用到足够的先验知识,导致难以快速找到最佳值.因此本文引入瞬态图像中频域的方法实现对K的快速计算.

3 基于中频域维纳滤波的非视域成像算法

瞬态图像的频谱G(u,v,w) 是一个M ×N ×P的复数矩阵,如图2 所示为w=50 时瞬态图像的频谱图 |G(u,v,w)|.可见瞬态图像的大部分信息分布在频谱原点G(u,v,w)=(0,0,50) 附近的“低频”区域,卷积核的信息被完全淹没在瞬态图像的信息中,而频谱的“高频”区域幅度小且易被噪声污染.由于“低频”和“高频”区域的频谱幅度相差大,不会出现交叠,两者之间必然存在一个中间过渡区域,即不含太多的瞬态图像能量又没有被噪声淹没,将之称为“中频域”,可以用于估计K值从而进行维纳滤波反卷积[22].非视域成像系统中捕获的瞬态图像中大多数信号变化缓慢,只有少数信号变化大,频谱往往为全局单减,因此瞬态图像存在中频域并且数值特征大都相似.

图2 w =50 时瞬态图像的频谱图|G(u,v,w)|Fig.2.Spectrum |G(u,v,w)|of the transient image at w=50.

图3 幅度 |G(u,v,w)|中过原点的一条线|G(u,0,50)|Fig.3.A line |G(u,0,50)|through the origin in the spectral magnitude |G(u,v,w)|.

图4 幅度 l n|G(u,0,50)|平滑之后的曲线Gr(u)Fig.4.Curve G r(u) after amplitude ln|G(u,0,50)|smoothing.

这时,对K值的估计问题就转换为了获取K值使得T1(u) 在抑制噪声的基础上最接近T0(u) .因为低频域和中频域中的噪声很小可以忽略,有T0(u)≈T1(u)≈T2(u),u ∈ULM,其中ULM为低频域和中频域.在高频域中,噪声近似为均匀分布,有T0(u)≈T0(uMH),u ∈UH.为了抑制噪声的影响,使T1(u)≧T0(u) 在高频区域成立,即:

其中u∈UT=[0,uT],上述引入的参数η称为“噪声抑制参数”,用来调节噪声和图像细节的平衡.

图5 u =0 时瞬态图像的频谱图|G(u,v,w)|Fig.5.Spectrum |G(u,v,w)|of the transient image at u=0.

图6 幅度 |G(u,v,w)|中过原点的一条线|G(0,0,w)|Fig.6.A line |G(0,0,w)|through the origin in the spectral magnitude |G(u,v,w)|.

其中w∈WT=[0,wT] 是曲线 |G(0,0,w)|的前半周期,Gr(w) 是曲线 l n|G(0,0,w)|平滑之后的曲线.

同理对K值进行估计:

分别使用空间维度上的频谱图和时间维度上的频谱图估计的K值没有很大的差异,本文选择使用时间维度上的频谱图 |G(0,0,w)|对K值进行估计.

针对基于光锥变换的非视域成像问题,使用基于中频域的维纳滤波算法对K值进行估计并完成重建的步骤如下:

1)在共焦非视域成像系统中,使用探测器捕获瞬态图像g(x′,y′,t) ;

3)计算出曲线 l n|G(0,0,w)|,再对该曲线平滑得到Gr(w) ;

4)根据(11)式计算出wMH;

5)根据(12)式计算出K值;

6)使用维纳滤波算法对瞬态图像反卷积并进行傅里叶反变换得到;

7)最终使用(4)式得到隐藏物体表面的反照率ρ∗.

4 实验及结果分析

搭建的实验场景如图7 所示,该共焦非视域成像系统包含的光源为波长1530 nm 的激光脉冲,脉冲宽度为70 ps,重复频率为40 MHz,平均功率为750 mW.采用的探测器为超导纳米线单光子探测系统(SNSPD),其探测效率约为70%.使用分束器(Thorlabs CCM1-BS015/M)将探测光路和激光发射光路共轴.使用振镜(Thorlabs GVS012)来实现对中介面的扫描.时间相关单光子计数模块以1 ps 的时间分辨率对探测事件进行时间标记.

图7 实验场景 (a)为在实验室搭建的共焦非视域成像场景;(b)为共焦非视域成像系统Fig.7.Experimental scene: (a) The confocal non-horizontal imaging scene built in the laboratory;(b) demonstrates the confocal non-horizontal imaging system.

本文通过上述实验装置对如图8 所示的5 个隐藏场景捕获光子飞行时间信息,5 个隐藏场景分别为T 形纸板、人偶模型手臂向下、房屋形纸板、C 形纸板和人偶模型手臂向上.

图8 隐藏场景 (a) T 形纸板;(b)人偶模型手臂向下;(c)房屋形纸板;(d)C 形纸板;(e)人偶模型手臂向上Fig.8.Hidden scene: (a) T-shaped cardboard;(b) puppet model with arms down;(c) house-shaped cardboard;(d) Cshaped cardboard;(e) puppet model with arms up.

(12)式中的参数η用来调节噪声和图像的细节,噪声和图像的清晰度会随η减小而变弱.在评估了噪声大小的基础上,本文选择η=1.1 来对K值进行估计,此时噪声在可接受范围内且细节更加丰富.基于中频域的维纳滤波算法对T 形纸板、人偶模型手臂向下、房屋形纸板、C 形纸板和人偶模型手臂向上5 个隐藏场景K值的估计值分别为2.8678,1.2353,3.6711,0.8096 和1.5939.

为了说明本文算法对非视域成像的有效性,分别取K为0.01,0.1,1,10,100,1000 对隐藏场景进行重建,将传统维纳滤波的重建结果与基于中频域的维纳滤波得到的结果进行对比.为方便起见,只对比重建结果的正视图,见图9—图18.

图9 隐藏物体T 形纸板和基于中频域的维纳滤波的重建结果Fig.9.T-shaped cardboard and reconstruction results of NLOS imaging based on mid-frequency Wiener filtering.

图10 传统维纳滤波的重建结果与基于中频域的维纳滤波的重建结果对比 (a)−(f) T 形纸板的隐藏场景分别取K 为0.01,0.1,1,10,100,1000 进行维纳滤波复原的结果;(h) T 形纸板基于中频域的维纳滤波重建的结果,估出K 为2.8678Fig.10.Comparison between the reconstruction results of traditional Wiener filtering and the reconstruction results based on Wiener filtering in the mid-frequency domain: (a)−(f) The results of Wiener filtering reconstruction with K as 0.01,0.1,1,10,100,and 1000 for T-shaped cardboard respectively;(h) the reconstruction result of T-shaped cardboard using the NLOS imaging algorithm based on Wiener filtering of mid-frequency domain,and the estimated K is 2.8678.

图11 隐藏场景人偶模型手臂向下和基于中频域的维纳滤波的重建结果Fig.11.Puppet model with arms down and reconstruction results of NLOS imaging based on mid-frequency Wiener filtering.

图12 传统维纳滤波的重建结果与基于中频域的维纳滤波的重建结果对比 (a)−(f)人偶模型隐藏场景分别取K 为0.01,0.1,1,10,100,1000 进行维纳滤波复原的结果;(h)人偶模型隐藏场景基于中频域的维纳滤波重建的结果,估计出的K 为1.2353Fig.12.Comparison between the reconstruction results of traditional Wiener filtering and the reconstruction results based on Wiener filtering in the mid-frequency domain: (a)−(f) The results of Wiener filtering reconstruction with K as 0.01,0.1,1,10,100,and 1000 for puppet model with arms down respectively;(h) the reconstruction result of puppet model with arms down using the NLOS imaging algorithm based on Wiener filtering of mid-frequency domain,and the estimated K is 1.2353.

图13 隐藏场景房屋形纸板和基于中频域的维纳滤波的重建结果Fig.13.House-shaped cardboard and reconstruction results of NLOS imaging based on mid-frequency Wiener filtering.

图14 传统维纳滤波的重建结果与基于中频域的维纳滤波的重建结果对比 (a)−(f)为房屋形纸板的隐藏场景分别取K 为0.01,0.1,1,10,100,1000 进行维纳滤波复原的结果;(h)房屋形纸板隐藏场景基于中频域的维纳滤波重建的结果,估计出的K 为3.6711Fig.14.Comparison between the reconstruction results of traditional Wiener filtering and the reconstruction results based on Wiener filtering in the mid-frequency domain: (a)−(f) The results of Wiener filtering reconstruction with K as 0.01,0.1,1,10,100,and 1000 for House-shaped cardboard respectively;(h) the reconstruction result of house-shaped cardboard using the NLOS imaging algorithm based on Wiener filtering of mid-frequency domain,and the estimated K is 3.6711.

图15 隐藏场景C 形纸板和基于中频域的维纳滤波的重建结果Fig.15.C-shaped cardboard and reconstruction results of NLOS imaging based on mid-frequency Wiener filtering.

图16 传统维纳滤波的重建结果与基于中频域的维纳滤波的重建结果对比 (a)−(f) C 形纸板的隐藏场景分别取K 为0.01,0.1,1,10,100,1000 进行维纳滤波复原的结果;(h) C 形纸板隐藏场景基于中频域的维纳滤波重建的结果,估出K 值为0.8096Fig.16.Comparison between the reconstruction results of traditional Wiener filtering and the reconstruction results based on Wiener filtering in the mid-frequency domain: (a)−(f) The results of Wiener filtering reconstruction with K as 0.01,0.1,1,10,100,and 1000 for C-shaped cardboard respectively;(h) the reconstruction result of C-shaped cardboard using the NLOS imaging algorithm based on Wiener filtering of mid-frequency domain,and the estimated K is 0.8096.

图17 隐藏场景人偶模型手臂向上和基于中频域的维纳滤波的重建结果Fig.17.Puppet model with arms up and reconstruction results of NLOS imaging based on mid-frequency Wiener filtering.

图18 传统维纳滤波的重建结果与基于中频域的维纳滤波的重建结果对比 (a)−(f)人偶模型手臂向上的隐藏场景分别取K 为0.01,0.1,1,10,100,1000 进行维纳滤波复原的结果;(h)人偶模型手臂向上隐藏场景基于中频域的维纳滤波重建的结果,估出的K 为1.5939Fig.18.Comparison between the reconstruction results of traditional Wiener filtering and the reconstruction results based on Wiener filtering in the mid-frequency domain: (a)−(f) The results of Wiener filtering reconstruction with K as 0.01,0.1,1,10,100,and 1000 for puppet model with arms up respectively;(h) the reconstruction result of puppet model with arms up using the NLOS imaging algorithm based on Wiener filtering of mid-frequency domain,and the estimated K is 1.5939.

考虑到人眼对于图像的主观评价不是从单一角度出发,因此本文选择综合图像Tenengrad 梯度和结构相似性(structural similarity,SSIM)两个指标来进行像质评价[23],从清晰度和空间结构性两方面来评价重建图像.从图像像素的角度来看,图像Tenengrad 梯度GRAD 越大,图像内的边缘越清晰,图像质量越好;原始图像和重建图像的结构相似性越大,重建效果越好,图像质量越好.考虑到图像Tenengrad 梯度和SSIM 两个指标的一致性和量级后,通过线性加权,得到最终图像评价指标为

式中,α和β分别为图像Tenengrad 梯度和SSIM 的权值,α+β=1 .本文根据对重建图像的分析,分别取α=0.1 ,β=0.9 .Eval越大,图像质量越好,Eval越小,图像质量越差.图16 所示为对不同K值维纳滤波的重建结果和基于中频域的维纳滤波重建结果的客观评价.

如图19 所示,本文方法计算出5 个隐藏场景的K值分别在 1 00,1 00,1 00,1 0−1,1 00量级上.基于中频域的维纳滤波算法取得的K值总能落在一个最佳的量级上,K值在该量级时,图像综合质量评价值最高,图像重建效果最好.可以看出,基于中频域维纳滤波的非视域成像算法重建图像的Eval值在一个较高的范围,说明本文方法估计出的K值进行非视域成像得到的重建图像效果好,并且速度更快.实验结果表明,使用本文方法能一步估出K值,并且接近最佳值.

图19 重建图像综合质量评价,其中蓝色线为设置不同K 得到的重建图像的综合质量评价值,红色圆圈为基于中频域的维纳滤波重建图像的综合质量评价值 (a) T 形纸板;(b)人偶模型手臂向下;(c)房屋形纸板;(d) C 形纸板;(e)人偶模型手臂向上Fig.19.Comprehensive quality evaluation of reconstructed images,the blue line is the comprehensive quality evaluation value of the reconstructed image obtained by setting different K,and the red circle is the comprehensive quality evaluation value of the reconstructed image based on the Wiener filter in the intermediate frequency domain: (a) The Eval of T-shaped cardboard,(b) the Eval of puppet model with arms down,(c) the Eval of house-shaped cardboard,(d) the Eval of C-shaped cardboard,(e) the Eval of puppet model with arms up.

5 结论

共焦光路中的非视域成像可以看作是一个反卷积问题,在维纳滤波反卷积的过程中参数K值的选取对成像的速度以及重建的质量有很大的影响,非视域成像中每种隐藏场景的最优K值都不一样,每次实验都需人为调节.针对该问题本文引入了基于中频域的非视域成像算法,可以使用瞬态图像的中频域信息来估计K值.相比其他取K值的算法,该算法没有迭代和矩阵运算,计算复杂度低,能够快速的确定K值.为了验证本文算法的有效性,本文进行共焦非视域成像实验,将一系列手动设置的K值的重建结果与基于中频域的非视域成像算法得到的重建结果进行了对比.实验结果表明,基于中频域的维纳滤波算法取得的K值能落在成像效果接近最佳的量级上.综上,该算法具有快速、准确和参数少的特点,有效提升了共焦非视域成像的重建质量和实时性.