基于等效源法插值的声场重放方法
2022-03-11杜博凯曾向阳
杜博凯,曾向阳,洪 汐
(西北工业大学航海学院,陕西 西安 710072)
0 引 言
声场重放(Sound Field Reproduction)旨在重现一个完整的声学环境或者合成一个期望的声学场景。空间声场重放技术是一种通过耳机或者扬声器阵列为听者提供空间立体声体验的方法。使用扬声器阵列的重放,可以构建较大区域的声学环境以及构建相对较广的听音区域,近年来受到了广泛的关注。
目前主流的扬声器声场重放方法为波场合成[1-3](Wave Field Synthesis, WFS)与高阶高保真立体声重放[4-6](Higher Order Ambisonics, HOA)。WFS 基于的是惠更斯原理(Huygens principle)以及 Kirchhoff-Helmholtz积分方程,即如果已知封闭曲面上声压和法向质点振速分布,那么可以在其表面布置一系列单极子和偶极子点声源或平面波模型推导声源的驱动函数。但是为了避免空间混叠,WFS通常需要几十到几千个扬声器来实现声场的重放,实用性与可操作性低,目前没有商业性大规模推广。HOA是另外一种常见的声场重放方法,即将声场在球坐标系下分解成一组球谐函数(基函数)的叠加,利用初级声场和重放声场之间的球谐函数模态进行匹配求解出次级声源的驱动函数。但是 HOA技术也存在一些缺陷,为了提高重放声场的精度,需要使用大量传声器采集声场,且重放扬声器需要特殊的排列形状如球形或圆形等,实用性受到了一定的限制。
由于WFS与HOA系统在信号录制与重放过程中的限制,一些研究也关注基于声压匹配法[7-8]的声场重放方法。不同于WFS与HOA是基于潜在的空间连续物理问题的解析方法,声压匹配法(Pressure Matching, PM)是基于空间离散策略的方法。通常选取位于重放目标区域周围或在该区域内的控制点,设计扬声器驱动函数使得在这些点上尽可能准确地合成目标声源的声压场。但是为了提高重放精度,需要大量的测量,此方法也存在一定限制。
等效源法最早是在声场再现(Sound field reconstruction)的近场声全息(Nearfield Acoustic Holography, NAH)中应用的[9],其基本思想是利用一定形式的传声器阵列在距离声源很近的表面采集声场信息,然后通过空间声场变换计算声源和整个声场的声压、质点振速及声强等分布。1989年Koopmann等[10]提出了波叠加法,即等效源法,该方法将单极子或偶极子等简单源作为等效源配置在振动体内,通过近场测量求解等效源的源强,再现整个声场分布。该方法适用于任意形状的声场,且不存在边界元法(Boundary Element Method, BEM)的缺陷。其团队随后[11-12]研究了等效源的位置、数目等对声场再现精度的影响。在之前的工作中,我们利用多层等效源再现封闭空间声场,在600 Hz以上比等效源法获得更低的再现误差[13]。随后,文献[14]利用等效源方法进行了多区域声场重放问题的研究,相对于传统的声压匹配法保持了重放精度的同时实现了更安静的暗区。然而,作者之前的工作对于等效源的数目选取,位置确定以及混响条件对方法性能影响等关键内容缺乏明确的讨论。同时,相对于传统的声压匹配法,也未提升在重放区域内的重放精度。
本文基于之前的工作,提出一种基于等效源法插值的声场重放方法。此方法可以有效降低传声器采样工作量,同时在目标区域内实现较低误差的声场重放。首先给出等效源法插值声场重放的理论推导。作为进一步讨论,本文对等效源数目、等效源距离以及不同混响条件下的重放误差进行了详细的比较与分析。最后分别对比了低采样与高采样声压匹配法与本文提出方法的重放误差。
1 理论方法
1.1 声压匹配法
假设目标声场由一个传声器阵列采样,传声器测得的声压为:
其中,M为传声器的数量。扬声器到重放区域中的传声器位置处的声传递函数表示为
1.2 等效源法插值声场重放
传声器点处的声压一般为实际声场景中的测量的声压或期望合成声场的声压,为已知量。当等效源的位置与传声器的位置固定时,声传递函数矩阵G确定。通过求解式(7)可以得到等效源的权重q。通常情况下,设置的等效声源的数量大于传声器的测量数量,则求解过程具有不适定性,需要借助正则化方法来消除矩阵中较小的奇异值引起的不稳定扰动。通常使用的正则化方法为截断奇异值分解(Truncated Singular Value Decompositon, TSVD)与Tikhonov正则化等。对于上述问题,等效源权重q的求解可以等效为2范数优化问题:
其中,λ为正则化过程中的超参数。通常选取参数的方法包括L曲线法、广义交叉验证法(Generalized Cross Validation, GCV)法等[12]。
1.3 方法流程图
为清晰描述本方法,图1为声压匹配法与等效源法插值声场重放方法的流程。首先,扬声器播放的声信号通过传声器阵列采样。对于声压匹配法,可以通过直接计算得到扬声器的驱动函数。对于等效源法插值声场重放,需要先计算扬声器至重放区域内虚拟点的声传递函数插值,得到插值后的声场,从而计算扬声器驱动函数。
图1 声压匹配法与等效源法插值声场重放方法流程图Fig.1 The flowchart of the pressure matching method and the equivalent source reproduction method
2 方法验证
2.1 仿真模型说明
为验证所提出的等效源(Equivalent Source Method, ESM)插值重放方法,以3D矩形封闭混响房间内的平面声场重放为例进行研究。如图 2所示,房间的三维尺寸为4 m×4 m×3 m。坐标原点为扬声器阵列、传声器阵列以及等效声源的中心点。目标声源的位置为rs(0,2,0)。扬声器阵列为一个均匀分布、L=32个扬声器组成的圆阵,其中扬声器都为单极子声源。重放区域在扬声器阵列内部,为0.5 m×0.5 m 的正方形区域,其中传声器采样点共M=16个,且均匀分布在重放区域的边界处。传声器阵列测量的声信号为Pmic。重放区域内部设置100个均匀分布的虚拟点。扬声器外围设置 N=48个等效源,呈圆形均匀分布。鉴于扬声器阵列的空间奈奎斯特(Nyquist)频率为876 Hz,本文所关注的声场重放频率为100~1 000 Hz。自由场中声传递函数由自由场格林(Green)函数给出,混响环境下的声传递函数则由镜像源方法(Image Source Method,ISM)[15]给出。另外,传声器的测量声压添加信噪比为30 dB的高斯白噪声。
图2 扬声器、传声器、等效声源和目标声源位置图Fig.2 The positions of loudspeakers, microphones, equivalent sources and the target sound source
2.2 数值仿真结果
其中:S为声场重放区域的面积;pre为重放声压;pdes为目标重放声压;E( f)的单位为dB。
在计算等效源法插值声场重放的过程中,等效源的数目、等效源的距离以及声场内部虚拟点的数目与距离,均对重放结果产生影响。在传声器采样位置、数量,目标声场内部虚拟点以及等效源的距离均相等时,增加等效源的数量,对于不同频率下的重放结果都有所提升,如图3所示。
图3 不同频率下等效源数目对重放误差的影响Fig.3 Effect of the number of equivalent sources on reproduction errors at different frequencies
对于300 Hz,当等效源数目增加到14时,重放误差降低,而后,随着等效源的数目增加,重放误差趋于稳定。而对于800 Hz,当等效源数目低于26时,重放误差存在波动,当等效源数目多于 26时,重放误差趋于稳定。对于不同的频率,在保证重放效果稳定的前提下,所需的最小等效源数目是不一定的。在本文中,对于所关注的频率区间,选取的等效源数目48个。
图4所示为不同等效源距离下的重放误差。随着等效源距离的增加,声场的重放误差降低,尤其是在500 Hz以下的低频段部分。但是,当等效源距离为扬声器阵列距离的两倍即2 m时,对于频率在500 Hz以下的部分,重放效果最好,500 Hz以上部分,重放误差与等效源距离2.3 m的重放误差接近,而等效源距离为2.3 m时,低于500 Hz频率的重放误差比等效源距离2.0 m稍高。本文中,对于之后的仿真验证,均选择等效源距离为2.0 m。
图4 不同等效源距离下的重放误差对比Fig.4 Comparison of reproduction errors fort different equivalent source distances
在封闭空间中的声场重放过程,会受到房间壁面反射声的影响,从而降低重放效果。图5对比了自由场条件下与封闭空间混响条件下的重放效果。图5中封闭空间的吸声系数为0.6。在200~300 Hz这一频率段,封闭空间混响条件下的重放误差较大,在部分频点处超过了-15 dB。在600 Hz以下频段处,自由场中的重放效果稳定,波动小,而封闭空间混响条件下的重放效果波动大。结果表明,对于低频部分,房间壁面的反射更易影响声场重放效果。在600 Hz以上频率部分,混响条件下的重放误差与自由场下的误差走势基本相同,重放误差大。封闭空间中,不同的吸声系数,对于声场重放的效果也有不同的影响。图6对比了不同吸声系数下的声场重放效果。在 4 m×4 m×3 m的矩形房间中,0.2、0.4、0.6和0.8的吸声系数对应的混响时间分别为0.48、0.24、0.16和0.12 s。由图6中的结果可知,吸声系数越大,混响时间越短,重放效果越好。但是,混响存在的环境中,对于不同的吸声系数,除了个别频点,重放误差相互之间的差距在10 dB内。即使对于吸声系数为0.8的情况,重放效果整体仍比自由场条件下的声场重放效果差。但是对于整个频率区间,不同混响环境下的重放误差均低于-10 dB在可以接受的重放误差区间内。
图5 不同声学环境中重放误差对比Fig.5 Comparison of reproduction errors under different acoustic conditions
图6 不同混响条件下重放误差对比Fig.6 Comparison of reproduction errors under different reverberant conditions
为对比验证所提出的等效源法插值的声场重放方法,分别计算了声压匹配法在低采样与高采样情况下的重放误差,同时对比了本文提出的等效源法插值方法,结果如图7所示。图7中低采样为目标声场由 16个传声器测量的声场信号,高采样为在低采样测量声场的基础上,目标声场增加100个测量点获得的声场信号。由结果可以得出,在低采样的情况下,重放误差较大,部分频率处的重放误差超过-10 dB。在500 Hz以下,高采样的声压匹配法与本文提出的等效源法插值方法得到的重放误差几乎相等。这意味着使用本文提出的方法可以大大降低声传递函数测量的工作量同时获得良好的重放效果。在500 Hz以上的频率,等效源法插值方法得到的重放误差大于高采样的声压匹配法的重放误差。这是因为随着频率的升高,在虚拟点的插值声压存在误差,然而相对于仅采用低采样的声压匹配法的结果,本文提出的方法仍然获得了更好的重放效果。
图7 PM法低采样、高采样和ESM插值声场重放误差对比Fig.7 Comparison of reproduction errors for the PM method of low and high sampling and the interpolation method
3 结 论
本文提出了一种等效源法插值声场重放方法。相对于传统的声压匹配法,在传声器低采样的条件下,利用等效源法对扬声器阵列声传递函数进行插值,提升了重放效果。在传声器阵列、扬声器阵列不变的条件下,通过仿真实验,选择合适的等效源数目与等效源距离,对比了本文提出的方法与传统声压匹配法的重放效果。结果表明,本文提出的方法比声压匹配法的重放误差小,提升了重放效果。并且对比了自由场与封闭空间混响条件下的重放误差。由于受到封闭空间内壁面的声反射影响,重放效果降低,尤其是对600 Hz以下低频段,在进一步的研究中,会针对封闭空间的房间补偿进行了展开,降低混响条件下的重放误差。