改进的混合下降法在麦克风阵列设计中的应用
2013-07-20孟晓莉
孟晓莉
江苏海事职业技术学院 信息工程系,南京 211170
改进的混合下降法在麦克风阵列设计中的应用
孟晓莉
江苏海事职业技术学院 信息工程系,南京 211170
宽带波束形成器因在无线通信、声呐、雷达、演讲和声学[1-3]的应用而受到广泛的研究。文献[4-7]中提到目前发展了很多基于模型的方法来设计波束形成器滤波器系数。除了最优滤波器系数,麦克风阵列阵元布置同样在波束形成器的整体性能中起着重要的作用,不同的麦克风阵列配置的效果明显不同。因此,为麦克风阵列阵元寻求一个好的布置在加强宽带波束形成器性能方面很重要。
麦克风阵列定位问题主要通过阵列稀疏技术[8]解决。它尝试降低阵元个数和调整剩余阵元的位置以保持性能。因为该问题是非线性的[9],现在已经发展了不同的全局优化方法,包括进化编程[10],遗传算法[11],模拟退火算法[12]和模式搜索算法[13]。但是,阵列稀疏技术本质上是一维的,它更适于天线设计。在公式化多维设计问题中,文献[14]提出了一个l2-norm下的非线性优化问题,它允许麦克风在多维解空间周围移动以搜寻更好的解。但是,目标函数是高度非线性和关于位置变量是非凸性的,所以很难用传统的基于梯度的方法来解决[15]。不同滤波器长度的影响使得该问题更加复杂化,其中不同的滤波器长度决定不同的最优设计。当滤波器长度很长时,该问题可以通过考虑性能极限来避免[16]。随着滤波器长度限制的无限大,文献[17]表明滤波器系数由一系列约束一维最优图问题定义,该系数可以通过一种特殊阵列配置高效地搜寻到。通过将该问题作为一个子问题,可以将原来的混合最优问题简化为麦克风阵列布置问题,即唯一决定量的定位问题。
针对上述问题,在研究二维中的最优定位问题的基础上,提出一种结合了梯度方法的遗传算法来解决定位过程中的非凸性。遗传算法可以跳出局部最小化同时保持原来的有用信息;梯度方法可以迅速地下降到最近的局部最小值。该方法具有很好的下降特征,它的目标函数是单调递增的。实验结果表明,所提算法在实际使用中可以找到更好的位置。
1 问题公式化
对于一个有N个阵元的麦克风阵列,假设每个阵元是一个L-tap的有限冲激响应(Finite Impulse Response,FIR)滤波器。定义麦克风位置为ri,i=1,2,…,N,第i个传输函数可定义为:
其中r是声音源的位置,c是声音在空气中的速度。如果由该麦克风阵列收到的信号在频率为fs的样本同步,则这些FIR滤波器的频率响应是:
其中hi是第i个FIR滤波器的系数,d0(f)是克罗内科频率响应,定义为:
假设期望响应是Gd(r,f,L),FIR滤波器宽带波束形成器设计问题是寻找一系列系数h=[h1,h2,…,hN]T,如波束形成器输出:
其中,AT(r,f)=[A1(r,f),A2(r,f)…,AN(r,f)]T是定义在式(1)中的转移函数向量,
是定义在式(2)中的频率滤波器响应向量。
存在很多目标准则评估G(r,f,L)和Gd(r,f,L)之间的错误,如l∞-norm[14]和l1-norm最小值。但是,这些设计技术通常比l2-norm的使用花费更高。接下来,采用l2-norm准则设计宽带波束形成器。对于给定位置的麦克风阵列,波束形成器设计问题可以表示为寻找滤波器参数h,如最小化目标函数:
其中Ω是特定的空间频率域,Gd(r,f,L)和ρ(r,f)的定义域是正权重函数。通常,域Ω=Ωp∪Ωs由通频带区域Ωp和阻带区域Ωs组成。然后,对于一个给定位置的麦克风阵列,波束形成器设计问题可以表示为:
其中
Γ表示为:
其中u(f)和v(f)是连续绝对可积分,左右导数都存在,
需要注意的是性能极限由一个给定位置的麦克风阵列计算出。不同的位置会产生不同的性能极限。因此定位设计是寻找相应的性能极限是最小化的麦克风阵列的位置。为了表示这个特征,让λ=(r1,r2,…,rN)∈Λ⊂ℝ3×N表示麦克风位置,其中Λ是所有可能λ的集合,定位问题可以表示为:
它满足‖ri-rj‖2≥εd,…,i,j=1,2,…,N,i≠j,其中,与式(8)相同,但是考虑λ作为新的决策向量。约束条件‖ri-rj‖2≥εd,…,i,j=1,2,…,N,i≠j是实用的,这样麦克风阵元集应该为特征函数互相保持适当的最小距离,εd是两个不同麦克风阵元之间最小距离的平方。
2 混合下降方法
通常,联合的非凸性最优化问题式(10)的两种变量很难作为一个整体解决。注意目标函数式(11)关于位置变量λ是非凸的和高度非线性的,但是该函数关于滤波器系数变量H~是凸的。对于一个给定的位置向量,最优频率响应可以通过解决式(7)二次方程而获得,它可以通过二次编程技术很快地解决。将位置设计问题式(10)重新表示为:
满足‖ri-rj‖2≥εd,…,i,j=1,2,…,N,i≠j。其中是一个给定位置向量λ子问题式(7)的解。
离散化可以应用到转化上面式(8)和式(11)的半无限编程问题为大规模约束优化问题。目标函数式(8)关于变量是凸的,因此产生了一个凸优化问题。目标函数(11)有内嵌在AT(λ,r,f)和的变量λ,它们关于λ是非凸的,因此问题式(10)是非凸的,并且需要一个好的策略来寻找更好的位置。所提的混合下降方法总结如下:
(1)产生一个初始位置点λ0,通过使λ=λ0来解决简化的最优化问题式(10)以得到最优目标函数值E(λ0) ,设k=0。
(2)将λk作为遗传算法的一个候选点,执行N次迭代计算直到得到的点满足
(3)通过采用一个梯度最小化方法将作为输入点解决局部以得到λk+1,目标函数有一个适度程度的下降,
(4)设置k:=k+1,返回到第2步直到收敛。
在混合下降方法的第2步中,将遗传算法的适应度函数值设为子问题式(7)的最优值,遗传算法由5个关键步骤组成:
①种群表示:将实值化位置变量λ初始化来构造染色体,存储全部种群到一个单矩阵,所有的染色体长度是一样的。
②适应度分配:适应度值由式(10)的最优值通过排列或缩放而得到。
③选择:选择函数从目前的种群中选择一个给定位置号,根据它们的适应度,返回一个列向量到它们的目录里。
④交叉:交叉算子按照给定概率重新联合个体组以产生子代。
⑤突变:突变算子对个体双亲采用随机变化以产生子代。
所有的步骤概述如下:
①通过最后局部最优位置λk产生初始位置染色体Λk,对所有个体采用式(10)求值得到E(λ),λ∈Λk。
②对E(λ),λ∈Λk进行排列,如果停止;否则,转向③。
③通过适当选择函数作为双亲选择个体。
④通过使用交叉算子联合两个双亲产生子代作为下一代。
3 实验
将给出一个数值实例来验证所提的混合下降算法,所有的实验均在2.53 GHz的Inter®、CoreTMi5CPU计算机上实现,所用编程环境为MATLAB7.0,运用遗传算法的工具箱对凸最优子问题使用约束非线性最小化函数。
3.1 参数设置
在所用实例中,设计的响应函数对于一个适合多媒体或手机应用的区域是特定的,包括人类声音的频率变化,麦克风阵元应该直接朝向的一组位置。为了允许声音到达麦克风的延迟,设计的通频带区域的响应函数定义如下:
实验将位置布置问题认为是2维的,麦克风阵列由9个阵元组成。说话者站在平面z=0上,这样通频带和阻带都定义在该平面上。这些麦克风安装在平面z=1上,即离说话者所在平面1 m远(如图1)。
图1 问题设计
特别的,位置可行区域Λ,通频带区域Ωp和阻带区域Ωs定义如下:
通频带区域:
阻带区域:
可行性布置区域:
3.2 实验结果及分析
对于Ω=Ωp∩Ωs的离散化,每个频域区域参数60个点,空间域区域取0.2 m为单位,通过采用所提混合下降方法,可以发现麦克风阵元的最优定位λ*为:
它在图2中展示,采用该定位配置可以获取最优目标函数值 -41.163 5 dB。
图2 最优布局
为了更好地体现所提方法的有效性及优越性,将使用所提方法得到的定位结构与采用模拟退火粒子群优化算法(SA-PSO[12])、基于模糊回归的粒子群优化算法(FR-PSO[14])得到的定位结构、遗传算法形成的波束(BF-GA[15])、近场宽带声源定位麦克风阵列(MA-NBB[17])进行对比,将每两个麦克风之间的距离设定为0.2 m,如此,四种定位结构均可以产生9个麦克风点,SA-PSO[12]、FR-PSO[14]、BF-GA[15]、MA-NBB[17]的定位结构分别如图3(a)~(d)所示。
图3 采用各个方法所得位置结构
从图3可以看出,利用四种不同的定位方法,得到了四种不同的定位结果,图3(a)中9个点以类正方形的结构显示,图3(b)中9个点在一条竖线上,图3(c)中9个点以十字形显示,图3(d)中9个点分布在同一圆上,然而,光从形状上不能准确地判断各个定位方法的优劣,因此,计算了各个定位方法所设计的结构的性能极限,即最优目标函数值(以dB为单位),如表1所示。
表1 四种定位方法所设计结构的性能极限 dB
从表1可以看出,四种定位方法中,以第一种方法的性能最为出色,第三种方法的性能次之,剩下的两种方法的性能相当,然后,将采用混合下降方法所得到的最优定位配置的性能与采用这四种定位方法得到的性能极限进行对比可以发现,所提方法分别比SA-PSO[12]、FR-PSO[14]、BF-GA[15]、MA-NBB[17]的性能极限值低10.650 5 dB、20.650 5 dB、15.711 5 dB、19.606 5 dB,从这几个数据可以看出所提方法明显优于采用SA-PSO[12]、FR-PSO[14]、BF-GA[15]、MA-NBB[17]得到的常用定位结构,由此体现了所提方法的优越性。
前面提到,将滤波器长度设为L=40可以得到最优滤波系数和以上麦克风阵列定位λ*的实际响应,因此,为了显现波束合成器的高效性,绘制了当频率为1 400 Hz时的实际响应性能的(x,y)坐标图和空间频率(x,f)坐标图(y= 0 m),如图4所示。
图4 最优定位下有限长度滤波器的性能
从图4可以清晰地看出,即使频率高达14 000 Hz,利用所提混合算法确定的定位结构所设计的滤波器依然能够取得如此优越的性能,充分地表明了所设计波束合成器的高效性。
4 结语
针对在宽带波束形成器设计中麦克风阵列位置最优化过程中的非凸性问题,利用可避免局部最小化的遗传算法以及可改进局部相邻点的梯度方法,提出了一种基于遗传算法的混合下降方法。通过数值实验结果表明,与其他常用的几种定位方法相比,所提的混合下降方法设计出的波束形成器具有更好的性能。
实验设定位置布置问题是二维的,作为未来拓展工作,波束形成器的更高维设计,将是进一步研究的重点。
[1]Ng B P,Duan H.Designing amplitude/phase response of the frost beamformer[J].IEEE Transactions on Signal Processing,2007,55(5):1944-1949.
[2]Liu W,Weiss S.Design of frequency invariant beamformers for broadband arrays[J].IEEE Transactions on Signal Processing,2008,56(2):855-860.
[3]刘子龙,丁淑娟,孙广俊,等.基于二阶锥规划的宽带波束形成器设计[J].计算机工程与应用,2013,49(5):195-199.
[4]鄢社锋,马远良.基于二阶锥规划的任意传感器阵列时域恒定束宽波束形成[J].声学学报,2005,30(4):309-316.
[5]杨威,赵极远,刘鑫.基于FPGA的成像声纳FFT波束形成器设计[J].电子技术应用,2011(10).
[6]范展,梁国龙.基于凸优化的最小旁瓣恒定束宽时域宽带波束形成[J].电子学报,2013,41(5):943-948.
[7]陈晖,刘成城,李冬海,等.基于子带SDL的宽带自适应波束形成[J].信号处理,2012,28(12):1685-1691.
[8]苏德伦,王仕成,张金生,等.电阻阵列稀疏网格非均匀性修正[J].红外与激光工程,2009(4):604-608.
[9]Fernandez-Delgado M,Rodriguez-Gonzalez J,Iglesias R,et al. Fast array thinning using global optimization methods[J].Journal of Electromagnetic Waves and Applications,2010,65(9):259-271.
[10]Chen K S,Yun X H,He Z S,et al.Synthesis of sparse planar arrays using modified real genetic algorithm[J].IEEE Transactions on Antennas and Propagation,2011,55(7):67-75.
[11]何学辉,朱凯然,吴顺君.基于整数编码遗传算法的稀疏阵列综合[J].电子与信息学报,2010,32(9):2277-2281.
[12]张永亮,朱美正,李欣.模拟退火粒子群算法在矢量线数据压缩中的应用[J].计算机应用与软件,2013,30(1):88-93.
[13]马颖,田维坚,樊养余.基于固定目标权重的量子搜索算法[J].计算机应用研究,2013,30(1):155-161.
[14]Chan K,Dillon T,Kwong C.Modeling a liquid epoxy molding process using a particle swarm optimization based fuzzy regression[J].IEEE Transactionson IndustrialInformatics,2011,17(3):148-158.
[15]Chan K,Low S,Nordholm S,et al.Speech recognition enhancement using beamforming and a genetic algorithm[C]// Proceedings of IEEE Third International Conference on Network and System Security,2009:510-515.
[16]Feng Z,Yiu K,Nordholm S.A two-stage method for the design of near-field broadband beamformer[J].IEEE Transactions on Signal Processing,2011,59(6):647-656.
[17]Feng Z,Yiu K,Nordholm S.Placement design of microphone arrays in near-field broadband beamformers[J].IEEE Transactions on Signal Processing,2012,60(3):1195-1204.
MENG Xiaoli
Department of Information Engineering,Jiangsu Maritime Institute,Nanjing 211170,China
Due to the microphone array positioning non-convexity problems in the process of nonlinear optimization in beamformer design,local search techniques might not yield the best result.To address this problem,a hybrid descent method is proposed which consists of a genetic algorithm together with a gradient-based method.The gradient-based method can help to locate the optimal solution rapidly around the start point,while the genetic algorithm is used to jump out from local minima.Both of which will promote to find the optimal position for bean shaper design.Experimental results show that the beamformer designed by position determined by proposed hybrid descent method has better performance compared with several frequently-used positioning approaches.
beamformer design;microphone array;local search techniques;gradient-based method;Genetic Algorithm(GA); hybrid descent method
在波束形成器设计中,由于麦克风阵列定位优化过程中的非凸性问题,传统的局部搜索技术可能不会产生最优的结果。为了解决这一问题,提出了一种联合遗传算法和梯度方法的混合下降法。通过使用梯度方法在启动点附近迅速找到最优解决方案,同时利用遗传算法避免了局部最小化,从而促进寻找更好的波束形成器设计的最优位置。实验结果表明,与其他几种常用的定位方法相比,使用混合下降方法确定的位置所设计出的波束形成器性能更好。
波束形成器设计;麦克风阵列;局部搜索技术;梯度方法;遗传算法;混合下降方法
A
TP3
10.3778/j.issn.1002-8331.1305-0425
MENG Xiaoli.Application of improved hybrid descent method in design of microphone array.Computer Engineering and Applications,2013,49(18):227-231.
江苏省教育厅教改项目(No.GYB16)。
孟晓莉(1977—),女,讲师,主要研究领域:人工智能、计算机应用。E-mail:mengxiaoli_2013@163.com
2013-05-30
2013-07-08
1002-8331(2013)18-0227-05
◎工程与应用◎